戴尔使用第三方合作伙伴软件及其自己的服务器、存储和网络硬件和软件,为组合数据湖/数据仓库设计了一种参考架构类型的设计。
与Databricks、Dremio、SingleStore和Snowflake一样,戴尔设想了一个单一的数据湖库结构。这个概念是您拥有一个单一的通用存储,无需运行提取、转换和加载 (ETL) 流程来选择原始数据并将其放入适当的形式以便在数据仓库中使用。就好像数据湖内部有一个虚拟数据仓库。
戴尔 ISG 解决方案营销总监 Chhandomay Mandal 写了一篇关于此的博客,他说:“传统的数据管理系统,如数据仓库,几十年来一直用于存储结构化数据并使其可用于分析。但是,数据仓库的设置并不能处理越来越多的数据戴尔已经设计了一种参考架构类型的设计,用于使用第三方合作伙伴软件及其自己的服务器、存储和网络硬件和软件的组合数据湖/数据仓库– 文本、图像、视频、物联网 (IoT) – 它们也不支持需要直接访问数据的人工智能 (AI) 和机器学习 (ML) 算法。”
他说,数据湖可以。“今天,许多组织将数据湖与数据仓库结合使用——将数据存储在湖中,然后将其复制到仓库以使其更易于访问——但这增加了分析环境的复杂性和成本。”
您需要一个平台来完成这一切,而戴尔的 Validated Design for Analytics – Data Lakehouse 提供了它,支持商业智能 (BI)、分析、实时数据应用程序、数据科学和机器学习。它基于 PowerEdge 服务器、PowerScale 统一块和文件阵列、ECS 对象存储和 PowerSwitch 网络。该系统可以安装在本地或托管设施中。
组件软件技术包括具有 Delta Lake 技术的Robin Cloud Native Platform、Apache Spark(开源分析引擎)和 Kafka(开源分布式事件流平台)。Databricks 的开源 Delta Lake 软件建立在 Apache Spark 之上,而戴尔正在其自己的数据湖库中使用 Databricks 的 Delta Lake。
戴尔还与乐天收购的 Robin.IO及其开源 Kubernetes 平台合作。
戴尔最近宣布与 Snowflake达成外部表访问协议,并表示这个数据湖库验证的设计概念补充了这一点。据推测,Snowflake 外部表可以引用戴尔数据湖库。显然,这不是一个现成的系统,在您与戴尔达成协议之前,需要进行大量的仔细调查以及组件选择和选型。
有趣的是,HPE 有一个有点相似的产品Ezmeral Unified Analytics。这也使用了 Databrick 的 Delta Lake 技术、Apache Spark 和 Kubernetes。慧与本周将举办一场探索活动,预计会有很多新闻。或许戴尔宣布的时机并非偶然。
【公司名称】四川旭辉星创科技有限公司
【代理级别】成都戴尔服务器工作站总代理
【销售经理】李经理
【联系方式】座机:028-85596747 手机:13540160369
【公司地址】成都市人民南路4段 桐梓林 商鼎国际2号楼1单元1913
请用微信扫描二维码