环球科创网

Cloudera将共享数据平台的第一个应用推向beta测试

更新时间:2021-12-06 20:52:01

导读 Cloudera Inc 于5月推出了首款基于Altus平台的应用即服务。即将进入beta测试的Cloudera Altus Analytic DB,是一个专门用

Cloudera Inc .于5月推出了首款基于Altus平台的应用即服务。

即将进入beta测试的Cloudera Altus Analytic DB,是一个专门用于自助服务的基于云的数据仓库。它在共享数据、目录和目录服务的基础上工作,因此不需要重复数据和提取/转换/加载数据。

该公司表示,它正在解决数据孤岛问题,随着许多用户请求访问大数据存储,数据孤岛正在迅速增加。该公司表示,支持同一数据的多个副本将使一致性、安全性和治理变得复杂,而短暂的集群通常会消失。用户经常被阻止执行他们自己的特殊分析,因为数据被工程师捆绑在一起。

Altus分析数据库利用共享的数据体验,使多个用户能够使用他们喜欢的工具,包括SQL、Python和altus数据工程。使数据科学家和工程师能够快速提供Apache Spark、Apache Hive、Spark上的Hive和云基础设施上的Map Reduce的功能,并为Amazon.com的S3对象存储提供初始支持,并计划在未来特定日期支持微软的Azure。

该公司表示,数据工程师可以读写云对象存储,而无需复制数据或更改文件格式。不需要将数据移入数据库,也不需要预处理。

Cloudera产品管理总监格雷格?格雷格莱恩说:“查询引擎可以直接与数据进行比较。”您可以将原始数据加载到S3,然后使用像Impala这样的东西将其转换为优化的格式。或者可以在这个过程中进行转换,直接输入Spark作业,Spark作业将Apache Parquet文件输出到S3。查询引擎只需要知道表的定义。

该产品具有与Apache Impala相同的功能,是一个巨大的并行Hadoop分析数据库。Cloudera是在2012年根据开源许可证开发和发布的。Lane说:“对于熟悉Impala工作负载的人来说,这是一个无缝过渡到云的过程。

Cloudera高级产品营销经理Alex Gutow表示,与Altus一起,“业务分析师可以立即自行分析和访问全面的数据,并且可以支持广泛的工作负载。”或者用户用例的数量是无止境的,无论运行多少其他工作负载,工作负载都是可预测的。“使用不会影响性能或满足服务级别的协议,”她补充道。

据该公司称,由于不需要将数据移动到数据库中,共享数据和相关的数据模式和结构几乎可以被用户选择的任何工具访问。Gutow表示,Cloudera拥有超过3000个合作伙伴的网络,并与所有领先的商业智能工具合作。该公司提供了阿卡迪亚数据公司、信息公司、Tableau软件公司、Qlik公司和Zoom数据公司的证词。

未指定定价。客户可以加入等候名单,以获得更多关于可用性的详细信息。

免责声明:本文由用户上传,如有侵权请联系删除!