Pivotal忙于打造大数据软件组合

EMC子公司Pivotal在为自己的业务智能PaaS(平台即服务)做准备的同时,也还在忙着构建自己的数据挖掘和数据分析软件产品组合。

Pivotal即将发布两个有助于数据分析的方案。一个是用于实时分析的内存数据库,可以配合Hadoop数据处理平台使用,另一个是针对业务分析师的数据发现工具。

作为Hadoop发行版升级Pivotal HD 1.1的一部分,Pivotal中将包括内存交易库GemFire HD(VMware在2010年收购)。通过将GemFire作为Hadoop包一部分提供给客户,Pivotal希望企业机构使用这款软件作为构建OLTP系统(可以使用Hadoop作为长期存储)的基础。

这种方案将让企业机构能够分析现在保存在GemFire中的数据,以及卸载到Hadoop中老的交易型数据,Pivotal产品经理Abhishek Kashyap这样表示。GemFire实例完全是在服务器内存中运行的,这样可以迅速询问实时SQL操作数据,对于情况感知和其他形式的实时分析都是有用处的。

此外Pivotal还推出了Pivotal Data Dispatch,一款帮助数据工作者发现和准备数据用于分析的工具。Data Dispatch最初是由纽约证券交易所开发的,从2007年开始他们的数据分析师利用这款软件更好地了解监管要求带来的影响。

该软件让分析师可以挑选、筛选和合并来自不同来源的数据集用于分析。分析师生成的最终数据集被保存在一个“沙箱”中,来自Oracle、IBM和SAP等厂商的业务智能工具都可以使用这个沙箱,Pivotal产品营销副总裁Todd Paoletti这样表示。

使用传统BI工具,分析师们通常需要请求IT工作人员结合数据集,并将其部署到数据仓库中。该软件让他们不需要咨询IT人员就可以生成新的数据集。

除了Data Dispatch之外,还有大量自助服务BI工具,例如由Tableau和MicroStrategy提供的工具,可以轻松地使用数据工作者他们自己可以利用的图形数据库。

系统管理员最初定义和标记数据来源,然后提供给分析师。缘数据文件可能是来自于数据库文件、平面文件、Hadoop文件、Microsoft Project文件或者其他通用格式的文件。最终合并的数据集可以保存在Hadoop或者Pivotal Greenplum中。

Pivotal计划在11月12日发布它的云服务,Pivotal HD 1.1将在11月1日开始供货。

上一篇: EMC市场调查揭示中国大数据应用趋势
下一篇: 行业专家论微软大数据分析,直观Office界面呈现