在过去的三年时间里,大数据批量处理平台Apache Hadoop获得长足发展。当然,它占据了“天时”的优势:Web 2.0公司运营规模不断壮大;传统IT部署从试用单点部署迈向大规模产品部署。另外,网络、存储和整合服务的迅猛发展使得Hadoop成为了企业和应用扩展至更大规模的首选平台。下面,我们为大家介绍,为何Hadoop将成为大数据分析的首选平台。
一、Hadoop在实时应用程序中应用更多
Hadoop可以在可用的计算机集簇间分配数据并完成计算任务,当然也可以实现实时数据分析。Hadoop 完全基于成本效益而构建的海量数据集分析,因此,这种实时应用平台中将会更多地采用Hadoop。
二、Hadoop将帮助节省成本
Hadoop对于海量数据处理支撑模型预测分析具有举足轻重的作用。在未来,将有越来越多的企业使用 这些应用来获得更高的收益。
三、其他大数据分析平台无法取代Hadoop
Hadoop与MongoDB、Cassandra、Couchbase和其他众多NoSQL具有显著区别。与相互割裂的处理方式不 同的是,Hadoop提供了统一的海量的API(包括MapReduce、查询语言和数据库访问,而且更易于整合 各种领先的分析和搜索平台),能够与现有的生态系统扩展提供更为丰富的服务。
四、Hadoop技术人才及需求都在不断增长
数据科学家和运营人才的需求增长迅猛,但目前的增长还不能满足需要。目前各大人才招聘站点的数 据科学家和技术人才岗位供不应求。
五、针对Hadoop的SQL工具不断扩展
结构化查询语言技能和人才的积累,将会驱动Hadoop对SQL的支持。基于SQL语言比如HiveQL和DrQL, 就是其中可以帮助Hadoop访问大规模SQL社区的工具。
HBase最能施展的舞台空间之一就是二进制大型对象(BLOB),HBase是Hadoop的开源、非关系型分布 式数据模型。这些二进制大型对象包括图片、音频等多媒体对象,它们要求有支持快速检索的大型数 据仓库。
七、硬件会针对Hadoop进行优化
不仅仅是Hadoop是一款强大分布式数据处理平台,而且在企业数据中心也会根据Hadoop进行部署、整合方面的硬件优化。
八、HBase助力轻量化在线事务处理
HBase是一个构建在Hadoop分布式文件系统(HDFS)之上的大规模、分布式数据库。整合了信息、聊天和邮件到实时会话系统的Facebook Messages,是Facebook首个采用HBase的产品。未来,将会有更多 基于HBase的部署在轻量化OLTP在线事务处理平台。
九、企业在Hadoop集群扩展更多应用
随着Hadoop的不断普及和应用,企业将利用Hadoop集群扩展更多应用,尤其是在多租户和跨用户、管理员共享集群的平台上吸引人们更多的注意力。
十、Hadoop将成为云端杀手级应用
Hadoop将成为云部署的杀手级应用。由众多云供应商提供的Hadoop集群,将会随着企业对Hadoop的应用而不断拓展。