多语言展示
当前在线:1136今日阅读:99今日分享:20

hadoop商业版本发行比较

目前大数据在国内正是火热,而hadoop作为大数据集群处理所必须的技术解决方案可以说是分枝太多,各种商业发行版让人有点不知所措。本文就DKhadoop、Apache原生hadoop、第三方发行版(CDH,HDP,MapR等)做简单的比较,供新手了解学习。
工具/原料
1

DKhadoop

2

Apache原生hadoop

3

第三方发行版hadoop(CDH,HDP,MapR)

方法/步骤
1

Apache原生hadoop优缺点:Apache原生hadoop的优点:Apache社区版本的hadoop是完全开源免费的,非商业发行版。社区活跃性以及文档、资料详实等方面。

2

Apache原生hadoop的缺点:Apache社区的hadoop版本分枝很多,并且部分hadoop存在bug。在选择hadoop,hbase,hive等时就需要考虑兼容性的问题。

3

DKhadoop的优点:DKH,有效的集成了整个HADOOP生态系统的全部组件,并深度优化,重新编译为一个完整的更高性能的大数据通用计算平台,实现了各部件的有机协调。因此DKH相比开源的大数据平台,在计算性能上有了高达5倍(最大)的性能提升。

4

第三方发行版hadoop(CDH,HDP,MapR)优缺点:第三方发行版hadoop(CDH,HDP,MapR)的优点:基于Apache协议,100%开源;相较于原生的hadoop在兼容性、安全型以及稳定性方面有所提升;版本管理清晰,更新更快;提供了部署、安装、配置工具,大大提高了集群部署的效率,可以在几个小时内部署好集群;运维简单。提供了管理、监控、诊断、配置修改的工具,管理配置方便,定位问题快速、准确,使运维工作简单,有效。

5

第三方发行版hadoop(CDH,HDP,MapR)的缺点:第三方hadoop发行版的主要缺点就是涉及到厂商锁定的问题,但这一问题可以通过技术方面解决掉。

推荐信息