多语言展示
当前在线:1863今日阅读:84今日分享:32

Hadoop生态系统(8)-Mahout简介

Hadoop生态系统系列
方法/步骤
1

什么是Mahout–Mahout 是机器学习和数据挖掘的一个分布式框架–区别于其他的开源数据挖掘软件,它是基于Hadoop之上的MapReduce实现

2

Mahout的特点–极强的扩展性:可以很方便的根据数据规模进行扩容,一般情况下不需要重启集群–良好的容错性: 可以自动的重新运行失败的任务,等,这些都有框架自动完成–高效的: 它以并行的方式工作,通过并行处理加快处理速度 ,利用集群的威力进行快速的运算–可移植性较强:因为Mahout是用Java开发的,所以移植性比较好

推荐信息