Hadoop学习入门介绍

Hadoop是一个开源、高可靠、可扩展的分布式计算框架，主要用来解决海量数据的存储（HDFS）、海量数据的分析（MapReduce）、分布式资源调度（Yarn）等。Hadoop可以用于日志分析、基于海量数据的在线应用、推荐系统、计算广告、复杂算法、网盘和搜索引擎等。Hadoop的起源是Lucence，Lucence是用java编写的，用于实现和Google类似的全文检索功能，Hadoop是2005年作为Lucence的子项目Nutch被纳入Apache基金会，目前Hadoop是实现云计算的标准开源软件。

工具/原料

思维导图工具

方法/步骤

首先我们来了解一下Haddop的生态圈，Hadoop项目主要包括以下几个模块：HDFS是一个高可靠、高吞吐量的分布式文件系统；MapReduce是一个分布式的离线并行计算框架；Hadoop YARN是一个新的MapReduce框架，任务调度与资源管理；Pig 轻量级的语言，可以将命令转换为MapReduce程序；Hive 相当于SQL到MapReduce的映射器；HBase Nosql数据库非关系型的列式数据库，其他的就不再一一介绍了，读者可自行了解。

JobTracker主要用于处理作业（用户提交代码）的后台程序，决定有哪些文件参与处理，然后切割task并分配节点，同时监控task并且重启失败的task（于不同的节点上）。，每一个集群只有唯一一个JobTracker，位于Master节点上。TaskTracker（任务跟踪器）位于slave节点上，与dataNode结合（代码与数据一起的原则），管理各自节点上的task（由jobtracker分配），每个节点只有一个tasktracker,但一个tasktracker可以启动多个JVM，用于并行执行map或reduce任务，TaskTracker可以与JobTracker交互。

接下来是Hadoop的安装和准备工作：安装jdk，配置环境变量；hadoop安装，设置环境变量、设置用户路径、修改配置文件；配置SSH免密码登录：安装SSH 生成一对空口令密钥对，生成的公钥放在系统等。Hadoop有三种运行模式，分别是：单机模式、伪分布式、完全分布式。单机模式安装简单，无需任何配置，但是仅限于调试使用；伪分布式即在单节点上同时启动namenode、datanode、jobtracker、tasktracker、secondary namenode等5个进程，模拟分布式运行;完全分布式便是正常的分布式Hadoop集群。

Hadoop的具体安装我们不介绍，下面介绍一下Hadoop中配置相关的文件，如下图所示。需要注意的是我们在core-site.xml中配置NameNode的IP地址和端口号（fs.default.name）为hdfs://master:9000，我们修改mapred-site.xml文件配置作业跟踪器的位置（mapred.job.tracker）:localhost:9001。

下面我们来简单了解一下MapReduce的原理。Map任务处理：读取输入文件内容，解析成key、value对；重写map方法，编写业务逻辑输出新的key、value对；对输出的key、value进行分区（Partitioner类）；对数据按照key进行排序、分组，相同key的value放到一个集合中。Reduce任务处理：对多个map任务的输出，按照不同的分区，通过网络copy到不同的reduce节点；对多个map任务的输出进行合并、排序，写reduce函数自己的逻辑，对输入的key、value处理，转换成新的key、value输出；把reduce的输出保存到文件中。

我们可以通过web来了解Hadoop的活动，通过浏览器和http访问jobtracker所在节点的50030端口监控jobtracker，通过浏览器和http访问namenode所在节点的50070端口监控集群，并在/logs目录下查看日志信息。Hadoop官网上有一些技术文档，如下图所示。

注意事项

文中部分图片来源于网络

文中内容为学习笔记整理，篇幅有限不能全面介绍还望见谅。

上一篇：近来“我”对TPM推行的一些个人建议

下一篇：游戏原画教程：角色细化到什么程度才能交稿

欧尼酱

Hadoop学习入门介绍

新手如何开始学习ECharts

Hadoop学习入门介绍

零基础hadoop大数据开发学习路线

五月天是由五个成员组成的，是哪五个成员组成的呢

如何做一碗色泽油亮的红烧肉

qq音乐在线播放 qq音乐不下软件怎么放歌

秘制的红烧肉

，秘制刘氏红烧肉

红烧肉怎做才好吃

不一样的红烧肉做法

色泽红亮红烧肉的做法

红烧肉的家庭制作方法

细说红烧肉

红烧肉如何做到肉肥而不腻

肥而不腻的红烧肉

家乡味红烧肉

红烧肉的东北秘制做法

这样做红烧肉，鲜香不腻

难忘年夜饭--香酥红烧肉

肥而不腻入口即化红烧肉

红烧肉秘制小方

红烧肉做法二

51级只是开始：满级之后玩什么(上)