多语言展示
当前在线:541今日阅读:19今日分享:20

大数据主要学些什么?

大数据主要学的内容有如下:
方法/步骤
1

1、熟练使用SQL语言;2、熟练使用Hadoop、M/R、Hive、Storm等开发工具;3、熟悉Linux命令及Shell编程;4、对数据敏感,良好的逻辑分析能力,良好沟通能力和团队精神;5、熟悉Impala、Druid、Mdrill、ElasticSearch等大数据工具者优先;

2

(1)Java语言基础(2) HTML、CSS与JavaScript(3)JavaWeb和数据库阶段二、 Linux&Hadoop生态体系Linux体系、Hadoop离线计算大纲、分布式数据库Hbase、数据仓库Hive、数据迁移工具Sqoop、Flume分布式日志框架

3

阶段三、 分布式计算框架和Spark&Strom生态体系(1)分布式计算框架Python编程语言、Scala编程语言、Spark大数据处理、Spark—Streaming大数据处理、Spark—Mlib机器学习、Spark—GraphX 图计算、实战一:基于Spark的推荐系统(真实项目)、实战二:新浪网(www.sina.com.cn)(2)storm技术架构体系Storm原理与基础、消息队列kafka、Redis工具、zookeeper详解、实战一:日志告警系统项目、实战二:猜你喜欢推荐系统实战

4

阶段四、 大数据项目实战(真实项目)数据获取、数据处理、数据分析、数据展现、数据应用阶段五、 大数据分析 —AI(人工智能)Data Analyze工作环境准备&数据分析基础、数据可视化、Python机器学习

推荐信息