多语言展示
当前在线:1483今日阅读:113今日分享:31

如何成为高级大数据分析师

在 中级数据分析师的基础上要求掌握 JAVA 语言和 linux 操作系统知识,能够掌握运用Hadoop、Spark、Storm 等至少一门专业大数据分析软件,从海量数据中提取相关信息,并能够结合 R、Python 等软件,形成严密的数据分析报告。就业方向:通常在政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与云端大数据的人员。
方法/步骤
1

java基础:1. Java 语言的发展史、java 开发环境搭建以及环境变量的配置,java 语言跨平台的原理,java 程序初次开发2. Java 语法格式,关键字,标识符,注释,常量,数据类型,数据类型转换,运算符3. 程序流程控制语句以及其应用场景4. 数组的应用及其常见操作5. 类和对象的概念、类和对象之间的关系6. 类的组成部分(成员变量,构造方法,成员方法)及其详细讲解7. 面向对象的三大特性:继承、封装 及其特点剖析8. 接口和抽象类及其特点分析9. java 的异常处理机制10. jdk API 常用类的讲解:Math,Random、String,StringBuffer,Date11. Java I/O 体系介绍:File 类的介绍和常用操作,字节流 InputStream 和OutputStream,字符流 Reader 和 Writer,以及相应实现类的介绍和使用,缓冲流和序列化流的的详解,IO 性能分析,字节和字符的转化流,包装流的概念,以及常用包装类。

2

大数据必备的数据结构与算法:1. 数据结构和算法概述2. 数组、链表、队列、栈等线性表3. 二叉树、BST、AVL 树及二叉树的递归与非递归遍历4. B+5. 跳表6. 图、图的存储、图的遍历7. 有向图、无向图、懒惰与积极的普利姆算法、克鲁斯卡尔算法及 MST、单源最短路径问题及 Dijkstra 算法8. 并查集与索引式优先队列、二叉堆9. 遗传算法初步与 TSP 问题10. 内部排序(直接插入、选择、希尔、堆排序、快排、归并等)算法与实践中的优化11. 外部排序与优化(文件编码、数据编码、I/O 方式与 JVM 特点、多线程、多路归并等)12. 哈希表、Trie 树、倒排索引、分布式索引初步(Map-Reduce)

4

Hadoop 大数据开发技术:hadoop、hive、hbase、hue、oozie、flume等生态圈相关软件的使用;MapReduce几个案例 :最短路径算法,PageRank算法,社交好友推荐算法等几个 比较常用的算法。

注意事项

大数据分析师,在很大程度其实还是能够往业务方向的,因为开发需要很高的智商

推荐信息