多语言展示
当前在线:620今日阅读:86今日分享:14

什么是大数据

大数据目前这个词很火,作为编程人员是必须学习的基础知识之一,对于其它行业的同时,了解一下大数据也是非常有必要的,将来有一天就会使用大数据技的发展方向,毕竟这是一个大数据时代
方法/步骤
1

首先简介一下大数据能够干什么:首先举个例子,大家都喜欢上淘宝买东西,淘宝网站会记录每个人在它网站上都买了什么,浏览了什么。。。等等一系列信息。然后分析什么产品卖的火爆,哪个客户喜欢买什么,那个商家盈利高等等,挖掘一系列有潜在价值

2

其次分析一下大数据的含义,大数据既然含有数据这个词汇,就表明他是和数据相关的,而数据无非就是如何存储数据和如何使用存储的数据这两个问题

3

首先说一下如何存储:传统的数据都是保存在关系型数据库,比如oracle和mysql等,这些数据库存储空间是有限的,并且数据库的东西多了之后,查询存取的速度会变得很慢,根本做数据分析等。此外传统数据都安装在一台服务器上,一旦服务器宕机了,数据库的内容就全部销毁了,无法恢复

4

大数据的含义就是说数据量很大,数据量达到pb级别,大公司也许需要几千台服务器才能存储,用的是分布式存储技术。所谓的分布式存储技术是指,同样一份文件,分别存储在3台不同的服务器上,假设其中服务器挂机了,还有另外两台服务器工作,并且迅速备份一份文件,始终保证相同文件有3台服务器提供工作

5

大数据的使用需求,对现有的数据进行挖掘分析。而挖掘分析做的最多的就是查询数据,大数据的查询速度是非常快的,因为底层用的是类似于lucene技术。但是大数据不适合修改存储的文件。因为大数据存储数据是以文件的形式存储的,如果想修改数据,它会把原先的文件删掉,然后重新写入。

6

最后什么人适合学习大数据:通常都会要求你会大数据,其次互联网行业也用到了大数据相关的部分技术,比如:zookeeper,但是你要想找到一份好的工作,大数据知识是必须有所了解

推荐信息