多语言展示
当前在线:1784今日阅读:167今日分享:16

Web 数据挖掘如何入门?

Web数据挖掘的目标是从Web超链接、网页内容和使用日志中探寻有用的信息。并利用这些信息实现功能及作用的一种互联网数据分析的手段,在信息化日益显著的今天越来越重要,那么要怎样才能入门呢?
工具/原料
1

知识渊博的子衿

2

web数据挖掘的初学者们

方法/步骤
1

做Web数据挖掘会用到数据挖掘的(所有)知识,无论是用户写的文本(文本挖掘,自然语言处理),用户购买商品的记录和评分(推荐系统),用户浏览的历史和点击流(流数据挖掘),用户上传的照片和视频音频(机器视觉),数据挖掘和机器学习中的各种方法都是需要掌握的,不过如果还学习过统计学知识,就是锦上添花的事了。

2

做数据挖掘,编程这一关是必须要过的,虽然现在已经有很多软件帮助你实现了,比如SPSS,WEKA,但是这些软件都是别人写好的,算法也规定死的,软件规定是什么就是什么,这样就限制了灵活性,也不一定能完全实现自己的需求。所以这个时候可能就需要挖掘者的进行基于相关平台的二次开发了。

3

子衿觉得数据挖掘基本上可以分为两个阶段:(1)研究阶段(2)应用阶段

4

在最初的研究阶段,可以称为迭代过程:1. 确定问题,能够根据实际情况建立统计学模型并作出假设检验的理论分析。2. 进行数据收集,根据问题,选择相应的Web数据挖掘工具,若无合适的工具最好先手工收集(通过Excel,或在线Survey工具)。3. 使用统计软件验证(SPSS、R),期间发现新规律或者对结果不满意,再从问题或数据出发,进行修正。

5

当相关研究具有有商业价值,则您的数据挖掘过程开始进入应用阶段,那么这时候就需要掌握以下的能力了:1、编程语言以实现数据的自动/在线多人采集、分析、存储。2、数据库和商业智能工具进行数据的复杂检索。

推荐信息