【定义】“从数据中提取出隐含的过去未知的有价值的潜在信息”[1]“一门从大量数据或者数据库中提取有用信息的科学。”[2]尽管通常数据挖掘应用于数据分析,但是像人工智能一样,它也是一个具有丰富含义的词汇,可用于不同的领域。 它与KDD的关系是:KDD是从数据中辨别有效的、新颖的、潜在有用的、最终可理解的模式的过程;而数据挖掘是KDD通过特定的算法在可接受的计算效率限制内生成特定模式的一个步骤。 事实上,在现今的文献中,这两个术语经常不加区分的使用。
【方法】数据挖掘的方法包括监督式学习、非监督式学习、关系分组(Affinity Grouping,作关系性的分析)与购物篮分析(Market Basket Analysis)或者称为关联规则分析、聚类(Clustering)与描述(Description)。监督式学习包括:分类、估计、预测。
【例子】数据挖掘在零售行业中的应用:跟踪客户的购买情况,发现某个客户购买了大量的真丝衬衣,这时数据挖掘系统就在此客户和真丝衬衣之间创建关系。销售部门就会看到此信息,直接发送真丝衬衣的当前行情,以及所有关于真丝衬衫的资料发给该客户。这样零售商店通过数据挖掘系统就发现了以前未知的关于客户的新信息,并且扩大经营范围。
【历史】数据挖掘是因为海量有用数据快速增长的产物。使用计算机进行历史数据分析,1960年代数字方式采集数据已经实现。1980年代,关系数据库随着能够适应动态按需分析数据的结构化查询语言发展起来。数据仓库开始用来存储大量的数据。因为面临处理数据库中大量数据的挑战,于是数据挖掘应运而生,对于这些问题,它的主要方法是数据统计分析和人工智能搜索技术。
赠人玫瑰,手留余香!积善成德而神明自得圣心倍焉!望您不吝为在下的付出点上一个宝贵的赞~!
若有问题,可以选择在下方发出,这样可以让和你有共同问题的小伙伴同时受益~!
此消息改编自维基百科相关词条,仅供参考