机器学习聚类分析能做什么

聚类就是按照某个特定标准（如距离准则）把一个数据集分割成不同的类或簇，使得同一个簇内的数据对象的相似性尽可能大，同时不在同一个簇中的数据对象的差异性也尽可能地大。即聚类后同一类的数据尽可能聚集到一起，不同数据尽量分离。

方法/步骤

l 聚类分析主要步骤1. 数据预处理：选择数量、类型和特征的标度，将孤立点移出数据。2. 为衡量数据点间的相似度定义一个距离函数3. 聚类或分组：将数据对象分到不同的类中4. 评估输出：评估聚类结果的质量

l 聚类和分类的区别聚类解决的是事物分组的问题，是非监督学习，那些表示数据类别的分类或者分组信息是没有的，简单地说，聚类就是把相似的东西分到一组，聚类时并不关心某一类是什么，需要实现的目标只是把相似的东西聚到一起。因此，一个聚类算法通常只需要知道如何计算相似度就可以开始工作了，并不需要使用训练数据进行学习。

而分类是解决“这是什么？”的问题，通常需要告诉它“这个东西被分为某某类”，分类会从它得到的训练集中进行“学习”，从而具备对未知数据进行分类的能力，属于监督式学习。

l 聚类分析无处不在1. 被用来发现不同的客户群，并且通过购买模式刻画不同的客户群的特征。2. 不同地区城镇居民收入和消费状况的分类研究。3. 社交网络分析中的社交圈子的识别。4. 被用来动植物分类和对基因进行分类，获取对种群固有结构的认识。5. 在电子商务中通过分组聚类出具有相似浏览行为的客户，并分析客户的共同特征，可以更好的帮助电子商务的用户了解自己的客户，向客户提供更合适的服务。6. 对购买了汽车保险的客户，标识那些有较高平均赔偿成本的客户。

上一篇：使用监督机器学习训练模型以对数据分类

下一篇：机器学习入门概念

欧尼酱

机器学习聚类分析能做什么

使用监督机器学习训练模型以对数据分类

机器学习聚类分析能做什么

机器学习入门概念

构建一个机器学习系统的基本步骤

Python机器学习库之Scikit-learn的六大功能

基于CRF工具的机器学习方法命名实体识别的过程

如何下载UCI机器学习数据集

图解机器学习的10个JavaScript示例

美味牛肉的做法家常菜

如何创作网络小说？

牛肉怎么做好吃

如何找到适合自己的网站发表网络小说

如何使用鸡汤创作写小说？

1岁零3个月宝宝吃牛肉的做法？

如何在网上写小说？

香辣干煸片片牛肉

牛肉的家常做法

冷吃肉的做法

如何提高写作效率

凉拌卤牛肉的做法

怎么写小说赚钱？

凉拌牛肉的家常做法

墨者写作如何才能快速入门创作

自己写的原创网络小说怎么排版？

热门冷盘【卤牛肉】

香辣冷吃牛肉

怎么做冷吃牛肉

如何在腾讯小说网写作