本文,学习一下K最近邻算法的python实现。
工具/原料
1
电脑
2
python3.6(anaconda)
3
sklearn模块
方法/步骤
1
加载一组数据——iris:from sklearn import datasets from sklearn.neighbors import KNeighborsClassifier import numpy as np a = datasets.load_iris()
2
从a里面读出输入数据:x=a.data 每一个数据都是一个四元向量。
3
从a里面读出输出数据:y=a.targetx里面的每一个向量,都对应y里面的一个数字。
4
给出0到150之间的正整数的随机排列:indices = np.random.permutation(len(x))此时,len(x)=150
5
把x和y分割为训练集和测试集:x_train = x[indices[:-10]]y_train = y[indices[:-10]]x_test = x[indices[-10:]]y_test = y[indices[-10:]]
6
定义一个knn分类器,并用训练集对它进行训练:knn = KNeighborsClassifier()knn.fit(x_train,y_train)
7
用测试集测试knn:z=knn.predict(x_test)准确率是100%。
8
用不同的训练集测试knn,准确率是不一样的。
下一篇:食补佳品实用芋头泥馅的做法