
KNN算法
KNN算法用来解决分类问题,它是属于基于实例的学习,每一次学习都是根据实例,也属于懒惰学习,处理训练集时没有创建模型,后面根据实例的对比才来归类
为了判断未知实例的类别,通过与他最近的已知实例的类别來对这个未知实例进行分类
选择一个参数K,K是选择已知实例的数目,使预测具有最高的精确度
计算未知实例和所有已知实例的距离
选择最近K个已知实例
选取最邻样本中最多数的类别作为这个实例的类别
KNN算法应用
在python库中有iris的数据集,可以直接加载,并且使用
数据集分为两部分,第一部分是每一个实例的特征值,有4项,第二部分是实例的标记
|
|
对于未知实例[0.1,0.2,0.3,0.4],预测的结果为属于[0]