
本文主要介绍一些浅显的机器学习的基本概念
- 概念学习
从某个有关布尔函数的输入和输出训练样例中该推断出该布尔函数
- 实例与集合
实例是一个样例,所有的实例构成一个集合
- 目标概念
待学习的函数或者目标概念
- 训练集
训练样例,用来进行训练,也就是产生模型或者算法的数据集
- 测试集
测试样例,用来专门进行测试已经学习好的模型或者算法的数据集
- 特征向量
属性的集合,通常用一个向量来表示,附属于一个实例
- 标记
实例类别的标记,学习的答案,结果的可能值的集合
- 分类与回归
分类: 目标标记为类别型数据
回归: 目标标记为连续型数据
- 监督学习
有监督学习: 训练集有类别标记
无监督学习: 训练集无类别标记
半监督学习: 有类别标记的训练集+无标记的训练集
机器学习步骤与框架
- 把数据拆分为训练集和测试集
- 用训练集和训练集的特征向量來训练算法
- 把学习來的算法运用在测试集上评估算法