假设空间:P5,介绍:监督学习的目的在于找到最好的模型,这个模型即是由输入空间到输出空间的映射的集合,这个集合就是假设空间(hypothesis space)。假设空间的确定意味着学习范围的确定。
监督学习是因为训练所需的数据是人工给出的。
描述输入输出变量的关系的模型,实际上是条件概率分布(P(X|Y))或者决策函数(Y=f(X)).
正则化:
泛化能力:通常将学习方法对未知数据的预测能力称为泛化能力(generaliization ability)。
过拟合:一味追求提高对训练数据的预测能力,所选模型的复杂度往往会比真模型更高。这种现象称为过拟合(over-fitting)。过拟合是指学习时选择的模型所包含的参数过多,以至于出现这一模型对已知数据预测得很好,但对未知数据预测得很差的现象。