KNN理解与实现

    技术2022-07-11  80

    KNN为有监督的分类算法 用来进行预测分类

    流程: 1) 计算已知类别数据集中的每个点与当前测试点之间的距离 2) 按距离递增次序排序 3) 选取与当前点距离最小的k个点 4) 统计前k个点所在的类别出现的频率 5) 返回前k个点出现频率最高的类别作为当前点的预测分类

    优点: 1、简单有效 2、重新训练代价低 3、算法复杂度低 4、适合类域交叉样本 5、适用大样本自动分类

    缺点: 1、惰性学习 2、类别分类不标准化 3、输出可解释性不强 4、不均衡性 5、计算量较大

    Processed: 0.010, SQL: 9