物体检测(笔记)

    技术2026-02-27  9

    物体检测的过去现在和未来-俞刚大佬讲座笔记

    行人检测 二维码检测

    bounding-box point keypoint

    物体检测 交通标示检测 人体骨架姿态检测

    特征+分类

    AP:average precision准确率 召回率

    precision and recall 分母的不同

    框面积 与真实面积的 交/并>50%认为框OK

    mmAP:所有类别 AOU 平均准确率 0.5-0.55-0.60-0.95

    all sub-windows feature 分类;计算量太大 轻feature和分类

    空中水中不会有汽车 无效遍历

    全卷积方式 友好一些

    feature+classifier:feature:Haar HOG LBP ACF; classifier:SVM Bootsing Random Forest

    传统方法:优点:容易计算,CPU计算小比如人脸检测,信息明确,不多检测是OK;缺点:大数据集很难fit,GPU

    深度学习:13年之后发展很快。

    one stage: Densebox Yolo SSD RetinaNet

    Two stages detector:RCNN

    正样本 负样本

    no anchor: GT assignment; Loss sampling

    大人脸 小人脸

    问题:自回归

    densebox-unitBox; yolo(no anchor 7*7; loss sampling)

    yolo:fc reshape(4096-7*7*30);yolo-yolov2

    SSD;尾巴非常长,耗时大些;SSD-DSSD;SSD-RON;SSD-RetinaNet特别容易对的图的loss拉低,FPN;

    Two stages detector:RCNN

    步骤复杂,太慢了

    RFCN-deformable convolutional networks

    RCNN-fast RCNN-FasterRCNN-FPN-MaskRCNN

    Resnet VGG(Backbone)-head-postprocessNMS

    Backbone:分类来训

    backbone-DetNet:分辨率

    head

    Pretraining-objects365 dataset 60多万张图

    收敛更快

    人脸检测:sliding window+haar feature+adaboost

    MegDetV2

    框更好,结果更好

    efficientDet

    Few shot很少的图片训练

    few shot-DLWL

    更多类别

    速度维度;快;极端条件:光照,拥挤;

    视频监控:人脸 车辆 行人 二维码 车牌 检测

    未来:upper-bound >=90 mAP; false positive

    Large-scale dataset training:semi-supervised training/ self-supervised

    Processed: 0.026, SQL: 9