物体检测（笔记）

技术2026-02-27 23

物体检测的过去现在和未来-俞刚大佬讲座笔记

行人检测二维码检测

bounding-box point keypoint

物体检测交通标示检测人体骨架姿态检测

特征+分类

AP：average precision准确率召回率

precision and recall 分母的不同

框面积与真实面积的交/并>50%认为框OK

mmAP：所有类别 AOU 平均准确率 0.5-0.55-0.60-0.95

all sub-windows feature 分类；计算量太大轻feature和分类

空中水中不会有汽车无效遍历

全卷积方式友好一些

feature+classifier:feature:Haar HOG LBP ACF; classifier:SVM Bootsing Random Forest

传统方法：优点：容易计算，CPU计算小比如人脸检测，信息明确，不多检测是OK；缺点：大数据集很难fit,GPU

深度学习：13年之后发展很快。

one stage: Densebox Yolo SSD RetinaNet

Two stages detector:RCNN

正样本负样本

no anchor: GT assignment; Loss sampling

大人脸小人脸

问题：自回归

densebox-unitBox; yolo(no anchor 7*7; loss sampling)

yolo:fc reshape(4096-7*7*30)；yolo-yolov2

SSD;尾巴非常长，耗时大些；SSD-DSSD；SSD-RON；SSD-RetinaNet特别容易对的图的loss拉低，FPN；

Two stages detector:RCNN

步骤复杂，太慢了

RFCN-deformable convolutional networks

RCNN-fast RCNN-FasterRCNN-FPN-MaskRCNN

Resnet VGG(Backbone)-head-postprocessNMS

Backbone：分类来训

backbone-DetNet:分辨率

head

Pretraining-objects365 dataset 60多万张图

收敛更快

人脸检测：sliding window+haar feature+adaboost

MegDetV2

框更好，结果更好

efficientDet

Few shot很少的图片训练

few shot-DLWL

更多类别

速度维度；快；极端条件：光照，拥挤；

视频监控：人脸车辆行人二维码车牌检测

未来：upper-bound >=90 mAP; false positive

Large-scale dataset training:semi-supervised training/ self-supervised

Processed: 0.013, SQL: 9