物体检测的过去现在和未来-俞刚大佬讲座笔记
行人检测 二维码检测
bounding-box point keypoint
物体检测 交通标示检测 人体骨架姿态检测
特征+分类
AP:average precision准确率 召回率
precision and recall 分母的不同
框面积 与真实面积的 交/并>50%认为框OK
mmAP:所有类别 AOU 平均准确率 0.5-0.55-0.60-0.95
all sub-windows feature 分类;计算量太大 轻feature和分类
空中水中不会有汽车 无效遍历
全卷积方式 友好一些
feature+classifier:feature:Haar HOG LBP ACF; classifier:SVM Bootsing Random Forest
传统方法:优点:容易计算,CPU计算小比如人脸检测,信息明确,不多检测是OK;缺点:大数据集很难fit,GPU
深度学习:13年之后发展很快。
one stage: Densebox Yolo SSD RetinaNet
Two stages detector:RCNN
正样本 负样本
no anchor: GT assignment; Loss sampling
大人脸 小人脸
问题:自回归
densebox-unitBox; yolo(no anchor 7*7; loss sampling)
yolo:fc reshape(4096-7*7*30);yolo-yolov2
SSD;尾巴非常长,耗时大些;SSD-DSSD;SSD-RON;SSD-RetinaNet特别容易对的图的loss拉低,FPN;
Two stages detector:RCNN
步骤复杂,太慢了
RFCN-deformable convolutional networks
RCNN-fast RCNN-FasterRCNN-FPN-MaskRCNN
Resnet VGG(Backbone)-head-postprocessNMS
Backbone:分类来训
backbone-DetNet:分辨率
head
Pretraining-objects365 dataset 60多万张图
收敛更快
人脸检测:sliding window+haar feature+adaboost
MegDetV2
框更好,结果更好
efficientDet
Few shot很少的图片训练
few shot-DLWL
更多类别
速度维度;快;极端条件:光照,拥挤;
视频监控:人脸 车辆 行人 二维码 车牌 检测
未来:upper-bound >=90 mAP; false positive
Large-scale dataset training:semi-supervised training/ self-supervised
