RetinaNet模型解析

技术2022-07-10 330

RetinaNet模型解析

出发点意义效果概览网络简介Focal Loss公式

\gamma

取值的影响训练细节特征提取网络anchor正负样本定义获取proposalsLoss

出发点

作者希望one-stage detector可以达到two-stage detector的准确率，同时不影响原有的速度。既然有了出发点，那么就要找one-stage detector的准确率不如two-stage detector的原因，作者认为原因是：样本的类别不均衡导致的。

意义

1.解决训练过程中foreground和background类别极度不平衡的问题； 2.解决easy和hard样本的问题。

效果概览

网络简介

1.网络组成：Resnet + FPN + 2路FCN； 2.创新点：Focal Loss； 3.anchor：3中ratio{1:2, 1:1, 2:1}和3种size{2⁰, 2^1/3, 2^2/3}，面积从32²到521²，金字塔等级[P3, P4, P5, P6, P7]；

Focal Loss

公式

Focal loss是在交叉熵损失函数基础上改进的。公式如下： ————————————— FL(p_t) = - $\alpha$ _t(1-p_t)^r log(p_t) ———————————————————————————————————————— 1.P_t是不同类别的分类概率， $\gamma$ 是个大于0的值， $\alpha$ _t 是个[0，1]间的小数。 2. P越大，权重(1-P)就越小，easy example就可以通过权重进行抑制，难分的目标就会增大Loss。 3. $\alpha$ _t用于调节positive和negative的比例。

$\gamma$ 取值的影响

论文中取值：alpha=0.25, gamma=2.0

训练细节

特征提取网络

anchor

features = [P3, P4, P5, P6, P7] sizes = [32, 64, 128, 256, 512] strides = [8, 16, 32, 64, 128] ratios = [0.5, 1, 2] scales = [2 ** 0, 2 ** (1.0 / 3.0), 2 ** (2.0 / 3.0)]

正负样本定义

retinanet通过IOU阈值来定义正负样本，阈值定义如下：

# 阈值定义 overlap_threshold=0.5 ignore_threshold=0.4

每个GT一定有对应的anchor负责预测，0.4以下是负样本，0.5以上并且是最大IOU的anchor是正样本，0.4~0.5之间的anchor是忽略样本。然后再通过Focal Loss来平衡分类loss。

获取proposals

每一类得分大于confidence_threshold的框和得分——IOU

Loss

Loss = Smooth L1 Loss + Focal Loss

1.Smooth Loss作用是计算目标回归框loss； 2.Focal Loss作用是计算所有未被忽略的种类的预测结果的交叉熵loss。

Processed: 0.012, SQL: 9

RetinaNet模型解析