深度学习（四）--目标分类

技术2022-07-11 127

目标分类

目标分类基本框架

数据准备数据来源现有数据集的子集；网络采集；现有数据人工标注数据扩充原始数据切割；草绳颜色等像素变化；旋转平移等姿态变化数据规范均值处理；归一化；大小调整

2. 模型设计

任务类型分类表情+程度多目标分类现有模型已有的方案能否/怎样借鉴局部更改-从头设计更改：哪里设计：新结构特点，为什么可行

3. 训练细节

GPU-Batch size，是否并行 GPU内存-与batch size关系数据循环方式/平衡性考虑数量较少的类别，数据是否需要补偿从头到尾多次循环每次随机选取部分数据网络深度宽度确定深度与卷积核关系：第i层卷积核关注范围？损失函数设计分类 softmax直接拟合学习率变化方式，模型各层学习率是否一致评价方式：准确率、F1

迁移学习

ImageNet参数上亿，数据量百万，是不是参数多的模型都需要大量数据如果数据很多就网络全部训练如果很少的话就只训练FC如果一般大小的话就训练FC和一部分的卷积网络学习率的处理最低卷积层基本不变中间卷积层看情况最后全连接，结构参数均变化

2. 基础模型选择

是否已有特定任务的模型

研究分享：如何设计神经网络

面部识别

1. 已有算法

不同部分学习比较好，需要对准每个像素设计一个卷积核分成网格，每个网格设计一个卷积核，但是还需要对准，并且十分耗时不足预处理：大量对准，对于对准要求高，原始信息可能丢失卷积参数数量很大，模型收敛难度大，需要大量数据模型可扩展性差，基本限于人脸计算改进方法不需要预处理，自动进行局部探测不需要所有区域都处理，更多关注再有意义的区域重要的区域之间不会影响削弱学习效果

2. 设计来源

注意力网络热度图找出信息人脸关键点检测找到行为单元中心由中心生成注意力图注意力网络添加添加在哪里某个区域加强后加到激励中怎么添加卷积核还是一个局部学习网络针对不同区域进行针对学习，不同区域有不同的卷积核对区域的分布能够自适应：分割出不同的区域每个区域设计一个小卷积整合和AU Labels作用无需提前对面部对准就可以面部行为识别脸部各个行为单元局部针对学习，局部信息可以单独用于某个行为单元识别根据肌肉分布以及人脸特征点检测结果确定区域，具有合理性和可操作性总结如何设计神经网络明确研究问题已有解决方案特点，借鉴地方，不足突破点在哪里，还是重复就足够了想法再网络结构中实现训练结果反馈调整

Processed: 0.058, SQL: 11