比赛简介
大赛提供5000张图片,10分类问题。
本次主要在数据,网络模型和优化器做优化,数据量较小,主要工作是在防止过拟合。
数据处理:
1.数据增强
随机水平翻转 RandomHorizontalFlip
随机仿射变换 RandomAffine
2.数据扩充
大赛提供了5000张数据进行训练,数据量较小。
在网上爬取了4946张图片,爬取的数据集链接:
链接:https://pan.baidu.com/s/1MbKgC3JP1EA5TbQUdl53xw
提取码:97qy
爬取的数据有很多脏数据,做了两轮简单的数据清洗后扩充数据集。
给易混淆的类别多扩充一些数据,同时考虑数据均衡。两轮每个类别的的数据增加量如下图。
训练时分别使用两个扩充的数据集训练。

模型选择
本次比赛分别尝试了ResNet系列和efficientnet系列,参考了下图,
最后直接选择了参数量最大的efficientnet-b7。
其他工作
优化器:训练全程采用ranger优化器,使用L2正则化。
损失函数:使用了标签平滑(LabelSmoothingCrossEntropy)
学习率策略:使用ReduceLROnPlateau,两个epoch验证集准确度没有上升就减小学习率。
模型训练
训练分两部分,图片输入尺寸为(224,224)
第一阶段:使用数据处理部分第一轮添加的数据,9:1划分,只训练最后一层网络参数,10个epoch。
第二阶段:在第一阶段模型基础上继续训练,使用数据处理部分第二轮添加的数据,9.6:0.4划分,训练最后一层网络参数10个epoch后,训练全部参数25个epoch。
未来展望
在efficientnet网络中添加cbam注意力机制。
使用学习率余弦退火等方法。
增大图片输入尺寸。
模型性能
单模型,测试集acc98.4%。

感谢分享