建议使用以下浏览器,以获得最佳体验。 IE 9.0+以上版本 Chrome 31+ 谷歌浏览器 Firefox 30+ 火狐浏览器
温馨提示

抱歉,您需设置社区昵称后才能参与社区互动!

前往修改
我再想想

华为云大赛技术圈

话题 : 467 成员 : 405

加入HCSD

【开发者高校青年班】华为云开发者AI青年班黑客松大赛——参赛方案分享

liecoding 2020/5/12 1668

比赛简介

        大赛提供5000张图片,10分类问题。

        本次主要在数据,网络模型和优化器做优化,数据量较小,主要工作是在防止过拟合。

数据处理:

1.数据增强

  • 随机水平翻转  RandomHorizontalFlip

  • 随机仿射变换       RandomAffine

2.数据扩充

    大赛提供了5000张数据进行训练,数据量较小。

    在网上爬取了4946张图片,爬取的数据集链接:

        链接:https://pan.baidu.com/s/1MbKgC3JP1EA5TbQUdl53xw 

        提取码:97qy

    爬取的数据有很多脏数据,做了两轮简单的数据清洗后扩充数据集。

    给易混淆的类别多扩充一些数据,同时考虑数据均衡。两轮每个类别的的数据增加量如下图。

    训练时分别使用两个扩充的数据集训练。

                            image.png

模型选择

    本次比赛分别尝试了ResNet系列和efficientnet系列,参考了下图,

    最后直接选择了参数量最大的efficientnet-b7。

                    image.png 


其他工作

    优化器:训练全程采用ranger优化器,使用L2正则化。

    损失函数:使用了标签平滑(LabelSmoothingCrossEntropy)

    学习率策略:使用ReduceLROnPlateau,两个epoch验证集准确度没有上升就减小学习率。

模型训练

        训练分两部分,图片输入尺寸为(224,224)

        第一阶段:使用数据处理部分第一轮添加的数据,9:1划分,只训练最后一层网络参数,10个epoch。

        第二阶段:在第一阶段模型基础上继续训练,使用数据处理部分第二轮添加的数据,9.6:0.4划分,训练最后一层网络参数10个epoch后,训练全部参数25个epoch。

未来展望

        在efficientnet网络中添加cbam注意力机制。

        使用学习率余弦退火等方法。

        增大图片输入尺寸。

模型性能

        单模型,测试集acc98.4%。

参考:

        模型选择出图片来源:https://github.com/lukemelas/EfficientNet-PyTorch

回复 (1)

2020/6/11 17:09

感谢分享

上划加载中
标签
您还可以添加5个标签
  • 没有搜索到和“关键字”相关的标签
  • 云产品
  • 解决方案
  • 技术领域
  • 通用技术
  • 平台功能
取消

liecoding

角色:成员

话题:2

发消息
发表于2020年05月12日 13:44:38 16681
直达本楼层的链接
楼主
正序浏览 只看该作者
[参赛经验分享] 【开发者高校青年班】华为云开发者AI青年班黑客松大赛——参赛方案分享

比赛简介

        大赛提供5000张图片,10分类问题。

        本次主要在数据,网络模型和优化器做优化,数据量较小,主要工作是在防止过拟合。

数据处理:

1.数据增强

  • 随机水平翻转  RandomHorizontalFlip

  • 随机仿射变换       RandomAffine

2.数据扩充

    大赛提供了5000张数据进行训练,数据量较小。

    在网上爬取了4946张图片,爬取的数据集链接:

        链接:https://pan.baidu.com/s/1MbKgC3JP1EA5TbQUdl53xw 

        提取码:97qy

    爬取的数据有很多脏数据,做了两轮简单的数据清洗后扩充数据集。

    给易混淆的类别多扩充一些数据,同时考虑数据均衡。两轮每个类别的的数据增加量如下图。

    训练时分别使用两个扩充的数据集训练。

                            image.png

模型选择

    本次比赛分别尝试了ResNet系列和efficientnet系列,参考了下图,

    最后直接选择了参数量最大的efficientnet-b7。

                    image.png 


其他工作

    优化器:训练全程采用ranger优化器,使用L2正则化。

    损失函数:使用了标签平滑(LabelSmoothingCrossEntropy)

    学习率策略:使用ReduceLROnPlateau,两个epoch验证集准确度没有上升就减小学习率。

模型训练

        训练分两部分,图片输入尺寸为(224,224)

        第一阶段:使用数据处理部分第一轮添加的数据,9:1划分,只训练最后一层网络参数,10个epoch。

        第二阶段:在第一阶段模型基础上继续训练,使用数据处理部分第二轮添加的数据,9.6:0.4划分,训练最后一层网络参数10个epoch后,训练全部参数25个epoch。

未来展望

        在efficientnet网络中添加cbam注意力机制。

        使用学习率余弦退火等方法。

        增大图片输入尺寸。

模型性能

        单模型,测试集acc98.4%。

参考:

        模型选择出图片来源:https://github.com/lukemelas/EfficientNet-PyTorch

点赞2 举报
分享

分享文章到朋友圈

分享文章到微博

l番薯加奶

角色:成员

话题:1

发消息
发表于2020年06月11日 17:09:29
直达本楼层的链接
沙发
只看该作者

感谢分享

点赞 评论 引用 举报

游客

您需要登录后才可以回帖 登录 | 立即注册