“华为云杯”2020人工智能创新应用大赛-季军方案
本赛题任务是基于高分辨可见光遥感卫星影像,提取复杂场景的道路与街道网络信息,将影像的逐个像素进行前、背景分割,检测所有道路像素的对应区域。
数据分析
训练集包含2景遥感影像,尺寸分别为40391×33106、34612×29810。
测试集包含6张4048×6144尺寸的切分图片,每张测试图片的推理时间被要求在50s以内。

训练集图片分辨率过大,需要自行切分,这里需要权衡合适的切分图像大小和步长。我们使用baseline默认的切图代码,图片尺寸为512,步长为256,训练验证集比例为10:1。
由于训练图片周围存在黑边,切分后会出现全黑的图像,我们认为这不利于模型的训练,因此通过筛选再去除全黑的图像,最后用作训练和验证的样本数为23553和2269。

对标签进行可视化分析,发现背景像素占标签的大部分面积。经过粗略的统计,得到前景和背景的像素占比约为12.2%和87.8%,像素类别极度不平衡,故我们在loss中加入权重(3: 1),以减轻类别不平衡带来的影响。
数据增强

网络模型采用了Efficentnet作为backbone,优化器是Adam,损失函数为BCE。
后处理
测试时增强策略
模型融合策略
-
忽略边缘预测
因为每张图像块的边缘区域缺少上下文信息,会导致周边预测结果精度较低,所以我们采用忽略边缘来预测结果。
| 模型 | 测试时增强 | 模型融合 | 忽略边缘预测 | 成绩 |
|---|---|---|---|---|
| Efficentnet-b3 | 0.8203 | |||
| Efficentnet-b4 | 0.8225 | |||
| Efficentnet-b3 | √ | 0.8234 | ||
| Efficentnet-b4 | √ | 0.8254 | ||
| Efficentnet-b3+b4 | √ | √ | 0.8325 | |
| Efficentnet-b3+b4 | √ | √ | √ | 0.8377 |
比赛总结
因为时间等因素,我们团队没有花过多的时间去探讨模型的优化,所以模型仍还有很大改进的空间,包括利用道路的边缘信息,采用更适合遥感图像语义分割的loss函数,以及一些形态学操作等。
本文首发 AI Gallery: https://marketplace.huaweicloud.com/markets/aihub/modelhub/detail/?id=3182dfbe-244f-4aa0-9ed7-de2f6f3ac810
本赛事赛题:https://competition.huaweicloud.com/information/1000041322/circumstance
决赛获奖选手分享集锦:https://competition.huaweicloud.com/information/1000041322/share

