当前位置:首页 > 公众号精选 > 雷达通信电子战
[导读]之前我们发布过《SAR图像船舶目标检测数据集SSDD》,需要英文原文的请给“雷达通信电子战”微信公众号发送“1010”查看,全文共41页。SSDD训练与测试集的划分标准SSDD的原论文采用了7:1:2的随机比例,将数据集划分为训练集、验证集和测试集。然而,这种随机划分机制将导致测...

之前我们发布过《SAR图像船舶目标检测数据集SSDD》,需要英文原文的请给“雷达通信电子战”微信公众号发送“1010”查看,全文共41页。
SSDD训练与测试集的划分标准



SSDD的原论文采用了7:1:2的随机比例,将数据集划分为训练集、验证集和测试集。然而,这种随机划分机制将导致测试集中样本的极大不确定性,导致使用同一检测算法进行多次训练和测试时,产生不同的结果。这是因为SSDD中的样本数量太少,只有1160个,随机划分可能会破坏训练集和测试集之间的分布一致性。
后来,一些研究人员也采用了其他比例进行训练、验证和测试,但这些不同的数据集划分将导致不统一的方法比较,不利于学术交流。事实上,计算机视觉领域的两个目标检测数据集(PACAL VOC和COCO),都提供了唯一确定的训练集、验证集和测试集,这可确保对比的公平性。
因此,这里对SSDD的训练集和测试集的划分做出了严格的规定。文件编号最后数字为1和9的图像被确定为测试集,其余的被视为训练集。该规则还可以保持训练集和测试集分布的一致性,有利于网络特征学习。
这里没有提供验证集,因为SSDD中的样本数量非常少,因此应该珍惜每个样本,以确保每个测试样本的训练梯度减小。然而,验证集不参与训练梯度下降,这将不可避免地导致船舶特征学习不足。当然,如果研究者想要监控模型在训练过程中是否被过度拟合,他们可以建立多个重叠的交叉验证集来达到目的。
近岸与远海目标划分标准



近岸图像中的陆地背景非常复杂,船舶容易受到港口设施的干扰。为了分别计算近岸和远海这两种情况下算法的性能,这里确定了测试集的近岸和远海图像(近岸图像在下图中以洋红色标记)。在232幅测试图像中,有186幅近海场景图像,而只有46幅近海场景图像。

HRSIDLS-SSDD-v1.0类似,这里将包含陆地的图像视为近岸样本,而将其他图像视为远海样本。近岸和远海样本的数量是极不平衡(分别是19.8%80.2%)的,这种现象与地球的海洋面积比陆地大得多这一事实相符。
然而,深度学习需要大量数据来学习特征,更多的数据可带来更好的学习效益。因此,近岸场景和远海场景之间样本数的不平衡将导致近岸场景和近岸场景之间模型学习表示能力的巨大不平衡。网络将仅擅长于检测许多简单的远海样本中的船。近岸船舶的检测性能将因训练样本少而差,而海上船舶的检测性能将因样本的增加而变得优异。学者在设计检测算法时应特别注意这一问题。

SSDD船舶目标尺寸定义标准



不同类型的船具有不同的尺寸,同一尺寸的船也会有不同的分辨率,这都会导致图像中像素总数的变化,多尺度船舶检测是一项具有挑战性的任务。但到目前为止,在SAR图像中还没有明确的定义哪些船舶是小型船舶,哪些船舶是大型船舶。一些学者认为小于40像素的船只是小型船只,但他们没有考虑到图像的实际分辨率。此外,仅仅根据像素数量来确定船舶的尺寸,这与计算机视觉界的共识不一致。
在SAR船舶检测领域,有人遵循COCO数据集的标准对船舶尺寸进行分类,即BBox<32X32的面积表示小型船舶,32X3296X96的面积表示大型船舶。

然而,该定义仅针对COCO数据集,在SSDD数据集上使用它会有问题,因为它与BBox的面积分布不匹配。因此,需要根据SSDD数据集指定船舶尺寸的定义,此外,还应根据不同的标签类型定义船舶尺寸。最后,根据统计结果,定义了船舶尺寸标准。 SSDD密集分布小尺寸样本标准



由于特征不明确,密集分布的小型船舶很难被检测。为了便于在此特定场景中进行性能评估,这里在测试集中指定了密集分布的小型船舶样本,如下图所示。在232张测试图像中,有10张图像密集分布着小型船舶,根据实际经验,001119.jpg中的船舶最难检测,研究人员可对此给予更多的关注。
密集分布的小船
对于这种困难的样本,这里提供了几种可能的解决方案:1.可以使用随机裁剪数据增强来增加小型船舶在整个图像中的比例。2.可以在深度网络的浅层检测小型船舶,特征损失低。3.可以将CFAR结合到深度网络中,因为CFAR对像素更敏感。4.可以结合视觉显著性理论生成显著性图来指导深度网络学习特征,因为这些小船在人眼观察中非常重要。5.可以设计一个深度网络来超分辨率重建小型船舶,这样,小型船舶的功能将更加丰富。
SSDD在港口密集排列的船舶样本标准



在港口密集排列的船舶也很难被发现。一方面,复杂的陆地背景会降低训练效率,因为训练过程中会产生大量的负样本。另一方面,由于SAR特殊的成像机制和有限的分辨率,并排停泊的船舶会产生船体重叠效应。为了便于在此特定场景中进行性能评估,我们在测试集中指定了港口船舶平行停泊的样本,如下图所示。
港口密集排列的船舶
此外,对于这种困难的样本,这里提供了几种可能的解决方案:1.可以使用注意机制来抑制陆地干扰,从而将注意力集中在船舶区域。2.可以使用分割掩模来辅助船舶检测。3.可以使用生成性对抗网络(GAN)生成此类场景的更多样本,以提高这些船舶的学习比例。4.可以使用软NMS后处理算法来避免漏检。

以上内容来自论文:SAR Ship Detection Dataset (SSDD) Official Release and Comprehensive Data Analysis,需要英文原文的请给“雷达通信电子战”微信公众号发送“1010”查看,全文共41页。


本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

9月2日消息,不造车的华为或将催生出更大的独角兽公司,随着阿维塔和赛力斯的入局,华为引望愈发显得引人瞩目。

关键字: 阿维塔 塞力斯 华为

加利福尼亚州圣克拉拉县2024年8月30日 /美通社/ -- 数字化转型技术解决方案公司Trianz今天宣布,该公司与Amazon Web Services (AWS)签订了...

关键字: AWS AN BSP 数字化

伦敦2024年8月29日 /美通社/ -- 英国汽车技术公司SODA.Auto推出其旗舰产品SODA V,这是全球首款涵盖汽车工程师从创意到认证的所有需求的工具,可用于创建软件定义汽车。 SODA V工具的开发耗时1.5...

关键字: 汽车 人工智能 智能驱动 BSP

北京2024年8月28日 /美通社/ -- 越来越多用户希望企业业务能7×24不间断运行,同时企业却面临越来越多业务中断的风险,如企业系统复杂性的增加,频繁的功能更新和发布等。如何确保业务连续性,提升韧性,成...

关键字: 亚马逊 解密 控制平面 BSP

8月30日消息,据媒体报道,腾讯和网易近期正在缩减他们对日本游戏市场的投资。

关键字: 腾讯 编码器 CPU

8月28日消息,今天上午,2024中国国际大数据产业博览会开幕式在贵阳举行,华为董事、质量流程IT总裁陶景文发表了演讲。

关键字: 华为 12nm EDA 半导体

8月28日消息,在2024中国国际大数据产业博览会上,华为常务董事、华为云CEO张平安发表演讲称,数字世界的话语权最终是由生态的繁荣决定的。

关键字: 华为 12nm 手机 卫星通信

要点: 有效应对环境变化,经营业绩稳中有升 落实提质增效举措,毛利润率延续升势 战略布局成效显著,战新业务引领增长 以科技创新为引领,提升企业核心竞争力 坚持高质量发展策略,塑强核心竞争优势...

关键字: 通信 BSP 电信运营商 数字经济

北京2024年8月27日 /美通社/ -- 8月21日,由中央广播电视总台与中国电影电视技术学会联合牵头组建的NVI技术创新联盟在BIRTV2024超高清全产业链发展研讨会上宣布正式成立。 活动现场 NVI技术创新联...

关键字: VI 传输协议 音频 BSP

北京2024年8月27日 /美通社/ -- 在8月23日举办的2024年长三角生态绿色一体化发展示范区联合招商会上,软通动力信息技术(集团)股份有限公司(以下简称"软通动力")与长三角投资(上海)有限...

关键字: BSP 信息技术
关闭
关闭