CRAS-YOLO：多类别船舶检测与分类模型

点击蓝字关注我们

关注并星标

从此不迷路

计算机视觉研究院

公众号ID｜计算机视觉研究院

学习群｜扫码在主页获取加入方式

计算机视觉研究院专栏

Column of Computer Vision Institute

目前，基于卫星图像的多类别船舶检测和分类由于在军事和民用领域的重要应用而备受关注。

01

前景概要

在今天分享中，我们团队在FUSAR船舶数据集和SimpleCopyPaste方法的基础上生成了一个新的Artificial-SAR-Vessel数据集中。我们进一步提出了一种新的多类船检测，称为CRAS-YOLO，它由卷积块注意力模块（CBAM）、感受野块（RFB）和基于YOLOv5s的自适应空间特征融合（ASFF）组成。CRAS-YOLO改进了基于路径聚合网络（PANet）的特征金字塔网络，该网络集成了RFB特征增强模块和ASFF特征融合策略，以获得更丰富的特征信息，并实现多尺度特征的自适应融合。同时，在骨干中增加了CBAM，以准确定位船只位置，提高检测能力。

结果证实，CRAS-YOLO模型的准确度、召回率和平均准确度（mAP）（0.5）分别高达90.4%、88.6%和92.1%。所提出的模型在另一个Sar船舶检测（SSDD）数据集中的精度、召回率和mAP得分分别高达97.3%、95.5%和98.7%，也优于先前的研究结果。

02

项目背景

如今，深度学习已经突破了传统目标检测算法的瓶颈，成为检测的主流算法。深度学习方法不需要在SAR图像中分离海洋和陆地，只需要通过标记的数据集进行训练，在目标检测方面具有很大的优势。目前流行的目标检测算法有两种类型。一种是基于区域推荐的两阶段目标检测算法，其中代表性的方法有基于区域的卷积神经网络（R-CNN）、Fast R-CNN和Faster R-CNN。其主要思想是利用选择性搜索方法来生成建议区域，然后在建议区域中进行回归分类。另一种是一阶段目标检测算法，它将检测问题简化为回归问题，只需要卷积神经网络就可以直接获得目标的类概率和位置坐标。代表性算法包括YOLO、SSD、Retina-Net等。YOLO系列算法通常比其他算法更快，对小目标检测效果良好。它们是经典的一阶段检测方法，通常比其他算法具有更快的识别速度，并且在小目标检测中表现出优异的检测能力。

迄今为止公开发布的上述SAR船舶探测数据集大多只包含船舶位置数据，缺乏船舶类别数据。同时，唯一一个名为SRSDD的公共多类别船舶检测数据集存在严重的类别不平衡问题，严重影响了船舶检测的准确性。因此，我们在研究中，基于FusarShip数据集和HAISI-1卫星拍摄的海面远程合成孔径雷达（SAR）图像的组合，生成了一个新的数据集，称为Artificial-SAR-Vessel据集。创新性地将SimpleCopyPaste方法引入到数据集的构建中，希望对SAR船舶检测数据集进行补充，为船舶检测数据缺乏的问题提供新的解决方案。

03

新研究框架介绍

我们研究的CRAS-YOLO是为了在给定SAR图像的情况下，在精确定位船只位置和提高检测能力方面提供高性能而形成的。下图中的流程图显示了所提出的CRAS-YOLO是如何开发的。

首先，生成了Artificial-SAR-Vessel数据集。其次，通过在YOLOv5s网络中添加CBAM、RFB和ASFF，形成了所提出的CRAS-YOLO模型。接下来，给出了性能度量，以评估所提出的模型与其他模型相比的性能。最后，将所开发的CRAS-YOLO模型应用于基于卫星图像的船舶探测。

在我们的研究中，提出的CRAS-YOLO船舶检测和分类模型基于YOLOv5s，通过在PANet（RA PANet）中添加RFB和ASFF来改进FPN，以获得更丰富的特征信息，并实现多尺度特征的自适应融合。拟议的CRAS-YOLO还将CBAM集成到网络的颈部。CRAS-YOLO的完整网络结构如下图所示。

注意机制主要包括空间注意和渠道注意。SE和ECA是渠道关注机制的代表。CA是空间注意机制的代表。CBAM融合了通道和空间注意力机制，具有良好的性能。我们将CBAM插入颈部结构中，以实现更有效的特征提取。从下图中，CBAM通过通道模块和空间模块提取特征信息，并使用串行结构融合特征信息。

从下图中，首先，输入特征图通过通道模块生成通道权重，并将获得的权重与输入相乘以生成通道图。接下来，将通道特征图导入空间模块以生成空间权重，并将权重与导入的特征图相乘以生成空间图。最后，将最终的加权特征图和原始输入逐元素相加，得到最终的输出结果，详细的CBAM结构如图所示。

浅层滤波器提取的特征包含更具体的特征信息。因此，我们在浅层集成了CBAM，以从浅层特征图中学习和选择重要特征，提高船舶的定量性能。

SAR图像特征图的可视化。（a）通过滤波器从RA PANet的骨干网络中提取的特征图的可视化。（b）从浅层到深层的小型船舶特征图的可视化。

RFB特征增强模块网络结构

ASFF网络结构

04

实验及可视化

CRAS-YOLO与其他模型的实验结果比较

基于CRAS-YOLO模型的船舶检测结果：上面三张分别是复杂海岸背景下的船舶测试结果，下面三张分别是深海中稀疏分布的船舶测试成果。

© THE END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入！

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域，主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架，提供论文一键下载，并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！

往期推荐

🔗

CVPR2023：零样本通用分割框架（附源代码）
改进的检测算法：用于高分辨率光学遥感图像目标检测
小米平板6 Max-Yolo：在便携终端上实时检测不再是难题
机场项目：解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题
 旋转角度目标检测的重要性！！！（附源论文下载）
PE-YOLO：解决黑夜中的目标检测难点
YOLO-S：小目标检测的轻量级、精确的类YOLO网络
EdgeYOLO：边缘设备上实时运行的目标检测器及Pytorch实现
Q-YOLO：用于实时目标检测的高效推理
Yolo算法的演进—YoloCS有效降低特征图空间复杂度（附论文下载）
InternImage：探索具有可变形卷积的大规模视觉基础模型
首个全量化Vision Transformer的方法FQ-ViT，AI大模型落地不远了！
YoloV8与ChatGPT互通，这功能是真的强大！
GPT理解的CV：基于Yolov5的半监督目标检测
Consistent-Teacher：半监督目标检测超强SOTA

自动化配置ssh互信

在运维工作中，经常需要配置互信(免密登录)，在这里就不介绍互信的原理了，如果需要配置的节点数不是很多(2个以内)，完全可以手动配置。如果数量很多的话，我们就需要自动配置了。在这里，用于配置机器之间的SSH互信脚本是(sshUserSetup.sh)，它存在在于Oracle的GRI
Spark Core 解析：RDD

引言 Spark Core是Spark的核心部分，是Spark SQL，Spark Streaming，Spark MLlib等等其他模块的基础, Spark Core提供了开发分布式应用的脚手架，使得其他模块或应用的开发者不必关心复杂的分布式计算如何实现，只需使用Spar
leetcode ——只出现一次的数字

给定一个非空整数数组，除了某个元素只出现一次以外，其余每个元素均出现两次。找出那个只出现了一次的元素。说明：你的算法应该具有线性时间复杂度。你可以不使用额外空间来实现吗？示例 1: 输入: [2,2,1] 输出: 1
xml schema中的命名空间

1．名称空间名称空间是W3C推荐标准提供的一种统一命名XML文档中的元素和属性的机制。使用名称空间可以明确标识和组合XML文档中来自不同标记词汇表的元素和属性，避免了名称之间的冲突。
YOLO格式数据集（.txt）如何转换为VOC格式数据集（.xml）

前言：安装好python环境与编译器转换：将标注文件从文本格式（.txt）转换为 XML 格式（.xml）可以通过以下步骤完成：解析文本标注文件：打
60-思考题（5）-将1到9 这九个数字分成若干个数，满足一定的算式

题目：求出所有可能的以下形式的算式，每个算式中有九个数位，正好用尽1到9这九个数字。 ○×○○○=○×○○○○ (共有28种可能的组合) /*60.思考题(5) 求出所有可能的以下
netty设计模式-装饰器模式

装饰器模式被大量地使用在各种框架的源码里面，真正学会了对看源码和设计软件受益匪浅。 1、装饰者和被装饰者继承同一个接口 2、装饰者给被装饰者动态修改行为首先我们一生活中的例子来看一看装饰器模式：
深度学习第一步——Pytorch-Gpu环境配置：Win11/Win10+Cuda10.2+cuDNN8.5.0+Pytorch1.8.0(步步巨细，少走十年弯路）

博主已有：Pycharm+Anaconda 通过这篇博客你将获得：Cuda10.2+cuDNN11.x+Pytorch1.8.0(GPU) import torch pri
java开发即时通讯_使用Java开发桌面即时通讯程序遇到的问题

1. JPanel面板绘制背景图片问题。本项目中顶部标题栏即使用该方法设置背景。
php 6.0新特性,新版特性 | 序言 | Laravel 6 中文文档

新版特性由学院君创建于1年前, 最后更新于 1年前版本号 #2 17909 views 7 likes 2 collects Laravel 6.0(LTS 版本) 在 Laravel 5