6 个月前

卷积神经网络

计算机视觉

Ivan Kitanovski Suzana Loshkovska Vlatko Spasev Ivica Dimitrovski

摘要

遥感影像的语义分割是遥感与计算机视觉领域中的基础性任务。其目标是生成图像的全像素级分割图，为每个像素分配一个特定类别标签，从而实现对地表特征的深入分析与理解。本文提出一种基于U-Net模型集成的方法，以提升语义分割性能。该方法采用三种不同主干网络——多轴视觉Transformer（Multi-Axis Vision Transformer）、ConvFormer与EfficientNet——构建U-Net模型的集成体系。最终的分割结果通过几何平均集成策略生成，充分利用各主干网络所学习到的多样化特征表示。所提出的基线U-Net模型及集成方法在多个常用于遥感影像语义分割任务的公开数据集上进行了评估，包括LandCover.ai、LoveDA、INRIA、UAVid以及ISPRS Potsdam数据集。实验结果表明，该方法在各项指标上均达到当前最优水平，充分验证了其在准确捕捉遥感影像中语义信息方面的有效性与鲁棒性。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

卷积神经网络

计算机视觉

Ivan Kitanovski Suzana Loshkovska Vlatko Spasev Ivica Dimitrovski

摘要

遥感影像的语义分割是遥感与计算机视觉领域中的基础性任务。其目标是生成图像的全像素级分割图，为每个像素分配一个特定类别标签，从而实现对地表特征的深入分析与理解。本文提出一种基于U-Net模型集成的方法，以提升语义分割性能。该方法采用三种不同主干网络——多轴视觉Transformer（Multi-Axis Vision Transformer）、ConvFormer与EfficientNet——构建U-Net模型的集成体系。最终的分割结果通过几何平均集成策略生成，充分利用各主干网络所学习到的多样化特征表示。所提出的基线U-Net模型及集成方法在多个常用于遥感影像语义分割任务的公开数据集上进行了评估，包括LandCover.ai、LoveDA、INRIA、UAVid以及ISPRS Potsdam数据集。实验结果表明，该方法在各项指标上均达到当前最优水平，充分验证了其在准确捕捉遥感影像中语义信息方面的有效性与鲁棒性。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供