6ヶ月前

セマンティックセグメンテーション

畳み込みニューラルネットワーク

アプローチ／フレームワーク

コンピュータビジョン

Kashu Yamazaki Taisei Hanyu Minh Tran Adrian de Luis Roy McCann Haitao Liao Chase Rainwater Meredith Adkins Jackson Cothren Ngan Le

概要

航空画像セグメンテーションは、上から見た視点におけるセマンティックセグメンテーションであり、前景と背景の分布に著しい不均衡、複雑な背景、クラス内異質性、クラス間同質性、および微小な物体といった幾つかの課題を有しています。これらの問題に対処するため、我々はTransformerの利点を活かしつつ、圧縮パス（contracting path）にTransformerを、拡張パス（expanding path）に軽量なマルチディレイド畳み込みニューラルネットワーク（MD-CNN）を統合する手法であるAerialFormerを提案します。AerialFormerは階層構造として設計されており、Transformerエンコーダがマルチスケール特徴を出力し、MD-CNNデコーダがこれらのマルチスケール情報から情報を統合します。これにより、局所的およびグローバルな文脈を両方考慮することで、強力な表現力と高解像度のセグメンテーションを実現します。我々は、iSAID、LoveDA、Potsdamの3つの代表的なデータセットにおいてAerialFormerのベンチマーク評価を行いました。包括的な実験および広範なアブレーションスタディの結果、提案手法のAerialFormerは従来の最先端手法を顕著に上回る性能を達成しました。本研究のソースコードは、論文の受容後、公開予定です。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

セマンティックセグメンテーション

畳み込みニューラルネットワーク

アプローチ／フレームワーク

コンピュータビジョン

Kashu Yamazaki Taisei Hanyu Minh Tran Adrian de Luis Roy McCann Haitao Liao Chase Rainwater Meredith Adkins Jackson Cothren Ngan Le

概要

航空画像セグメンテーションは、上から見た視点におけるセマンティックセグメンテーションであり、前景と背景の分布に著しい不均衡、複雑な背景、クラス内異質性、クラス間同質性、および微小な物体といった幾つかの課題を有しています。これらの問題に対処するため、我々はTransformerの利点を活かしつつ、圧縮パス（contracting path）にTransformerを、拡張パス（expanding path）に軽量なマルチディレイド畳み込みニューラルネットワーク（MD-CNN）を統合する手法であるAerialFormerを提案します。AerialFormerは階層構造として設計されており、Transformerエンコーダがマルチスケール特徴を出力し、MD-CNNデコーダがこれらのマルチスケール情報から情報を統合します。これにより、局所的およびグローバルな文脈を両方考慮することで、強力な表現力と高解像度のセグメンテーションを実現します。我々は、iSAID、LoveDA、Potsdamの3つの代表的なデータセットにおいてAerialFormerのベンチマーク評価を行いました。包括的な実験および広範なアブレーションスタディの結果、提案手法のAerialFormerは従来の最先端手法を顕著に上回る性能を達成しました。本研究のソースコードは、論文の受容後、公開予定です。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

AerialFormer：航空画像セグメンテーションのためのマルチ解像度Transformer | 記事 | HyperAI超神経