都市問題、産業安全、農業健康、屋内シナリオなどを網羅したリモートセンシングターゲット検出データセットのコレクション。

人工知能とリモートセンシング技術の深い統合により、リモートセンシングターゲット検出は、コンピュータービジョンの分野で最もダイナミックな研究方向の 1 つになりつつあります。特に衛星画像やドローンによる空撮を駆使した物体検出技術は、自然風景における人、車両、建物の識別だけでなく、複雑な地理的環境における土砂崩れや農作物の正確な検出も可能にします。物体検出は、世界を見通す「機械の目」を提供し、人類が初めて地球をほぼリアルタイムで包括的かつ詳細に観測することを可能にしたと言えるでしょう。
ハードウェア面では、ドローンやリモートセンシング衛星のセンサー解像度は物理的な限界に近づいていますが、膨大で複雑なデータから貴重なターゲット情報をどのように抽出するかは、効率的なアルゴリズムの最適化にますます依存するようになっています。リモートセンシング画像には、解像度の大きな差、対象スケールの劇的な変化、複雑な背景といった特徴がしばしば見られます。つまり、データの品質は、対象検出モデルが「存在の有無の識別」から「正確な位置特定と複数カテゴリの分類」へと移行できるかどうかを直接左右するのです。
データセットの構築は、ターゲット検出の実用化を促進するための核心です。自然風景データと比較して、リモートセンシングおよびターゲット検出データセットは、広い範囲をカバーし、強力な時空間ダイナミクスを特徴としており、短時間で大規模かつ高解像度の地理情報を取得できます。科学的なデータ収集プロセスでは、地域的な範囲と時間枠を合理的に計画し、トレーニング セット、検証セット、テスト セットの分割を厳密に制御して、モデルが十分な一般化機能を備えていることを保証する必要があります。
一般的に、高品質な物体検出とリモートセンシングデータセットへの社会の注目は高まり続けています。このため、HyperAIは、現在学界と産業界で人気のあるデータセットを多数まとめています。医療用画像、都市問題、屋内シーン、農業病害、産業安全など、複数の分野をカバーしています。これらのデータセットは、研究者やエンジニアにとって重要なツールであるだけでなく、テクノロジーを実際のアプリケーションに向けて推進するための強力なエンジンでもあります。
クリックすると、さらにオープン ソース データセットが表示されます。
リモートセンシングターゲット検出データセットの概要
推定サイズ:19.84 GB
ダウンロードアドレス:https://go.hyper.ai/eyG9q
InteriorGS は、幾何学的完全性、セマンティック注釈、空間インタラクション機能に関して既存の屋内シーン データセットの制限を克服するように設計された 3D 屋内シーン データセットです。
このデータセットは、高品質な3Dガウス散乱(3DGS)表現に加え、インスタンスレベルのセマンティックバウンディングボックスと、エージェントがアクセス可能なエリアを示す占有マップを提供します。データセットには、住宅、コンビニエンスストア、結婚式場、美術館など、80種類以上の環境タイプを網羅した1,000点の高品質な屋内シーンとそれに対応するフロアプランが含まれています。さらに、755のオブジェクトカテゴリにわたる554,000点以上のオブジェクトインスタンスが含まれています。
2. Landslide4Sense 地すべりリモートセンシングベンチマーク
推定サイズ:2.84GB
ダウンロードアドレス:https://go.hyper.ai/mIdeN
Landslide4Sense は、2022 年に IARAI によってリリースされた、地滑り検出用のマルチソース衛星リモートセンシング ベンチマーク データセットであり、Landslide4Sense コンペティションの公式データセットとして機能します。
このデータセットは、2015年から2021年にかけて複数の地域で発生した土砂崩れの現場を収録しています。データセットは128×128の画像ブロックで構成され、解像度は約10m/ピクセルで、各サンプルは14バンドで構成されています。データはトレーニングセット、検証セット、テストセットに分かれており、それぞれ3,799、245、800のサンプルが含まれています。また、ピクセルレベルのバイナリマスク(土砂崩れあり = 1、土砂崩れなし = 0)も提供されています。公開ラベルはトレーニングセットのみに提供され、検証セットとテストセットはランキング評価に使用されます。
推定サイズ:2.1GB
ダウンロードアドレス:https://go.hyper.ai/Odzam
VisDroneは、天津大学のAISKYEYEチームが公開した、ドローンによる視覚的ターゲット検出および追跡のための大規模ベンチマークデータセットです。ターゲット検出、オブジェクト追跡、画像セグメンテーションといったコンピュータービジョンタスクの開発と評価を支援することを目的としています。
このデータセットには、中国の様々な都市の都市部および郊外環境でドローンによって収集された高解像度の画像と動画が含まれており、6つのカテゴリ(人、車両、建物、動物など)をカバーしています。データは、異なる照明条件、角度、動きのパターンで撮影されており、YOLO形式で詳細な画像データとラベルが提供されています。
推定サイズ:1.99GB
ダウンロードアドレス:https://go.hyper.ai/exltg
Crops Disease は、さまざまな作物の病気を自動的に検出して分類するためのコンピューター ビジョン モデルの開発を支援するために設計された、農作物の病気画像データセットです。
このデータセットには、さまざまな作物(トウモロコシ、トマト、ジャガイモなど)によく見られる病気を網羅した約 1,300 枚の農作物病気画像が含まれており、各画像には特定の病気のカテゴリとしてラベルが付けられています。
安全ベスト検出データセット
推定サイズ:408.58 MB
ダウンロードアドレス:https://go.hyper.ai/ahI1u
Safety Vests Detection は、新しいオブジェクト検出アーキテクチャ (YOLOv8、Faster-RCNN、SSD など)、関連する PPE 検出タスク (ヘルメット、手袋、ゴーグル) の転移学習、エッジ展開型安全モニターのプロトタイプ開発をベンチマークするために設計された安全ベスト検出データセットであり、安全ベストを着用している人を自動的に識別および検出し、職場の安全性を向上させるモデルの開発とトレーニングに役立ちます。
データセットには、3,897 枚の高解像度写真 (安全ベストを着用した作業員と着用していない作業員を表示)、境界ボックスの注釈 (安全ベスト着用、安全ベスト着用なし)、および画像コンテキスト (屋内の作業場、屋外の建設現場、さまざまな照明条件、遮蔽、複数の視点) が含まれています。
ダウンロードアドレス:https://go.hyper.ai/p7As2
このデータセットは、骨折の検出と分類のタスクをサポートすることを目的とした、2024 年にアメリカン国際大学バングラデシュ校によってリリースされた医療画像データセットです。
このデータセットには、肘、指、前腕、上腕骨、肩、大腿骨、脛骨、膝、股関節、手首、脊椎、および選択された健康な骨のX線画像とMRI画像が含まれています。データセットは最初に641枚のオリジナル画像を収集し、449枚のトレーニングセット、128枚の検証セット、64枚のテストセットに分割しました。すべての画像は自動的に方向調整され、サイズ(640×640)が変更され、コントラストが強調されました。トレーニングセットに基づいて、反転、回転、拡大縮小、せん断、明るさと彩度の変更などの強調手法をさらに適用し、約1,347枚の拡張サンプルを生成しました。最終的なデータセットには1,539枚の画像が含まれています。
ダウンロードアドレス:https://go.hyper.ai/VqriU
Urban Issuesは、自動ビジョンシステムやマシンビジョンシステムが都市環境における公共インフラや環境問題を識別できるように設計された、公開画像分類データセットです。このデータセットには、損傷した道路、道路の穴、違法駐車など、10のカテゴリが含まれています。
このデータセットの画像はカテゴリ別に保存され、YOLO形式でアノテーションが付与・整理されています。画像分類モデルや物体検出モデルの学習・評価に適しており、特にスマートシティのインフラ監視、公共環境の維持管理、道路状況の検出、都市ガバナンスといったアプリケーションにおいて有用です。
ダウンロードアドレス:https://go.hyper.ai/C0DhD
New Plant Diseases は、植物病害の特定と葉の分類研究のために 2018 年にリリースされた画像データセットです。
このデータセットには、健康な葉から様々な病害まで、38のカテゴリーに分類された約87,000枚のRGB画像が含まれています。画像はカテゴリー別にトレーニングセット(80%)と検証セット(20%)に整理されています。また、モデルのパフォーマンス評価用に、33枚のテストセットも提供されています。このデータセットは、機械学習およびディープラーニングモデルの開発と評価に広く適用可能であり、特に作物の健康状態監視、病害識別、精密農業モデル、学術研究などにおいて、貴重なベンチマークを提供します。
上記は今号のおすすめデータセットのまとめです。ぜひワンクリックでダウンロードしてくださいね~
HyperAIについて Hyper.ai
HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。
* 1,200 を超える公開データセットに対して国内の高速ダウンロード ノードを提供
* 300 以上の古典的で人気のあるオンライン チュートリアルが含まれています
* 200 以上の AI4Science 論文ケースを解釈
* 500 以上の関連用語クエリをサポート
*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします
学習の旅を始めるには、公式 Web サイトにアクセスしてください。