2ヶ月前
ScanNet: 室内シーンの豊富にアノテーションされた3D再構築
Angela Dai; Angel X. Chang; Manolis Savva; Maciej Halber; Thomas Funkhouser; Matthias Nießner

要約
監督付き深層学習手法を活用するための重要な要件は、大量のラベル付きデータセットの可用性です。しかしながら、RGB-Dシーン理解の文脈においては、利用可能なデータが非常に少ないという問題があります。現在のデータセットは、限られた範囲のシーンビューしかカバーしておらず、意味的な注釈も限定的です。この課題に対処するために、我々はScanNetを導入します。これは、3Dカメラポーズ、表面再構成、および意味セグメンテーションでアノテーションされた1513つのシーンに含まれる250万ビューを含むRGB-Dビデオデータセットです。このデータを収集するために、自動表面再構成とクラウドソーシングによる意味アノテーションを含む使いやすくスケーラブルなRGB-Dキャプチャシステムを設計しました。本研究では、このデータを使用することで3Dオブジェクト分類、意味ボクセルラベリング、CADモデル検索などの複数の3Dシーン理解タスクで最先端の性能が達成できることを示しています。データセットはhttp://www.scan-net.orgで無料で提供されています。