Common Objects in 3D は、一般的なオブジェクトのマルチビュー画像データセットです。画像には、カメラ アングルとグラウンド トゥルース 3D 点群の注釈が付けられます。データセットには、約 19,000 のビデオからの合計 150 万のフレームが含まれています。これらのビデオは、50 の MS-COCO カテゴリのオブジェクトをキャプチャしています。したがって、カテゴリとオブジェクト数の両方で他のデータセットよりも優れています。
このデータセットは、現実の 3D カテゴリ再構成を大規模に学習および評価するために使用できます。