インスタンス セグメンテーションは、画像内の個々のオブジェクトを識別してセグメント化するコンピューター ビジョン技術です。セマンティクス (道路、空、人物など) に基づいてピクセルをグループ化するセマンティック セグメンテーションとは異なり、インスタンス セグメンテーションは、同じオブジェクト クラスの複数のオブジェクトを区別します。
インスタンスのセグメンテーションには、オブジェクト検出とセマンティック セグメンテーションという 2 つの主要な手順が含まれます。
オブジェクト検出ステップでは、モデルを使用して画像内のすべてのオブジェクトの境界ボックスを識別します。
セマンティック セグメンテーションのステップでは、各境界ボックス内の各ピクセルがいくつかのカテゴリの 1 つに分類されます。最後に、各オブジェクトの輪郭に合わせて境界ボックスが調整されます。
インスタンスのセグメンテーションには、画像内の個々のオブジェクトの識別と描画が含まれ、4 つの課題があります。
課題の 1 つは、特にオブジェクトが近接して配置されている場合や複雑な形状をしている場合に、オブジェクトの境界を正確に描写することです。
もう 1 つの課題は、オブジェクトが部分的に互いに重なり合ったり、ビューから隠れたりするオクルージョン インスタンスに対処することです。画像内のさまざまなオブジェクトのスケールやサイズを処理することも課題です。
さらに、インスタンスのセグメンテーションには、ピクセルレベルの予測と高解像度の特徴マップが必要なため、大量のコンピューティング リソースが必要になります。
最後に、大規模なインスタンス セグメンテーション データセットの収集と注釈付けには時間と費用がかかり、正確なモデルを開発するためのトレーニング データの利用が制限される可能性があります。
インスタンスのセグメンテーションはさまざまな分野に応用できます。
さらに、オブジェクトのカウント、インスタンスレベルの画像編集、拡張現実などのコンピューター ビジョン タスクにも使用できるため、さまざまな分野での視覚的な理解とユーザー エクスペリエンスが向上します。