
要約
私たちは、セマンティックセグメンテーションとインスタンスセグメンテーションを同時に実行する弱教師付きモデルを提案します。これらのタスクのピクセル単位のアノテーションを取得する際の高コストを考えると、これは特に重要な問題です。一般的なオブジェクト検出器に基づく多くのポピュラーなインスタンスセグメンテーション手法とは異なり、当社の手法では重複するインスタンスを予測しません。さらに、「もの」クラスと「質感」クラスの両方をセグメント化でき、画像内のすべてのピクセルを説明することが可能です。「もの」クラスはバウンディングボックスで弱教師付きにされ、「質感」クラスは画像レベルのタグで弱教師付きにされます。Pascal VOCにおいて、完全教師付きおよび弱教師付き(完全教師付き性能の約95%)の両方で最先端の結果を得ています。また、Cityscapesにおけるセマンティックセグメンテーションとインスタンスセグメンテーションの最初の弱教師付き結果も示しています。最後に、当社の弱教師付きフレームワークを使用して、アノテーション品質と予測性能との関係を分析し、データセット作成者にとって興味深い結果を得ています。注:「thing」クラスと「stuff」クラスは日本語では一般的に「もの」クラスと「質感」クラスとして訳されます。ただし、「stuff」は文脈によって異なる解釈が可能なため、必要に応じて原文を括弧内に記載しました(例:「質感(stuff)」)。