
要約
本論文では、タイトなバウンディングボックス注釈を採用した弱教師付き画像セグメンテーション手法について述べています。本手法は、バウンディングボックスのタイトさの事前情報をエンドツーエンドで深層ニューラルネットワークに統合するために、一般化された多重インスタンス学習(MIL)と平滑最大値近似を提案しています。一般化されたMILにおいては、正のバッグが異なる角度を持つ平行交差線によって定義され、負のバッグは任意のバウンディングボックスの外にある個々のピクセルとして定義されます。平滑最大値近似の2つの変種である$\alpha$-ソフトマックス関数と$\alpha$-準最大関数が、バッグ予測の最大値関数によって引き起こされる数値不安定性を克服するために利用されています。提案手法はDice係数を使用して2つの公開医療データセット上で評価されました。結果は、本手法が最先端の方法よりも優れていることを示しています。コードは\url{https://github.com/wangjuan313/wsis-boundingbox}から入手可能です。