多重インスタンス学習

複数インスタンス学習(Multiple Instance Learning: MIL)は、教師あり学習の一種で、訓練データがバッグと呼ばれる単位に組織化されます。各バッグには、複数のインスタンス $X=\{x_1,x_2,\ldots,x_M\}$ が含まれ、各バッグには単一のラベル $Y \in \{0, 1\}$ が付与されます。このアルゴリズムでは、各インスタンスに独自のラベル $y_1, y_2, \ldots, y_M$ があると仮定されますが、訓練プロセス中にはこれらのラベルは未知です。 標準的な複数インスタンス学習の仮定は、バッグ内のすべてのインスタンスが負の場合、そのバッグも負である;一方、バッグ内に少なくとも1つの正のインスタンスが存在する場合、そのバッグは正である、というものです。このアルゴリズムは、複雑なデータ構造を処理する上で大きな利点があり、特に医療画像分類などの分野で有用です。

多重インスタンス学習 | SOTA | HyperAI超神経