MHIST は、Minimalist Histopathology image Analysis dataset の略で、バイナリ分類画像データセットです。このデータ セットには 3,152 枚の固定サイズの結腸直腸ポリープ画像が含まれており、各画像のゴールド スタンダード アノテーションは 7 人の消化器病理学者の多数決によって決定されました。 MHIST には、各画像に対するアノテーターの同意も含まれています。このデータセットは最小限のデータセットなので、占有するディスク容量は 400 MB 未満です。 ResNet-18 ベースラインは、3.5 GB のメモリを使用する NVIDIA RTX 3090 上でわずか 6 分で MHIST に収束するようにトレーニングします。
ユースケースとして、研究者は MHIST を使用して、データセットのサイズ、ネットワークの深さ、転移学習、高度に発散するインスタンスがモデルのパフォーマンスにどのように影響するかなど、病理組織画像分類で生じる自然な問題を研究しました。