
口腔潰瘍分野におけるコンピュータ支援診断の発展は遅れてきた。その主な理由の一つは、公に利用可能なデータセットが不足していることにある。しかし、口腔潰瘍は悪性腫瘍を引き起こす可能性があり、致死率も高い。早期に迅速かつ効果的に口腔潰瘍を認識する能力は、極めて重要な課題である。近年、少数の研究者がこの分野に取り組んでいるものの、その多くはデータセットを非公開としている。このような課題に対処するため、本論文では、病変領域のセグメンテーションと分類という2つの主要なタスクを含む、マルチタスク型口腔潰瘍データセット「Autooral」を提案し、公開した。筆者らの知る限り、本研究がマルチタスク型の口腔潰瘍データセットを初めて公に提供した最初のチームである。さらに、口腔潰瘍病変領域のセグメンテーションを目的として、新しいモデルフレームワーク「HF-UNet」を提案する。具体的には、高次注意力を用いてグローバルな特徴を獲得するとともに、局所的な特徴を強調する「高次フォーカス相互作用モジュール(HFblock)」を導入した。また、病変の局在化を高めるために、新しいハイブリッドソーベルフィルタを採用した「病変局在化モジュール(LL-M)」を提案している。提案したAutooralデータセットを用いた実験結果から、HF-UNetによる口腔潰瘍セグメンテーションはDSC値約0.80を達成し、推論時のメモリ使用量はわずか2029MBにとどまる。本手法は、高いセグメンテーション性能を維持しつつ、低負荷の実行を実現している。本研究で提案したAutooralデータセットおよびコードは、https://github.com/wurenkai/HF-UNet-and-Autooral-dataset から公開されている。