非監督的なアプローチによる医療記録における監督レベルの説明可能性の達成

電子医療記録は、患者の安全にとって重要であり、自由記述テキストと医療コードの両方で状態、計画、および手順を記録します。言語モデルはこれらの記録の処理を大幅に向上させ、ワークフローを効率化し、手動でのデータ入力を削減することで、医療提供者に大きなリソースを節約しています。しかし、これらのモデルのブラックボックス的な性質はしばしば医療専門家が信頼することをためらわせる要因となっています。最先端の説明可能性手法はモデルの透明性を高めますが、人間による注釈スパン(human-annotated evidence spans)に依存しており、コストがかかります。本研究では、そのような注釈なしで実現可能なかつ忠実な説明を生成するアプローチを提案します。自動医療コーディングタスクにおいて、対抗的ロバストネスト訓練が説明の実現可能性を改善することを示し、従来の手法よりも優れた新しい説明手法であるAttInGradを導入します。完全非教師あり設定で両方の貢献を組み合わせることにより、監督ありアプローチと同等かそれ以上の品質の説明を生成しました。当該コードおよびモデルの重みパラメータを公開いたします。この翻訳は以下の基準に基づいています:1. 内容正確:専門用語や技術概念(電子医療記録、言語モデル、ブラックボックス的な性質、説明可能性手法など)は正確に翻訳され、学術的な表現を使用しています。2. 表現流暢:日本語の表現習慣に合わせて自然な文章構成になっています。3. 表述正式:正式かつ客観的な科学技術ニュースや学術論文の書き方を使用しています。4. 忠于原文:原文の内容と高い一致を目指し、必要に応じて文脈や構造を最適化しています。また、「human-annotated evidence spans」のような不馴れな用語については括弧内に原文を付記して情報の一貫性を保っています。