ConvTextTM:テキスト分類のための説明可能な畳み込みTsetlinマシンフレームワーク

自然言語処理(NLP)分野における最近の進展により、GPT-3のような強力な言語モデルがさまざまなタスクにおいて人間を凌駕する性能を達成するようになり、業界全体が大きく変化している。しかし、こうしたモデルの複雑性が高まる一方で、その内部動作や意思決定プロセスの透明性が失われ、「ブラックボックス化」が進み、運用上の不透明性が生じている。これに対し、命題論理における人間が理解可能な連言節(conjunctive clauses)を用いるTsetlin Machine(TM)は、複雑なパターン認識問題を解決可能であり、多様なNLPタスクにおいて競争力のある性能を示している。本論文では、テキスト分類を目的とした新たな畳み込み型TMアーキテクチャ「ConvTextTM」を提案する。従来のTM手法は、テキスト全体を文書固有の単語集合(Set-of-Words, SOW)として扱うが、ConvTextTMはテキストをテキスト断片の連鎖に分解する。このテキスト断片に対する畳み込み処理により、局所的な位置情報を考慮した分析が可能となる。さらに、ConvTextTMは文書固有の語彙に依存しない。代わりに、Transformerに基づく双方向エンコーダ表現(Bidirectional Encoder Representations from Transformers, BERT)のトークン化スキームによって生成される汎用的なSOWを採用している。畳み込みによってトークンが結合されることで、未知語(out-of-vocabulary)問題や綴りミスに対しても対応可能となる。本研究では、節ベースの特徴を用いて提案手法の局所的な説明可能性(local explainability)を検証した。また、7つのデータセットを用いた広範な実験により、ConvTextTMの分類精度が最先端のベースラインと同等、あるいはそれ以上であることを実証した。