HyperAI超神経
Back to Headlines

香港大学とAppleの共同チーム、拡散言語モデルDiffuCoder開発 非線形タスク生成でも優れた性能示す

5日前

DiffuCoder:初めての「ディフュージョン・ネイティブ」強化学習モデル 2023年、香港大学とApple社の共同研究チームが、新たなディフュージョン言語モデル「DiffuCoder」を開発しました。このモデルは、自然言語処理やコード生成などの非線形課題への対応力が従来の自己回帰モデルよりも優れていることが証明されています。 一般的に、自己回帰モデルは文を逐次生成しますが、非線形依存関係のある代碼のような課題に対しては、局所的な一貫性と全体の連続性を保つことが困難でした。これに対して、DiffuCoderは「並行的なマスク解除過程」という独創的なアプローチを採用しています。初期状態では全ての位置が[MASK]で覆われた系列から始め、複数の反復の中で徐々に仮想文字を実際の単語に置き換えていきます。これは文全体の生成過程をより自然に制御することができ、複雑な依存関係を効果的に扱うことを可能にしています。 研究チームは、「自己回帰性(AR-ness)」という新しい評価指標を導入しました。これはモデルが部分的な連続性(隣接する単語の予測精度)と全体的な順序性(左から右までの一貫した生成方向)を同時に評価するものです。分析結果では、DiffuCoderは完全にランダムな生成ではないことが示されました。テキストデータの固有の順序性に影響を受けるため、モデルは緊密に連携した単語に対しより高い予測確信度を示す傾向があるという現象を「エントロピーシンク(Entropy Sink)」と定義しています。 さらに、モデルの生成行動は温度設定によって大きく影響を受けます。高温度設定では単語選択の多様性が増し、生成シーケンスの柔軟性と多様化が向上しますが、低温度では部分的な位置生成の確実性が増します。これにより、DiffuCoderは具体的なタスク特性により適した生成戦略を選択でき、後续的な強化学習の最適化に役立つ可能性があります。

Related Links