13日前

リトリーブ拡張型コード生成および要約

Md Rizwan Parvez, Wasi Uddin Ahmad, Saikat Chakraborty, Baishakhi Ray, Kai-Wei Chang
リトリーブ拡張型コード生成および要約
要約

ソフトウェア開発者は、ソフトウェア開発の過程において大量のソースコードおよびドキュメントを記述する。本質的に、開発者はソフトウェアの実装やドキュメント作成を行う際、過去に自身が記述したコードの一部やコード要約を想起することが多い。開発者のコードまたは要約生成行動を模倣するため、本研究では、リトリーブデータベースから関連するコードや要約を検索し、それをコード生成モデルや要約モデルの補完情報として提供する、リトリーブ拡張型フレームワーク「REDCODER」を提案する。REDCODERの特徴は以下の通りである。第一に、最先端の密度型リトリーブ技術を拡張し、関連するコードや要約を検索可能にしている。第二に、単モーダル(コードのみまたは自然言語による記述のみ)またはバイモーダル(コードと記述のペア)のインスタンスを含むリトリーブデータベースと連携できる点である。本研究では、JavaおよびPythonにおけるコード生成および要約のための2つのベンチマークデータセットを用いて実験と広範な分析を実施した結果、提案するリトリーブ拡張型フレームワークの有効性が明確に裏付けられた。

リトリーブ拡張型コード生成および要約 | 最新論文 | HyperAI超神経