Discordで議論

1年前

マルチタスク学習

自然言語処理

Martin Vechev Veselin Raychev Jingxuan He Berkay Berabi

概要

プログラム内のエラーを修正する問題は、長年にわたり多くの関心を寄せられてきた。効果的なコード修正ツールを構築する際の主要な課題は、広範なエラーを捉えつつも高い精度を維持することにある。本論文では、この課題に取り組み、新しい学習ベースのシステムであるTFixを提案する。TFixはプログラムのテキストを直接処理し、コード修正の問題をテキストからテキストへの変換（text-to-text）タスクとして定式化する。これにより、自然言語で事前に学習された強力なTransformerベースのモデルを活用し、GitHubのコミットから得られた大規模かつ高品質なデータセットを用いて微調整（fine-tuning）することで、コード修正の生成を可能にする。TFixは特定のプログラミング言語やエラーの種類に限定されず、実際、人気のある静的解析ツールが報告する52種類の異なるエラー種別を同時に微調整することにより、精度を向上させた。JavaScriptプログラムの大規模データセットを用いた評価において、TFixは実用的に有効であることが示された。具体的には、67％のケースでエラーを修正するコードを自動生成でき、既存の学習ベースのアプローチを顕著に上回った。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Discordで議論

1年前

マルチタスク学習

自然言語処理

Martin Vechev Veselin Raychev Jingxuan He Berkay Berabi

概要

プログラム内のエラーを修正する問題は、長年にわたり多くの関心を寄せられてきた。効果的なコード修正ツールを構築する際の主要な課題は、広範なエラーを捉えつつも高い精度を維持することにある。本論文では、この課題に取り組み、新しい学習ベースのシステムであるTFixを提案する。TFixはプログラムのテキストを直接処理し、コード修正の問題をテキストからテキストへの変換（text-to-text）タスクとして定式化する。これにより、自然言語で事前に学習された強力なTransformerベースのモデルを活用し、GitHubのコミットから得られた大規模かつ高品質なデータセットを用いて微調整（fine-tuning）することで、コード修正の生成を可能にする。TFixは特定のプログラミング言語やエラーの種類に限定されず、実際、人気のある静的解析ツールが報告する52種類の異なるエラー種別を同時に微調整することにより、精度を向上させた。JavaScriptプログラムの大規模データセットを用いた評価において、TFixは実用的に有効であることが示された。具体的には、67％のケースでエラーを修正するコードを自動生成でき、既存の学習ベースのアプローチを顕著に上回った。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

TFix：Text-to-Text Transformerを用いたコーディングエラーの自動修復手法の学習 | 記事 | HyperAI超神経