HyperAIHyperAI

Command Palette

Search for a command to run...

ManyTypes4TypeScript:シーケンスベースの型推論のための包括的なTypeScriptデータセット

Premkumar T. Devanbu Kevin Jesse

概要

本稿では、TypeScriptにおけるシーケンスベースの型推論のための機械学習モデルの学習および評価を目的とした、非常に大規模なコーパス「ManyTypes4TypeScript」を紹介する。このデータセットは、13,953プロジェクトおよび539,571ファイルにまたがり、900万件を超える型注釈を含んでいる。これはPython向けの類似データセットと比較して約10倍の規模であり、現時点で利用可能な最も大規模なTypeScript用データセットである。また、本データセットはAPI経由でアクセス可能であり、任意のトークナイザーに統合可能で、最新のシーケンスベースモデルと連携して利用できる。さらに、ベースライン評価を目的として、最新のコード特化型モデルの分析および性能評価結果も提供している。ManyTypes4TypeScriptは、Hugging Face、Zenodo、およびCodeXGLUEにて公開されている。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています