HellaSwag 大規模モデル常識推論データセット

日期

6 个月前

大小

17.45 MB

机构

アレン人工知能研究所
ワシントン大学

发布地址

rowanzellers.com

特色图像

※本データセットはオンライン利用に対応しておりますが、ここをクリックしてジャンプしてください

HellaSwag データセットは、常識的な自然言語推論 (commonsense NLI) をテストするための新しいチャレンジ データセットです。ワシントン大学と Allen AI によって 2019 年に開始されたこのデータセットは、既存の最先端モデルに挑戦的なデータセットを構築することで、常識的な推論における深く事前トレーニングされたモデルのパフォーマンスを調査することを目的としています。関連する論文結果」HellaSwag: 機械は本当に文を完成させることができるのでしょうか?「ACL 2019に承認されました。

HellaSwag データセットには 70,000 の問題が含まれており、問題は人間にとっては非常に単純ですが (精度は 95% を超えます)、最も高度なモデルでも人間レベルに近いパフォーマンスを達成するのは困難です (精度は約 48%)。データセットは、敵対的フィルタリング (AF) 手法を通じて構築されます。この手法では、一連の識別子を利用して、機械生成の不正解を繰り返し選択して、データセットの難易度を高めます。 HellaSwag の作成により、事前に深くトレーニングされたモデルの内部動作が明らかになり、NLP 研究に新しい方向性が提供されます。ベンチマークは、より困難なタスクを提供するために、進化する最先端のモデルと敵対的な方法で共進化します。

hellaswag.torrent

做种 1

下载中 0

已完成 30

总下载 105

  • hellaswag/
    • README.md
      1.88 KB
    • README.txt
      3.76 KB
      • data/
        • hellaswag.zip
          17.45 MB