AxCell: 機械学習論文からの結果の自動抽出

機械学習の進展を追跡することは、最近の論文数の急増に伴いますます困難になっています。本稿では、論文から結果を抽出するための自動機械学習パイプラインであるAxCellを紹介します。AxCellは、テーブル分割サブタスクを含むいくつかの新規コンポーネントを使用して、抽出に役立つ関連構造知識を学習します。既存の手法と比較した際、当方針は結果抽出における最先端技術を大幅に向上させています。また、結果抽出モデルの訓練用に構造化且つ注釈付きデータセットを公開し、このタスクにおけるモデル性能評価用のデータセットも提供しています。最後に、当方針が実用的な半自動結果抽出に利用可能であることを示し、これが初めて実践的に利用可能な状態になったことを示唆しています。コードはGitHub上で入手可能です。请注意,这里的“方針”(hoshin)在科技文献中可能不太常用,更合适的可能是“アプローチ”(approach)。因此,优化后的翻译如下:機械学習の進展を追跡することは、最近の論文数の急増に伴いますます困難になっています。本稿では、論文から結果を抽出するための自動機械学習パイプラインであるAxCellを紹介します。AxCellは、テーブル分割サブタスクを含むいくつかの新規コンポーネントを使用して、抽出に役立つ関連構造知識を学習します。既存手法と比較した際、当アプローチは結果抽出における最先端技術を大幅に向上させています。また、結果抽出モデルの訓練用に構造化且つ注釈付きデータセットを公開し、このタスクにおけるモデル性能評価用のデータセットも提供しています。最後に、当アプローチが実用的な半自動結果抽出に利用可能であることを示し、これが初めて実践的に利用可能な状態になったことを示唆しています。コードはGitHub上で入手可能です。