6ヶ月前

ベンチマーク

AIインフラストラクチャ

アプローチ／フレームワーク

Yanis Labrak Adrien Bazoge Emmanuel Morin Pierre-Antoine Gourraud Mickael Rouvier Richard Dufour

概要

近年、大規模言語モデル（LLMs）は、医療や医学を含む専門分野において多様な応用が可能であることを示しており、その汎用性が著しく顕著である。一方で、医療文脈に特化したさまざまなオープンソースLLMが存在するものの、汎用LLMを医療分野に適応させるには依然として大きな課題が残っている。本論文では、Mistralを基盤モデルとして採用し、PubMed Centralデータセット上でさらなる事前学習を行った、バイオメディカル分野に特化したオープンソースLLM「BioMistral」を紹介する。我々は、英語で構成された10の既存の医療QA（質問応答）タスクを含むベンチマーク上で、BioMistralの包括的な評価を実施した。さらに、量子化およびモデル統合（model merging）手法によって得られる軽量モデルについても検討を行った。実験結果から、BioMistralは既存のオープンソース医療用LLMと比較して優れた性能を発揮し、プロプライエタリモデルと比較しても競争力を持つことが明らかになった。最後に、英語以外の言語におけるデータの限界を克服し、医療用LLMの多言語一般化能力を評価するため、本ベンチマークを自動翻訳して7か国語に変換し、評価を実施した。これは、医療分野におけるLLMの初めての大規模な多言語評価である。本研究で生成されたデータセット、多言語評価ベンチマーク、スクリプト、およびすべての実験で得られたモデルは、自由に公開されている。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

ベンチマーク

AIインフラストラクチャ

アプローチ／フレームワーク

Yanis Labrak Adrien Bazoge Emmanuel Morin Pierre-Antoine Gourraud Mickael Rouvier Richard Dufour

概要

近年、大規模言語モデル（LLMs）は、医療や医学を含む専門分野において多様な応用が可能であることを示しており、その汎用性が著しく顕著である。一方で、医療文脈に特化したさまざまなオープンソースLLMが存在するものの、汎用LLMを医療分野に適応させるには依然として大きな課題が残っている。本論文では、Mistralを基盤モデルとして採用し、PubMed Centralデータセット上でさらなる事前学習を行った、バイオメディカル分野に特化したオープンソースLLM「BioMistral」を紹介する。我々は、英語で構成された10の既存の医療QA（質問応答）タスクを含むベンチマーク上で、BioMistralの包括的な評価を実施した。さらに、量子化およびモデル統合（model merging）手法によって得られる軽量モデルについても検討を行った。実験結果から、BioMistralは既存のオープンソース医療用LLMと比較して優れた性能を発揮し、プロプライエタリモデルと比較しても競争力を持つことが明らかになった。最後に、英語以外の言語におけるデータの限界を克服し、医療用LLMの多言語一般化能力を評価するため、本ベンチマークを自動翻訳して7か国語に変換し、評価を実施した。これは、医療分野におけるLLMの初めての大規模な多言語評価である。本研究で生成されたデータセット、多言語評価ベンチマーク、スクリプト、およびすべての実験で得られたモデルは、自由に公開されている。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

BioMistral：医療分野向けオープンソース事前学習済み大規模言語モデルのコレクション | 記事 | HyperAI超神経