8ヶ月前

ベンチマーク

AIインフラストラクチャ

アプローチ／フレームワーク

Jiatong Li Junxian Li Yunqing Liu Dongzhan Zhou Qing Li

概要

本稿では、大規模言語モデル（LLM）のオープンドメイン分子生成能力を評価する最初のベンチマークであるテキストベースのオープン分子生成ベンチマーク（Text-based Open Molecule Generation Benchmark, TOMG-Bench）を提案します。TOMG-Benchは、分子編集（MolEdit）、分子最適化（MolOpt）、カスタマイズされた分子生成（MolCustom）という3つの主要なタスクを含むデータセットで構成されています。各タスクはさらに3つのサブタスクに分かれ、それぞれのサブタスクには5,000個のテストサンプルが含まれています。オープン分子生成の固有の複雑さを考え、生成された分子の品質と精度を測定する自動評価システムも開発しました。25の大規模言語モデルを包括的にベンチマークした結果、テキストガイダンスによる分子探索における現在の制限と改善すべき潜在的な領域が明らかになりました。さらに、TOMG-Benchによって提起された課題を解決するために提案された専門的な指示微調整データセットであるOpenMolInsの支援により、Llama3.1-8Bはすべてのオープンソースの大規模言語モデルを上回り、TOMG-BenchにおいてGPT-3.5-turboよりも46.5%高い性能を示しました。当方のコードとデータセットは、https://github.com/phenixace/TOMG-Bench から入手可能です。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

ベンチマーク

AIインフラストラクチャ

アプローチ／フレームワーク

Jiatong Li Junxian Li Yunqing Liu Dongzhan Zhou Qing Li

概要

本稿では、大規模言語モデル（LLM）のオープンドメイン分子生成能力を評価する最初のベンチマークであるテキストベースのオープン分子生成ベンチマーク（Text-based Open Molecule Generation Benchmark, TOMG-Bench）を提案します。TOMG-Benchは、分子編集（MolEdit）、分子最適化（MolOpt）、カスタマイズされた分子生成（MolCustom）という3つの主要なタスクを含むデータセットで構成されています。各タスクはさらに3つのサブタスクに分かれ、それぞれのサブタスクには5,000個のテストサンプルが含まれています。オープン分子生成の固有の複雑さを考え、生成された分子の品質と精度を測定する自動評価システムも開発しました。25の大規模言語モデルを包括的にベンチマークした結果、テキストガイダンスによる分子探索における現在の制限と改善すべき潜在的な領域が明らかになりました。さらに、TOMG-Benchによって提起された課題を解決するために提案された専門的な指示微調整データセットであるOpenMolInsの支援により、Llama3.1-8Bはすべてのオープンソースの大規模言語モデルを上回り、TOMG-BenchにおいてGPT-3.5-turboよりも46.5%高い性能を示しました。当方のコードとデータセットは、https://github.com/phenixace/TOMG-Bench から入手可能です。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

TOMG-Bench: テキストベースのオープンな分子生成におけるLLMの評価 | 記事 | HyperAI超神経