HyperAI超神経

スイスの研究機関三つが連携し、オープンソースの大規模言語モデル「Apertus」を発表した。このモデルは、スイス連邦工科大学ローザンヌ校（EPFL）、スイス連邦工科大学チューリッヒ校（ETH Zurich）、およびスイス国立スーパーコンピューティングセンター（CSCS）が共同開発した。名前の「Apertus」はラテン語で「開かれた」という意味を持ち、その開発理念にふさわしい透明性を重視している。 Apertusは、米国を代表する大手テック企業が提供するGPTシリーズ（OpenAI）、Llama（Meta）、Claude（Anthropic）といったモデルと対照的に、技術の「開かれている」姿勢を徹底している。モデルの重み、アーキテクチャ設計、トレーニングコード、データソース、さらには訓練プロセスの詳細なドキュメントまで、すべてを公開している。この徹底したオープン戦略により、研究者や開発者はモデルの動作原理を検証・改良し、新たな応用を展開できる。近年のAI分野では、多くのモデルが「ブラックボックス」と化し、トレーニングデータや推論メカニズムが非公開なまま提供されることが一般的である。これにより、信頼性や倫理的懸念が指摘されてきた。Apertusはこうした課題に真摯に向き合い、透明性と共同開発を推進する新たな道を提示している。研究チームは、Apertusの目的は単なる技術提供にとどまらず、グローバルなAI研究コミュニティの活性化にあると強調している。技術の壁を低くすることで、より多くの人々がAIの開発・応用に参加できる環境を整えることを目指している。この取り組みは、スイスがAI分野で独自の影響力を持つための重要な一歩であり、今後、類似のオープンソースモデルの登場を予想させる。Apertusの進展は、AIの持続可能な発展に向けた国際的な協働のモデルとなり得る。

関連リンク

関連リンク

関連リンク

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

Command Palette

スイス三機関が「Apertus」公開 完全開示型大規模言語モデルで米テック巨人に挑戦

関連リンク

Command Palette

スイス三機関が「Apertus」公開 完全開示型大規模言語モデルで米テック巨人に挑戦

関連リンク

Command Palette

スイス三機関が「Apertus」公開 完全開示型大規模言語モデルで米テック巨人に挑戦

関連リンク

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

高速かつ高精度！Cohereがオープンソースの文字起こしモデルをリリース。複雑なシナリオの精密な解析：Chandra-ocr-2ビジュアル言語モデルが高精度OCRを実現。

スイス三機関が「Apertus」公開　完全開示型大規模言語モデルで米テック巨人に挑戦

スイス三機関が「Apertus」公開　完全開示型大規模言語モデルで米テック巨人に挑戦

スイス三機関が「Apertus」公開　完全開示型大規模言語モデルで米テック巨人に挑戦