ライブストリームリプレイ | HyperAI は「オープンソースラージモデルサブフォーラム」を主催し、研究、業界、投資の観点から技術的な展望を概説しました。

3年前

内容の概要:9月21日、「2023 OSCARオープンソース業界カンファレンス」において、SegmentfaultとHyperAIが共同主催する「オープンソース大規模モデル」サブフォーラムが正式に開催されました。研究、産業界、投資コミュニティの専門家が集まり、「オープンソース大規模モデル開発における機会と課題」について、包括的かつ多面的な意見交換と議論を行いました。HyperAIはBilibiliでフォーラムのライブストリーミング配信も行っており、録画は以下からご覧いただけます。

ライブ放送時間:2023年9月21日

キーワード:オープンソースの大規模モデル、技術フォーラム、オンラインライブ放送

あと 2 か月で ChatGPT は 1 周年を迎えます。歴史を切り開いてきた大規模な AI モデルである ChatGPT は、数千の業界の中枢神経系に侵入した興奮剤のようなもので、世界中で前例のない AI 軍備競争を引き起こしました。

昨年、私たちは GPT-3.5 がマルチモーダル GPT-4 への進化を完了し、5,620 億のパラメーターを主張する Google PaLM がより小さいパラメーターの規模とより効率的な PaLM 2 に移行するのを見てきました。は、ラマの大型モデルを調達し、アルパカ、ビキューナ、コアラ、ファルコンなどを含む、多数の低コストで小規模な製品を生み出しました。 「アルパカファミリー」…

わずか数か月の間に、オープンソースの大規模モデルコミュニティが開花し、クローズドソースと競合する傾向が強くなり、Google に衝撃を与え、「堀がない」ことを心配させました。7 月に Meta は、GPT-3.5 に匹敵するパフォーマンスを備え、商用利用が無料のオープンソースバージョンである Llama 2 をリリースしました。これは、大規模モデルのパターンを直接覆すものでした。これにより、自己研究レベルが Llama 2 ほど良くないいくつかの大規模なクローズドソースモデルの命が救われました。

その結果、多くの人が「Androidの大型モデルを誰もが持つ瞬間が来る」と叫んだ。しかし、私たちは次のことも見るべきですオープンソースの大規模モデルという明るいイメージの下には、人材、組織、データ、商業上の制限などの一連の課題もあります。海外に目を向けると、オープンソースの大型モデルはLlama 2と同じくらい強力ですが、国内のオープンソースの大型モデルはいつ彼らに追いつくことができるのでしょうか？オープンソースとクローズドソースの間の議論は、最終的には大きなモデルにどのような結果をもたらすのでしょうか?

9月21日、中国情報通信技術院と中国通信標準協会は共催で、 「2023 OSCAR オープンソース業界カンファレンス」Segmentfault と HyperAl が共催し北京で成功裡に開催された「オープンソース大規模モデル」サブフォーラムでは、科学研究コミュニティ、業界コミュニティ、投資コミュニティの専門家が、「オープンソースの大規模モデル開発における機会と課題」について、全方位的かつ多角的な意見交換や議論を行いました。さらに、HyperAI はフォーラムを Bilibili でライブ配信し、直接参加できなかった人もオンラインでこの知的饗宴に参加できるようにしました。

* ライブストリームの再放送を視聴するには、以下のリンクをクリックしてください。

https://www.bilibili.com/video/BV1oF411m7yc/?spm_id_from=333.999.0.0&vd_source=5e54209e1f8c68b7f1dc3df8aabf856c

このラウンドテーブル対談のゲストは次の 3 名です。華東師範大学データ科学工学部の教授であり、開源協会理事のWang Wei氏、アント・グループの上級技術専門家であり、著名な投資機関の副ゼネラルマネジャーであるXu Kaiyong氏。ワン・チェンハン氏は、OpenBayes の創設者兼 CEO です。

ラウンドテーブルフォーラム: 「オープンソースの大規模モデル開発における機会と課題」

左から右へ:

モデレーター: OpenBayes の創設者兼 CEO ワン・チェンハン

華東師範大学データ理工学院教授、開源協会理事 ワン・ウェイ

Ant Group の上級技術専門家 砂の剣

有名投資機関の副本部長 徐開勇

当初の意図に反しない範囲で、この対談の要点を以下に要約して列挙しましたので、ぜひご参加いただき、専門家の素晴らしい洞察をお聞きください。

オープンソースの大規模モデルの最新の進歩についてのディスカッション

昨年の ChatGPT の立ち上げから現在まで、私たちは GPT-4 の国際リリース、Claude Anthropic のフォローアップ、およびオープンソースコミュニティにおける Llama ファミリーの急速な更新を目にしてきました。これらはすべて、大規模なモデルの開発が非常に速いことを示しています。ご出席の 3 人の先生方は、それぞれ科学研究コミュニティ、産業界、投資コミュニティの出身であり、大規模モデル分野の現状と今後の発展動向をさまざまな観点から評価していただきたいと思います。 Q1: オープンソースコミュニティ全体と GPT-4 の間にはどのくらいの距離がありますか?オープンソースコミュニティの総合的な成果が営利企業の最高を超える転換点はあるのでしょうか?

王偉:オープンソースとクローズドソースは相反する 2 つのアプローチであると考えられることがよくあります。しかし、個人的には、この 2 つの方法は実際には異なるビジネス戦略を表していると感じています。オープンソース企業であっても莫大なリソースを投資する必要がありますが、遅れをとっている企業もオープンソースを通じて先行企業に追いつくことができ、また、先行企業もオープンソースを通じて複数の視点を得ることができます。

長期的な開発の観点からは、商品化は非常に重要です。商業化を超えて、短期的にエコシステムや開発者コミュニティを拡大したい場合、オープンソースは大きな利点をもたらします。 Llama 2 は 2023 年にオープンソース化されて以来、多数の開発者だけでなく、ツールチェーン、業界、評価の多くの専門家も魅了されており、OpenAI にある程度の圧力をかけてきました。

オープンソースの最大の利点は、オープンソースが何をしたいのか、どのように実行するつもりなのかを誰もが確認できることです。学校の観点から見ると、オープンソースは大学の学者にとって便利な研究チャネルを提供し、それによって貴重な研究結果が生み出され、ひいてはオープンソース技術の開発を促進することになります。したがって、私はオープンソースが優れたビジネス戦略であると常に考えています。

砂の剣：産業の観点から見ると、大きな技術の波や技術的進歩がなければ、過去 2 年間で大型モデルが急速に発展しました。実際、モデル構造自体は統一される傾向にあります。

営利企業にとって、オープンソースモデルは自社の影響力を高め、テクノロジーの反復を加速するのに役立ちます。その一方で、モデル効果の観点からは、モデルはトレーニングデータとトレーニング方法に関連していますが、クローズドソースです。企業にはこれらの側面に多くのユニークな機能がある可能性があります。

しかし、長い歴史を振り返ると、私たちは、いかなる技術的閉鎖も歴史の過程を妨げるものではないと常に信じています。最終的には、クローズドソース企業のテクノロジーを隠す必要がなくなるでしょう。

徐凱勇：投資コミュニティの観点から見ると、オープンソースがクローズドソースに追いつくのは間違いありませんが、具体的な時期を予測するのは困難です。しかし、個人的には、モデル自体に関する限り、クローズドソースには先行者利益があまりないため、今後 2 ～ 3 年でオープンソースがクローズドソースに追いつく可能性があると考えています。

先行者利益は通常、次の 2 つのカテゴリに分類されます。たとえば、チップの製造が 7 ナノメートルから 3 ナノメートルになると、後発企業も一定の経路に従って開発する必要がありますが、大きなモデル自体はこの経路に従わないのです。1 つはデータ、もう 1 つはトレーニング方法です。

現在、トレーニング方法は OpenAI などの先進的なクローズドソース企業によって管理されていますが、コミュニティがより良いソリューションを発見したり、クローズドソース企業の従業員が仕事を辞めてオープンソースコミュニティに投資したりすると、オープンソースの方法が活用されるようになります。急速に強化される。したがって、大型モデル自体の参入障壁はそれほど高くありません。

2点目はネットワーク効果です。たとえば、共同購入アプリには多くの販売者とユーザーが含まれるため、ネットワーク効果があります。ただし、大規模モデルのモデル自体にはそのような特性がないため、クローズドソースの大規模モデル企業にはネットワーク効果のバリアアドバンテージがありません。

したがって、オープンソースは間違いなくクローズドソースを超えると思いますが、そのタイミングは現状と進捗次第です。

中国のローカルなオープンソース大型モデル分野には 2 つの開発方向があることがわかります。1 つは、たとえば、Llama のローカライズ作業を行っている人たちです。 Baichuan Intelligence のように、独自の大規模な中国語モデルを公開してください。全体として、中国分野の大型モデルは活況を呈しているが、データ評価の観点から見ると、中国コミュニティの活動と国際社会との間には依然として一定のギャップがある。 Q2: 専門家の目から見ると、中国の大型モデルの分野におけるオープンソースの進歩はどのようになっているのでしょうか? それとも、クローズドソースに追いついているのでしょうか?それぞれの割合はどのくらいでしょうか?大型モデルの分野における中国のオープンソースの雰囲気はどのようなものですか?

王偉:私たちは無意識のうちに、中国のオープンソース環境や雰囲気を西側諸国と比較することがよくあります。実際、オープンソース自体は世界的な現象です。つまり、世界中のどこでも入手、配布、改変できるということです。

オープンソースは欧米発祥で、LinuxやApacheの基盤が築かれてから数十年が経ちました。それに比べて、中国では OSCAR のような大規模なオープンソースカンファレンスが登場したばかりですが、年次支部カンファレンスで発表されるさまざまな結果からもわかるように、それでも私たちは大きな進歩を遂げてきました。さらに、国家レベルでもオープンソースの重要性が高まっており、現在、中国では世界的なオープンソースに貢献する人が増えています。

さらに、中国の大型モデルは世界でも非常にユニークな革新点です。なぜなら、中国語は非常にユニークで豊かな言語であり、幅広いユーザーがいるからです。私たちが作り上げた大規模な中国モデルは、対立や競争ではなく、文化的多様性を反映したものです。国際的にも多言語による評価や申請が多く行われており、国際中国語など、大規模なモデルのもとで広範な応用価値を持つコースやプロジェクトも開催する予定です。

中国大型モデルの具体的な範囲を評価したいのであれば、最終的な適用効果から判断すべきだと個人的には思います。 ChatGPT によってトリガーされる AIGC のこのラウンドが人気がある理由は、テキストとグラフィックの生成に大きな利点があるためです。中国の大型モデルを教育や国際交流などの比較的優れた応用シナリオに導入できれば、その影響力と進歩は自然に反映されるだろう。

砂の剣：まず評価の観点から言えば、初期の ChatGPT-4 は複数言語での評価が可能でしたが、主流の言語ではパフォーマンスが向上し、人気のない言語ではパフォーマンスが低下する可能性があります。

現段階で、多くの中国の機関が中国モデルを開発する必要があるのは、国から見ても、企業から見ても、コア技術を極めたいと願っています。他人のサービスに直接電話する場合と比べても、コストが高いほうが当面は良い結果が得られるとは限りません。

第二に、コミュニティの観点から見ると、オープンソースコミュニティを含む中国のコミュニティ全体の雰囲気は西側諸国ほど良くありませんが、Apache や Linux Foundation を含む多くの西側の財団が中国支部を設立しています。著名な海外の財団や中国支部が中国人コミュニティの立ち上がりを促すことが期待される。私たちは実際、影響力のある地元の財団が独自のコミュニティを開発することを期待しています。

徐凱勇：中国の大型モデルと外国の大型モデルの間にはまだ差があると思います。海外の大型モデルは多言語をサポートしていますが、国内の大型モデルは開発が遅れています。また、中国では中国語の大型モデルを使用する学生が非常に少ないです。宿題をしたり、エッセイを書いたり、数学の問題を解決したりするための言語モデルですが、この現象は実際には海外では非常に一般的です。

これは、国内の大型モデルが時々失敗することがあり、ユーザーがそれをからかう傾向があることも一因です。したがって、中国の大型モデルにはまだ道があると思いますが、中国語には独自の言語特性があり、国産大型モデルの生き残りと発展の機会はまだたくさんあります。

現在、人々は大規模モデル自体に加えて、データセット、トレーニング方法、チップベース、チップクラスター関連ソフトウェア、推論など、大規模モデル構築のエコロジカルチェーン全体における他のプロジェクトにますます注目し始めています。関連するソフトウェアの生態。 Q3: 先生方は、オープンソースの大規模モデルの分野における他のツールコンポーネントや営利企業に注目していますか?

王偉:エコロジーに加えて、また、法律、規制、コンプライアンス関連の問題にも重点を置いています。

学校の観点から見ると、ビジネスの社会的影響はその発展よりも重要です。特に大規模なモデルの場合、ガバナンス、コンプライアンス、倫理に関する問題についてよく話されます。大規模モデルはもはや業界特有の単純なテクノロジーではなく、誰もがそれを使用してテキストや画像を生成できるため、潜在的なセキュリティ問題も発生します。

これらの質問はデータと技術ツールにマッピングされ、たとえば、トレーニングモデルのデータの品質、プライバシー、セキュリティはどうなっていますか? この部分には、エンジニアの努力だけでなく、弁護士などの専門家の強力なサポートも必要です。この拠点を一緒に作りましょう。これに基づいて、上記のチップ層、ソフトウェア、その他の内容に焦点を当てます。

技術レベルでは、私は基本的なツールチェーンにもっと注意を払っています。これらのツールチェーンは営利企業のように直接的な商業的価値を持たない可能性があり、大学はこれらのことを行う機会が増えるでしょう。現在、復旦大学などの多くの大学がいくつかの基本的なソフトウェアを構築していますが、これは我が国に現在欠けているものですが、これらのツールチェーン自体にはそれほど商業的価値はありませんが、核となる基本的なものです。したがって、学校の観点から、私たちはこれらと前述の倫理遵守の問題にさらに注意を払っています。

砂の剣：その生態と大型モデルの上流・下流への影響について、ソフトウェアとハードウェアの観点からお話しします。

アルゴリズム開発者の観点から見ると、大規模モデルは、エンジニアリングの観点から一般的なタスクを解決するアルゴリズムモデルであり、計算能力、データ、パラメーターの量が上限を決定します。モデルの機能。しかし現在、多くの研究が大規模モデルの軽量化に焦点を当て始めています。これは、モデルにそれほど多くのパラメータが必要ないからではなく、現在のソフトウェア層とハードウェア層が追いつかないからです。

ソフトウェア、ハードウェア、アルゴリズムの歴史全体のサイクルは、実際にはスパイラルであり、相互に強化し合う開発プロセスです。現在、大きなモデルがボールを投げ、そのソフトウェア、特にハードウェアのコストが非常に高くなっています。

現在、大規模モデルの商用実装に影響を与えている最大の問題は、推論のコストです。トレーニングコストが第一の側面ですが、トレーニングが遅くても実行可能です。結局のところ、プロセスはオフラインであり、1 か月のトレーニングで 1,000 億の大きなモデルを作成できます。しかし、理由は異なります。たとえば、QPS を全国の 10 億人以上に無料で提供すると、コストが高くなりすぎる可能性があります。ユーザーを失うのが最大の問題です。

現在、全国のすべての政党がこれらの問題に取り組んでいます。ハードウェア層の観点から見ると、米国の弾圧により、購入するカードは基本的に去勢版となっており、大手企業も国産カードの適用を模索している。私の観察に関する限り、国内のカードコンピューティング能力を示す現在のさまざまな指標は良好です。

ソフトウェアに関して言えば、NVIDIA が CUDA に基づいて構築した GPU エコロジカルソフトウェアスタックには依然として強力な堀があり、上位層のトレーニングフレームワークから基盤となるオペレーターライブラリまでをカバーしており、国内のハードウェアメーカーが登らなければならない山でもあります。大手ハードウェア企業は独自のソフトウェアスタックを開発し、さまざまな戦略を採用しています。

しかし、ユーザーと開発者の観点から見ると、私は、コンパイラレベルで独自のエコロジーに適応し、ユーザーレベルで主流のオープンソースフレームワークに収束して、ユーザーがパフォーマンスの向上だけを認識できるようにすることを願っています。現在はこの傾向が主流のようですが、大手企業は自社の事業戦略上、必ずしも全面的に賛同できるわけではありません。

したがって、ソフトウェア層とハードウェア層の観点から見ると、現在のニーズに追いつくには、ある程度の時間と技術的なブレークスルーが必要です。これは挑戦ですが、素晴らしいチャンスでもあります。

徐凱勇：投資コミュニティは、上流および下流のモデルとその関連産業に細心の注意を払っています。

例えばモデルの最下層では、3D ネットワークや RDBMS などのインフラストラクチャ層におけるいくつかの機会を見ていきます。アプリケーション層私たちは、財務報告書や発表を自動的に読んだり、自動的に要約したりする金融業界、障害検出を実行する業界、企業が専用のデータベースを持っている業界、スタートアップ企業がプライベートな大規模モデルや小規模なモデルを提供しているなど、一部の垂直産業における機会に注目します。この問題または一連の問題を解決します。

投資家は、大型モデルの上流と下流に加えて、大型モデルや人工知能の新たな可能性にも注目するでしょう。例えば、私は最近、オープンソース分野や量子コンピューティング関連の分野に注目しています。これは、従来の人工知能は大規模なモデルを含み、その性能がコストに比例して増加しますが、量子コンピューティングは指数関数的に増加するためです。

過去 10 ～ 12 年の間に、Apache、Mongo DB などのオープンソーステクノロジーに基づいた (または上場企業の親会社に基づいた) かなりの数の米国ナスダック上場企業が誕生しました。オープンソースに投資したこれらの企業は、優れたビジネス価値と利益を達成していることがわかります。しかし、中国を振り返ってみると、オープンソースエコシステムに投資している中国企業はほとんどなく、上場したり主導権を握った企業はさらに少ない。 Q4: 先生方、中国のオープンソースエコシステムのビジネスモデルは本当に軌道に乗っていますか?ビジネスで成功した事例はありますか?もしそうなら、大型モデルがこの傾向に貢献するでしょうか?そうでない場合、より大型のモデルがこの傾向に加わる可能性はありますか?

徐凱勇：中国には基本的にオープンソースの上場企業はありませんが、海外にはオープンソースの上場企業が数多くあります。中国と米国のオープンソースのリスト結果における主な違いは人材の要素だと思います。米国には世界中から才能が集まり、オープンなアイデアとユニークな洞察を持っています。オープンソースプロジェクトのイニシエーターのほとんどはシリコンバレー出身です。

中国にもオープンソースに携わる開発者/オピニオンリーダーが多数います。オープンソース上場企業はまだありませんが、特に大規模モデルの分野では、将来的にはそうなる可能性があると思います。

現在、国内で大規模なモデルを製造できるのは中国と米国だけであり、より直接的な競争に直面していますが、長年にわたって多数のコンピューター人材を育成しており、オープンソースへの参加者も増えています。したがって、オープンソース分野で公開会社を設立する機会はまだあります。

砂の剣：中国ではあまり成功しているオープンソースプロジェクトはリストされていないようですが、有名なオープンソースプロジェクトやスタートアップは確かに存在します。

結局のところ、シリコンバレーの雰囲気は確かに良くなり、長年にわたって発展してきたため、海外のオープンソース財団や投資機関は、コミュニティの協力や商業化の育成など、潜在的なオープンソースプロジェクトに対する優れたインキュベーションと指導メカニズムを備えています。プロジェクトが大きく成長することはありません。私たちはまだ追いつくプロセスが必要であり、国も教育を含むこれらの側面への投資を続ける必要があります。

中国のこの急成長産業において、上場したい場合は、第一に、企業の技術蓄積が比較的深くなければならず、第二に、テストに耐えられるビジネスモデルが必要です。多くの優れたオープンソースプロジェクトは、自分たちのものからどうやってお金を稼ぐかについて考えていないことがわかりましたが、実際にはこれが最も重要なことです。

王偉:一つ目は商業的な成功です。私は商業化の成功は必ずしもオープンソースかどうかに関係ないと常々信じてきました。商業レベルでは、市場に必要とされているかどうか、顧客のニーズを満たしているかどうかによって決まりますが、オープンソースは現在、宣伝の手段としての側面が強いです。

2 点目は、大規模モデルのオープンソースとは一体何を意味するのかということです。モデルのオープンソースは、ソフトウェアコードのオープンソースとは異なります。モデルがオープンソース化された後に開発者とユーザーができることは、私たちにとって新しい経験です。モデルオープンソースはダウンロードして使用できる方法ですが、いくつかの新しい問題ももたらし、従来のオープンソースの定義やフレームワークを適用することが困難になります。したがって、モデルのコミュニティと生態系をどのように構築するかは、まったく新しい問題です。

私が個人的に最も重視しているのは才能の育成です。オープンソースは才能の育成に非常に役立つと思います。

まず第一に、大学生は最先端のテクノロジーに迅速にアクセスできるようになります。Llama の登場後、多くの大学がすぐに導入、微調整、独自の分野に関連したコンテンツの追加を行い、そのすべてがオープンソースの恩恵を受けました。

第 2 に、オープンソースのコラボレーションモデルは、純粋に技術的なトレーニングよりも学生のトレーニングに役立ちます。これは学生のコミュニケーションスキルを大幅に向上させ、パートナーと競争的かつ協力的な関係を築く方法を教えてくれますが、これはまさに中国人の学生に欠けているものです。中国には海外ほど成熟したオープンソースプロジェクトが存在しませんが、一方では言語の問題が原因である可能性があり、私たちは自分の意見を表現することがあまり得意ではありません。公の場ではもちろんですが、コミュニティではいくつかの事実に基づいて自分の意見を表明する必要があります。したがって、オープンソースは、この分野における学生の能力を鍛えるのに最適なトレーニングとなります。

私は学生にオープンソースプロジェクトやコミュニティ、特に中国のオープンソースプロジェクトに参加することを強く推奨します。また、より多くの企業がコミュニティに積極的に貢献する学生にもっと多くの機会を提供できることを願っています。

科学研究、産業、投資の観点から見たオープンソースの大規模モデル

現在、大規模モデルにはコード生成機能があり、エンジニアリングアーキテクチャの提案も提供できます。特にコンピューター分野では、将来的には多くの仕事が AI に置き換わるといわれており、大規模モデルの出現により仕事のパラダイムが多少変化する可能性があります。 Q1: 王偉先生は、オープンソースの先駆者であり、華東師範大学の学術リーダーとして、コンピューター分野の人材育成の過程で AI がもたらした変化についてどう思いますか?今後大型モデルの強力化が進む中、学生や人材を育成する際、どのようなスキルに重点を置いてスキルアップを図っていきますか？

王偉:現在、私たちはオープンソースを積極的に採用しており、コース上の多くのプロジェクト、トピック、Q&A のやりとりは GitHub リポジトリを使用して実装されています。大きなモデルでできることであれば、できるだけ大きなモデルで行うことを学生に勧めます。さらに、教師もこれらの実践に参加することが奨励されています。

コンピューターサイエンスの学生や教師にとって、大規模なモデルを使用できるだけでは十分ではなく、アプリケーションやツールをより適切に作成できるように、その背後にある原理を理解することも必要です。将来、一部の仕事や職業は大型モデルに置き換わることは間違いありませんが、産業革命と同じように、多くの労働者が失業した一方で、より多くの新しい産業や職業も生まれました。そのため、私たちは学生たちに、「これからは新しい業界や職業がどんどん出てくるので、在学中に準備しておく必要がある」と伝え、それを受け入れることから準備が始まります。

第二に、起業家の役割も非常に重要です。あなたは雇用を生み出す組織です。大型モデルの登場以降、プロンプトエンジニアやチューニングエンジニアといった新たなポジションも登場しており、今後も新たなポジションはどんどん増えていくでしょう。これらは起業家によって生み出される機会です。

Ant は、SOFA やクラウドネイティブミドルウェアに関する一連のオープンソース作業など、オープンソースエコシステムで多くの作業を行ってきました。これらの作業は、業界全体のクラウドネイティブサポートに非常に優れた環境基盤を提供したと言えます。 Q2: Sha Jian 氏から、オープンソースの大規模モデルの分野における Ant の今後の方向性について紹介していただけますか?同時に、技術専門家として、オープンソース分野における Ant の取り組みの有効性をどのように評価しますか?また、この取り組みは Ant 会社全体にとってどれほど価値があるのでしょうか?

Sha Jian: Ant はオープンソースを採用しています。社内プロジェクトがうまく育成されれば、同社はすべての人にオープンソース化を奨励するでしょう。これは、技術的な影響力を高め、テクノロジー企業のイメージを構築するためです。

AI分野や大型モデルのラインナップはいくつかに分かれます。

まず最も基本的なのはインフラです。これは制作ツールに相当し、全体としてオープンソースになります。現在、トレーニングの最初のステップの AI インフラストラクチャは DLRover で完全にリリースできるようになり、推論部分全体に加え、GPU 仮想化、GPU クラスター、AIDC も段階的にリリースされる予定です。

アプリケーション層に関しては、正式に発表されている一部の大規模モデルはデータの問題により完全にオープンではない可能性がありますが、CodeFuse などの一部の大規模な垂直モデルは徐々にオープンソースになりつつあり、現在多くのチームが徐々にオープンソースに移行しています。

私たち自身の DLRover プロジェクトに関しては、なぜオープンソースにする必要があるのかについても考えています。このプロジェクトの潜在的なユースケースは何ですか?

Alibaba Cloud や Baidu Cloud などの一部のクラウドベンダーは、独自のサービスを販売する必要があるため、独自のアプリケーションとハードウェアを開発します。しかし、大量のハードウェアと研究者を備えているにもかかわらず、これらのハードウェアを効率的に使用するための専門的なインフラチームが不足している機関が依然として多くあり、DLRover はこれを支援したいと考えています。これは、彼らに権限を与えたり、Ant 内で検証された完全なソリューションセットを提供したりすることに相当します。これは潜在的な可能性であり、コンポーネントの 1 つを個別に実行できる個人の開発者などのエンドユーザーも存在します。したがって、対象者はかなり幅広いです。

私たちはこれらのユーザー向けにプロジェクトを構築したいと考えていますが、将来的にどのように商用化できるか、またはそのような目標は現時点ではありません。

観察によると、オープンソースプロジェクトに投資する中国人民元ファンドはほとんどなく、中国のオープンソースプロジェクトへの主な投資家も一部の米ドルファンドでした。徐氏の投資機関は、中国で比較的代表的な人民元ファンドとして、多数のAIチップ/大型モデル企業に直接的または間接的に投資を行っている。 Q3: 優れたエグジット実績を誇るファンドとして、貴機関や個人はオープンソースへの投資についてどのような考えを持っていますか?今後、オープンソースプロジェクトへの投資に前向きな姿勢をとりますか?その理由は何ですか?

Xu Kaiyong: オープンソースはソフトウェア業界において無視できない勢力です。当社はオープンソース分野でも存在感を示しており、テクノロジーソフトウェアインフラ、データベース、データガバナンス、その他の関連企業に投資してきました。私は個人的に情報技術、ソフトウェア、オープンソースを信じており、大学でコードを書いて以来、オープンソースの恩恵を受け、推進者でした。

私たちのファンド全体の運営も非常にオープンであり、オープンソース分野への投資を強力にサポートし、質の高いオープンソースプロジェクトの発掘に引き続き注目し、促進しています。ただし、すべての投資機関がそれほどオープンであるわけではありません。一部の投資家はオープンソースを理解しておらず、オープンソースは無料であると考えており、そのことがオープンソースへの投資の敷居を高めています。

かつてはオープンソース投資は米ドルファンドが中心でしたが、現在では米ドルファンドの傾向は薄れています。そうなると人民元ファンドもオープンソースソフトウェア投資の旗を掲げなければならない。

今後の展望

オープンソースは、2021 年に国の「第 14 次 5 か年計画」に初めて組み込まれました。平等、オープン、コラボレーション、共有の優れた創造モデルにより、オープンソースはデジタルテクノロジーのイノベーションの原動力となり続け、最適化されています。ソフトウェア生産モデルは、伝統的産業の変革とアップグレードを支援し、企業がコストを削減し効率を向上させるための重要なエンジンです。

大型モデルは最先端の新興技術の代表として、今後の開発が模索されている時期にあります。オープンソースコミュニティは世界中の才能を結集し、大規模モデルの反復、最適化、実装を加速するために協力することができ、それによって高品質の製品とサービスによってあらゆる分野でのデジタル変革とビジネスの成功を促進します。

全体として、オープンソースの大規模モデルは無限の機会を提供しますが、多くの課題にも直面しています。国産大型モデルがしのぎを削る昨今、数千台のモデルが競合する中、誰が抜きん出てくるだろうか。コメント欄にぜひご意見を残してください。

この記事はもともと以下から公開されました HyperAI スーパーニューラルWeChatパブリックプラットフォーム~

ライブストリームリプレイ | HyperAI は「オープンソースラージモデルサブフォーラム」を主催し、研究、業界、投資の観点から技術的な展望を概説しました。

3年前

情報

機械学習

内容の概要:9月21日、「2023 OSCARオープンソース業界カンファレンス」において、SegmentfaultとHyperAIが共同主催する「オープンソース大規模モデル」サブフォーラムが正式に開催されました。研究、産業界、投資コミュニティの専門家が集まり、「オープンソース大規模モデル開発における機会と課題」について、包括的かつ多面的な意見交換と議論を行いました。HyperAIはBilibiliでフォーラムのライブストリーミング配信も行っており、録画は以下からご覧いただけます。

ライブ放送時間:2023年9月21日

キーワード:オープンソースの大規模モデル、技術フォーラム、オンラインライブ放送

* ライブストリームの再放送を視聴するには、以下のリンクをクリックしてください。

https://www.bilibili.com/video/BV1oF411m7yc/?spm_id_from=333.999.0.0&vd_source=5e54209e1f8c68b7f1dc3df8aabf856c

左から右へ:

モデレーター: OpenBayes の創設者兼 CEO ワン・チェンハン

華東師範大学データ理工学院教授、開源協会理事 ワン・ウェイ

Ant Group の上級技術専門家 砂の剣

有名投資機関の副本部長 徐開勇

オープンソースの大規模モデルの最新の進歩についてのディスカッション

昨年の ChatGPT の立ち上げから現在まで、私たちは GPT-4 の国際リリース、Claude Anthropic のフォローアップ、およびオープンソースコミュニティにおける Llama ファミリーの急速な更新を目にしてきました。これらはすべて、大規模なモデルの開発が非常に速いことを示しています。ご出席の 3 人の先生方は、それぞれ科学研究コミュニティ、産業界、投資コミュニティの出身であり、大規模モデル分野の現状と今後の発展動向をさまざまな観点から評価していただきたいと思います。 Q1: オープンソースコミュニティ全体と GPT-4 の間にはどのくらいの距離がありますか?オープンソースコミュニティの総合的な成果が営利企業の最高を超える転換点はあるのでしょうか?

したがって、オープンソースは間違いなくクローズドソースを超えると思いますが、そのタイミングは現状と進捗次第です。

中国のローカルなオープンソース大型モデル分野には 2 つの開発方向があることがわかります。1 つは、たとえば、Llama のローカライズ作業を行っている人たちです。 Baichuan Intelligence のように、独自の大規模な中国語モデルを公開してください。全体として、中国分野の大型モデルは活況を呈しているが、データ評価の観点から見ると、中国コミュニティの活動と国際社会との間には依然として一定のギャップがある。 Q2: 専門家の目から見ると、中国の大型モデルの分野におけるオープンソースの進歩はどのようになっているのでしょうか? それとも、クローズドソースに追いついているのでしょうか?それぞれの割合はどのくらいでしょうか?大型モデルの分野における中国のオープンソースの雰囲気はどのようなものですか?

現在、人々は大規模モデル自体に加えて、データセット、トレーニング方法、チップベース、チップクラスター関連ソフトウェア、推論など、大規模モデル構築のエコロジカルチェーン全体における他のプロジェクトにますます注目し始めています。関連するソフトウェアの生態。 Q3: 先生方は、オープンソースの大規模モデルの分野における他のツールコンポーネントや営利企業に注目していますか?

王偉:エコロジーに加えて、また、法律、規制、コンプライアンス関連の問題にも重点を置いています。

砂の剣：その生態と大型モデルの上流・下流への影響について、ソフトウェアとハードウェアの観点からお話しします。

徐凱勇：投資コミュニティは、上流および下流のモデルとその関連産業に細心の注意を払っています。

過去 10 ～ 12 年の間に、Apache、Mongo DB などのオープンソーステクノロジーに基づいた (または上場企業の親会社に基づいた) かなりの数の米国ナスダック上場企業が誕生しました。オープンソースに投資したこれらの企業は、優れたビジネス価値と利益を達成していることがわかります。しかし、中国を振り返ってみると、オープンソースエコシステムに投資している中国企業はほとんどなく、上場したり主導権を握った企業はさらに少ない。 Q4: 先生方、中国のオープンソースエコシステムのビジネスモデルは本当に軌道に乗っていますか?ビジネスで成功した事例はありますか?もしそうなら、大型モデルがこの傾向に貢献するでしょうか?そうでない場合、より大型のモデルがこの傾向に加わる可能性はありますか?

私が個人的に最も重視しているのは才能の育成です。オープンソースは才能の育成に非常に役立つと思います。

科学研究、産業、投資の観点から見たオープンソースの大規模モデル

現在、大規模モデルにはコード生成機能があり、エンジニアリングアーキテクチャの提案も提供できます。特にコンピューター分野では、将来的には多くの仕事が AI に置き換わるといわれており、大規模モデルの出現により仕事のパラダイムが多少変化する可能性があります。 Q1: 王偉先生は、オープンソースの先駆者であり、華東師範大学の学術リーダーとして、コンピューター分野の人材育成の過程で AI がもたらした変化についてどう思いますか?今後大型モデルの強力化が進む中、学生や人材を育成する際、どのようなスキルに重点を置いてスキルアップを図っていきますか？

Ant は、SOFA やクラウドネイティブミドルウェアに関する一連のオープンソース作業など、オープンソースエコシステムで多くの作業を行ってきました。これらの作業は、業界全体のクラウドネイティブサポートに非常に優れた環境基盤を提供したと言えます。 Q2: Sha Jian 氏から、オープンソースの大規模モデルの分野における Ant の今後の方向性について紹介していただけますか?同時に、技術専門家として、オープンソース分野における Ant の取り組みの有効性をどのように評価しますか?また、この取り組みは Ant 会社全体にとってどれほど価値があるのでしょうか?

AI分野や大型モデルのラインナップはいくつかに分かれます。

観察によると、オープンソースプロジェクトに投資する中国人民元ファンドはほとんどなく、中国のオープンソースプロジェクトへの主な投資家も一部の米ドルファンドでした。徐氏の投資機関は、中国で比較的代表的な人民元ファンドとして、多数のAIチップ/大型モデル企業に直接的または間接的に投資を行っている。 Q3: 優れたエグジット実績を誇るファンドとして、貴機関や個人はオープンソースへの投資についてどのような考えを持っていますか?今後、オープンソースプロジェクトへの投資に前向きな姿勢をとりますか?その理由は何ですか?

今後の展望

この記事はもともと以下から公開されました HyperAI スーパーニューラルWeChatパブリックプラットフォーム~

Command Palette

ライブ ストリーム リプレイ | HyperAI は「オープン ソース ラージ モデル サブフォーラム」を主催し、研究、業界、投資の観点から技術的な展望を概説しました。

オープンソースの大規模モデルの最新の進歩についてのディスカッション

科学研究、産業、投資の観点から見たオープンソースの大規模モデル

今後の展望

Command Palette

ライブ ストリーム リプレイ | HyperAI は「オープン ソース ラージ モデル サブフォーラム」を主催し、研究、業界、投資の観点から技術的な展望を概説しました。

オープンソースの大規模モデルの最新の進歩についてのディスカッション

科学研究、産業、投資の観点から見たオープンソースの大規模モデル

今後の展望

関連 ニュース

OpenAIは、129の質問と10の分野にわたるAI研究能力を評価するGeneBench-Proをリリースした。

HyperAIの新機能リリース｜コンピューティングコンテナの環境変数とシークレット変数の設定

チュートリアル概要｜オープンソースの小型モデルがGPT-5に匹敵する総合的な知能を実現。Qwen 3.5/Gemma 4などの人気モデルをワンストップで評価。

シンガポール国立大学は、糖尿病性創傷治癒のための薬剤の用途転換を加速させるAIと計算化学の協働プロセスを提案しており、研究開発サイクルを701 TP3T以上短縮できるとしている。

MITとIBMは、これまでで最大の合成チャートデータセットであるChartNetを公開した。ChartNetは、150万個の多様なチャートサンプルを生成している。

無料CPUオンラインチュートリアル | Hermes Agent: 長期記憶について学びましょう。メモリ拡張プラグインTencentDB Agent Memoryは、事実、設定、タスク状態などを個別に保存できます。

コーネル大学は、電子顕微鏡画像をわずか2～5分で材料科学的な知見に変換できるマルチエージェントプラットフォーム「EMSeek」を開発した。

オンラインチュートリアル｜41,000個のスターを獲得：香港大学のチームが、OpenClawの中核機能を4,000行のコードで実装した超軽量AIアシスタントナノボットをオープンソース化。

Command Palette

ライブ ストリーム リプレイ | HyperAI は「オープン ソース ラージ モデル サブフォーラム」を主催し、研究、業界、投資の観点から技術的な展望を概説しました。

オープンソースの大規模モデルの最新の進歩についてのディスカッション

科学研究、産業、投資の観点から見たオープンソースの大規模モデル

今後の展望

関連 ニュース

OpenAIは、129の質問と10の分野にわたるAI研究能力を評価するGeneBench-Proをリリースした。

HyperAIの新機能リリース｜コンピューティングコンテナの環境変数とシークレット変数の設定

チュートリアル概要｜オープンソースの小型モデルがGPT-5に匹敵する総合的な知能を実現。Qwen 3.5/Gemma 4などの人気モデルをワンストップで評価。

シンガポール国立大学は、糖尿病性創傷治癒のための薬剤の用途転換を加速させるAIと計算化学の協働プロセスを提案しており、研究開発サイクルを701 TP3T以上短縮できるとしている。

MITとIBMは、これまでで最大の合成チャートデータセットであるChartNetを公開した。ChartNetは、150万個の多様なチャートサンプルを生成している。

無料CPUオンラインチュートリアル | Hermes Agent: 長期記憶について学びましょう。メモリ拡張プラグインTencentDB Agent Memoryは、事実、設定、タスク状態などを個別に保存できます。

コーネル大学は、電子顕微鏡画像をわずか2～5分で材料科学的な知見に変換できるマルチエージェントプラットフォーム「EMSeek」を開発した。

オンラインチュートリアル｜41,000個のスターを獲得：香港大学のチームが、OpenClawの中核機能を4,000行のコードで実装した超軽量AIアシスタントナノボットをオープンソース化。

関連 ニュース

OpenAIは、129の質問と10の分野にわたるAI研究能力を評価するGeneBench-Proをリリースした。

HyperAIの新機能リリース｜コンピューティングコンテナの環境変数とシークレット変数の設定

チュートリアル概要｜オープンソースの小型モデルがGPT-5に匹敵する総合的な知能を実現。Qwen 3.5/Gemma 4などの人気モデルをワンストップで評価。

シンガポール国立大学は、糖尿病性創傷治癒のための薬剤の用途転換を加速させるAIと計算化学の協働プロセスを提案しており、研究開発サイクルを701 TP3T以上短縮できるとしている。

MITとIBMは、これまでで最大の合成チャートデータセットであるChartNetを公開した。ChartNetは、150万個の多様なチャートサンプルを生成している。

無料CPUオンラインチュートリアル | Hermes Agent: 長期記憶について学びましょう。メモリ拡張プラグインTencentDB Agent Memoryは、事実、設定、タスク状態などを個別に保存できます。

コーネル大学は、電子顕微鏡画像をわずか2～5分で材料科学的な知見に変換できるマルチエージェントプラットフォーム「EMSeek」を開発した。

オンラインチュートリアル｜41,000個のスターを獲得：香港大学のチームが、OpenClawの中核機能を4,000行のコードで実装した超軽量AIアシスタントナノボットをオープンソース化。

関連 ニュース

OpenAIは、129の質問と10の分野にわたるAI研究能力を評価するGeneBench-Proをリリースした。

HyperAIの新機能リリース｜コンピューティングコンテナの環境変数とシークレット変数の設定

チュートリアル概要｜オープンソースの小型モデルがGPT-5に匹敵する総合的な知能を実現。Qwen 3.5/Gemma 4などの人気モデルをワンストップで評価。

シンガポール国立大学は、糖尿病性創傷治癒のための薬剤の用途転換を加速させるAIと計算化学の協働プロセスを提案しており、研究開発サイクルを701 TP3T以上短縮できるとしている。

MITとIBMは、これまでで最大の合成チャートデータセットであるChartNetを公開した。ChartNetは、150万個の多様なチャートサンプルを生成している。

無料CPUオンラインチュートリアル | Hermes Agent: 長期記憶について学びましょう。メモリ拡張プラグインTencentDB Agent Memoryは、事実、設定、タスク状態などを個別に保存できます。

コーネル大学は、電子顕微鏡画像をわずか2～5分で材料科学的な知見に変換できるマルチエージェントプラットフォーム「EMSeek」を開発した。

オンラインチュートリアル｜41,000個のスターを獲得：香港大学のチームが、OpenClawの中核機能を4,000行のコードで実装した超軽量AIアシスタントナノボットをオープンソース化。

ライブストリームリプレイ | HyperAI は「オープンソースラージモデルサブフォーラム」を主催し、研究、業界、投資の観点から技術的な展望を概説しました。

ライブストリームリプレイ | HyperAI は「オープンソースラージモデルサブフォーラム」を主催し、研究、業界、投資の観点から技術的な展望を概説しました。

関連ニュース

ライブストリームリプレイ | HyperAI は「オープンソースラージモデルサブフォーラム」を主催し、研究、業界、投資の観点から技術的な展望を概説しました。

関連ニュース

関連ニュース

関連ニュース