[OSCAR オープンソース産業カンファレンス サブフォーラム] オープンソースのビッグモデルはどこへ向かうのでしょうか?

特色图像

あと 2 か月で ChatGPT は 1 周年を迎えます。歴史を切り開いてきた大規模な AI モデルである ChatGPT は、数千の業界の中枢神経系に侵入した興奮剤のようなもので、世界中で前例のない AI 軍備競争を引き起こしました。

昨年、私たちは GPT-3.5 がマルチモーダル GPT-4 への進化を完了し、5,620 億のパラメーターを主張する Google PaLM がより小さいパラメーターの規模とより効率的な PaLM 2 に移行するのを見てきました。は、ラマの大型モデルを調達し、アルパカ、ビキューナ、コアラ、ファルコンなどを含む、多数の低コストで小規模な製品を生み出しました。 「アルパカファミリー」

わずか数か月の間に、オープンソースの大規模モデル コミュニティが開花し、クローズド ソースと競合する傾向が強くなり、Google に衝撃を与え、「堀がない」ことを心配させました。7 月に Meta は、GPT-3.5 に匹敵するパフォーマンスを備え、商用利用が無料のオープンソース バージョンである Llama 2 をリリースしました。これは、大規模モデルのパターンを直接覆すものでした。これにより、自己研究レベルが Llama 2 ほど良くないいくつかの大規模なクローズドソース モデルの命が救われました。

その結果、多くの人が「Androidの大型モデルを誰もが持つ瞬間が来る」と叫んだ。しかし、私たちは次のことも見るべきですオープンソースの大規模モデルという明るいイメージの下には、人材、組織、データ、商業上の制限などの一連の課題もあります。海外に目を向けると、オープンソースの大型モデルはLlama 2と同じくらい強力ですが、国内のオープンソースの大型モデルはいつ彼らに追いつくことができるのでしょうか?オープンソースとクローズドソースの間の議論は、最終的には大きなモデルにどのような結果をもたらすのでしょうか?

著者 | 鉄の塔

編集者 | 三陽

9月21日、中国情報通信技術院と中国通信標準協会は共催で、 「2023 OSCAR オープンソース業界カンファレンス」Segmentfault と HyperAl が共催し北京で成功裡に開催された「オープンソース大規模モデル」サブフォーラムでは、科学研究コミュニティ、業界コミュニティ、投資コミュニティの専門家が、「オープンソースの大規模モデル開発における機会と課題」について、全方位的かつ多角的な意見交換や議論を行いました。

このラウンドテーブル対談のゲストは次の 3 名です。華東師範大学データ科学工学部の教授であり、開源協会理事のWang Wei氏、アント・グループの上級技術専門家であり、著名な投資機関の副ゼネラルマネジャーであるXu Kaiyong氏。ワン・チェンハン氏は、OpenBayes の創設者兼 CEO です。

ラウンドテーブル フォーラム: 「オープンソースの大規模モデル開発における機会と課題」

左から右へ:

モデレーター: OpenBayes の創設者兼 CEO ワン・チェンハン

華東師範大学データ理工学院教授、開源協会理事 ワン・ウェイ

Ant Group の上級技術専門家 砂の剣

有名投資機関の副本部長 徐開勇

フォーラムに直接アクセスするには、下のリンクをクリックしてください☟

https://www.bilibili.com/video/BV1oF411m7yc/?spm_id_from=333.999.0.0&vd_source=5e54209e1f8c68b7f1dc3df8aabf856c

当初の意図に反しない範囲で、この対談の要点を以下に要約して列挙しましたので、ぜひご参加いただき、専門家の素晴らしい洞察をお聞きください。

オープンソースの大規模モデルの最新の進歩についてのディスカッション

モデレーター: ワン・チェンハン、OpenBayes 創設者兼 CEO

昨年の ChatGPT の立ち上げから現在まで、私たちは GPT-4 の国際リリース、Claude Anthropic のフォローアップ、およびオープンソース コミュニティにおける Llama ファミリーの急速な更新を目にしてきました。これらはすべて、大規模なモデルの開発が非常に速いことを示しています。ご出席の 3 人の先生方は、それぞれ科学研究コミュニティ、産業界、投資コミュニティの出身であり、大規模モデル分野の現状と今後の発展動向をさまざまな観点から評価していただきたいと思います。 Q1: オープンソース コミュニティ全体と GPT-4 の間にはどのくらいの距離がありますか?オープンソース コミュニティの総合的な成果が営利企業の最高を超える転換点はあるのでしょうか?

王偉:オープンソースとクローズドソースは相反する 2 つのアプローチであると考えられることがよくあります。しかし、個人的には、この 2 つの方法は実際には異なるビジネス戦略を表していると感じています。オープンソース企業であっても莫大なリソースを投資する必要がありますが、遅れをとっている企業もオープンソースを通じて先行企業に追いつくことができ、また、先行企業もオープンソースを通じて複数の視点を得ることができます。

長期的な開発の観点からは、商品化は非常に重要です。商業化を超えて、短期的にエコシステムや開発者コミュニティを拡大したい場合、オープンソースは大きな利点をもたらします。 Llama 2 は 2023 年にオープンソース化されて以来、多数の開発者だけでなく、ツールチェーン、業界、評価の多くの専門家も魅了されており、OpenAI にある程度の圧力をかけてきました。

オープンソースの最大の利点は、オープンソースが何をしたいのか、どのように実行するつもりなのかを誰もが確認できることです。学校の観点から見ると、オープンソースは大学の学者にとって便利な研究チャネルを提供し、それによって貴重な研究結果が生み出され、ひいてはオープンソース技術の開発を促進することになります。したがって、私はオープンソースが優れたビジネス戦略であると常に考えています。

砂の剣:産業の観点から見ると、大きな技術の波や技術的進歩がなければ、過去 2 年間で大型モデルが急速に発展しました。実際、モデル構造自体は統一される傾向にあります。

営利企業にとって、オープンソース モデルは自社の影響力を高め、テクノロジーの反復を加速するのに役立ちます。その一方で、モデル効果の観点からは、モデルはトレーニング データとトレーニング方法に関連していますが、クローズド ソースです。企業にはこれらの側面に多くのユニークな機能がある可能性があります。

しかし、長い歴史を振り返ると、私たちは、いかなる技術的閉鎖も歴史の過程を妨げるものではないと常に信じています。最終的には、クローズドソース企業のテクノロジーを隠す必要がなくなるでしょう。

徐凱勇:投資コミュニティの観点から見ると、オープンソースがクローズドソースに追いつくのは間違いありませんが、具体的な時期を予測するのは困難です。しかし、個人的には、モデル自体に関する限り、クローズド ソースには先行者利益があまりないため、今後 2 ~ 3 年でオープンソースがクローズド ソースに追いつく可能性があると考えています。

先行者利益は通常、次の 2 つのカテゴリに分類されます。たとえば、チップの製造が 7 ナノメートルから 3 ナノメートルになると、後発企業も一定の経路に従って開発する必要がありますが、大きなモデル自体はこの経路に従わないのです。1 つはデータ、もう 1 つはトレーニング方法です。

現在、トレーニング方法は OpenAI などの先進的なクローズドソース企業によって管理されていますが、コミュニティがより良いソリューションを発見したり、クローズドソース企業の従業員が仕事を辞めてオープンソース コミュニティに投資したりすると、オープンソースの方法が活用されるようになります。急速に強化される。したがって、大型モデル自体の参入障壁はそれほど高くありません。

2点目はネットワーク効果です。たとえば、共同購入アプリには多くの販売者とユーザーが含まれるため、ネットワーク効果があります。ただし、大規模モデルのモデル自体にはそのような特性がないため、クローズドソースの大規模モデル企業にはネットワーク効果のバリアアドバンテージがありません。

したがって、オープンソースは間違いなくクローズドソースを超えると思いますが、そのタイミングは現状と進捗次第です。

中国のローカルなオープンソース大型モデル分野には 2 つの開発方向があることがわかります。1 つは、たとえば、Llama のローカライズ作業を行っている人たちです。 Baichuan Intelligence のように、独自の大規模な中国語モデルを公開してください。全体として、中国分野の大型モデルは活況を呈しているが、データ評価の観点から見ると、中国コミュニティの活動と国際社会との間には依然として一定のギャップがある。 Q2: 専門家の目から見ると、中国の大型モデルの分野におけるオープンソースの進歩はどのようになっているのでしょうか? それとも、クローズド ソースに追いついているのでしょうか?それぞれの割合はどのくらいでしょうか?大型モデルの分野における中国のオープンソースの雰囲気はどのようなものですか?

王偉:私たちは無意識のうちに、中国のオープンソース環境や雰囲気を西側諸国と比較することがよくあります。実際、オープンソース自体は世界的な現象です。つまり、世界中のどこでも入手、配布、改変できるということです。

オープンソースは欧米発祥で、LinuxやApacheの基盤が築かれてから数十年が経ちました。それに比べて、中国では OSCAR のような大規模なオープンソース カンファレンスが登場したばかりですが、年次支部カンファレンスで発表されるさまざまな結果からもわかるように、それでも私たちは大きな進歩を遂げてきました。さらに、国家レベルでもオープンソースの重要性が高まっており、現在、中国では世界的なオープンソースに貢献する人が増えています。

さらに、中国の大型モデルは世界でも非常にユニークな革新点です。なぜなら、中国語は非常にユニークで豊かな言語であり、幅広いユーザーがいるからです。私たちが作り上げた大規模な中国モデルは、対立や競争ではなく、文化的多様性を反映したものです。国際的にも多言語による評価や申請が多く行われており、国際中国語など、大規模なモデルのもとで広範な応用価値を持つコースやプロジェクトも開催する予定です。

中国大型モデルの具体的な範囲を評価したいのであれば、最終的な適用効果から判断すべきだと個人的には思います。 ChatGPT によってトリガーされる AIGC のこのラウンドが人気がある理由は、テキストとグラフィックの生成に大きな利点があるためです。中国の大型モデルを教育や国際交流などの比較的優れた応用シナリオに導入できれば、その影響力と進歩は自然に反映されるだろう。

砂の剣:まず評価の観点から言えば、初期の ChatGPT-4 は複数言語での評価が可能でしたが、主流の言語ではパフォーマンスが向上し、人気のない言語ではパフォーマンスが低下する可能性があります。

現段階で、多くの中国の機関が中国モデルを開発する必要があるのは、国から見ても、企業から見ても、コア技術を極めたいと願っています。他人のサービスに直接電話する場合と比べても、コストが高いほうが当面は良い結果が得られるとは限りません。

第二に、コミュニティの観点から見ると、オープンソース コミュニティを含む中国のコミュニティ全体の雰囲気は西側諸国ほど良くありませんが、Apache や Linux Foundation を含む多くの西側の財団が中国支部を設立しています。著名な海外の財団や中国支部が中国人コミュニティの立ち上がりを促すことが期待される。私たちは実際、影響力のある地元の財団が独自のコミュニティを開発することを期待しています。

徐凱勇:中国の大型モデルと外国の大型モデルの間にはまだ差があると思います。海外の大型モデルは多言語をサポートしていますが、国内の大型モデルは開発が遅れています。また、中国では中国語の大型モデルを使用する学生が非常に少ないです。宿題をしたり、エッセイを書いたり、数学の問題を解決したりするための言語モデルですが、この現象は実際には海外では非常に一般的です。

これは、国内の大型モデルが時々失敗することがあり、ユーザーがそれをからかう傾向があることも一因です。したがって、中国の大型モデルにはまだ道があると思いますが、中国語には独自の言語特性があり、国産大型モデルの生き残りと発展の機会はまだたくさんあります。

現在、人々は大規模モデル自体に加えて、データセット、トレーニング方法、チップベース、チップクラスター関連ソフトウェア、推論など、大規模モデル構築のエコロジカルチェーン全体における他のプロジェクトにますます注目し始めています。関連するソフトウェアの生態。 Q3: 先生方は、オープンソースの大規模モデルの分野における他のツールコンポーネントや営利企業に注目していますか?

王偉:エコロジーに加えて、また、法律、規制、コンプライアンス関連の問題にも重点を置いています。

学校の観点から見ると、ビジネスの社会的影響はその発展よりも重要です。特に大規模なモデルの場合、ガバナンス、コンプライアンス、倫理に関する問題についてよく話されます。大規模モデルはもはや業界特有の単純なテクノロジーではなく、誰もがそれを使用してテキストや画像を生成できるため、潜在的なセキュリティ問題も発生します。

これらの質問はデータと技術ツールにマッピングされ、たとえば、トレーニング モデルのデータの品質、プライバシー、セキュリティはどうなっていますか? この部分には、エンジニアの努力だけでなく、弁護士などの専門家の強力なサポートも必要です。この拠点を一緒に作りましょう。これに基づいて、上記のチップ層、ソフトウェア、その他の内容に焦点を当てます。

技術レベルでは、私は基本的なツールチェーンにもっと注意を払っています。これらのツールチェーンは営利企業のように直接的な商業的価値を持たない可能性があり、大学はこれらのことを行う機会が増えるでしょう。現在、復旦大学などの多くの大学がいくつかの基本的なソフトウェアを構築していますが、これは我が国に現在欠けているものですが、これらのツールチェーン自体にはそれほど商業的価値はありませんが、核となる基本的なものです。したがって、学校の観点から、私たちはこれらと前述の倫理遵守の問題にさらに注意を払っています。

砂の剣:その生態と大型モデルの上流・下流への影響について、ソフトウェアとハードウェアの観点からお話しします。

アルゴリズム開発者の観点から見ると、大規模モデルは、エンジニアリングの観点から一般的なタスクを解決するアルゴリズム モデルであり、計算能力、データ、パラメーターの量が上限を決定します。モデルの機能。しかし現在、多くの研究が大規模モデルの軽量化に焦点を当て始めています。これは、モデルにそれほど多くのパラメータが必要ないからではなく、現在のソフトウェア層とハードウェア層が追いつかないからです。

ソフトウェア、ハードウェア、アルゴリズムの歴史全体のサイクルは、実際にはスパイラルであり、相互に強化し合う開発プロセスです。現在、大きなモデルがボールを投げ、そのソフトウェア、特にハードウェアのコストが非常に高くなっています。

現在、大規模モデルの商用実装に影響を与えている最大の問題は、推論のコストです。トレーニングコストが第一の側面ですが、トレーニングが遅くても実行可能です。結局のところ、プロセスはオフラインであり、1 か月のトレーニングで 1,000 億の大きなモデルを作成できます。しかし、理由は異なります。たとえば、QPS を全国の 10 億人以上に無料で提供すると、コストが高くなりすぎる可能性があります。ユーザーを失うのが最大の問題です。

現在、全国のすべての政党がこれらの問題に取り組んでいます。ハードウェア層の観点から見ると、米国の弾圧により、購入するカードは基本的に去勢版となっており、大手企業も国産カードの適用を模索している。私の観察に関する限り、国内のカードコンピューティング能力を示す現在のさまざまな指標は良好です。

ソフトウェアに関して言えば、NVIDIA が CUDA に基づいて構築した GPU エコロジカル ソフトウェア スタックには依然として強力な堀があり、上位層のトレーニング フレームワークから基盤となるオペレーター ライブラリまでをカバーしており、国内のハードウェア メーカーが登らなければならない山でもあります。大手ハードウェア企業は独自のソフトウェア スタックを開発し、さまざまな戦略を採用しています。

しかし、ユーザーと開発者の観点から見ると、私は、コンパイラ レベルで独自のエコロジーに適応し、ユーザー レベルで主流のオープン ソース フレームワークに収束して、ユーザーがパフォーマンスの向上だけを認識できるようにすることを願っています。現在はこの傾向が主流のようですが、大手企業は自社の事業戦略上、必ずしも全面的に賛同できるわけではありません。

したがって、ソフトウェア層とハードウェア層の観点から見ると、現在のニーズに追いつくには、ある程度の時間と技術的なブレークスルーが必要です。これは挑戦ですが、素晴らしいチャンスでもあります。

徐凱勇:投資コミュニティは、上流および下流のモデルとその関連産業に細心の注意を払っています。

例えばモデルの最下層では、3D ネットワークや RDBMS などのインフラストラクチャ層におけるいくつかの機会を見ていきます。アプリケーション層私たちは、財務報告書や発表を自動的に読んだり、自動的に要約したりする金融業界、障害検出を実行する業界、企業が専用のデータベースを持っている業界、スタートアップ企業がプライベートな大規模モデルや小規模なモデルを提供しているなど、一部の垂直産業における機会に注目します。この問題または一連の問題を解決します。

投資家は、大型モデルの上流と下流に加えて、大型モデルや人工知能の新たな可能性にも注目するでしょう。例えば、私は最近、オープンソース分野や量子コンピューティング関連の分野に注目しています。これは、従来の人工知能は大規模なモデルを含み、その性能がコストに比例して増加しますが、量子コンピューティングは指数関数的に増加するためです。

過去 10 ~ 12 年の間に、Apache、Mongo DB などのオープンソース テクノロジーに基づいた (または上場企業の親会社に基づいた) かなりの数の米国ナスダック上場企業が誕生しました。オープンソースに投資したこれらの企業は、優れたビジネス価値と利益を達成していることがわかります。しかし、中国を振り返ってみると、オープンソースエコシステムに投資している中国企業はほとんどなく、上場したり主導権を握った企業はさらに少ない。 Q4: 先生方、中国のオープンソース エコシステムのビジネス モデルは本当に軌道に乗っていますか?ビジネスで成功した事例はありますか?もしそうなら、大型モデルがこの傾向に貢献するでしょうか?そうでない場合、より大型のモデルがこの傾向に加わる可能性はありますか?

徐凱勇:中国には基本的にオープンソースの上場企業はありませんが、海外にはオープンソースの上場企業が数多くあります。中国と米国のオープンソースのリスト結果における主な違いは人材の要素だと思います。米国には世界中から才能が集まり、オープンなアイデアとユニークな洞察を持っています。オープンソース プロジェクトのイニシエーターのほとんどはシリコンバレー出身です。

中国にもオープンソースに携わる開発者/オピニオンリーダーが多数います。オープンソース上場企業はまだありませんが、特に大規模モデルの分野では、将来的にはそうなる可能性があると思います。

現在、国内で大規模なモデルを製造できるのは中国と米国だけであり、より直接的な競争に直面していますが、長年にわたって多数のコンピューター人材を育成しており、オープンソースへの参加者も増えています。したがって、オープンソース分野で公開会社を設立する機会はまだあります。

砂の剣:中国ではあまり成功しているオープンソース プロジェクトはリストされていないようですが、有名なオープンソース プロジェクトやスタートアップは確かに存在します。

結局のところ、シリコンバレーの雰囲気は確かに良くなり、長年にわたって発展してきたため、海外のオープンソース財団や投資機関は、コミュニティの協力や商業化の育成など、潜在的なオープンソースプロジェクトに対する優れたインキュベーションと指導メカニズムを備えています。プロジェクトが大きく成長することはありません。私たちはまだ追いつくプロセスが必要であり、国も教育を含むこれらの側面への投資を続ける必要があります。

中国のこの急成長産業において、上場したい場合は、第一に、企業の技術蓄積が比較的深くなければならず、第二に、テストに耐えられるビジネスモデルが必要です。多くの優れたオープンソース プロジェクトは、自分たちのものからどうやってお金を稼ぐかについて考えていないことがわかりましたが、実際にはこれが最も重要なことです。

王偉:一つ目は商業的な成功です。私は商業化の成功は必ずしもオープンソースかどうかに関係ないと常々信じてきました。商業レベルでは、市場に必要とされているかどうか、顧客のニーズを満たしているかどうかによって決まりますが、オープンソースは現在、宣伝の手段としての側面が強いです。

2 点目は、大規模モデルのオープンソースとは一体何を意味するのかということです。モデルのオープンソースは、ソフトウェア コードのオープンソースとは異なります。モデルがオープンソース化された後に開発者とユーザーができることは、私たちにとって新しい経験です。モデル オープン ソースはダウンロードして使用できる方法ですが、いくつかの新しい問題ももたらし、従来のオープン ソースの定義やフレームワークを適用することが困難になります。したがって、モデルのコミュニティと生態系をどのように構築するかは、まったく新しい問題です。

私が個人的に最も重視しているのは才能の育成です。オープンソースは才能の育成に非常に役立つと思います。

まず第一に、大学生は最先端のテクノロジーに迅速にアクセスできるようになります。Llama の登場後、多くの大学がすぐに導入、微調整、独自の分野に関連したコンテンツの追加を行い、そのすべてがオープンソースの恩恵を受けました。

第 2 に、オープンソースのコラボレーション モデルは、純粋に技術的なトレーニングよりも学生のトレーニングに役立ちます。これは学生のコミュニケーションスキルを大幅に向上させ、パートナーと競争的かつ協力的な関係を築く方法を教えてくれますが、これはまさに中国人の学生に欠けているものです。中国には海外ほど成熟したオープンソース プロジェクトが存在しませんが、一方では言語の問題が原因である可能性があり、私たちは自分の意見を表現することがあまり得意ではありません。公の場ではもちろんですが、コミュニティではいくつかの事実に基づいて自分の意見を表明する必要があります。したがって、オープンソースは、この分野における学生の能力を鍛えるのに最適なトレーニングとなります。

私は学生にオープンソース プロジェクトやコミュニティ、特に中国のオープンソース プロジェクトに参加することを強く推奨します。また、より多くの企業がコミュニティに積極的に貢献する学生にもっと多くの機会を提供できることを願っています。

科学研究、産業、投資の観点から見たオープンソースの大規模モデル

現在、大規模モデルにはコード生成機能があり、エンジニアリング アーキテクチャの提案も提供できます。特にコンピューター分野では、将来的には多くの仕事が AI に置き換わるといわれており、大規模モデルの出現により仕事のパラダイムが多少変化する可能性があります。 Q1: 王偉先生は、オープンソースの先駆者であり、華東師範大学の学術リーダーとして、コンピューター分野の人材育成の過程で AI がもたらした変化についてどう思いますか?今後大型モデルの強力化が進む中、学生や人材を育成する際、どのようなスキルに重点を置いてスキルアップを図っていきますか?

王偉氏、華東師範大学データ理工学部教授、開源協会理事

王偉:現在、私たちはオープンソースを積極的に採用しており、コース上の多くのプロジェクト、トピック、Q&A のやりとりは GitHub リポジトリを使用して実装されています。大きなモデルでできることであれば、できるだけ大きなモデルで行うことを学生に勧めます。さらに、教師もこれらの実践に参加することが奨励されています。

コンピューター サイエンスの学生や教師にとって、大規模なモデルを使用できるだけでは十分ではなく、アプリケーションやツールをより適切に作成できるように、その背後にある原理を理解することも必要です。将来、一部の仕事や職業は大型モデルに置き換わることは間違いありませんが、産業革命と同じように、多くの労働者が失業した一方で、より多くの新しい産業や職業も生まれました。そのため、私たちは学生たちに、「これからは新しい業界や職業がどんどん出てくるので、在学中に準備しておく必要がある」と伝え、それを受け入れることから準備が始まります。

第二に、起業家の役割も非常に重要です。あなたは雇用を生み出す組織です。大型モデルの登場以降、プロンプトエンジニアやチューニングエンジニアといった新たなポジションも登場しており、今後も新たなポジションはどんどん増えていくでしょう。これらは起業家によって生み出される機会です。

Ant は、SOFA やクラウド ネイティブ ミドルウェアに関する一連のオープン ソース作業など、オープン ソース エコシステムで多くの作業を行ってきました。これらの作業は、業界全体のクラウド ネイティブ サポートに非常に優れた環境基盤を提供したと言えます。 Q2: Sha Jian 氏から、オープンソースの大規模モデルの分野における Ant の今後の方向性について紹介していただけますか?同時に、技術専門家として、オープンソース分野における Ant の取り組みの有効性をどのように評価しますか?また、この取り組みは Ant 会社全体にとってどれほど価値があるのでしょうか?

Sha Jian 氏、Ant Group 上級技術専門家

Sha Jian: Ant はオープンソースを採用しています。社内プロジェクトがうまく育成されれば、同社はすべての人にオープンソース化を奨励するでしょう。これは、技術的な影響力を高め、テクノロジー企業のイメージを構築するためです。

AI分野や大型モデルのラインナップはいくつかに分かれます。

まず最も基本的なのはインフラです。これは制作ツールに相当し、全体としてオープンソースになります。現在、トレーニングの最初のステップの AI インフラストラクチャは DLRover で完全にリリースできるようになり、推論部分全体に加え、GPU 仮想化、GPU クラスター、AIDC も段階的にリリースされる予定です。

アプリケーション層に関しては、正式に発表されている一部の大規模モデルはデータの問題により完全にオープンではない可能性がありますが、CodeFuse などの一部の大規模な垂直モデルは徐々にオープンソースになりつつあり、現在多くのチームが徐々にオープンソースに移行しています。

私たち自身の DLRover プロジェクトに関しては、なぜオープンソースにする必要があるのかについても考えています。このプロジェクトの潜在的なユースケースは何ですか?

Alibaba Cloud や Baidu Cloud などの一部のクラウド ベンダーは、独自のサービスを販売する必要があるため、独自のアプリケーションとハードウェアを開発します。しかし、大量のハードウェアと研究者を備えているにもかかわらず、これらのハードウェアを効率的に使用するための専門的なインフラ チームが不足している機関が依然として多くあり、DLRover はこれを支援したいと考えています。これは、彼らに権限を与えたり、Ant 内で検証された完全なソリューション セットを提供したりすることに相当します。これは潜在的な可能性であり、コンポーネントの 1 つを個別に実行できる個人の開発者などのエンド ユーザーも存在します。したがって、対象者はかなり幅広いです。

私たちはこれらのユーザー向けにプロジェクトを構築したいと考えていますが、将来的にどのように商用化できるか、またはそのような目標は現時点ではありません。

観察によると、オープンソース プロジェクトに投資する中国人民元ファンドはほとんどなく、中国のオープンソース プロジェクトへの主な投資家も一部の米ドルファンドでした。徐氏の投資機関は、中国で比較的代表的な人民元ファンドとして、多数のAIチップ/大型モデル企業に直接的または間接的に投資を行っている。 Q3: 優れたエグジット実績を誇るファンドとして、貴機関や個人はオープンソースへの投資についてどのような考えを持っていますか?今後、オープンソース プロジェクトへの投資に前向きな姿勢をとりますか?その理由は何ですか?

徐凱勇氏、有名投資機関の副総経理

Xu Kaiyong: オープンソースはソフトウェア業界において無視できない勢力です。当社はオープンソース分野でも存在感を示しており、テクノロジーソフトウェアインフラ、データベース、データガバナンス、その他の関連企業に投資してきました。私は個人的に情報技術、ソフトウェア、オープンソースを信じており、大学でコードを書いて以来、オープンソースの恩恵を受け、推進者でした。

私たちのファンド全体の運営も非常にオープンであり、オープンソース分野への投資を強力にサポートし、質の高いオープンソース プロジェクトの発掘に引き続き注目し、促進しています。ただし、すべての投資機関がそれほどオープンであるわけではありません。一部の投資家はオープンソースを理解しておらず、オープンソースは無料であると考えており、そのことがオープンソースへの投資の敷居を高めています。

かつてはオープンソース投資は米ドルファンドが中心でしたが、現在では米ドルファンドの傾向は薄れています。そうなると人民元ファンドもオープンソースソフトウェア投資の旗を掲げなければならない。

今後の展望

オープンソースは、2021 年に国の「第 14 次 5 か年計画」に初めて組み込まれました。平等、オープン、コラボレーション、共有の優れた創造モデルにより、オープンソースはデジタル テクノロジーのイノベーションの原動力となり続け、最適化されています。ソフトウェア生産モデルは、伝統的産業の変革とアップグレードを支援し、企業がコストを削減し効率を向上させるための重要なエンジンです。

大型モデルは最先端の新興技術の代表として、今後の開発が模索されている時期にあります。オープンソース コミュニティは世界中の才能を結集し、大規模モデルの反復、最適化、実装を加速するために協力することができ、それによって高品質の製品とサービスによってあらゆる分野でのデジタル変革とビジネスの成功を促進します。

全体として、オープンソースの大規模モデルは無限の機会を提供しますが、多くの課題にも直面しています。国産大型モデルがしのぎを削る昨今、数千台のモデルが競合する中、誰が抜きん出てくるだろうか。コメント欄にぜひご意見を残してください。

この記事はもともと以下から公開されました HyperAI スーパーニューラルWeChatパブリックプラットフォーム~