HyperAIHyperAI

Command Palette

Search for a command to run...

南大团队突破AI本地化瓶颈,国产显卡上实现模型显存减半

南京大学の李猛研究員らのチームが、AIのプライバシーとセキュリティを脅かす課題に挑む画期的な研究を発表した。2023年、三星がChatGPTを導入した直後、社内機密情報が多数漏洩する事態が発生。従業員が半導体設計データやコードをAIに直接入力した結果、これらの情報がクラウドの学習データに含まれるという事例は、AIのクラウド処理モデルに伴う重大なリスクを浮き彫りにした。現在、多くのスマートフォンAIアプリはユーザーの入力をクラウドに送信して処理するため、個人情報や企業の知的財産が外部に流出する危険性がある。 李猛チームは、AIモデルを端末(スマートフォンやPC)の内部で実行する「ローカル化」の実現に成功。この技術の核は、混合専門家モデル(MoE)における「低スコアの専門家は置き換え可能」という新発見。この法則を基に、専門家のキャッシュヒット率を2倍以上に高めるシステムを構築。これにより、従来2枚のGPUが必要だった処理が、1枚のGPUで可能に。特に、国産GPUの限られたVRAM(メモリ)環境でも、効率的なメモリ使用が実現した。 この成果は、スマートフォンなどの端末に強力なAIを搭載する可能性を開く。現在のスマホはメモリ制約により、高度なモデルを実行できず、性能を犠牲にしている。しかし、李猛チームの技術により、現行のメモリ容量で、従来は不可能だった大規模モデルの推論が可能に。ユーザーは、高価な大容量メモリ搭載機種を購入せずに、高機能AIを体験できる。 また、この研究は「ソフトウェア・ハードウェア・アルゴリズム」の連携設計の重要性を示した。李猛氏は、国産GPUの性能とエコシステムの進化を実感し、「国内の計算基盤は着実に成長している」と評価。今後は、端末やエッジデバイスでの低コスト・高効率なAI実装を推進し、AIを「電気や水」と同様に誰もが使えるインフラへと進化させるというビジョンを掲げる。 この技術により、ユーザーのデータは端末内で処理され、クラウドへの流出リスクをゼロに近づける。プライバシーを重視するユーザーにとって、まさに「データを自分の手に置く」実現手段となる。

関連リンク

南大团队突破AI本地化瓶颈,国产显卡上实现模型显存减半 | 人気の記事 | HyperAI超神経