GPUメモリ最大16倍削減でAI視覚を高精度化
韓国科学技術院(KAIST)を拠点とするキム・チャンギク教授らを代表とする国際共同研究チームは、AIの視覚認識性能を維持しつつGPUメモリの使用量を最大16倍まで削減するアップサンプリング技術「Upsample Anything」を開発した。この成果は国際会議CVPR 2026で採択され、計算リソースの効率的な利用が認められ「CVPR Compute Gold Star」、研究プロセスの透明性と再現性の高さにより総合首位の「Transparency Champion」を同時に受賞した。 従来のビジョンファウンデーションモデルでは、処理速度とメモリ節約のため画像を低解像度の特徴量に圧縮する手法が主流であった。しかしこの過程では小物体や微細な構造、欠陥といった重要な視覚情報が消失する課題があった。一方、全画像を高解像度で処理すれば認識精度は向上するが、メモリと計算コストが膨大となり、スマートフォンや自律走行車、人間型ロボットといったリソース制約の厳しい環境でのリアルタイム運用は困難だった。 本研究チームが開発した新技術は、追加データを用いた再学習を必要としない学習不要型のアプローチを採用している。入力画像から得られた低解像度の特徴マップに対して、画像の輪郭や構造情報を活用したテストタイム最適化を適用し、ピクセルレベルの双方向アップサンプリングを行うことで、高解像度の特徴マップを高精度に復元する。この機構により、単一枚の画像から最適な復元方法を自動導出し、多様な環境に即時適応可能となった。 実験では、AI研究で標準的な224×224ピクセルの画像に対し約0.4秒で処理を完了し、従来の手法と比較してGPUメモリ効率を最大16倍向上させる実績を達成した。キム教授は本アルゴリズムが限られた計算資源でAIの視覚精度を飛躍的に高め、人間型ロボットやオンデバイスAIの実用化を加速させると指摘する。さらに、パフォーマンスだけでなく計算効率と研究透明性においても国際学会から高い評価を得たと強調した。 本技術は、メモリ制約の厳しいエッジデバイスやモバイルプラットフォームへの組み込みが容易であり、自律走行、人間型ロボットの微細物体認識・制御、およびローカル環境で動作する次世代AIシステムの普及を後押しすると期待されている。
