HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
SenseNova-MARS:強化学習を活用したマルチモーダルエージェント型推論と検索の実現
エージェント
マルチモーダル表現
Yong Xien Chng, Tao Hu, Wenwen Tong, et al.
アバター・フォースイング:自然な会話を実現するリアルタイム対話型ヘッドアバター生成
人間-コンピュータインタラクション
エムボディドインテリジェンス
Taekyung Ki, Sangwon Jang, Jaehyeong Jo, et al.
NeoVerse:リアルワールドの単眼動画を活用した4Dワールドモデルの強化
動画生成
3Dモデル
Yuxue Yang, Lue Fan, Ziqi Shi, et al.
Youtu-Agent:自動生成とハイブリッドポリシー最適化によるエージェント生産性のスケーリング
エージェント
LLM
Yuchen Shi, Yuzheng Cai, Siqi Cai, et al.
IQuest-Coder-V1 技術報告
コード生成
エージェント
Jian Yang, Wei Zhang, Shawn Guo, et al.
再帰型言語モデル
LLM
エージェント
Alex L. Zhang, Tim Kraska, Omar Khattab
FlowBlending:段階認識型マルチモデルサンプリングによる高速かつ高忠実度の動画生成
動画生成
拡散モデル
Jibin Song, Mingi Kwon, Jaeseok Jeong, et al.
Dream2Flow:3Dオブジェクトフローを用いたビデオ生成とオープンワールド操作の橋渡し
動画生成
ロボティクス
Karthik Dharmarajan, Wenlong Huang, Jiajun Wu, et al.
拡散LLMにおける離散性の役割
拡散モデル
LLM
Ziqi Jin, Bin Wang, Xiang Lin, et al.
DiffThinker:拡散モデルを用いた生成型マルチモーダル推論へ向けて
拡散モデル
Reasoning
Zefeng He, Xiaoye Qu, Yafu Li, et al.
動的大型概念モデル:適応型意味空間における潜在的推論
LLM
自然言語処理
Xingwei Qu, Shaowen Wang, Zihao Huang, et al.
長文脈複雑関係モデリングにおけるハイパーグラフベースメモリを用いたマルチステップRAGの改善
検索拡張生成
Reasoning
Chulun Zhou, Chunkang Zhang, Guoxin Yu, et al.
AIが脳に出会う:認知神経科学から自律エージェントへ至る記憶システム
エージェント
LLM
Jiafeng Liang, Hao Li, Chang Li, et al.
スケーラビリティの向上による開かれたエンドリーディング推論による未来予測
Reasoning
検索拡張生成
Nikhil Chandak, Shashwat Goel, Ameya Prabhu, et al.
GaMO:スパースビュー3D再構成のための幾何学的注意型マルチビュー拡散外挿
拡散モデル
3D マシンビジョン
Yi-Chuan Huang, Hao-Jen Chien, Chin-Yang Lin, et al.
mHC:多様体制約付きハイパーパス
Transformer
モデル学習
Zhenda Xie, Yixuan Wei, Huanqi Cao, et al.
Let It Flow: ロックンロールにおけるエージェンティック・クラフティング、オープンエージェンティック・ラーニングエコシステム内でのROMEモデル構築
エージェント
オープンソース
Weixun Wang, XiaoXiao Xu, Wanhe An, et al.
Youtu-LLM:軽量型大規模言語モデルにおけるネイティブなエージェント機能の潜在能力を解き放つ
エージェント
LLM
Junru Lu, Jiarui Qin, Lingfeng Qiao, et al.
GateBreaker:Mixture-of-Expert LLMsにおけるGate誘導型攻撃
LLM
テキスト生成
Lichao Wu, Sasha Behrouzi, Mohamadreza Rostami, et al.
GraphLocator:グラフ誘導型因果推論を用いた問題局所化
Reasoning
アルゴリズム
Wei Liu, Chao Peng, Pengfei Gao, et al.
RLVRにおけるパラメータ効率的な手法の評価
強化学習
監視付き微調整
Qingyu Yin, Yulun Wu, Zhennan Shen, et al.
エンドツーエンドテスト時学習による長文脈処理
Transformer
自然言語処理
Arnuv Tandon, Karan Dalal, Xinhao Li, et al.
DreamOmni3:スクリブルベースの編集と生成
画像生成
画像修復
Bin Xia, Bohao Peng, Jiyang Liu, et al.
UltraShape 1.0:スケーラブルな幾何学的精緻化を用いた高忠実度3D形状生成
3D生成
拡散モデル
Tanghui Jia, Dongyu Yan, Dehao Hao, et al.
mimic-video:汎用的なロボット制御のためのビデオ・アクションモデル—VLAsを超えた枠組み
ロボティクス
エムボディドインテリジェンス
Jonas Pai, Liam Achenbach, Victoriano Montesinos, et al.
HY-Motion 1.0:テキストからモーション生成へのフローマッチングモデルのスケーリング
拡散モデル
3D生成
Yuxin Wen, Qing Shuai, Di Kang, et al.
SurgWorld:ワールドモデリングを用いた動画からの外科ロボット方策学習
ロボティクス
エムボディドインテリジェンス
Yufan He, Pengfei Guo, Mengya Xu, et al.
SpotEdit:拡散変換器における選択的領域編集
拡散モデル
画像処理
Zhibin Qin, Zhenxiong Tan, Zeqing Wang, et al.
拡散モデルは透過性を理解する:動画拡散モデルを用いた透過物体の深度および法線推定
深度推定
拡散モデル
Shaocong Xu, Songlin Wei, Qizhe Wei, et al.
SmartSnap:自己検証型エージェントにおける能動的証拠探索
エージェント
強化学習
Shaofei Cai, Yulei Qin, Haojia Lin, et al.
Yume-1.5:テキスト制御型インタラクティブな世界生成モデル
テキストから動画
拡散モデル
Xiaofeng Mao, Zhen Li, Chuanhao Li, et al.
LiveTalk:改善されたオンポリシー蒸留を用いたリアルタイムマルチモーダル相互作用型ビデオディフュージョン
拡散モデル
動画生成
Ethan Chern, Zhulin Hu, Bohao Tang, et al.
1
7
8
9
10
11
12
13
51
SenseNova-MARS:強化学習を活用したマルチモーダルエージェント型推論と検索の実現
エージェント
マルチモーダル表現
Yong Xien Chng, Tao Hu, Wenwen Tong, et al.
アバター・フォースイング:自然な会話を実現するリアルタイム対話型ヘッドアバター生成
人間-コンピュータインタラクション
エムボディドインテリジェンス
Taekyung Ki, Sangwon Jang, Jaehyeong Jo, et al.
NeoVerse:リアルワールドの単眼動画を活用した4Dワールドモデルの強化
動画生成
3Dモデル
Yuxue Yang, Lue Fan, Ziqi Shi, et al.
Youtu-Agent:自動生成とハイブリッドポリシー最適化によるエージェント生産性のスケーリング
エージェント
LLM
Yuchen Shi, Yuzheng Cai, Siqi Cai, et al.
IQuest-Coder-V1 技術報告
コード生成
エージェント
Jian Yang, Wei Zhang, Shawn Guo, et al.
再帰型言語モデル
LLM
エージェント
Alex L. Zhang, Tim Kraska, Omar Khattab
FlowBlending:段階認識型マルチモデルサンプリングによる高速かつ高忠実度の動画生成
動画生成
拡散モデル
Jibin Song, Mingi Kwon, Jaeseok Jeong, et al.
Dream2Flow:3Dオブジェクトフローを用いたビデオ生成とオープンワールド操作の橋渡し
動画生成
ロボティクス
Karthik Dharmarajan, Wenlong Huang, Jiajun Wu, et al.
拡散LLMにおける離散性の役割
拡散モデル
LLM
Ziqi Jin, Bin Wang, Xiang Lin, et al.
DiffThinker:拡散モデルを用いた生成型マルチモーダル推論へ向けて
拡散モデル
Reasoning
Zefeng He, Xiaoye Qu, Yafu Li, et al.
動的大型概念モデル:適応型意味空間における潜在的推論
LLM
自然言語処理
Xingwei Qu, Shaowen Wang, Zihao Huang, et al.
長文脈複雑関係モデリングにおけるハイパーグラフベースメモリを用いたマルチステップRAGの改善
検索拡張生成
Reasoning
Chulun Zhou, Chunkang Zhang, Guoxin Yu, et al.
AIが脳に出会う:認知神経科学から自律エージェントへ至る記憶システム
エージェント
LLM
Jiafeng Liang, Hao Li, Chang Li, et al.
スケーラビリティの向上による開かれたエンドリーディング推論による未来予測
Reasoning
検索拡張生成
Nikhil Chandak, Shashwat Goel, Ameya Prabhu, et al.
GaMO:スパースビュー3D再構成のための幾何学的注意型マルチビュー拡散外挿
拡散モデル
3D マシンビジョン
Yi-Chuan Huang, Hao-Jen Chien, Chin-Yang Lin, et al.
mHC:多様体制約付きハイパーパス
Transformer
モデル学習
Zhenda Xie, Yixuan Wei, Huanqi Cao, et al.
Let It Flow: ロックンロールにおけるエージェンティック・クラフティング、オープンエージェンティック・ラーニングエコシステム内でのROMEモデル構築
エージェント
オープンソース
Weixun Wang, XiaoXiao Xu, Wanhe An, et al.
Youtu-LLM:軽量型大規模言語モデルにおけるネイティブなエージェント機能の潜在能力を解き放つ
エージェント
LLM
Junru Lu, Jiarui Qin, Lingfeng Qiao, et al.
GateBreaker:Mixture-of-Expert LLMsにおけるGate誘導型攻撃
LLM
テキスト生成
Lichao Wu, Sasha Behrouzi, Mohamadreza Rostami, et al.
GraphLocator:グラフ誘導型因果推論を用いた問題局所化
Reasoning
アルゴリズム
Wei Liu, Chao Peng, Pengfei Gao, et al.
RLVRにおけるパラメータ効率的な手法の評価
強化学習
監視付き微調整
Qingyu Yin, Yulun Wu, Zhennan Shen, et al.
エンドツーエンドテスト時学習による長文脈処理
Transformer
自然言語処理
Arnuv Tandon, Karan Dalal, Xinhao Li, et al.
DreamOmni3:スクリブルベースの編集と生成
画像生成
画像修復
Bin Xia, Bohao Peng, Jiyang Liu, et al.
UltraShape 1.0:スケーラブルな幾何学的精緻化を用いた高忠実度3D形状生成
3D生成
拡散モデル
Tanghui Jia, Dongyu Yan, Dehao Hao, et al.
mimic-video:汎用的なロボット制御のためのビデオ・アクションモデル—VLAsを超えた枠組み
ロボティクス
エムボディドインテリジェンス
Jonas Pai, Liam Achenbach, Victoriano Montesinos, et al.
HY-Motion 1.0:テキストからモーション生成へのフローマッチングモデルのスケーリング
拡散モデル
3D生成
Yuxin Wen, Qing Shuai, Di Kang, et al.
SurgWorld:ワールドモデリングを用いた動画からの外科ロボット方策学習
ロボティクス
エムボディドインテリジェンス
Yufan He, Pengfei Guo, Mengya Xu, et al.
SpotEdit:拡散変換器における選択的領域編集
拡散モデル
画像処理
Zhibin Qin, Zhenxiong Tan, Zeqing Wang, et al.
拡散モデルは透過性を理解する:動画拡散モデルを用いた透過物体の深度および法線推定
深度推定
拡散モデル
Shaocong Xu, Songlin Wei, Qizhe Wei, et al.
SmartSnap:自己検証型エージェントにおける能動的証拠探索
エージェント
強化学習
Shaofei Cai, Yulei Qin, Haojia Lin, et al.
Yume-1.5:テキスト制御型インタラクティブな世界生成モデル
テキストから動画
拡散モデル
Xiaofeng Mao, Zhen Li, Chuanhao Li, et al.
LiveTalk:改善されたオンポリシー蒸留を用いたリアルタイムマルチモーダル相互作用型ビデオディフュージョン
拡散モデル
動画生成
Ethan Chern, Zhulin Hu, Bohao Tang, et al.
1
7
8
9
10
11
12
13
51