HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
FlowBlending:段階認識型マルチモデルサンプリングによる高速かつ高忠実度の動画生成
動画生成
拡散モデル
Jibin Song, Mingi Kwon, Jaeseok Jeong, et al.
Dream2Flow:3Dオブジェクトフローを用いたビデオ生成とオープンワールド操作の橋渡し
動画生成
ロボティクス
Karthik Dharmarajan, Wenlong Huang, Jiajun Wu, et al.
拡散LLMにおける離散性の役割
拡散モデル
LLM
Ziqi Jin, Bin Wang, Xiang Lin, et al.
DiffThinker:拡散モデルを用いた生成型マルチモーダル推論へ向けて
拡散モデル
Reasoning
Zefeng He, Xiaoye Qu, Yafu Li, et al.
動的大型概念モデル:適応型意味空間における潜在的推論
LLM
自然言語処理
Xingwei Qu, Shaowen Wang, Zihao Huang, et al.
長文脈複雑関係モデリングにおけるハイパーグラフベースメモリを用いたマルチステップRAGの改善
検索拡張生成
Reasoning
Chulun Zhou, Chunkang Zhang, Guoxin Yu, et al.
AIが脳に出会う:認知神経科学から自律エージェントへ至る記憶システム
エージェント
LLM
Jiafeng Liang, Hao Li, Chang Li, et al.
スケーラビリティの向上による開かれたエンドリーディング推論による未来予測
Reasoning
検索拡張生成
Nikhil Chandak, Shashwat Goel, Ameya Prabhu, et al.
GaMO:スパースビュー3D再構成のための幾何学的注意型マルチビュー拡散外挿
拡散モデル
3D マシンビジョン
Yi-Chuan Huang, Hao-Jen Chien, Chin-Yang Lin, et al.
mHC:多様体制約付きハイパーパス
Transformer
モデル学習
Zhenda Xie, Yixuan Wei, Huanqi Cao, et al.
Let It Flow: ロックンロールにおけるエージェンティック・クラフティング、オープンエージェンティック・ラーニングエコシステム内でのROMEモデル構築
エージェント
オープンソース
Weixun Wang, XiaoXiao Xu, Wanhe An, et al.
Youtu-LLM:軽量型大規模言語モデルにおけるネイティブなエージェント機能の潜在能力を解き放つ
エージェント
LLM
Junru Lu, Jiarui Qin, Lingfeng Qiao, et al.
GateBreaker:Mixture-of-Expert LLMsにおけるGate誘導型攻撃
LLM
テキスト生成
Lichao Wu, Sasha Behrouzi, Mohamadreza Rostami, et al.
GraphLocator:グラフ誘導型因果推論を用いた問題局所化
Reasoning
アルゴリズム
Wei Liu, Chao Peng, Pengfei Gao, et al.
RLVRにおけるパラメータ効率的な手法の評価
強化学習
監視付き微調整
Qingyu Yin, Yulun Wu, Zhennan Shen, et al.
エンドツーエンドテスト時学習による長文脈処理
Transformer
自然言語処理
Arnuv Tandon, Karan Dalal, Xinhao Li, et al.
DreamOmni3:スクリブルベースの編集と生成
画像生成
画像修復
Bin Xia, Bohao Peng, Jiyang Liu, et al.
UltraShape 1.0:スケーラブルな幾何学的精緻化を用いた高忠実度3D形状生成
3D生成
拡散モデル
Tanghui Jia, Dongyu Yan, Dehao Hao, et al.
mimic-video:汎用的なロボット制御のためのビデオ・アクションモデル—VLAsを超えた枠組み
ロボティクス
エムボディドインテリジェンス
Jonas Pai, Liam Achenbach, Victoriano Montesinos, et al.
HY-Motion 1.0:テキストからモーション生成へのフローマッチングモデルのスケーリング
拡散モデル
3D生成
Yuxin Wen, Qing Shuai, Di Kang, et al.
SurgWorld:ワールドモデリングを用いた動画からの外科ロボット方策学習
ロボティクス
エムボディドインテリジェンス
Yufan He, Pengfei Guo, Mengya Xu, et al.
SpotEdit:拡散変換器における選択的領域編集
拡散モデル
画像処理
Zhibin Qin, Zhenxiong Tan, Zeqing Wang, et al.
拡散モデルは透過性を理解する:動画拡散モデルを用いた透過物体の深度および法線推定
深度推定
拡散モデル
Shaocong Xu, Songlin Wei, Qizhe Wei, et al.
SmartSnap:自己検証型エージェントにおける能動的証拠探索
エージェント
強化学習
Shaofei Cai, Yulei Qin, Haojia Lin, et al.
Yume-1.5:テキスト制御型インタラクティブな世界生成モデル
テキストから動画
拡散モデル
Xiaofeng Mao, Zhen Li, Chuanhao Li, et al.
LiveTalk:改善されたオンポリシー蒸留を用いたリアルタイムマルチモーダル相互作用型ビデオディフュージョン
拡散モデル
動画生成
Ethan Chern, Zhulin Hu, Bohao Tang, et al.
Mixture-of-Expertsにおける補助損失を用いたエキスパートとルーターの結合
LLM
アルゴリズム
Ang Lv, Jin Ma, Yiyuan Ma, et al.
LongFly:時空間的コンテキスト統合を用いた長期予測UAV視覚言語ナビゲーション
ロボティクス
ビデオ理解
Wen Jiang, Li Wang, Kangyao Huang, et al.
注目はあなたが必要なものではない
Transformer
言語
Zhang Chong
SlideTailor:科学論文向けのパーソナライズ型プレゼンテーションスライド生成
テキスト生成
人間-コンピュータインタラクション
Wenzheng Zeng, Mingyu Ouyang, Langyuan Cui, et al.
InSight-o3:汎用視覚検索によるマルチモーダル基盤モデルの強化
エージェント
マルチモーダル表現
Kaican Li, Lewei Yao, Jiannan Wu, et al.
InsertAnywhere:4Dシーン幾何と拡散モデルを橋渡しするリアルな動画オブジェクト挿入
拡散モデル
ビデオ処理
Hoiyeong Jin, Hyojin Jang, Jeongho Kim, et al.
1
3
4
5
6
7
8
9
47
FlowBlending:段階認識型マルチモデルサンプリングによる高速かつ高忠実度の動画生成
動画生成
拡散モデル
Jibin Song, Mingi Kwon, Jaeseok Jeong, et al.
Dream2Flow:3Dオブジェクトフローを用いたビデオ生成とオープンワールド操作の橋渡し
動画生成
ロボティクス
Karthik Dharmarajan, Wenlong Huang, Jiajun Wu, et al.
拡散LLMにおける離散性の役割
拡散モデル
LLM
Ziqi Jin, Bin Wang, Xiang Lin, et al.
DiffThinker:拡散モデルを用いた生成型マルチモーダル推論へ向けて
拡散モデル
Reasoning
Zefeng He, Xiaoye Qu, Yafu Li, et al.
動的大型概念モデル:適応型意味空間における潜在的推論
LLM
自然言語処理
Xingwei Qu, Shaowen Wang, Zihao Huang, et al.
長文脈複雑関係モデリングにおけるハイパーグラフベースメモリを用いたマルチステップRAGの改善
検索拡張生成
Reasoning
Chulun Zhou, Chunkang Zhang, Guoxin Yu, et al.
AIが脳に出会う:認知神経科学から自律エージェントへ至る記憶システム
エージェント
LLM
Jiafeng Liang, Hao Li, Chang Li, et al.
スケーラビリティの向上による開かれたエンドリーディング推論による未来予測
Reasoning
検索拡張生成
Nikhil Chandak, Shashwat Goel, Ameya Prabhu, et al.
GaMO:スパースビュー3D再構成のための幾何学的注意型マルチビュー拡散外挿
拡散モデル
3D マシンビジョン
Yi-Chuan Huang, Hao-Jen Chien, Chin-Yang Lin, et al.
mHC:多様体制約付きハイパーパス
Transformer
モデル学習
Zhenda Xie, Yixuan Wei, Huanqi Cao, et al.
Let It Flow: ロックンロールにおけるエージェンティック・クラフティング、オープンエージェンティック・ラーニングエコシステム内でのROMEモデル構築
エージェント
オープンソース
Weixun Wang, XiaoXiao Xu, Wanhe An, et al.
Youtu-LLM:軽量型大規模言語モデルにおけるネイティブなエージェント機能の潜在能力を解き放つ
エージェント
LLM
Junru Lu, Jiarui Qin, Lingfeng Qiao, et al.
GateBreaker:Mixture-of-Expert LLMsにおけるGate誘導型攻撃
LLM
テキスト生成
Lichao Wu, Sasha Behrouzi, Mohamadreza Rostami, et al.
GraphLocator:グラフ誘導型因果推論を用いた問題局所化
Reasoning
アルゴリズム
Wei Liu, Chao Peng, Pengfei Gao, et al.
RLVRにおけるパラメータ効率的な手法の評価
強化学習
監視付き微調整
Qingyu Yin, Yulun Wu, Zhennan Shen, et al.
エンドツーエンドテスト時学習による長文脈処理
Transformer
自然言語処理
Arnuv Tandon, Karan Dalal, Xinhao Li, et al.
DreamOmni3:スクリブルベースの編集と生成
画像生成
画像修復
Bin Xia, Bohao Peng, Jiyang Liu, et al.
UltraShape 1.0:スケーラブルな幾何学的精緻化を用いた高忠実度3D形状生成
3D生成
拡散モデル
Tanghui Jia, Dongyu Yan, Dehao Hao, et al.
mimic-video:汎用的なロボット制御のためのビデオ・アクションモデル—VLAsを超えた枠組み
ロボティクス
エムボディドインテリジェンス
Jonas Pai, Liam Achenbach, Victoriano Montesinos, et al.
HY-Motion 1.0:テキストからモーション生成へのフローマッチングモデルのスケーリング
拡散モデル
3D生成
Yuxin Wen, Qing Shuai, Di Kang, et al.
SurgWorld:ワールドモデリングを用いた動画からの外科ロボット方策学習
ロボティクス
エムボディドインテリジェンス
Yufan He, Pengfei Guo, Mengya Xu, et al.
SpotEdit:拡散変換器における選択的領域編集
拡散モデル
画像処理
Zhibin Qin, Zhenxiong Tan, Zeqing Wang, et al.
拡散モデルは透過性を理解する:動画拡散モデルを用いた透過物体の深度および法線推定
深度推定
拡散モデル
Shaocong Xu, Songlin Wei, Qizhe Wei, et al.
SmartSnap:自己検証型エージェントにおける能動的証拠探索
エージェント
強化学習
Shaofei Cai, Yulei Qin, Haojia Lin, et al.
Yume-1.5:テキスト制御型インタラクティブな世界生成モデル
テキストから動画
拡散モデル
Xiaofeng Mao, Zhen Li, Chuanhao Li, et al.
LiveTalk:改善されたオンポリシー蒸留を用いたリアルタイムマルチモーダル相互作用型ビデオディフュージョン
拡散モデル
動画生成
Ethan Chern, Zhulin Hu, Bohao Tang, et al.
Mixture-of-Expertsにおける補助損失を用いたエキスパートとルーターの結合
LLM
アルゴリズム
Ang Lv, Jin Ma, Yiyuan Ma, et al.
LongFly:時空間的コンテキスト統合を用いた長期予測UAV視覚言語ナビゲーション
ロボティクス
ビデオ理解
Wen Jiang, Li Wang, Kangyao Huang, et al.
注目はあなたが必要なものではない
Transformer
言語
Zhang Chong
SlideTailor:科学論文向けのパーソナライズ型プレゼンテーションスライド生成
テキスト生成
人間-コンピュータインタラクション
Wenzheng Zeng, Mingyu Ouyang, Langyuan Cui, et al.
InSight-o3:汎用視覚検索によるマルチモーダル基盤モデルの強化
エージェント
マルチモーダル表現
Kaican Li, Lewei Yao, Jiannan Wu, et al.
InsertAnywhere:4Dシーン幾何と拡散モデルを橋渡しするリアルな動画オブジェクト挿入
拡散モデル
ビデオ処理
Hoiyeong Jin, Hyojin Jang, Jeongho Kim, et al.
1
3
4
5
6
7
8
9
47