HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
Pangu Pro MoE: グループ化されたエキスパートの混合体による効率的な疎性
LLM
Transformer
Tang, Yehui, Li, et al.
LLaVA-Scissor: セマンティック連結成分を用いたトークン圧縮手法によるビデオLLMの改善
視覚質問応答
マルチモーダル
Boyuan Sun, Jiaxing Zhao, Xihan Wei, et al.
BlenderFusion: 3D グラウンデッド ビジュアル編集とジェネレーティブ コンポジティング
拡散モデル
画像分割
Chen, Jiacheng, Mehran, et al.
UniMate: 機械メタマテリアル生成、特性予測、および状態確認のための統合モデル
マルチモーダル
マルチタスク学習
Wangzhi Zhan, Jianpeng Chen, Dongqi Fu, et al.
トランスフォーマーの中間層をスキップする学習
Transformer
LLM
Tim Lawson, Laurence Aitchison
SAM4D: カメラとLiDARストリームで何でもセグメンテーション
セマンティックセグメンテーション
マルチモーダル
Jianyun Xu, Song Wang, Ziqian Ni, et al.
LLMの事前学習におけるGrokkingの検出方法:テストなしで記憶から一般化への移行を監視する
ディープラーニング
自然言語処理
Ziyue Li, Chenrui Fan, Tianyi Zhou
FineWeb2: すべての言語に適応するための1つのパイプライン -- プリトレーニングデータ処理の言語間適応
データセット
LLM
Guilherme Penedo, Hynek Kydl\u00ed\u010dek, Vinko Sabol\u010dec, et al.
MADrive: メモリ拡張型ドライビングシーンモデリング
コンピュータビジョン
自動運転
Polina Karpikova, Daniil Selikhanovych, Kirill Struminsky, et al.
FaSTA^*:高速-低速ツールパスエージェントとサブルーチンマイニングによる効率的なマルチターン画像編集
エージェント
Reasoning
Advait Gupta, Rishie Raj, Dang Nguyen, et al.
Mind2Web 2: エージェントによる評価とエージェントとしての審判
エージェント
検索拡張生成
Boyu Gou, Zanming Huang, Yuting Ning, et al.
WorldVLA: 自回帰行動世界モデルへ向けて
Transformer
画像理解
Jun Cen, Chaohui Yu, Hangjie Yuan, et al.
ReCode: 強化学習を用いたコードAPI知識の更新
コード生成
LLM
Haoze Wu, Yunzhi Yao, Wenhao Yu, et al.
ライフがサンプルを提供するとき:多言語LLMの推論スケーリングアップの利点
LLM
マルチタスク学習
Ammar Khairi, Daniel Dsouza, Ye Shen, et al.
HiWave: 波動ベースの拡散サンプリングによる学習不要の高解像度画像生成
拡散モデル
画像生成
Tobias Vontobel, Seyedmorteza Sadat, Farnood Salehi, et al.
DualTHOR: 両腕ヒューマノイドシミュレーションプラットフォームによる予測計画
エムボディドインテリジェンス
ロボティクス
Li, Boyu, He, et al.
MMSearch-R1: LMMの検索を奨励する
検索拡張生成
視覚質問応答
Jinming Wu, Zihao Deng, Wei Li, et al.
OctoThinker: 中間トレーニングが強化学習のスケーリングを促進する
強化学習
モデル学習
Zengzhi Wang, Fan Zhou, Xuefeng Li, et al.
AlphaGenome: 統一されたDNA配列モデルを用いた制御変異効果予測の進歩
サイエンスのためのAI
ディープラーニング
\u017diga Avsec, Natasha Latysheva, Jun Cheng, et al.
OmniDrive: 自動運転のための包括的な視覚言語データセットと反実仮想推論
自動運転
LLM
Shihao Wang, Zhiding Yu, Xiaohui Jiang, et al.
EcoMapper: 気候認識型衛星画像の生成モデル
テキストから画像生成
画像生成
Muhammed Goktepe, Amir hossein Shamseddin, Erencan Uysal, et al.
JarvisArt: インテリジェントな写真レタッチエージェントを用いた人間の芸術的創造性の解放
マルチモーダル
コンピュータビジョン
Lin, Yunlong, Lin, et al.
ScaleCap: 推論時のスケーラブルな画像キャプショニングを実現するための双モダリティデバイアシング
画像説明
マルチモーダル
Long Xing, Qidong Huang, Xiaoyi Dong, et al.
GRPO-CARE: 多モーダル推論のための一貫性を考慮した強化学習
強化学習
マルチモーダル
Chen, Yi, Ge, et al.
Skywork-SWE: ソフトウェア工学におけるLLMのデータスケーリング法則の解明
コード生成
LLM
Liang Zeng, Yongcong Li, Yuzhen Xiao, et al.
マトリックスゲーム:インタラクティブな世界基盤モデル
動画生成
画像から動画生成
Yifan Zhang, Chunli Peng, Boyang Wang, et al.
AnimaX: 無生物の3Dアニメーションを関節ビデオ-ポーズ拡散モデルで実現
拡散モデル
3D生成
Zehuan Huang, Haoran Feng, Yangtian Sun, et al.
無人航空機による効率的な視覚に基づく飛行目標のアクティブ追跡の学習アプローチ
オブジェクト追跡
オブジェクト検出
Jagadeswara PKV Pothuri, Aditya Bhatt, Prajit KrisshnaKumar, et al.
TritonZ: 遠隔操作可能な探査・救難用水中ローバー操纵腕付き
ロボティクス
コンピュータビジョン
Kawser Ahmed, Mir Shahriar Fardin, Md Arif Faysal Nayem, et al.
ReasonFlux-PRM: 軌道認識型PRMによるLLMにおける長期思考連鎖の推論
監視付き微調整
Preference Modeling
Jiaru Zou, Ling Yang, Jingwen Gu, et al.
Phantom-Data : 一般的な被験者一貫性を持つビデオ生成データセットに向けて
テキストから動画
画像から動画生成
Zhuowei Chen, Bingchuan Li, Tianxiang Ma, et al.
RLPR: バリデーターなしで一般ドメインにRLVRを外挿する
ベンチマーク
Reasoning
Tianyu Yu, Bo Ji, Shouli Wang, et al.
1
41
42
43
44
45
46
47
Pangu Pro MoE: グループ化されたエキスパートの混合体による効率的な疎性
LLM
Transformer
Tang, Yehui, Li, et al.
LLaVA-Scissor: セマンティック連結成分を用いたトークン圧縮手法によるビデオLLMの改善
視覚質問応答
マルチモーダル
Boyuan Sun, Jiaxing Zhao, Xihan Wei, et al.
BlenderFusion: 3D グラウンデッド ビジュアル編集とジェネレーティブ コンポジティング
拡散モデル
画像分割
Chen, Jiacheng, Mehran, et al.
UniMate: 機械メタマテリアル生成、特性予測、および状態確認のための統合モデル
マルチモーダル
マルチタスク学習
Wangzhi Zhan, Jianpeng Chen, Dongqi Fu, et al.
トランスフォーマーの中間層をスキップする学習
Transformer
LLM
Tim Lawson, Laurence Aitchison
SAM4D: カメラとLiDARストリームで何でもセグメンテーション
セマンティックセグメンテーション
マルチモーダル
Jianyun Xu, Song Wang, Ziqian Ni, et al.
LLMの事前学習におけるGrokkingの検出方法:テストなしで記憶から一般化への移行を監視する
ディープラーニング
自然言語処理
Ziyue Li, Chenrui Fan, Tianyi Zhou
FineWeb2: すべての言語に適応するための1つのパイプライン -- プリトレーニングデータ処理の言語間適応
データセット
LLM
Guilherme Penedo, Hynek Kydl\u00ed\u010dek, Vinko Sabol\u010dec, et al.
MADrive: メモリ拡張型ドライビングシーンモデリング
コンピュータビジョン
自動運転
Polina Karpikova, Daniil Selikhanovych, Kirill Struminsky, et al.
FaSTA^*:高速-低速ツールパスエージェントとサブルーチンマイニングによる効率的なマルチターン画像編集
エージェント
Reasoning
Advait Gupta, Rishie Raj, Dang Nguyen, et al.
Mind2Web 2: エージェントによる評価とエージェントとしての審判
エージェント
検索拡張生成
Boyu Gou, Zanming Huang, Yuting Ning, et al.
WorldVLA: 自回帰行動世界モデルへ向けて
Transformer
画像理解
Jun Cen, Chaohui Yu, Hangjie Yuan, et al.
ReCode: 強化学習を用いたコードAPI知識の更新
コード生成
LLM
Haoze Wu, Yunzhi Yao, Wenhao Yu, et al.
ライフがサンプルを提供するとき:多言語LLMの推論スケーリングアップの利点
LLM
マルチタスク学習
Ammar Khairi, Daniel Dsouza, Ye Shen, et al.
HiWave: 波動ベースの拡散サンプリングによる学習不要の高解像度画像生成
拡散モデル
画像生成
Tobias Vontobel, Seyedmorteza Sadat, Farnood Salehi, et al.
DualTHOR: 両腕ヒューマノイドシミュレーションプラットフォームによる予測計画
エムボディドインテリジェンス
ロボティクス
Li, Boyu, He, et al.
MMSearch-R1: LMMの検索を奨励する
検索拡張生成
視覚質問応答
Jinming Wu, Zihao Deng, Wei Li, et al.
OctoThinker: 中間トレーニングが強化学習のスケーリングを促進する
強化学習
モデル学習
Zengzhi Wang, Fan Zhou, Xuefeng Li, et al.
AlphaGenome: 統一されたDNA配列モデルを用いた制御変異効果予測の進歩
サイエンスのためのAI
ディープラーニング
\u017diga Avsec, Natasha Latysheva, Jun Cheng, et al.
OmniDrive: 自動運転のための包括的な視覚言語データセットと反実仮想推論
自動運転
LLM
Shihao Wang, Zhiding Yu, Xiaohui Jiang, et al.
EcoMapper: 気候認識型衛星画像の生成モデル
テキストから画像生成
画像生成
Muhammed Goktepe, Amir hossein Shamseddin, Erencan Uysal, et al.
JarvisArt: インテリジェントな写真レタッチエージェントを用いた人間の芸術的創造性の解放
マルチモーダル
コンピュータビジョン
Lin, Yunlong, Lin, et al.
ScaleCap: 推論時のスケーラブルな画像キャプショニングを実現するための双モダリティデバイアシング
画像説明
マルチモーダル
Long Xing, Qidong Huang, Xiaoyi Dong, et al.
GRPO-CARE: 多モーダル推論のための一貫性を考慮した強化学習
強化学習
マルチモーダル
Chen, Yi, Ge, et al.
Skywork-SWE: ソフトウェア工学におけるLLMのデータスケーリング法則の解明
コード生成
LLM
Liang Zeng, Yongcong Li, Yuzhen Xiao, et al.
マトリックスゲーム:インタラクティブな世界基盤モデル
動画生成
画像から動画生成
Yifan Zhang, Chunli Peng, Boyang Wang, et al.
AnimaX: 無生物の3Dアニメーションを関節ビデオ-ポーズ拡散モデルで実現
拡散モデル
3D生成
Zehuan Huang, Haoran Feng, Yangtian Sun, et al.
無人航空機による効率的な視覚に基づく飛行目標のアクティブ追跡の学習アプローチ
オブジェクト追跡
オブジェクト検出
Jagadeswara PKV Pothuri, Aditya Bhatt, Prajit KrisshnaKumar, et al.
TritonZ: 遠隔操作可能な探査・救難用水中ローバー操纵腕付き
ロボティクス
コンピュータビジョン
Kawser Ahmed, Mir Shahriar Fardin, Md Arif Faysal Nayem, et al.
ReasonFlux-PRM: 軌道認識型PRMによるLLMにおける長期思考連鎖の推論
監視付き微調整
Preference Modeling
Jiaru Zou, Ling Yang, Jingwen Gu, et al.
Phantom-Data : 一般的な被験者一貫性を持つビデオ生成データセットに向けて
テキストから動画
画像から動画生成
Zhuowei Chen, Bingchuan Li, Tianxiang Ma, et al.
RLPR: バリデーターなしで一般ドメインにRLVRを外挿する
ベンチマーク
Reasoning
Tianyu Yu, Bo Ji, Shouli Wang, et al.
1
41
42
43
44
45
46
47