HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
Shape-for-Motion: 3D プロキシを用いた精密で一貫性のあるビデオ編集
3Dモデル
ビデオ処理
Yuhao Liu, Tengfei Wang, Fang Liu, et al.
理想から現実へ:統一的でデータ効率の高い密集予測の実世界シナリオへの適用
セマンティックセグメンテーション
マルチタスク学習
Changliang Xia, Chengyou Jia, Zhuohang Dang, et al.
ShotBench: 視覚言語モデルにおける映画的な理解の専門家レベル
視覚質問応答
マルチモーダル
Hongbo Liu, Jingwen He, Yi Jin, et al.
XVerse: 複数主題のアイデンティティと意味属性をDiT調節を通じて一貫して制御する方法
テキストから画像生成
拡散モデル
Bowen Chen, Mengyi Zhao, Haomiao Sun, et al.
24ウェルプレートにおけるゼロショット抗体設計
サイエンスのためのAI
マルチモーダル
Chai Discovery Team
KinFormer: カタリスト有機反応動力学の一般化可能な動的記号回帰
ディープラーニング
モデリング
Jindou Chen, Jidong Tian, Liang Wu, et al.
MiCo: 複数画像の対照性を用いた強化学習視覚推論
Reasoning
マルチモーダル
Xi Chen, Mingkang Zhu, Shaoteng Liu, et al.
微細な嗜好最適化がVLMにおける空間推論を改善する
Reasoning
視覚質問応答
Yifan Shen, Yuanzhe Liu, Jingyuan Zhu, et al.
ARK: ロボット学習のためのオープンソースPythonベースフレームワーク
ロボティクス
エムボディドインテリジェンス
Magnus Dierking, Christopher E. Mower, Sarthak Das, et al.
Pangu Pro MoE: グループ化されたエキスパートの混合体による効率的な疎性
LLM
Transformer
Tang, Yehui, Li, et al.
LLaVA-Scissor: セマンティック連結成分を用いたトークン圧縮手法によるビデオLLMの改善
視覚質問応答
マルチモーダル
Boyuan Sun, Jiaxing Zhao, Xihan Wei, et al.
BlenderFusion: 3D グラウンデッド ビジュアル編集とジェネレーティブ コンポジティング
拡散モデル
画像分割
Chen, Jiacheng, Mehran, et al.
UniMate: 機械メタマテリアル生成、特性予測、および状態確認のための統合モデル
マルチモーダル
マルチタスク学習
Wangzhi Zhan, Jianpeng Chen, Dongqi Fu, et al.
トランスフォーマーの中間層をスキップする学習
Transformer
LLM
Tim Lawson, Laurence Aitchison
SAM4D: カメラとLiDARストリームで何でもセグメンテーション
セマンティックセグメンテーション
マルチモーダル
Jianyun Xu, Song Wang, Ziqian Ni, et al.
LLMの事前学習におけるGrokkingの検出方法:テストなしで記憶から一般化への移行を監視する
ディープラーニング
自然言語処理
Ziyue Li, Chenrui Fan, Tianyi Zhou
FineWeb2: すべての言語に適応するための1つのパイプライン -- プリトレーニングデータ処理の言語間適応
データセット
LLM
Guilherme Penedo, Hynek Kydl\u00ed\u010dek, Vinko Sabol\u010dec, et al.
MADrive: メモリ拡張型ドライビングシーンモデリング
コンピュータビジョン
自動運転
Polina Karpikova, Daniil Selikhanovych, Kirill Struminsky, et al.
FaSTA^*:高速-低速ツールパスエージェントとサブルーチンマイニングによる効率的なマルチターン画像編集
エージェント
Reasoning
Advait Gupta, Rishie Raj, Dang Nguyen, et al.
Mind2Web 2: エージェントによる評価とエージェントとしての審判
エージェント
検索拡張生成
Boyu Gou, Zanming Huang, Yuting Ning, et al.
WorldVLA: 自回帰行動世界モデルへ向けて
Transformer
画像理解
Jun Cen, Chaohui Yu, Hangjie Yuan, et al.
ReCode: 強化学習を用いたコードAPI知識の更新
コード生成
LLM
Haoze Wu, Yunzhi Yao, Wenhao Yu, et al.
ライフがサンプルを提供するとき:多言語LLMの推論スケーリングアップの利点
LLM
マルチタスク学習
Ammar Khairi, Daniel Dsouza, Ye Shen, et al.
HiWave: 波動ベースの拡散サンプリングによる学習不要の高解像度画像生成
拡散モデル
画像生成
Tobias Vontobel, Seyedmorteza Sadat, Farnood Salehi, et al.
DualTHOR: 両腕ヒューマノイドシミュレーションプラットフォームによる予測計画
エムボディドインテリジェンス
ロボティクス
Li, Boyu, He, et al.
MMSearch-R1: LMMの検索を奨励する
検索拡張生成
視覚質問応答
Jinming Wu, Zihao Deng, Wei Li, et al.
OctoThinker: 中間トレーニングが強化学習のスケーリングを促進する
強化学習
モデル学習
Zengzhi Wang, Fan Zhou, Xuefeng Li, et al.
AlphaGenome: 統一されたDNA配列モデルを用いた制御変異効果予測の進歩
サイエンスのためのAI
ディープラーニング
\u017diga Avsec, Natasha Latysheva, Jun Cheng, et al.
OmniDrive: 自動運転のための包括的な視覚言語データセットと反実仮想推論
自動運転
LLM
Shihao Wang, Zhiding Yu, Xiaohui Jiang, et al.
EcoMapper: 気候認識型衛星画像の生成モデル
テキストから画像生成
画像生成
Muhammed Goktepe, Amir hossein Shamseddin, Erencan Uysal, et al.
JarvisArt: インテリジェントな写真レタッチエージェントを用いた人間の芸術的創造性の解放
マルチモーダル
コンピュータビジョン
Lin, Yunlong, Lin, et al.
ScaleCap: 推論時のスケーラブルな画像キャプショニングを実現するための双モダリティデバイアシング
画像説明
マルチモーダル
Long Xing, Qidong Huang, Xiaoyi Dong, et al.
1
42
43
44
45
46
47
48
Shape-for-Motion: 3D プロキシを用いた精密で一貫性のあるビデオ編集
3Dモデル
ビデオ処理
Yuhao Liu, Tengfei Wang, Fang Liu, et al.
理想から現実へ:統一的でデータ効率の高い密集予測の実世界シナリオへの適用
セマンティックセグメンテーション
マルチタスク学習
Changliang Xia, Chengyou Jia, Zhuohang Dang, et al.
ShotBench: 視覚言語モデルにおける映画的な理解の専門家レベル
視覚質問応答
マルチモーダル
Hongbo Liu, Jingwen He, Yi Jin, et al.
XVerse: 複数主題のアイデンティティと意味属性をDiT調節を通じて一貫して制御する方法
テキストから画像生成
拡散モデル
Bowen Chen, Mengyi Zhao, Haomiao Sun, et al.
24ウェルプレートにおけるゼロショット抗体設計
サイエンスのためのAI
マルチモーダル
Chai Discovery Team
KinFormer: カタリスト有機反応動力学の一般化可能な動的記号回帰
ディープラーニング
モデリング
Jindou Chen, Jidong Tian, Liang Wu, et al.
MiCo: 複数画像の対照性を用いた強化学習視覚推論
Reasoning
マルチモーダル
Xi Chen, Mingkang Zhu, Shaoteng Liu, et al.
微細な嗜好最適化がVLMにおける空間推論を改善する
Reasoning
視覚質問応答
Yifan Shen, Yuanzhe Liu, Jingyuan Zhu, et al.
ARK: ロボット学習のためのオープンソースPythonベースフレームワーク
ロボティクス
エムボディドインテリジェンス
Magnus Dierking, Christopher E. Mower, Sarthak Das, et al.
Pangu Pro MoE: グループ化されたエキスパートの混合体による効率的な疎性
LLM
Transformer
Tang, Yehui, Li, et al.
LLaVA-Scissor: セマンティック連結成分を用いたトークン圧縮手法によるビデオLLMの改善
視覚質問応答
マルチモーダル
Boyuan Sun, Jiaxing Zhao, Xihan Wei, et al.
BlenderFusion: 3D グラウンデッド ビジュアル編集とジェネレーティブ コンポジティング
拡散モデル
画像分割
Chen, Jiacheng, Mehran, et al.
UniMate: 機械メタマテリアル生成、特性予測、および状態確認のための統合モデル
マルチモーダル
マルチタスク学習
Wangzhi Zhan, Jianpeng Chen, Dongqi Fu, et al.
トランスフォーマーの中間層をスキップする学習
Transformer
LLM
Tim Lawson, Laurence Aitchison
SAM4D: カメラとLiDARストリームで何でもセグメンテーション
セマンティックセグメンテーション
マルチモーダル
Jianyun Xu, Song Wang, Ziqian Ni, et al.
LLMの事前学習におけるGrokkingの検出方法:テストなしで記憶から一般化への移行を監視する
ディープラーニング
自然言語処理
Ziyue Li, Chenrui Fan, Tianyi Zhou
FineWeb2: すべての言語に適応するための1つのパイプライン -- プリトレーニングデータ処理の言語間適応
データセット
LLM
Guilherme Penedo, Hynek Kydl\u00ed\u010dek, Vinko Sabol\u010dec, et al.
MADrive: メモリ拡張型ドライビングシーンモデリング
コンピュータビジョン
自動運転
Polina Karpikova, Daniil Selikhanovych, Kirill Struminsky, et al.
FaSTA^*:高速-低速ツールパスエージェントとサブルーチンマイニングによる効率的なマルチターン画像編集
エージェント
Reasoning
Advait Gupta, Rishie Raj, Dang Nguyen, et al.
Mind2Web 2: エージェントによる評価とエージェントとしての審判
エージェント
検索拡張生成
Boyu Gou, Zanming Huang, Yuting Ning, et al.
WorldVLA: 自回帰行動世界モデルへ向けて
Transformer
画像理解
Jun Cen, Chaohui Yu, Hangjie Yuan, et al.
ReCode: 強化学習を用いたコードAPI知識の更新
コード生成
LLM
Haoze Wu, Yunzhi Yao, Wenhao Yu, et al.
ライフがサンプルを提供するとき:多言語LLMの推論スケーリングアップの利点
LLM
マルチタスク学習
Ammar Khairi, Daniel Dsouza, Ye Shen, et al.
HiWave: 波動ベースの拡散サンプリングによる学習不要の高解像度画像生成
拡散モデル
画像生成
Tobias Vontobel, Seyedmorteza Sadat, Farnood Salehi, et al.
DualTHOR: 両腕ヒューマノイドシミュレーションプラットフォームによる予測計画
エムボディドインテリジェンス
ロボティクス
Li, Boyu, He, et al.
MMSearch-R1: LMMの検索を奨励する
検索拡張生成
視覚質問応答
Jinming Wu, Zihao Deng, Wei Li, et al.
OctoThinker: 中間トレーニングが強化学習のスケーリングを促進する
強化学習
モデル学習
Zengzhi Wang, Fan Zhou, Xuefeng Li, et al.
AlphaGenome: 統一されたDNA配列モデルを用いた制御変異効果予測の進歩
サイエンスのためのAI
ディープラーニング
\u017diga Avsec, Natasha Latysheva, Jun Cheng, et al.
OmniDrive: 自動運転のための包括的な視覚言語データセットと反実仮想推論
自動運転
LLM
Shihao Wang, Zhiding Yu, Xiaohui Jiang, et al.
EcoMapper: 気候認識型衛星画像の生成モデル
テキストから画像生成
画像生成
Muhammed Goktepe, Amir hossein Shamseddin, Erencan Uysal, et al.
JarvisArt: インテリジェントな写真レタッチエージェントを用いた人間の芸術的創造性の解放
マルチモーダル
コンピュータビジョン
Lin, Yunlong, Lin, et al.
ScaleCap: 推論時のスケーラブルな画像キャプショニングを実現するための双モダリティデバイアシング
画像説明
マルチモーダル
Long Xing, Qidong Huang, Xiaoyi Dong, et al.
1
42
43
44
45
46
47
48