HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
ScaleNet:増分パラメータを用いた事前学習ニューラルネットワークのスケーリング
Transformer
ニューラルネットワーク
Zhiwei Hao, Jianyuan Guo, Li Shen, et al.
ブロック注意の混合最適化
LLM
Transformer
Guangxuan Xiao, Junxian Guo, Kasra Mazaheri, et al.
フラクタルフォレンジックス:フラクタルウォーターマークを用いたプロアクティブなディープフェイク検出と局所化
コンピュータビジョン
ディープラーニング
Tianyi Wang, Harry Cheng, Ming-Hui Liu, et al.
チェーン・オブ・シンク・ハイジャッキング
LLM
Reasoning
Jianli Zhao, Tingchen Fu, Rylan Schaeffer, et al.
InstanceAssemble:インスタンスアセンブリーアテンションを用いたレイアウト認識型画像生成
拡散モデル
テキストから画像生成
Qiang Xiang, Shuang Sun, Binglei Li, et al.
3EED:3次元空間におけるあらゆるものを基礎化する
3D マシンビジョン
マルチモーダル
Rong Li, Yuhao Dong, Tianshuai Hu, et al.
DetectiumFire:視覚と言語を橋渡しする火災理解のための包括的なマルチモーダルデータセット
マルチモーダル
ビデオ理解
Zixuan Liu, Siavash H. Khajavi, Guangkai Jiang
CHIP:産業現場における椅子の6次元姿勢推定のためのマルチセンサデータセット
3D マシンビジョン
ロボティクス
Mattia Nardon, Mikel Mujika Agirre, Ander González Tomé, et al.
幾何制約付きエージェントによる空間推論
エージェント
Reasoning
Zeren Chen, Xiaoya Lu, Zhijie Zheng, et al.
DeepSeek-V3.2:オープン型大規模言語モデルの限界を押し広げる
DeepSeek
Reasoning
DeepSeek-AI, Aixin Liu, Aoxue Mei, et al.
DiP:ピクセル空間における拡散モデルの制御
拡散モデル
画像生成
Zhennan Chen, Junwei Zhu, Xu Chen, et al.
アーキテクチャの分離は、統合型マルチモーダルモデルにとって必要なすべてではない
Any-to-Any
マルチタスク学習
Dian Zheng, Manyuan Zhang, Hongyu Li, et al.
スケールにおけるビジョンブリッジトランスフォーマー
Transformer
画像から動画生成
Zhenxiong Tan, Zeqing Wang, Xingyi Yang, et al.
AnyTalker:インタラクティビティ精 refinement を用いたマルチペルソントーキング動画生成のスケーラビリティ向上
動画生成
マルチモーダル
Zhizhou Zhong, Yicheng Ji, Zhe Kong, et al.
REASONEDIT:推論強化型画像編集モデルへの道標
テキストから画像生成
拡散モデル
Fukun Yin, Shiyu Liu, Yucheng Han, et al.
OpenApps:環境変動のシミュレーションによるUIエージェントの信頼性評価
エージェント
ベンチマーク
Karen Ullrich, Jingtong Su, Claudia Shi, et al.
Qwen3-VL 技ical Report
Any-to-Any
マルチモーダル表現
Shuai Bai, Yuxuan Cai, Ruizhe Chen, et al.
G$^2$VLM:統一的3D再構成と空間推論を備えた幾何学的根拠付き視覚言語モデル
マルチモーダル
マルチモーダル表現
Wenbo Hu, Jingli Lin, Yilin Long, et al.
マルチクリット:多様な基準に従うためのマルチモーダル・ジャッジのベンチマーク評価
ベンチマーク
マルチモーダル
Tianyi Xiong, Yi Ge, Ming Li, et al.
MIRA:画像編集のための多モーダル反復推論エージェント
マルチモーダル
拡散モデル
Ziyun Zeng, Hang Hua, Jiebo Luo
ENACT:エゴセントリックな相互作用のワールドモデリングを用いた身体化認知の評価
視覚質問応答
エムボディドインテリジェンス
Qineng Wang, Wenlong Huang, Yu Zhou, et al.
キャンバスから画像へ:マルチモーダル制御を用いた構成画像生成
拡散モデル
画像生成
Yusuf Dalva, Guocheng Gordon Qian, Maya Goldenberg, et al.
ビデオ生成モデルは優れた潜在報酬モデルである
Any-to-Any
拡散モデル
Xiaoyue Mi, Wenqing Yu, Jiesong Lian, et al.
DeepSeekMath-V2:自己検証可能な数学的推論へ向けて
LLM
Reasoning
Zhihong Shao, Yuxiang Luo, Chengda Lu, et al.
ToolOrchestra:効率的なモデルおよびツールのオーケストレーションによる知能の向上
エージェント
Reasoning
Hongjin Su, Shizhe Diao, Ximing Lu, et al.
視覚的に考える、文章的に推論する:ARCにおける視覚言語連携
マルチモーダル
Reasoning
Beichen Zhang, Yuhang Zang, Xiaoyi Dong, et al.
ハーモニー:クロストラスクシンエジーによる音声と動画生成の調和
拡散モデル
Any-to-Any
Teng Hu, Zhentao Yu, Guozhen Zhang, et al.
Inferix:世界シミュレーション向け次世代推論エンジンとしてのブロックディフュージョンベースのアーキテクチャ
ビデオ理解
合成
Inferix Team, Tianyu Feng, Yizeng Han, et al.
マルチエージェントシステムにおける潜在的協働
エージェント
LLM
Jiaru Zou, Xiyuan Yang, Ruizhong Qiu, et al.
ロシア語アーキテクチャのマルチモーダル評価
マルチモーダル
ベンチマーク
Artem Chervyakov, Ulyana Isaeva, Anton Emelyanov, et al.
ROOT: ニューラルネットワーク学習のためのロバスト直交化最適化手法
LLM
Transformer
Wei He, Kai Han, Hang Zhou, et al.
重ね合わせが堅牢なニューラルスケーリングをもたらす
機械学習
人工知能
Yizhou Liu, Ziming Liu, Jeff Gore
1
11
12
13
14
15
16
17
48
ScaleNet:増分パラメータを用いた事前学習ニューラルネットワークのスケーリング
Transformer
ニューラルネットワーク
Zhiwei Hao, Jianyuan Guo, Li Shen, et al.
ブロック注意の混合最適化
LLM
Transformer
Guangxuan Xiao, Junxian Guo, Kasra Mazaheri, et al.
フラクタルフォレンジックス:フラクタルウォーターマークを用いたプロアクティブなディープフェイク検出と局所化
コンピュータビジョン
ディープラーニング
Tianyi Wang, Harry Cheng, Ming-Hui Liu, et al.
チェーン・オブ・シンク・ハイジャッキング
LLM
Reasoning
Jianli Zhao, Tingchen Fu, Rylan Schaeffer, et al.
InstanceAssemble:インスタンスアセンブリーアテンションを用いたレイアウト認識型画像生成
拡散モデル
テキストから画像生成
Qiang Xiang, Shuang Sun, Binglei Li, et al.
3EED:3次元空間におけるあらゆるものを基礎化する
3D マシンビジョン
マルチモーダル
Rong Li, Yuhao Dong, Tianshuai Hu, et al.
DetectiumFire:視覚と言語を橋渡しする火災理解のための包括的なマルチモーダルデータセット
マルチモーダル
ビデオ理解
Zixuan Liu, Siavash H. Khajavi, Guangkai Jiang
CHIP:産業現場における椅子の6次元姿勢推定のためのマルチセンサデータセット
3D マシンビジョン
ロボティクス
Mattia Nardon, Mikel Mujika Agirre, Ander González Tomé, et al.
幾何制約付きエージェントによる空間推論
エージェント
Reasoning
Zeren Chen, Xiaoya Lu, Zhijie Zheng, et al.
DeepSeek-V3.2:オープン型大規模言語モデルの限界を押し広げる
DeepSeek
Reasoning
DeepSeek-AI, Aixin Liu, Aoxue Mei, et al.
DiP:ピクセル空間における拡散モデルの制御
拡散モデル
画像生成
Zhennan Chen, Junwei Zhu, Xu Chen, et al.
アーキテクチャの分離は、統合型マルチモーダルモデルにとって必要なすべてではない
Any-to-Any
マルチタスク学習
Dian Zheng, Manyuan Zhang, Hongyu Li, et al.
スケールにおけるビジョンブリッジトランスフォーマー
Transformer
画像から動画生成
Zhenxiong Tan, Zeqing Wang, Xingyi Yang, et al.
AnyTalker:インタラクティビティ精 refinement を用いたマルチペルソントーキング動画生成のスケーラビリティ向上
動画生成
マルチモーダル
Zhizhou Zhong, Yicheng Ji, Zhe Kong, et al.
REASONEDIT:推論強化型画像編集モデルへの道標
テキストから画像生成
拡散モデル
Fukun Yin, Shiyu Liu, Yucheng Han, et al.
OpenApps:環境変動のシミュレーションによるUIエージェントの信頼性評価
エージェント
ベンチマーク
Karen Ullrich, Jingtong Su, Claudia Shi, et al.
Qwen3-VL 技ical Report
Any-to-Any
マルチモーダル表現
Shuai Bai, Yuxuan Cai, Ruizhe Chen, et al.
G$^2$VLM:統一的3D再構成と空間推論を備えた幾何学的根拠付き視覚言語モデル
マルチモーダル
マルチモーダル表現
Wenbo Hu, Jingli Lin, Yilin Long, et al.
マルチクリット:多様な基準に従うためのマルチモーダル・ジャッジのベンチマーク評価
ベンチマーク
マルチモーダル
Tianyi Xiong, Yi Ge, Ming Li, et al.
MIRA:画像編集のための多モーダル反復推論エージェント
マルチモーダル
拡散モデル
Ziyun Zeng, Hang Hua, Jiebo Luo
ENACT:エゴセントリックな相互作用のワールドモデリングを用いた身体化認知の評価
視覚質問応答
エムボディドインテリジェンス
Qineng Wang, Wenlong Huang, Yu Zhou, et al.
キャンバスから画像へ:マルチモーダル制御を用いた構成画像生成
拡散モデル
画像生成
Yusuf Dalva, Guocheng Gordon Qian, Maya Goldenberg, et al.
ビデオ生成モデルは優れた潜在報酬モデルである
Any-to-Any
拡散モデル
Xiaoyue Mi, Wenqing Yu, Jiesong Lian, et al.
DeepSeekMath-V2:自己検証可能な数学的推論へ向けて
LLM
Reasoning
Zhihong Shao, Yuxiang Luo, Chengda Lu, et al.
ToolOrchestra:効率的なモデルおよびツールのオーケストレーションによる知能の向上
エージェント
Reasoning
Hongjin Su, Shizhe Diao, Ximing Lu, et al.
視覚的に考える、文章的に推論する:ARCにおける視覚言語連携
マルチモーダル
Reasoning
Beichen Zhang, Yuhang Zang, Xiaoyi Dong, et al.
ハーモニー:クロストラスクシンエジーによる音声と動画生成の調和
拡散モデル
Any-to-Any
Teng Hu, Zhentao Yu, Guozhen Zhang, et al.
Inferix:世界シミュレーション向け次世代推論エンジンとしてのブロックディフュージョンベースのアーキテクチャ
ビデオ理解
合成
Inferix Team, Tianyu Feng, Yizeng Han, et al.
マルチエージェントシステムにおける潜在的協働
エージェント
LLM
Jiaru Zou, Xiyuan Yang, Ruizhong Qiu, et al.
ロシア語アーキテクチャのマルチモーダル評価
マルチモーダル
ベンチマーク
Artem Chervyakov, Ulyana Isaeva, Anton Emelyanov, et al.
ROOT: ニューラルネットワーク学習のためのロバスト直交化最適化手法
LLM
Transformer
Wei He, Kai Han, Hang Zhou, et al.
重ね合わせが堅牢なニューラルスケーリングをもたらす
機械学習
人工知能
Yizhou Liu, Ziming Liu, Jeff Gore
1
11
12
13
14
15
16
17
48