HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

言語中心のオムニモーダル表現学習のスケーリング

言語中心のオムニモーダル表現学習のスケーリング

マルチモーダル表現

Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.

DITING：ウェブ小説翻訳のベンチマーク評価を目的としたマルチエージェント評価フレームワーク

DITING：ウェブ小説翻訳のベンチマーク評価を目的としたマルチエージェント評価フレームワーク

Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.

自己教師あり事前学習を活用したエンドツーエンド型ピクセル空間生成モデリングの進展

拡散モデル

Jiachen Lei, Keli Liu, Julius Berner, et al.

空間的強制：視覚言語行動モデルにおける暗黙的空間表現の整合

マルチモーダル

マルチモーダル表現

Fuhao Li, Wenxuan Song, Han Zhao, et al.

大規模言語モデルを用いた好みの獲得における明確化質問の提示

Preference Modeling

Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.

CTRL-Rec：自然言語によるレコメンデーションシステムの制御

Preference Modeling

自然言語処理

Micah Carroll, Adeline Foote, Kevin Feng, et al.

RLFR：フローエンバイロメントを用いた大規模言語モデル向け強化学習の拡張

Jinghao Zhang, Naishan Zheng, Ruilin Li, et al.

潜在精製デコーディング：信念状態の精製による拡散型言語モデルの性能向上

拡散モデル

テキスト生成

Qinglin Zhu, Yizhen Yao, Runcong Zhao, et al.

OmniVideoBench：オムニマルチモーダル大規模言語モデルにおける音声視覚理解評価への道標

ビデオ理解

マルチモーダル

Caorui Li, Yu Chen, Yiyan Ji, et al.

BEAR：原子的な身体的機能を備えたマルチモーダル言語モデルのベンチマーク設定と性能向上

エージェント

ベンチマーク

Yu Qi, Haibo Zhao, Ziyu Guo, et al.

表現自己符号化器を用いた拡散変換器

拡散モデル

Boyang Zheng, Nanye Ma, Shengbang Tong, et al.

QeRL：効率性を越えて――量子化拡張型強化学習による大規模言語モデル向けアプローチ

モデル学習

Wei Huang, Yi Ge, Shuai Yang, et al.

逆行列を必要としないウィルソン環：変換器における不変性および順序敏感性の実用的診断

監視付き微調整

Edward Y. Chang, Ethan Y. Chang

TUMIX：ツール利用混合を用いたマルチエージェントのテスト時スケーリング

エージェント

Yongchao Chen, Jiefeng Chen, Rui Meng, et al.

R-Horizon：大規模な推論モデルの広がりと深さにおける到達可能範囲はどこまでか？

ベンチマーク

Yi Lu, Jianing Wang, Linsen Guo, et al.

AutoPR：学術昇進を自動化しましょう！

ベンチマーク

マルチモーダル

Qiguang Chen, Zheng Yan, Mingda Yang, et al.

マルチモーダル・プロンプト最適化：MLLMsにおいて複数のモダリティを活用しない理由は何か

マルチモーダル

Yumin Choi, Dongki Kim, Jinheon Baek, et al.

補正方向誘導による妄想耐性のある拡散サンプリング

拡散モデル

Hyunmin Cho, Donghoon Ahn, Susung Hong, et al.

カメラで考える：カメラ中心の理解と生成のための統合型マルチモーダルモデル

マルチモーダル

Kang Liao, Size Wu, Zhonghua Wu, et al.

D2E：エムボディドAIへの転移を目的としたデスクトップデータ上の視覚-行動事前学習のスケーリング

エムボディドインテリジェンス

Suwhan Choi, Jaeyoon Jung, Haebin Seong, et al.

Code2Video：教育用動画生成のためのコード中心型パラダイム

コード生成

Yanzhe Chen, Kevin Qinghong Lin, Mike Zheng Shou

バイアス博士：AIを活用した医療支援における社会的格差

自然言語処理

Emma Kondrup, Anne Imouza

大規模言語モデルにおける2次最適化の可能性：フル・ガウス・ニュートン法を用いた研究

Natalie Abreu, Nikhil Vyas, Sham Kakade, et al.

メタ認識が推論モデルを向上させる：自己整合強化学習

Yoonjeon Kim, Doohyuk Jang, Eunho Yang

何が起こったかからなぜ起こったかへ：根拠に基づく化学反応条件の推論のためのマルチエージェントシステム

エージェント

検索拡張生成

Cheng Yang, Jiaxuan Lu, Haiyuan Wan, et al.

DreamOmni2：マルチモーダルな指示ベースの編集と生成

マルチモーダル

Bin Xia, Bohao Peng, Yuechen Zhang, et al.

VideoCanvas：文脈条件付きによる任意の時空間パッチからの統一的動画補完

Minghong Cai, Qiulin Wang, Zongli Ye, et al.

UniVideo：動画の統合的理解・生成・編集

Cong Wei, Quande Liu, Zixuan Ye, et al.

MemMamba：状態空間モデルにおけるメモリパターンの再考

自然言語処理

Youjin Wang, Yangjingyi Chen, Jiahao Yan, et al.

PromptCoT 2.0：大規模言語モデル推論のためのプロンプト生成のスケーリング

Xueliang Zhao, Wei Wu, Jian Guan, et al.

抽出-0：ドキュメント情報抽出のための専門化された言語モデル

監視付き微調整

ドキュメント理解

オムニリターゲット：ヒューマノイド全身運動と操作およびシーンインタラクションのためのインタラクション保持型データ生成

ロボティクス

Lujie Yang, Xiaoyu Huang, Zhen Wu, et al.

言語中心のオムニモーダル表現学習のスケーリング

言語中心のオムニモーダル表現学習のスケーリング

マルチモーダル表現

Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.

DITING：ウェブ小説翻訳のベンチマーク評価を目的としたマルチエージェント評価フレームワーク

DITING：ウェブ小説翻訳のベンチマーク評価を目的としたマルチエージェント評価フレームワーク

Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.

自己教師あり事前学習を活用したエンドツーエンド型ピクセル空間生成モデリングの進展

拡散モデル

Jiachen Lei, Keli Liu, Julius Berner, et al.

空間的強制：視覚言語行動モデルにおける暗黙的空間表現の整合

マルチモーダル

マルチモーダル表現

Fuhao Li, Wenxuan Song, Han Zhao, et al.

大規模言語モデルを用いた好みの獲得における明確化質問の提示

Preference Modeling

Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.

CTRL-Rec：自然言語によるレコメンデーションシステムの制御

Preference Modeling

自然言語処理

Micah Carroll, Adeline Foote, Kevin Feng, et al.

RLFR：フローエンバイロメントを用いた大規模言語モデル向け強化学習の拡張

Jinghao Zhang, Naishan Zheng, Ruilin Li, et al.

潜在精製デコーディング：信念状態の精製による拡散型言語モデルの性能向上

拡散モデル

テキスト生成

Qinglin Zhu, Yizhen Yao, Runcong Zhao, et al.

OmniVideoBench：オムニマルチモーダル大規模言語モデルにおける音声視覚理解評価への道標

ビデオ理解

マルチモーダル

Caorui Li, Yu Chen, Yiyan Ji, et al.

BEAR：原子的な身体的機能を備えたマルチモーダル言語モデルのベンチマーク設定と性能向上

エージェント

ベンチマーク

Yu Qi, Haibo Zhao, Ziyu Guo, et al.

表現自己符号化器を用いた拡散変換器

拡散モデル

Boyang Zheng, Nanye Ma, Shengbang Tong, et al.

QeRL：効率性を越えて――量子化拡張型強化学習による大規模言語モデル向けアプローチ

モデル学習

Wei Huang, Yi Ge, Shuai Yang, et al.

逆行列を必要としないウィルソン環：変換器における不変性および順序敏感性の実用的診断

監視付き微調整

Edward Y. Chang, Ethan Y. Chang

TUMIX：ツール利用混合を用いたマルチエージェントのテスト時スケーリング

エージェント

Yongchao Chen, Jiefeng Chen, Rui Meng, et al.

R-Horizon：大規模な推論モデルの広がりと深さにおける到達可能範囲はどこまでか？

ベンチマーク

Yi Lu, Jianing Wang, Linsen Guo, et al.

AutoPR：学術昇進を自動化しましょう！

ベンチマーク

マルチモーダル

Qiguang Chen, Zheng Yan, Mingda Yang, et al.

マルチモーダル・プロンプト最適化：MLLMsにおいて複数のモダリティを活用しない理由は何か

マルチモーダル

Yumin Choi, Dongki Kim, Jinheon Baek, et al.

補正方向誘導による妄想耐性のある拡散サンプリング

拡散モデル

Hyunmin Cho, Donghoon Ahn, Susung Hong, et al.

カメラで考える：カメラ中心の理解と生成のための統合型マルチモーダルモデル

マルチモーダル

Kang Liao, Size Wu, Zhonghua Wu, et al.

D2E：エムボディドAIへの転移を目的としたデスクトップデータ上の視覚-行動事前学習のスケーリング

エムボディドインテリジェンス

Suwhan Choi, Jaeyoon Jung, Haebin Seong, et al.

Code2Video：教育用動画生成のためのコード中心型パラダイム

コード生成

Yanzhe Chen, Kevin Qinghong Lin, Mike Zheng Shou

バイアス博士：AIを活用した医療支援における社会的格差

自然言語処理

Emma Kondrup, Anne Imouza

大規模言語モデルにおける2次最適化の可能性：フル・ガウス・ニュートン法を用いた研究

Natalie Abreu, Nikhil Vyas, Sham Kakade, et al.

メタ認識が推論モデルを向上させる：自己整合強化学習

Yoonjeon Kim, Doohyuk Jang, Eunho Yang

何が起こったかからなぜ起こったかへ：根拠に基づく化学反応条件の推論のためのマルチエージェントシステム

エージェント

検索拡張生成

Cheng Yang, Jiaxuan Lu, Haiyuan Wan, et al.

DreamOmni2：マルチモーダルな指示ベースの編集と生成

マルチモーダル

Bin Xia, Bohao Peng, Yuechen Zhang, et al.

VideoCanvas：文脈条件付きによる任意の時空間パッチからの統一的動画補完

Minghong Cai, Qiulin Wang, Zongli Ye, et al.

UniVideo：動画の統合的理解・生成・編集

Cong Wei, Quande Liu, Zixuan Ye, et al.

MemMamba：状態空間モデルにおけるメモリパターンの再考

自然言語処理

Youjin Wang, Yangjingyi Chen, Jiahao Yan, et al.

PromptCoT 2.0：大規模言語モデル推論のためのプロンプト生成のスケーリング

Xueliang Zhao, Wei Wu, Jian Guan, et al.

抽出-0：ドキュメント情報抽出のための専門化された言語モデル

監視付き微調整

ドキュメント理解

オムニリターゲット：ヒューマノイド全身運動と操作およびシーンインタラクションのためのインタラクション保持型データ生成

ロボティクス

Lujie Yang, Xiaoyu Huang, Zhen Wu, et al.

自己教師あり事前学習を活用したエンドツーエンド型ピクセル空間生成モデリングの進展

空間的強制：視覚言語行動モデルにおける暗黙的空間表現の整合

大規模言語モデルを用いた好みの獲得における明確化質問の提示

CTRL-Rec：自然言語によるレコメンデーションシステムの制御

RLFR：フローエンバイロメントを用いた大規模言語モデル向け強化学習の拡張

潜在精製デコーディング：信念状態の精製による拡散型言語モデルの性能向上

OmniVideoBench：オムニマルチモーダル大規模言語モデルにおける音声視覚理解評価への道標

BEAR：原子的な身体的機能を備えたマルチモーダル言語モデルのベンチマーク設定と性能向上

表現自己符号化器を用いた拡散変換器

QeRL：効率性を越えて――量子化拡張型強化学習による大規模言語モデル向けアプローチ

逆行列を必要としないウィルソン環：変換器における不変性および順序敏感性の実用的診断

TUMIX：ツール利用混合を用いたマルチエージェントのテスト時スケーリング

R-Horizon：大規模な推論モデルの広がりと深さにおける到達可能範囲はどこまでか？

AutoPR：学術昇進を自動化しましょう！

マルチモーダル・プロンプト最適化：MLLMsにおいて複数のモダリティを活用しない理由は何か

補正方向誘導による妄想耐性のある拡散サンプリング

カメラで考える：カメラ中心の理解と生成のための統合型マルチモーダルモデル

D2E：エムボディドAIへの転移を目的としたデスクトップデータ上の視覚-行動事前学習のスケーリング

Code2Video：教育用動画生成のためのコード中心型パラダイム

バイアス博士：AIを活用した医療支援における社会的格差

大規模言語モデルにおける2次最適化の可能性：フル・ガウス・ニュートン法を用いた研究

メタ認識が推論モデルを向上させる：自己整合強化学習

何が起こったかからなぜ起こったかへ：根拠に基づく化学反応条件の推論のためのマルチエージェントシステム

DreamOmni2：マルチモーダルな指示ベースの編集と生成

VideoCanvas：文脈条件付きによる任意の時空間パッチからの統一的動画補完

UniVideo：動画の統合的理解・生成・編集

MemMamba：状態空間モデルにおけるメモリパターンの再考

PromptCoT 2.0：大規模言語モデル推論のためのプロンプト生成のスケーリング

抽出-0：ドキュメント情報抽出のための専門化された言語モデル

オムニリターゲット：ヒューマノイド全身運動と操作およびシーンインタラクションのためのインタラクション保持型データ生成

自己教師あり事前学習を活用したエンドツーエンド型ピクセル空間生成モデリングの進展

空間的強制：視覚言語行動モデルにおける暗黙的空間表現の整合

大規模言語モデルを用いた好みの獲得における明確化質問の提示

CTRL-Rec：自然言語によるレコメンデーションシステムの制御

RLFR：フローエンバイロメントを用いた大規模言語モデル向け強化学習の拡張

潜在精製デコーディング：信念状態の精製による拡散型言語モデルの性能向上

OmniVideoBench：オムニマルチモーダル大規模言語モデルにおける音声視覚理解評価への道標

BEAR：原子的な身体的機能を備えたマルチモーダル言語モデルのベンチマーク設定と性能向上

表現自己符号化器を用いた拡散変換器

QeRL：効率性を越えて――量子化拡張型強化学習による大規模言語モデル向けアプローチ

逆行列を必要としないウィルソン環：変換器における不変性および順序敏感性の実用的診断

TUMIX：ツール利用混合を用いたマルチエージェントのテスト時スケーリング

R-Horizon：大規模な推論モデルの広がりと深さにおける到達可能範囲はどこまでか？

AutoPR：学術昇進を自動化しましょう！

マルチモーダル・プロンプト最適化：MLLMsにおいて複数のモダリティを活用しない理由は何か

補正方向誘導による妄想耐性のある拡散サンプリング

カメラで考える：カメラ中心の理解と生成のための統合型マルチモーダルモデル

D2E：エムボディドAIへの転移を目的としたデスクトップデータ上の視覚-行動事前学習のスケーリング

Code2Video：教育用動画生成のためのコード中心型パラダイム

バイアス博士：AIを活用した医療支援における社会的格差

大規模言語モデルにおける2次最適化の可能性：フル・ガウス・ニュートン法を用いた研究

メタ認識が推論モデルを向上させる：自己整合強化学習

何が起こったかからなぜ起こったかへ：根拠に基づく化学反応条件の推論のためのマルチエージェントシステム

DreamOmni2：マルチモーダルな指示ベースの編集と生成

VideoCanvas：文脈条件付きによる任意の時空間パッチからの統一的動画補完

UniVideo：動画の統合的理解・生成・編集

MemMamba：状態空間モデルにおけるメモリパターンの再考

PromptCoT 2.0：大規模言語モデル推論のためのプロンプト生成のスケーリング

抽出-0：ドキュメント情報抽出のための専門化された言語モデル

オムニリターゲット：ヒューマノイド全身運動と操作およびシーンインタラクションのためのインタラクション保持型データ生成