HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
HyperAI
HyperAI超神経
ホーム
プラットフォーム
ドキュメント
ニュース
論文
Notebooks
データセット
百科事典
SOTA
LLMモデル
GPU ランキング
学会
検索
サイトについて
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
サイトを検索…
⌘
K
Command Palette
Search for a command to run...
Console
サインイン
ホーム
論文
論文
日々更新される最先端AI研究論文、人工知能の最新動向を把握
Console
Console
論文 | HyperAI超神経
EmoBench-M:マルチモーダル大規模言語モデルの感情知能のベンチマーク評価
He Hu, Yucheng Zhou, Lianzhong You, et al.
FDABench:異種データ上の分析クエリ向けデータエージェントのベンチマーク
Ziting Wang, Shize Zhang, Haitao Yuan, et al.
思考するより絵を描くほうが簡単:テキストから画像を生成するモデルは舞台を設定できるが、演出まではできないか?
Ouxiang Li, Yuan Wang, Xinting Hu, et al.
UniVerse-1:エキスパートのステッチングによる統合型音声・映像生成
Duomin Wang, Wei Zuo, Aojie Li, et al.
基礎モデルは段階的エムボディド推論においてどれほど優れているか?
Dinura Dissanayake, Ahmed Heakl, Omkar Thawakar, et al.
スパイキングブレイン技術報告書:スパイキングブレインをインスパイアした大規模モデル
Yuqi Pan, Yupeng Feng, Jinghao Zhuang, et al.
SAGE:意味理解のための現実的なベンチマーク
Samarth Goel, Reagan J. Lee, Kannan Ramchandran
WAVECLIP:適応的解像度CLIPのためのウェーブレットトークナイゼーション
Moshe Kimhi, Erez Koifman, Ehud Rivlin, et al.
EmbeddingGemma:強力で軽量なテキスト表現
Henrique Schechter Vera, Sahil Dua, Biao Zhang, et al.
GRPOを用いた音声認識言語モデルにおける音声理解の進展
Avishai Elmakies, Hagai Aronowitz, Nimrod Shabtay, et al.
VLMが視覚空間的知能からどれほど離れているのか? ベンチマーク駆動型の視点から
Songsong Yu, Yuxin Chen, Hao Ju, et al.
SIM-CoT:教師付き暗黙的チェーン・オブ・シンキング
Xilin Wei, Xiaoran Liu, Yuhang Zang, et al.
SWE-QA:言語モデルはリポジトリレベルのコード質問に答えられるか?
Weihan Peng, Yuling Shi, Yuhang Wang, et al.
動画モデルはゼロショット学習者かつ推論者である。
Thaddäus Wiedemer, Yuxuan Li, Paul Vicol, et al.
機械工学解析問題の重要課題に対するN-Plus-1 GPTエージェンシー
Anthony Patera, Rohan Abeyaratne
メモリQA:マルチモーダル記憶を基にしたリコール質問への回答
Hongda Jiang, Xinyuan Zhang, Siddhant Garg, et al.
MAPO:ミックスドアドバンテージポリシー最適化
Wenke Huang, Quan Zhang, Yiyang Fang, et al.
ハイパーバゲル:マルチモーダル理解および生成のための統合型高速化フレームワーク
Yanzuo Lu, Xin Xia, Manlin Zhang, et al.
事前学習データにおける強化学習
Siheng Li, Kejiao Li, Zenan Xu, et al.
視覚運動方策に本体感觉状態は必要か?
Juntu Zhao, Wenbo Lu, Di Zhang, et al.
Baseer:アラビア語文書からMarkdownへのOCR向け視覚言語モデル
Khalil Hennara, Muhammad Hreden, Mohamed Motasim Hamed, et al.
GenExam:多分野テキスト-to-画像試験
Zhaokai Wang, Penghao Yin, Xiangyu Zhao, et al.
Nav-R1:身体化されたシーンにおける推論とナビゲーション
Qingxiang Liu, Ting Huang, Zeyu Zhang, et al.
MoEはあなたが思っているよりも強い:RoEによるハイパープアラレル推論スケーリング
Soheil Zibakhsh, Mohammad Samragh, Kumari Nishu, et al.
ARE:エージェント環境および評価のスケーリング
Pierre Andrews, Amine Benhalloum, Gerard Moreno-Torres Bertran, et al.
DiffusionNFT:前方過程を用いたオンラインディフュージョン強化学習
Kaiwen Zheng, Huayu Chen, Haotian Ye, et al.
TempSamp-R1:強化学習微調整を用いた効果的な時系列サンプリングによる動画LLM向け手法
Yunheng Li, Jing Cheng, Shaoyong Jia, et al.
ワンピース:コンテキスト工学と推論を産業用カスケードランキングシステムに導入する
Sunhao Dai, Jiakai Tang, Jiahua Wu, et al.
OmniInsert:拡散変換器モデルを用いた参照画像の自由なマスクフリー動画挿入
Jinshu Chen, Xinghui Li, Xu Bai, et al.
LIMI:エージェンシーにおける「少即是多」
Yang Xiao, Mohan Jiang, Jie Sun, et al.
効率的なタンパク質配列中の多金属結合部位予測のためのモジュール型融合ニューラルネットワークアプローチ
JIZHENG LI, CHANGXIN FAN, Hoi Ying LAU, et al.
IndexTTS2:感情表現豊かで発話時間制御が可能な自己回帰型ゼロショット音声合成
Siyi Zhou, Yiquan Zhou, Yi He, et al.
1
15
16
17
18
19
20
21
39
EmoBench-M:マルチモーダル大規模言語モデルの感情知能のベンチマーク評価
He Hu, Yucheng Zhou, Lianzhong You, et al.
FDABench:異種データ上の分析クエリ向けデータエージェントのベンチマーク
Ziting Wang, Shize Zhang, Haitao Yuan, et al.
思考するより絵を描くほうが簡単:テキストから画像を生成するモデルは舞台を設定できるが、演出まではできないか?
Ouxiang Li, Yuan Wang, Xinting Hu, et al.
UniVerse-1:エキスパートのステッチングによる統合型音声・映像生成
Duomin Wang, Wei Zuo, Aojie Li, et al.
基礎モデルは段階的エムボディド推論においてどれほど優れているか?
Dinura Dissanayake, Ahmed Heakl, Omkar Thawakar, et al.
スパイキングブレイン技術報告書:スパイキングブレインをインスパイアした大規模モデル
Yuqi Pan, Yupeng Feng, Jinghao Zhuang, et al.
SAGE:意味理解のための現実的なベンチマーク
Samarth Goel, Reagan J. Lee, Kannan Ramchandran
WAVECLIP:適応的解像度CLIPのためのウェーブレットトークナイゼーション
Moshe Kimhi, Erez Koifman, Ehud Rivlin, et al.
EmbeddingGemma:強力で軽量なテキスト表現
Henrique Schechter Vera, Sahil Dua, Biao Zhang, et al.
GRPOを用いた音声認識言語モデルにおける音声理解の進展
Avishai Elmakies, Hagai Aronowitz, Nimrod Shabtay, et al.
VLMが視覚空間的知能からどれほど離れているのか? ベンチマーク駆動型の視点から
Songsong Yu, Yuxin Chen, Hao Ju, et al.
SIM-CoT:教師付き暗黙的チェーン・オブ・シンキング
Xilin Wei, Xiaoran Liu, Yuhang Zang, et al.
SWE-QA:言語モデルはリポジトリレベルのコード質問に答えられるか?
Weihan Peng, Yuling Shi, Yuhang Wang, et al.
動画モデルはゼロショット学習者かつ推論者である。
Thaddäus Wiedemer, Yuxuan Li, Paul Vicol, et al.
機械工学解析問題の重要課題に対するN-Plus-1 GPTエージェンシー
Anthony Patera, Rohan Abeyaratne
メモリQA:マルチモーダル記憶を基にしたリコール質問への回答
Hongda Jiang, Xinyuan Zhang, Siddhant Garg, et al.
MAPO:ミックスドアドバンテージポリシー最適化
Wenke Huang, Quan Zhang, Yiyang Fang, et al.
ハイパーバゲル:マルチモーダル理解および生成のための統合型高速化フレームワーク
Yanzuo Lu, Xin Xia, Manlin Zhang, et al.
事前学習データにおける強化学習
Siheng Li, Kejiao Li, Zenan Xu, et al.
視覚運動方策に本体感觉状態は必要か?
Juntu Zhao, Wenbo Lu, Di Zhang, et al.
Baseer:アラビア語文書からMarkdownへのOCR向け視覚言語モデル
Khalil Hennara, Muhammad Hreden, Mohamed Motasim Hamed, et al.
GenExam:多分野テキスト-to-画像試験
Zhaokai Wang, Penghao Yin, Xiangyu Zhao, et al.
Nav-R1:身体化されたシーンにおける推論とナビゲーション
Qingxiang Liu, Ting Huang, Zeyu Zhang, et al.
MoEはあなたが思っているよりも強い:RoEによるハイパープアラレル推論スケーリング
Soheil Zibakhsh, Mohammad Samragh, Kumari Nishu, et al.
ARE:エージェント環境および評価のスケーリング
Pierre Andrews, Amine Benhalloum, Gerard Moreno-Torres Bertran, et al.
DiffusionNFT:前方過程を用いたオンラインディフュージョン強化学習
Kaiwen Zheng, Huayu Chen, Haotian Ye, et al.
TempSamp-R1:強化学習微調整を用いた効果的な時系列サンプリングによる動画LLM向け手法
Yunheng Li, Jing Cheng, Shaoyong Jia, et al.
ワンピース:コンテキスト工学と推論を産業用カスケードランキングシステムに導入する
Sunhao Dai, Jiakai Tang, Jiahua Wu, et al.
OmniInsert:拡散変換器モデルを用いた参照画像の自由なマスクフリー動画挿入
Jinshu Chen, Xinghui Li, Xu Bai, et al.
LIMI:エージェンシーにおける「少即是多」
Yang Xiao, Mohan Jiang, Jie Sun, et al.
効率的なタンパク質配列中の多金属結合部位予測のためのモジュール型融合ニューラルネットワークアプローチ
JIZHENG LI, CHANGXIN FAN, Hoi Ying LAU, et al.
IndexTTS2:感情表現豊かで発話時間制御が可能な自己回帰型ゼロショット音声合成
Siyi Zhou, Yiquan Zhou, Yi He, et al.
1
15
16
17
18
19
20
21
39