HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
MegaPairs:ユニバーサルなマルチモーダル検索のための大規模データ合成
マルチモーダル
データセット
Junjie Zhou, Zheng Liu, Ze Liu, et al.
ライラ:包括認知を統合的に扱うための効率的でスピーチ中心のフレームワーク
Any-to-Any
LLM
Zhisheng Zhong, Chengyao Wang, Yuqi Liu, et al.
オープンソース多モーダルモデルの性能境界をモデル、データ、テスト時スケーリングによって拡張する
マルチモーダル
LLM
Zhe Chen, Weiyun Wang, Yue Cao, et al.
NVILA:効率的フロンティア視覚言語モデル
マルチモーダル
ビデオ理解
Zhijian Liu, Ligeng Zhu, Baifeng Shi, et al.
VisionZip:視覚言語モデルにおいて、長ければ長いほど良いが、必ずしも必要ではない
マルチモーダル
マルチモーダル表現
Senqiao Yang, Yukang Chen, Zhuotao Tian, et al.
百川オムニ技術報告書
マルチモーダル
Any-to-Any
Yadong Li, Haoze Sun, Mingan Lin, et al.
MM1.5:多モーダルLLMのファインチューニングからの手法、分析および知見
マルチモーダル
LLM
Haotian Zhang, Mingfei Gao, Zhe Gan, et al.
Emu3:次トークン予測こそがすべてである
Transformer
Any-to-Any
Xinlong Wang, Xiaosong Zhang, Zhengxiong Luo, et al.
CogVLM2:画像および動画理解のための視覚言語モデル
画像理解
ビデオ理解
Wenyi Hong, Weihan Wang, Ming Ding, et al.
Qwen2 技術報告
LLM
コード生成
An Yang, Baosong Yang, Binyuan Hui, et al.
再構成と生成における画像の価値は32トークンに相当する
Transformer
画像生成
Qihang Yu, Mark Weber, Xueqing Deng, et al.
自己回帰モデルが拡散モデルを上回る:スケーラブルな画像生成のためのLlama
LLM
画像生成
Peize Sun, Yi Jiang, Shoufa Chen, et al.
Meteor:大規模言語・視覚モデルの根拠の探索をMambaに基づいて実現する手法
視覚質問応答
マルチモーダル
Byung-Kwan Lee, Chae Won Kim, Beomchan Park, et al.
FIFO-Diffusion:学習を伴わずにテキストから無限の動画を生成する
拡散モデル
動画生成
Jihwan Kim, Junoh Kang, Jinyoung Choi, et al.
GPT-4Vまでの道のりはどのくらいか?オープンソース・スイートによる商用マルチモーダルモデルとのギャップを埋める
視覚質問応答
ドキュメント理解
Zhe Chen, Weiyun Wang, Hao Tian, et al.
想像、探索、批判を通じたLLMの自己改善へ
LLM
Reasoning
Ye Tian, Baolin Peng, Linfeng Song, et al.
オムニフュージョン技術報告書
視覚質問応答
Any-to-Any
Elizaveta Goncharova, Anton Razzhigaev, Matvey Mikhalchuk, et al.
機械学習による予測誤差は、DFTの精度を上回る
ディープラーニング
分子ネットワーク
Felix A. Faber, Luke Hutchison, Bing Huang, et al.
SEAgent:経験からの自律学習を備えた自己進化型コンピュータ利用エージェント
エージェント
Any-to-Any
Zeyi Sun, Ziyu Liu, Yuhang Zang, et al.
AMix-1:テスト時スケーラブルなタンパク質フォンドエーションモデルへの道
サイエンスのためのAI
ディープラーニング
Changze Lv, Jiang Zhou, Siyu Long, et al.
CRINN:近似最近傍探索における対照的強化学習
検索拡張生成
LLM
Xiaoya Li, Xiaofei Sun, Albert Wang, et al.
表現のシフト:トークン圧縮とFlashAttentionの統一
Transformer
ビデオ処理
Joonmyung Choi, Sanghyeok Lee, Byungoh Ko, et al.
CompassVerifier:大規模言語モデルの評価および結果報酬のための統合的で堅牢な検証フレームワーク
LLM
Reasoning
Shudong Liu, Hongwei Liu, Junnan Liu, et al.
LongVie:マルチモーダル誘導型制御可能超長動画生成
動画生成
マルチモーダル
Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.
Skywork UniPic:視覚理解と生成のための統合型自己回帰モデル
テキストから画像生成
画像理解
Peiyu Wang, Yi Peng, Yimeng Gan, et al.
シード拡散:高速推論を実現する大規模な拡散言語モデル
LLM
拡散モデル
\Yuxuan Song\, \ Zheng Zhang\, \ Cheng Luo\, et al.
エージェントライトニング:強化学習でANY AIエージェントを訓練する
強化学習
LLM
Xufang Luo, Yuge Zhang, Zhiyuan He, et al.
大規模言語モデルによる進化的モンテカルロ木探索を用いた指導下的な自動アルゴリズム発見による重力波検出
アルゴリズム
機械学習
He Wang, Liang Zeng
トレードオフを越えて:推論モデルの指示追随のための自己教師付き強化学習
強化学習
Reasoning
Qingyu Ren, Qianyu He, Bowei Zhang, et al.
Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct 技術報告
LLM
監視付き微調整
Sajana Weerawardhena, Paul Kassianik, Blaine Nelson, et al.
CellForge:仮想細胞モデルのエージェント型設計
エージェント
モデリング
Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, et al.
SitEmb-v1.5:意味的関連性および長編物語理解のための文脈認識型高密度検索の改善
検索拡張生成
ドキュメント理解
Junjie Wu, Jiangnan Li, Yuqing Li, et al.
1
35
36
37
38
39
40
41
48
MegaPairs:ユニバーサルなマルチモーダル検索のための大規模データ合成
マルチモーダル
データセット
Junjie Zhou, Zheng Liu, Ze Liu, et al.
ライラ:包括認知を統合的に扱うための効率的でスピーチ中心のフレームワーク
Any-to-Any
LLM
Zhisheng Zhong, Chengyao Wang, Yuqi Liu, et al.
オープンソース多モーダルモデルの性能境界をモデル、データ、テスト時スケーリングによって拡張する
マルチモーダル
LLM
Zhe Chen, Weiyun Wang, Yue Cao, et al.
NVILA:効率的フロンティア視覚言語モデル
マルチモーダル
ビデオ理解
Zhijian Liu, Ligeng Zhu, Baifeng Shi, et al.
VisionZip:視覚言語モデルにおいて、長ければ長いほど良いが、必ずしも必要ではない
マルチモーダル
マルチモーダル表現
Senqiao Yang, Yukang Chen, Zhuotao Tian, et al.
百川オムニ技術報告書
マルチモーダル
Any-to-Any
Yadong Li, Haoze Sun, Mingan Lin, et al.
MM1.5:多モーダルLLMのファインチューニングからの手法、分析および知見
マルチモーダル
LLM
Haotian Zhang, Mingfei Gao, Zhe Gan, et al.
Emu3:次トークン予測こそがすべてである
Transformer
Any-to-Any
Xinlong Wang, Xiaosong Zhang, Zhengxiong Luo, et al.
CogVLM2:画像および動画理解のための視覚言語モデル
画像理解
ビデオ理解
Wenyi Hong, Weihan Wang, Ming Ding, et al.
Qwen2 技術報告
LLM
コード生成
An Yang, Baosong Yang, Binyuan Hui, et al.
再構成と生成における画像の価値は32トークンに相当する
Transformer
画像生成
Qihang Yu, Mark Weber, Xueqing Deng, et al.
自己回帰モデルが拡散モデルを上回る:スケーラブルな画像生成のためのLlama
LLM
画像生成
Peize Sun, Yi Jiang, Shoufa Chen, et al.
Meteor:大規模言語・視覚モデルの根拠の探索をMambaに基づいて実現する手法
視覚質問応答
マルチモーダル
Byung-Kwan Lee, Chae Won Kim, Beomchan Park, et al.
FIFO-Diffusion:学習を伴わずにテキストから無限の動画を生成する
拡散モデル
動画生成
Jihwan Kim, Junoh Kang, Jinyoung Choi, et al.
GPT-4Vまでの道のりはどのくらいか?オープンソース・スイートによる商用マルチモーダルモデルとのギャップを埋める
視覚質問応答
ドキュメント理解
Zhe Chen, Weiyun Wang, Hao Tian, et al.
想像、探索、批判を通じたLLMの自己改善へ
LLM
Reasoning
Ye Tian, Baolin Peng, Linfeng Song, et al.
オムニフュージョン技術報告書
視覚質問応答
Any-to-Any
Elizaveta Goncharova, Anton Razzhigaev, Matvey Mikhalchuk, et al.
機械学習による予測誤差は、DFTの精度を上回る
ディープラーニング
分子ネットワーク
Felix A. Faber, Luke Hutchison, Bing Huang, et al.
SEAgent:経験からの自律学習を備えた自己進化型コンピュータ利用エージェント
エージェント
Any-to-Any
Zeyi Sun, Ziyu Liu, Yuhang Zang, et al.
AMix-1:テスト時スケーラブルなタンパク質フォンドエーションモデルへの道
サイエンスのためのAI
ディープラーニング
Changze Lv, Jiang Zhou, Siyu Long, et al.
CRINN:近似最近傍探索における対照的強化学習
検索拡張生成
LLM
Xiaoya Li, Xiaofei Sun, Albert Wang, et al.
表現のシフト:トークン圧縮とFlashAttentionの統一
Transformer
ビデオ処理
Joonmyung Choi, Sanghyeok Lee, Byungoh Ko, et al.
CompassVerifier:大規模言語モデルの評価および結果報酬のための統合的で堅牢な検証フレームワーク
LLM
Reasoning
Shudong Liu, Hongwei Liu, Junnan Liu, et al.
LongVie:マルチモーダル誘導型制御可能超長動画生成
動画生成
マルチモーダル
Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.
Skywork UniPic:視覚理解と生成のための統合型自己回帰モデル
テキストから画像生成
画像理解
Peiyu Wang, Yi Peng, Yimeng Gan, et al.
シード拡散:高速推論を実現する大規模な拡散言語モデル
LLM
拡散モデル
\Yuxuan Song\, \ Zheng Zhang\, \ Cheng Luo\, et al.
エージェントライトニング:強化学習でANY AIエージェントを訓練する
強化学習
LLM
Xufang Luo, Yuge Zhang, Zhiyuan He, et al.
大規模言語モデルによる進化的モンテカルロ木探索を用いた指導下的な自動アルゴリズム発見による重力波検出
アルゴリズム
機械学習
He Wang, Liang Zeng
トレードオフを越えて:推論モデルの指示追随のための自己教師付き強化学習
強化学習
Reasoning
Qingyu Ren, Qianyu He, Bowei Zhang, et al.
Llama-3.1-FoundationAI-SecurityLLM-8B-Instruct 技術報告
LLM
監視付き微調整
Sajana Weerawardhena, Paul Kassianik, Blaine Nelson, et al.
CellForge:仮想細胞モデルのエージェント型設計
エージェント
モデリング
Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, et al.
SitEmb-v1.5:意味的関連性および長編物語理解のための文脈認識型高密度検索の改善
検索拡張生成
ドキュメント理解
Junjie Wu, Jiangnan Li, Yuqing Li, et al.
1
35
36
37
38
39
40
41
48