HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
科学者の最初の試験:MLLMの認知能力を知覚、理解、推論を通じて探究する
マルチモーダル
ベンチマーク
Zhou, Yuhao, Wang, et al.
MiniMax-M1: ライトニング・アテンションを用いてテスト時の計算リソースを効率的にスケーリング
LLM
モデル学習
MiniMax, Aili Chen, Aonian Li, et al.
均質アテンションを超えて:フーリエ近似KVキャッシュを用いたメモリ効率の高いLLM
Transformer
LLM
Xiaoran Liu, Siyang He, Qiqi Wang, et al.
高品質データセットと信頼性のある評価手法による 画像・テキスト連携生成
データセット
LLM
Yukang Feng, Jianwen Sun, Chuanhao Li, et al.
SwS: 自己の弱点を認識した問題合成手法による強化学習のLLM推論向上
強化学習
LLM
Liang, Xiao, Li, et al.
LiveCodeBench Pro: オリンピックメダリストが競技プログラミングにおけるLLMの評価方法を解説
ベンチマーク
コード生成
Zihan Zheng, Zerui Cheng, Zeyu Shen, et al.
拡散の二重性
拡散モデル
自然言語処理
Sahoo, Subham Sekhar, Deschenaux, et al.
Alignされた新規視点画像と幾何学合成をクロスモーダル注意インストレーションを用いて実現
画像修復
3D生成
Min-Seop Kwak, Junho Kim, Sangdoo Yun, et al.
VRBench: 長編ナラティブビデオにおける多段階推論のベンチマーク
ビデオ理解
Reasoning
Yu, Jiashuo, Wu, et al.
AniMaker: MCTS駆動の自動化されたマルチエージェントアニメーションストーリーテリング
テキストから動画
動画生成
Shi, Haoyuan, Li, et al.
テキストに配慮したディフュージョンモデルを用いた画像修復
拡散モデル
画像修復
Jaewon Min, Jin Hyeon Kim, Paul Hyunbin Cho, et al.
Magistral この単語は、学術的な文脈では「権威ある」や「卓越した」といった意味で使用されます。ただし、具体的な文脈がないと正確な翻訳が難しいため、以下に一般的な翻訳を示します。 権威ある 卓越した もし特定の文脈がある場合は、その情報を提供いただければより適切な翻訳が可能です。
強化学習
Reasoning
Mistral-AI, Abhinav Rastogi, Albert Q. Jiang, et al.
SWE-Factory: イシュー解決トレーニングデータと評価ベンチマークの自動化された工場
コード生成
ベンチマーク
Lianghong Guo, Yanlin Wang, Caihua Li, et al.
ReasonMed: 医療推論の進歩のために生成された370Kマルチエージェントデータセット
Reasoning
データセット
Yu Sun, Xingyu Qian, Weiwen Xu, et al.
サピエンス:人間の視覚モデルの基盤
コンピュータビジョン
マルチタスク学習
Rawal Khirodkar, Timur Bagautdinov, Julieta Martinez, et al.
LongVILA:長時間動画向けにスケーリングされた長文脈視覚言語モデル
LLM
Transformer
Fuzhao Xue, Yukang Chen, Dacheng Li, et al.
DeepSeek-Prover-V1.5:証明補助ツールのフィードバックを活用した強化学習およびモンテカルロ木探索
LLM
強化学習
Huajian Xin, Z. Z. Ren, Junxiao Song, et al.
LLaVA-OneVision:視覚タスクの簡単な転移
マルチモーダル
ビデオ理解
Bo Li, Yuanhan Zhang, Dong Guo, et al.
SAM 2:画像および動画におけるアノテーションの汎用化
コンピュータビジョン
ビデオ理解
Nikhila Ravi, Valentin Gabeur, Yuan-Ting Hu, et al.
Llama 3 モデル群
LLM
Transformer
Abhimanyu Dubey, Abhinav Jauhri, Abhinav Pandey, et al.
InternLM-XComposer-2.5:長文入出力に対応する汎用的大規模視覚言語モデル
Any-to-Any
マルチモーダル表現
Pan Zhang, Xiaoyi Dong, Yuhang Zang, et al.
MMDU:LVLMs向けのマルチターン・マルチイメージ対話理解ベンチマークおよびインストラクションチューニングデータセット
マルチモーダル
データセット
Ziyu Liu, Tao Chu, Yuhang Zang, et al.
視覚言語モデルを構築する際に重要な要素は何ですか?
マルチモーダル
Transformer
Hugo Laurençon, Léo Tronchon, Matthieu Cord, et al.
DDOS:ドローン深度および障害物セグメンテーションデータセット
深度推定
セマンティックセグメンテーション
Benedikt Kolbeinsson, Krystian Mikolajczyk
自己回帰モデルとフローマッチング:テキストから音楽への生成モデリングの比較研究
Text-to-Audio
拡散モデル
Tal, Or, Kreuk, et al.
SeerAttention-R: 長い推論のためのスパースアテンション適応
Transformer
自然言語処理
Gao, Yizhao, Guo, et al.
プレイヤーワン:自己中心的な世界シミュレーター
動画生成
画像から動画生成
Yuanpeng Tu, Hao Luo, Xi Chen, et al.
ComfyUI-R1: ワークフロー生成のための推論モデルの探求
ComfyUI
Reasoning
Zhenran Xu, Yiyu Wang, Xue Yang, et al.
自己回帰敵対的後学習によるリアルタイムインタラクティブビデオ生成
動画生成
拡散モデル
Shanchuan Lin, Ceyuan Yang, Hao He, et al.
自信がすべて:言語モデルのFew-Shot RLファインチューニング
強化学習
監視付き微調整
Li, Pengyi, Skripkin, et al.
1
45
46
47
48
科学者の最初の試験:MLLMの認知能力を知覚、理解、推論を通じて探究する
マルチモーダル
ベンチマーク
Zhou, Yuhao, Wang, et al.
MiniMax-M1: ライトニング・アテンションを用いてテスト時の計算リソースを効率的にスケーリング
LLM
モデル学習
MiniMax, Aili Chen, Aonian Li, et al.
均質アテンションを超えて:フーリエ近似KVキャッシュを用いたメモリ効率の高いLLM
Transformer
LLM
Xiaoran Liu, Siyang He, Qiqi Wang, et al.
高品質データセットと信頼性のある評価手法による 画像・テキスト連携生成
データセット
LLM
Yukang Feng, Jianwen Sun, Chuanhao Li, et al.
SwS: 自己の弱点を認識した問題合成手法による強化学習のLLM推論向上
強化学習
LLM
Liang, Xiao, Li, et al.
LiveCodeBench Pro: オリンピックメダリストが競技プログラミングにおけるLLMの評価方法を解説
ベンチマーク
コード生成
Zihan Zheng, Zerui Cheng, Zeyu Shen, et al.
拡散の二重性
拡散モデル
自然言語処理
Sahoo, Subham Sekhar, Deschenaux, et al.
Alignされた新規視点画像と幾何学合成をクロスモーダル注意インストレーションを用いて実現
画像修復
3D生成
Min-Seop Kwak, Junho Kim, Sangdoo Yun, et al.
VRBench: 長編ナラティブビデオにおける多段階推論のベンチマーク
ビデオ理解
Reasoning
Yu, Jiashuo, Wu, et al.
AniMaker: MCTS駆動の自動化されたマルチエージェントアニメーションストーリーテリング
テキストから動画
動画生成
Shi, Haoyuan, Li, et al.
テキストに配慮したディフュージョンモデルを用いた画像修復
拡散モデル
画像修復
Jaewon Min, Jin Hyeon Kim, Paul Hyunbin Cho, et al.
Magistral この単語は、学術的な文脈では「権威ある」や「卓越した」といった意味で使用されます。ただし、具体的な文脈がないと正確な翻訳が難しいため、以下に一般的な翻訳を示します。 権威ある 卓越した もし特定の文脈がある場合は、その情報を提供いただければより適切な翻訳が可能です。
強化学習
Reasoning
Mistral-AI, Abhinav Rastogi, Albert Q. Jiang, et al.
SWE-Factory: イシュー解決トレーニングデータと評価ベンチマークの自動化された工場
コード生成
ベンチマーク
Lianghong Guo, Yanlin Wang, Caihua Li, et al.
ReasonMed: 医療推論の進歩のために生成された370Kマルチエージェントデータセット
Reasoning
データセット
Yu Sun, Xingyu Qian, Weiwen Xu, et al.
サピエンス:人間の視覚モデルの基盤
コンピュータビジョン
マルチタスク学習
Rawal Khirodkar, Timur Bagautdinov, Julieta Martinez, et al.
LongVILA:長時間動画向けにスケーリングされた長文脈視覚言語モデル
LLM
Transformer
Fuzhao Xue, Yukang Chen, Dacheng Li, et al.
DeepSeek-Prover-V1.5:証明補助ツールのフィードバックを活用した強化学習およびモンテカルロ木探索
LLM
強化学習
Huajian Xin, Z. Z. Ren, Junxiao Song, et al.
LLaVA-OneVision:視覚タスクの簡単な転移
マルチモーダル
ビデオ理解
Bo Li, Yuanhan Zhang, Dong Guo, et al.
SAM 2:画像および動画におけるアノテーションの汎用化
コンピュータビジョン
ビデオ理解
Nikhila Ravi, Valentin Gabeur, Yuan-Ting Hu, et al.
Llama 3 モデル群
LLM
Transformer
Abhimanyu Dubey, Abhinav Jauhri, Abhinav Pandey, et al.
InternLM-XComposer-2.5:長文入出力に対応する汎用的大規模視覚言語モデル
Any-to-Any
マルチモーダル表現
Pan Zhang, Xiaoyi Dong, Yuhang Zang, et al.
MMDU:LVLMs向けのマルチターン・マルチイメージ対話理解ベンチマークおよびインストラクションチューニングデータセット
マルチモーダル
データセット
Ziyu Liu, Tao Chu, Yuhang Zang, et al.
視覚言語モデルを構築する際に重要な要素は何ですか?
マルチモーダル
Transformer
Hugo Laurençon, Léo Tronchon, Matthieu Cord, et al.
DDOS:ドローン深度および障害物セグメンテーションデータセット
深度推定
セマンティックセグメンテーション
Benedikt Kolbeinsson, Krystian Mikolajczyk
自己回帰モデルとフローマッチング:テキストから音楽への生成モデリングの比較研究
Text-to-Audio
拡散モデル
Tal, Or, Kreuk, et al.
SeerAttention-R: 長い推論のためのスパースアテンション適応
Transformer
自然言語処理
Gao, Yizhao, Guo, et al.
プレイヤーワン:自己中心的な世界シミュレーター
動画生成
画像から動画生成
Yuanpeng Tu, Hao Luo, Xi Chen, et al.
ComfyUI-R1: ワークフロー生成のための推論モデルの探求
ComfyUI
Reasoning
Zhenran Xu, Yiyu Wang, Xue Yang, et al.
自己回帰敵対的後学習によるリアルタイムインタラクティブビデオ生成
動画生成
拡散モデル
Shanchuan Lin, Ceyuan Yang, Hao He, et al.
自信がすべて:言語モデルのFew-Shot RLファインチューニング
強化学習
監視付き微調整
Li, Pengyi, Skripkin, et al.
1
45
46
47
48