HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
HyperAI
HyperAI
メイン
ホーム
GPU
コンソール
ドキュメント
料金
パルス
ニュース
リソース
論文
ノートブック
データセット
Wiki
ベンチマーク
SOTA
LLMモデル
GPUランキング
コミュニティ
イベント
ユーティリティ
検索
概要
利用規約
プライバシーポリシー
日本語
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
サインイン
HyperAI
Papers
Papers
最新のAIトレンドを把握するための、日々更新される最先端AI研究論文
GTA1: GUI テスト時のスケーリングエージェント
エージェント
人間-コンピュータインタラクション
Yan Yang, Dongxu Li, Yutong Dai, et al.
MedGen: グラナラーに注釈付けられた医療動画のスケーリングによる医療動画生成の解錠
動画生成
テキストから動画
Rongsheng Wang, Junying Chen, Ke Ji, et al.
RLVER: 強化学習による検証可能な感情報酬を用いた共感型エージェント
ベンチマーク
エージェント
Peisong Wang, Ruotian Ma, Bang Zhang, et al.
ユーザーセンタードのジオエクスペリエンス:高度な計画、ナビゲーション、および動的な適応を実現するLLM駆動のフレームワーク
検索拡張生成
LLM
Jieren Deng, Aleksandar Cvetkovic, Pak Kiu Chung, et al.
PLAME: プリトレーニングされた言語モデルを活用して強化されたタンパク質多重配列アライメントを生成する
Transformer
自然言語処理
Hanqun Cao, Xinyi Zhou, Zijun Gao, et al.
CriticLean: Critic-Guided 強化学習による数学的形式化
ベンチマーク
監視付き微調整
Zhongyuan Peng, Yifan Yao, Kaijing Ma, et al.
StreamVLN: ストリーミング視覚言語ナビゲーションを用いたSlowFastコンテキストモデル링
LLM
マルチモーダル
Meng Wei, Chenyang Wan, Xiqian Yu, et al.
OmniPart: 部分認識を備えた意味論的分離と構造的一致性を持つ3D生成
3D生成
Any-to-Any
Yunhan Yang, Yufan Zhou, Yuan-Chen Guo, et al.
SingLoRA: 単一行列を使用した低ランク適応
LLM
Transformer
David Bensa\u00efd, Noam Rotstein, Roy Velich, et al.
潜在的な推論に関する調査
LLM
Reasoning
Rui-Jie Zhu, Tianhao Peng, Tianhao Cheng, et al.
エージェントKB:クロスドメイン経験を活用したエージェンティックな問題解決
エージェント
Reasoning
Xiangru Tang, Tianrui Qin, Tianhao Peng, et al.
ChipSeek-R1: ヒエラルキー報酬駆動強化学習を用いた人間を超えるRTLの生成
LLM
モデル学習
Zhirong Chen, Kaiyan Chang, Zhuolin Li, et al.
MedGemma 技術報告書
Any-to-Any
視覚質問応答
Andrew Sellergren, Sahar Kazemzadeh, Tiam Jaroensri, et al.
BMMR: 大規模な二言語マルチモーダル多分野推論データセット
マルチモーダル
データセット
Zhiheng Xi, Guanyu Li, Yutao Fan, et al.
事前学習されたポリシーディスクリミネーターは一般的な報酬モデルである
Preference Modeling
モデル学習
Shihan Dou, Shichun Liu, Yuming Yang, et al.
DreamVLA: 全世界的知識を夢見る視覚・言語・行動モデル
Any-to-Any
ロボティクス
Wenyao Zhang, Hongsi Liu, Zekun Qi, et al.
4DSloMo: 高速シーンの非同期キャプチャによる4D再構成
3D マシンビジョン
ビデオ処理
Yutian Chen, Shi Guo, Tianshuo Yang, et al.
マスク言語モデルを使用してエンコーダーを事前学習するべきか?
自然言語処理
Transformer
Hippolyte Gisserot-Boukhlef, Nicolas Boizard, Manuel Faysse, et al.
MemOS: AIシステム用のメモリOS
LLM
検索拡張生成
Zhiyu Li, Shichao Song, Chenyang Xi, et al.
OGF: 不安定な乱流の統計的定常状態の時間平均を最適化するためのオンライン勾配流手法
サイエンスのためのAI
高性能計算
Tom Hickling, Jonathan F. MacArt, Justin Sirignano, et al.
OpenS2S: オープンソースのエンドツーエンド共感型大規模音声言語モデルの進化
Text-to-Speech
音声および音声処理
Chen Wang, Tianyu Peng, Wen Yang, et al.
Point3R: 明示的空間ポインタメモリを用いたストリーミング3D再構成
3D マシンビジョン
深度推定
Yuqi Wu, Wenzhao Zheng, Jie Zhou, et al.
ステップヒント:多段階の逐次ヒントが強化学習による推論を向上させる
強化学習
LLM
Kaiyi Zhang, Ang Lv, Jinpeng Li, et al.
厳密な主体的ベンチマークの構築における最良の実践手法の確立
ベンチマーク
エージェント
Yuxuan Zhu, Tengjun Jin, Yada Pruksachatkun, et al.
GPT-4oは視覚をどの程度理解しているのか?標準的なコンピュータビジョンタスクにおけるマルチモーダル基礎モデルの評価
画像認識
画像分類
Rahul Ramachandran, Ali Garjani, Roman Bachmann, et al.
Eka-Eval : インド言語の大規模言語モデルの包括的評価フレームワーク
ベンチマーク
LLM
Samridhi Raj Sinha, Rajvee Sheth, Abhishek Upperwal, et al.
DynamiCare: 動的なマルチエージェントフレームワークによるインタラクティブかつオープンエンドの医療意思決定
エージェント
LLM
Tianqi Shang, Weiqing He, Charles Zheng, et al.
エネルギーベースのトランスフォーマーはスケーラブルな学習者であり思考者である
Transformer
コンピュータビジョン
Alexi Gladstone, Ganesh Nanduru, Md Mofijul Islam, et al.
IntFold: 一般および専門的なバイオ分子構造予測のための制御可能な基盤モデル
Transformer
生物分子
The IntFold Team, Leon Qiao, Wayne Bai, et al.
内なる声に耳を傾ける:中間特徴フィードバックによるControlNetの訓練の整合
拡散モデル
画像生成
Nina Konovalova, Maxim Nikolaev, Andrey Kuznetsov, et al.
Skywork-Reward-V2: ヒューマン-AI 協調による嗜好データのキュレーションのスケーリング
Preference Modeling
データセット
Chris Yuhao Liu, Liang Zeng, Yuzhen Xiao, et al.
LangScene-X: 3D言語埋め込みシーンの一般化再構築に向けたTriMapビデオ拡散モデル
Any-to-Any
3D生成
Fangfu Liu, Hao Li, Jiawei Chi, et al.
1
39
40
41
42
43
44
45
47
GTA1: GUI テスト時のスケーリングエージェント
エージェント
人間-コンピュータインタラクション
Yan Yang, Dongxu Li, Yutong Dai, et al.
MedGen: グラナラーに注釈付けられた医療動画のスケーリングによる医療動画生成の解錠
動画生成
テキストから動画
Rongsheng Wang, Junying Chen, Ke Ji, et al.
RLVER: 強化学習による検証可能な感情報酬を用いた共感型エージェント
ベンチマーク
エージェント
Peisong Wang, Ruotian Ma, Bang Zhang, et al.
ユーザーセンタードのジオエクスペリエンス:高度な計画、ナビゲーション、および動的な適応を実現するLLM駆動のフレームワーク
検索拡張生成
LLM
Jieren Deng, Aleksandar Cvetkovic, Pak Kiu Chung, et al.
PLAME: プリトレーニングされた言語モデルを活用して強化されたタンパク質多重配列アライメントを生成する
Transformer
自然言語処理
Hanqun Cao, Xinyi Zhou, Zijun Gao, et al.
CriticLean: Critic-Guided 強化学習による数学的形式化
ベンチマーク
監視付き微調整
Zhongyuan Peng, Yifan Yao, Kaijing Ma, et al.
StreamVLN: ストリーミング視覚言語ナビゲーションを用いたSlowFastコンテキストモデル링
LLM
マルチモーダル
Meng Wei, Chenyang Wan, Xiqian Yu, et al.
OmniPart: 部分認識を備えた意味論的分離と構造的一致性を持つ3D生成
3D生成
Any-to-Any
Yunhan Yang, Yufan Zhou, Yuan-Chen Guo, et al.
SingLoRA: 単一行列を使用した低ランク適応
LLM
Transformer
David Bensa\u00efd, Noam Rotstein, Roy Velich, et al.
潜在的な推論に関する調査
LLM
Reasoning
Rui-Jie Zhu, Tianhao Peng, Tianhao Cheng, et al.
エージェントKB:クロスドメイン経験を活用したエージェンティックな問題解決
エージェント
Reasoning
Xiangru Tang, Tianrui Qin, Tianhao Peng, et al.
ChipSeek-R1: ヒエラルキー報酬駆動強化学習を用いた人間を超えるRTLの生成
LLM
モデル学習
Zhirong Chen, Kaiyan Chang, Zhuolin Li, et al.
MedGemma 技術報告書
Any-to-Any
視覚質問応答
Andrew Sellergren, Sahar Kazemzadeh, Tiam Jaroensri, et al.
BMMR: 大規模な二言語マルチモーダル多分野推論データセット
マルチモーダル
データセット
Zhiheng Xi, Guanyu Li, Yutao Fan, et al.
事前学習されたポリシーディスクリミネーターは一般的な報酬モデルである
Preference Modeling
モデル学習
Shihan Dou, Shichun Liu, Yuming Yang, et al.
DreamVLA: 全世界的知識を夢見る視覚・言語・行動モデル
Any-to-Any
ロボティクス
Wenyao Zhang, Hongsi Liu, Zekun Qi, et al.
4DSloMo: 高速シーンの非同期キャプチャによる4D再構成
3D マシンビジョン
ビデオ処理
Yutian Chen, Shi Guo, Tianshuo Yang, et al.
マスク言語モデルを使用してエンコーダーを事前学習するべきか?
自然言語処理
Transformer
Hippolyte Gisserot-Boukhlef, Nicolas Boizard, Manuel Faysse, et al.
MemOS: AIシステム用のメモリOS
LLM
検索拡張生成
Zhiyu Li, Shichao Song, Chenyang Xi, et al.
OGF: 不安定な乱流の統計的定常状態の時間平均を最適化するためのオンライン勾配流手法
サイエンスのためのAI
高性能計算
Tom Hickling, Jonathan F. MacArt, Justin Sirignano, et al.
OpenS2S: オープンソースのエンドツーエンド共感型大規模音声言語モデルの進化
Text-to-Speech
音声および音声処理
Chen Wang, Tianyu Peng, Wen Yang, et al.
Point3R: 明示的空間ポインタメモリを用いたストリーミング3D再構成
3D マシンビジョン
深度推定
Yuqi Wu, Wenzhao Zheng, Jie Zhou, et al.
ステップヒント:多段階の逐次ヒントが強化学習による推論を向上させる
強化学習
LLM
Kaiyi Zhang, Ang Lv, Jinpeng Li, et al.
厳密な主体的ベンチマークの構築における最良の実践手法の確立
ベンチマーク
エージェント
Yuxuan Zhu, Tengjun Jin, Yada Pruksachatkun, et al.
GPT-4oは視覚をどの程度理解しているのか?標準的なコンピュータビジョンタスクにおけるマルチモーダル基礎モデルの評価
画像認識
画像分類
Rahul Ramachandran, Ali Garjani, Roman Bachmann, et al.
Eka-Eval : インド言語の大規模言語モデルの包括的評価フレームワーク
ベンチマーク
LLM
Samridhi Raj Sinha, Rajvee Sheth, Abhishek Upperwal, et al.
DynamiCare: 動的なマルチエージェントフレームワークによるインタラクティブかつオープンエンドの医療意思決定
エージェント
LLM
Tianqi Shang, Weiqing He, Charles Zheng, et al.
エネルギーベースのトランスフォーマーはスケーラブルな学習者であり思考者である
Transformer
コンピュータビジョン
Alexi Gladstone, Ganesh Nanduru, Md Mofijul Islam, et al.
IntFold: 一般および専門的なバイオ分子構造予測のための制御可能な基盤モデル
Transformer
生物分子
The IntFold Team, Leon Qiao, Wayne Bai, et al.
内なる声に耳を傾ける:中間特徴フィードバックによるControlNetの訓練の整合
拡散モデル
画像生成
Nina Konovalova, Maxim Nikolaev, Andrey Kuznetsov, et al.
Skywork-Reward-V2: ヒューマン-AI 協調による嗜好データのキュレーションのスケーリング
Preference Modeling
データセット
Chris Yuhao Liu, Liang Zeng, Yuzhen Xiao, et al.
LangScene-X: 3D言語埋め込みシーンの一般化再構築に向けたTriMapビデオ拡散モデル
Any-to-Any
3D生成
Fangfu Liu, Hao Li, Jiawei Chi, et al.
1
39
40
41
42
43
44
45
47