HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

RelayLLM：協調デコードによる効率的な推論

RelayLLM：協調デコードによる効率的な推論

テキスト生成

Chengsong Huang, Tong Zheng, Langlin Huang, et al.

トークンレベルにおけるLLM協働のためのFusionRoute

トークンレベルにおけるLLM協働のためのFusionRoute

テキスト生成

Nuoya Xiong, Yuhang Zhou, Hanqing Zeng, et al.

RL-AWB：低照度夜間シーンにおける自動ホワイトバランス補正のためのディープ強化学習

マシンビジョン

Yuan-Kang Lee, Kuan-Lin Chen, Chia-Che Chang, et al.

学習可能なマルチプライヤー：言語モデル行列層のスケーリングを解放する

Maksim Velikanov, Ilyas Chahed, Jingwei Zuo, et al.

GDPO：マルチリワードRL最適化のためのグループ報酬分解型正規化ポリシー最適化

Preference Modeling

Shih-Yang Liu, Xin Dong, Ximing Lu, et al.

MemRL：エピソード記憶上のランタイム強化学習を用いた自己進化型エージェント

エージェント

Shengtao Zhang, Jiaqian Wang, Ruiwen Zhou, et al.

失敗から習得へ：ツール利用エージェント向けハードサンプルの生成

エージェント

Bingguang Hao, Zengzhuang Xu, Yuntao Wen, et al.

動的オブジェクトの世界を巧みに編み込む

Yanzhe Lyu, Chen Geng, Karthik Dharmarajan, et al.

Klear：統合型マルチタスク音声・映像共同生成

テキストから動画

Jun Wang, Chunyu Qiang, Yuxin Guo, et al.

Atlas：マルチドメイン複雑推論のための異種モデルおよびツールのオーケストレーション

エージェント

Jinyang Wu, Guocheng Zhai, Ruihan Jin, et al.

Benchmark^2：LLMベンチマークの体系的評価

データセット

Qi Qian, Chengsong Huang, Jingwen Xu, et al.

MindWatcher：よりスマートなマルチモーダルツール統合推論への道

エージェント

Jiawei Chen, Xintian Shen, Lihao Zheng, et al.

エントロピー適応型ファインチューニング：確信した矛盾の解消による忘却の軽減

監視付き微調整

Muxi Diao, Lele Yang, Wuxuan Gong, et al.

多様性か精度か？次トークン予測の深い考察

監視付き微調整

Haoyuan Wu, Hai Wang, Jiajia Wu, et al.

孔子コードエージェント：現実世界のコードベースにおけるスケーラブルなエージェント構造

エージェント

コード生成

Sherman Wong, Zhenting Qi, Zhaodong Wang, et al.

DreamStyle：ビデオスタイル化のための統合枠組み

画像から動画生成

ビデオ処理

Mengtian Li, Jinshu Chen, Songtao Zhao, et al.

UniCorn：自己生成された教師信号を用いた自己改善型統合型マルチモーダルモデルへの道

テキストから画像生成

Ruiyan Han, Zhen Fang, XinYu Sun, et al.

LTX-2：効率的な共同音声視覚基盤モデル

テキストから動画

拡散モデル

Yoav HaCohen, Benny Brazowski, Nisan Chiprut, et al.

SciEvalKit：科学一般知能向けオープンソース評価ツールキット

ベンチマーク

オープンソース

Yiheng Wang, Yixin Chen, Shuo Li, et al.

MOSS Transcribe Diarize：発話者分離を伴う高精度な音声認識

音声および音声処理

Donghua Yu, Zhengyuan Lin, Chen Yang, et al.

InfiniDepth：ニューラルインプリシットフィールドを用いた任意解像度・細粒度深度推定

3D マシンビジョン

Hao Yu, Haotong Lin, Jiawei Wang, et al.

エージェント型AIの適応

エージェント

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, et al.

大規模なビデオ計画が汎用的なロボット制御を可能にする

ロボティクス

エムボディドインテリジェンス

Boyuan Chen, Tianyuan Zhang, Haoran Geng, et al.

InfiniteVGGT：無限ストリーム向け視覚幾何学に基づくトランスフォーマー

アーキテクチャ

3D マシンビジョン

Shuai Yuan, Yantai Yang, Xiaotian Yang, et al.

GARDO：報酬ハッキングを伴わずに拡散モデルを強化する

拡散モデル

Haoran He, Yuxiao Ye, Jie Liu, et al.

VAR RLの正しさ：視覚的自己回帰生成における非同期な方策の衝突への対処

拡散モデル

Shikun Sun, Liao Qu, Huichao Zhang, et al.

DreamID-V：拡散トランスフォーマーを活用した高忠実度顔交換における画像から動画へのギャップの橋渡し

画像から動画生成

拡散モデル

Xu Guo, Fulong Ye, Xinghui Li, et al.

NextFlow：統一された順序モデリングがマルチモーダル理解および生成を活性化する

テキストから画像生成

Huichao Zhang, Liao Qu, Yiheng Liu, et al.

K-EXAONE 技術報告

テキスト生成

Eunbi Choi, Kibong Choi, Seokhee Hong, et al.

ハンガーゲーム論争：マルチエージェントシステムにおける過度な競争の台頭について

エージェント

Xinbei Ma, Ruotian Ma, Xingyu Chen, et al.

ルーブリック報酬を用いたAI共同研究者の訓練

エージェント

Shashwat Goel, Rishi Hazra, Dulhan Jayalath, et al.

AdaGaR：動的シーン再構成のための適応型ガボール表現

3D マシンビジョン

Jiewen Chan, Zhenjun Zhao, Yu-Lun Liu

RelayLLM：協調デコードによる効率的な推論

RelayLLM：協調デコードによる効率的な推論

テキスト生成

Chengsong Huang, Tong Zheng, Langlin Huang, et al.

トークンレベルにおけるLLM協働のためのFusionRoute

トークンレベルにおけるLLM協働のためのFusionRoute

テキスト生成

Nuoya Xiong, Yuhang Zhou, Hanqing Zeng, et al.

RL-AWB：低照度夜間シーンにおける自動ホワイトバランス補正のためのディープ強化学習

マシンビジョン

Yuan-Kang Lee, Kuan-Lin Chen, Chia-Che Chang, et al.

学習可能なマルチプライヤー：言語モデル行列層のスケーリングを解放する

Maksim Velikanov, Ilyas Chahed, Jingwei Zuo, et al.

GDPO：マルチリワードRL最適化のためのグループ報酬分解型正規化ポリシー最適化

Preference Modeling

Shih-Yang Liu, Xin Dong, Ximing Lu, et al.

MemRL：エピソード記憶上のランタイム強化学習を用いた自己進化型エージェント

エージェント

Shengtao Zhang, Jiaqian Wang, Ruiwen Zhou, et al.

失敗から習得へ：ツール利用エージェント向けハードサンプルの生成

エージェント

Bingguang Hao, Zengzhuang Xu, Yuntao Wen, et al.

動的オブジェクトの世界を巧みに編み込む

Yanzhe Lyu, Chen Geng, Karthik Dharmarajan, et al.

Klear：統合型マルチタスク音声・映像共同生成

テキストから動画

Jun Wang, Chunyu Qiang, Yuxin Guo, et al.

Atlas：マルチドメイン複雑推論のための異種モデルおよびツールのオーケストレーション

エージェント

Jinyang Wu, Guocheng Zhai, Ruihan Jin, et al.

Benchmark^2：LLMベンチマークの体系的評価

データセット

Qi Qian, Chengsong Huang, Jingwen Xu, et al.

MindWatcher：よりスマートなマルチモーダルツール統合推論への道

エージェント

Jiawei Chen, Xintian Shen, Lihao Zheng, et al.

エントロピー適応型ファインチューニング：確信した矛盾の解消による忘却の軽減

監視付き微調整

Muxi Diao, Lele Yang, Wuxuan Gong, et al.

多様性か精度か？次トークン予測の深い考察

監視付き微調整

Haoyuan Wu, Hai Wang, Jiajia Wu, et al.

孔子コードエージェント：現実世界のコードベースにおけるスケーラブルなエージェント構造

エージェント

コード生成

Sherman Wong, Zhenting Qi, Zhaodong Wang, et al.

DreamStyle：ビデオスタイル化のための統合枠組み

画像から動画生成

ビデオ処理

Mengtian Li, Jinshu Chen, Songtao Zhao, et al.

UniCorn：自己生成された教師信号を用いた自己改善型統合型マルチモーダルモデルへの道

テキストから画像生成

Ruiyan Han, Zhen Fang, XinYu Sun, et al.

LTX-2：効率的な共同音声視覚基盤モデル

テキストから動画

拡散モデル

Yoav HaCohen, Benny Brazowski, Nisan Chiprut, et al.

SciEvalKit：科学一般知能向けオープンソース評価ツールキット

ベンチマーク

オープンソース

Yiheng Wang, Yixin Chen, Shuo Li, et al.

MOSS Transcribe Diarize：発話者分離を伴う高精度な音声認識

音声および音声処理

Donghua Yu, Zhengyuan Lin, Chen Yang, et al.

InfiniDepth：ニューラルインプリシットフィールドを用いた任意解像度・細粒度深度推定

3D マシンビジョン

Hao Yu, Haotong Lin, Jiawei Wang, et al.

エージェント型AIの適応

エージェント

Pengcheng Jiang, Jiacheng Lin, Zhiyi Shi, et al.

大規模なビデオ計画が汎用的なロボット制御を可能にする

ロボティクス

エムボディドインテリジェンス

Boyuan Chen, Tianyuan Zhang, Haoran Geng, et al.

InfiniteVGGT：無限ストリーム向け視覚幾何学に基づくトランスフォーマー

アーキテクチャ

3D マシンビジョン

Shuai Yuan, Yantai Yang, Xiaotian Yang, et al.

GARDO：報酬ハッキングを伴わずに拡散モデルを強化する

拡散モデル

Haoran He, Yuxiao Ye, Jie Liu, et al.

VAR RLの正しさ：視覚的自己回帰生成における非同期な方策の衝突への対処

拡散モデル

Shikun Sun, Liao Qu, Huichao Zhang, et al.

DreamID-V：拡散トランスフォーマーを活用した高忠実度顔交換における画像から動画へのギャップの橋渡し

画像から動画生成

拡散モデル

Xu Guo, Fulong Ye, Xinghui Li, et al.

NextFlow：統一された順序モデリングがマルチモーダル理解および生成を活性化する

テキストから画像生成

Huichao Zhang, Liao Qu, Yiheng Liu, et al.

K-EXAONE 技術報告

テキスト生成

Eunbi Choi, Kibong Choi, Seokhee Hong, et al.

ハンガーゲーム論争：マルチエージェントシステムにおける過度な競争の台頭について

エージェント

Xinbei Ma, Ruotian Ma, Xingyu Chen, et al.

ルーブリック報酬を用いたAI共同研究者の訓練

エージェント

Shashwat Goel, Rishi Hazra, Dulhan Jayalath, et al.

AdaGaR：動的シーン再構成のための適応型ガボール表現

3D マシンビジョン

Jiewen Chan, Zhenjun Zhao, Yu-Lun Liu

RL-AWB：低照度夜間シーンにおける自動ホワイトバランス補正のためのディープ強化学習

学習可能なマルチプライヤー：言語モデル行列層のスケーリングを解放する

GDPO：マルチリワードRL最適化のためのグループ報酬分解型正規化ポリシー最適化

MemRL：エピソード記憶上のランタイム強化学習を用いた自己進化型エージェント

失敗から習得へ：ツール利用エージェント向けハードサンプルの生成

動的オブジェクトの世界を巧みに編み込む

Klear：統合型マルチタスク音声・映像共同生成

Atlas：マルチドメイン複雑推論のための異種モデルおよびツールのオーケストレーション

Benchmark^2：LLMベンチマークの体系的評価

MindWatcher：よりスマートなマルチモーダルツール統合推論への道

エントロピー適応型ファインチューニング：確信した矛盾の解消による忘却の軽減

多様性か精度か？次トークン予測の深い考察

孔子コードエージェント：現実世界のコードベースにおけるスケーラブルなエージェント構造

DreamStyle：ビデオスタイル化のための統合枠組み

UniCorn：自己生成された教師信号を用いた自己改善型統合型マルチモーダルモデルへの道

LTX-2：効率的な共同音声視覚基盤モデル

SciEvalKit：科学一般知能向けオープンソース評価ツールキット

MOSS Transcribe Diarize：発話者分離を伴う高精度な音声認識

InfiniDepth：ニューラルインプリシットフィールドを用いた任意解像度・細粒度深度推定

エージェント型AIの適応

大規模なビデオ計画が汎用的なロボット制御を可能にする

InfiniteVGGT：無限ストリーム向け視覚幾何学に基づくトランスフォーマー

GARDO：報酬ハッキングを伴わずに拡散モデルを強化する

VAR RLの正しさ：視覚的自己回帰生成における非同期な方策の衝突への対処

DreamID-V：拡散トランスフォーマーを活用した高忠実度顔交換における画像から動画へのギャップの橋渡し

NextFlow：統一された順序モデリングがマルチモーダル理解および生成を活性化する

K-EXAONE 技術報告

ハンガーゲーム論争：マルチエージェントシステムにおける過度な競争の台頭について

ルーブリック報酬を用いたAI共同研究者の訓練

AdaGaR：動的シーン再構成のための適応型ガボール表現

RL-AWB：低照度夜間シーンにおける自動ホワイトバランス補正のためのディープ強化学習

学習可能なマルチプライヤー：言語モデル行列層のスケーリングを解放する

GDPO：マルチリワードRL最適化のためのグループ報酬分解型正規化ポリシー最適化

MemRL：エピソード記憶上のランタイム強化学習を用いた自己進化型エージェント

失敗から習得へ：ツール利用エージェント向けハードサンプルの生成

動的オブジェクトの世界を巧みに編み込む

Klear：統合型マルチタスク音声・映像共同生成

Atlas：マルチドメイン複雑推論のための異種モデルおよびツールのオーケストレーション

Benchmark^2：LLMベンチマークの体系的評価

MindWatcher：よりスマートなマルチモーダルツール統合推論への道

エントロピー適応型ファインチューニング：確信した矛盾の解消による忘却の軽減

多様性か精度か？次トークン予測の深い考察

孔子コードエージェント：現実世界のコードベースにおけるスケーラブルなエージェント構造

DreamStyle：ビデオスタイル化のための統合枠組み

UniCorn：自己生成された教師信号を用いた自己改善型統合型マルチモーダルモデルへの道

LTX-2：効率的な共同音声視覚基盤モデル

SciEvalKit：科学一般知能向けオープンソース評価ツールキット

MOSS Transcribe Diarize：発話者分離を伴う高精度な音声認識

InfiniDepth：ニューラルインプリシットフィールドを用いた任意解像度・細粒度深度推定

エージェント型AIの適応

大規模なビデオ計画が汎用的なロボット制御を可能にする

InfiniteVGGT：無限ストリーム向け視覚幾何学に基づくトランスフォーマー

GARDO：報酬ハッキングを伴わずに拡散モデルを強化する

VAR RLの正しさ：視覚的自己回帰生成における非同期な方策の衝突への対処

DreamID-V：拡散トランスフォーマーを活用した高忠実度顔交換における画像から動画へのギャップの橋渡し

NextFlow：統一された順序モデリングがマルチモーダル理解および生成を活性化する

K-EXAONE 技術報告

ハンガーゲーム論争：マルチエージェントシステムにおける過度な競争の台頭について

ルーブリック報酬を用いたAI共同研究者の訓練

AdaGaR：動的シーン再構成のための適応型ガボール表現