HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

メイン

GPU

コンソール
Studio
ドキュメント
料金

パルス

ニュース

リソース

論文
ノートブック
データセット
Wiki

ベンチマーク

SOTA
LLMモデル
GPUランキング

コミュニティ

イベント

ユーティリティ

概要利用規約プライバシーポリシー
日本語

Command Palette

Search for a command to run...

HyperAI
Papers

Papers

最新のAIトレンドを把握するための、日々更新される最先端AI研究論文

人工知能の未来を築く

概要

当社についてサポートデータセットのヘルプ

製品

ニュース論文ノートブックデータセット Wiki

リンク

© HyperAI

GitHub Discord X (formerly Twitter)

Generative World Renderer

Generative World Renderer

拡散モデル

Zheng-Hui Huang, Zhixiang Wang, Jiaming Tan, et al.

潜在空間：基盤、進化、メカニズム、能力、および展望

潜在空間：基盤、進化、メカニズム、能力、および展望

ディープラーニング

Xinlei Yu, Zhangquan Chen, Yongbo He, et al.

DataFlex: 大規模言語モデルのデータ中心動的学習のための統合フレームワーク

モデル学習

Hao Liang, Zhengyang Zhao, Meiyi Qiang, et al.

QuitoBench：高品質なオープンタイムシリーズ予測ベンチマーク

ディープラーニング

ベンチマーク

Siqiao Xue, Zhaoyang Zhu, Wei Zhang, et al.

Vision2Web：エージェント検証を備えた視覚的ウェブサイト開発のための階層的ベンチマーク

コード生成

マルチモーダル

Zehai He, Wenyi Hong, Zhen Yang, et al.

ViGoR-Bench：視覚生成モデルはゼロショット視覚推論器からどれほど遠いのか？

マルチモーダル

画像間変換

Haonan Han, Jiancheng Huang, Xiaopeng Sun, et al.

MiroEval: プロセスと成果におけるマルチモーダル深層研究エージェントのベンチマーク評価

マルチモーダル

ベンチマーク

Fangda Ye, Yuxin Hu, Pengxiang Zhu, et al.

エンタープライズ自動化にはターミナル Agent で十分である

エージェント

Patrice Bechard, Orlando Marquez Ayala, Emily Chen, et al.

ClawKeeper: スキル、プラグイン、およびウォッチャーを通じた OpenClaw エージェントのための包括的な安全保護

エージェント

Songyang Liu, Chaozhuo Li, Chenxu Wang, et al.

確率的勾配降下法の高速な不確実性定量化のための安価なブートストラップ

モデル学習

ディープラーニング

Henry Lam, Zitong Wang

Generative AI Enables Structural Brain Network Construction from fMRI via Symmetric Diffusion Learning

拡散モデル

Qiankun Zuo, Bangjun Lei, Wanyu Qiu, et al.

エッジ AI 向けの早期退出型予測符号化ニューラルネットワーク

ディープラーニング

Alaa Zniber, Mounir Ghogho, Ouassim Karrakchou, et al.

二次勾配：ヘッシアンと勾配の統合による勾配降下法とニュートン型手法の架け橋となる統一フレームワーク

ディープラーニング

モデル学習

製品ブロードキャストチャネルのクラスにおける容量領域

Yanlin Geng, Amin Gohari, Chandra Nair, et al.

Colon-Bench: 全手技大腸内視鏡検査動画におけるスケーラブルな高密度病変注釈のためのアジェンティックワークフロー

視覚質問応答

Abdullah Hamdi, Changchun Yang, Xin Gao

TOOLACE：LLM 関数呼び出しにおける優位性の確立

監視付き微調整

Weiwen Liu, Xu Huang, Xingshan Zeng, et al.

LightMover: 色と強度の制御を備えた生成光移動

画像間変換

拡散モデル

Gengze Zhou, Tianyu Wang, Soo Ye Kim, et al.

強化学習と対戦相手のポーズ推定を用いた自律的な追い越し軌道最適化

Matej Rene Cihlar, Luka Šiktar, Branimir Ćaran, et al.

Make It Up：一般化された少数ショット意味セグメンテーションにおける偽造画像による実質的な性能向上

拡散モデル

セマンティックセグメンテーション

Guohuan Xie, Xin He, Dingying Fan, et al.

LLM ベースのマルチトークヤースピーチ認識に向けた、ゲート付きクロスアテンションアダプタを用いた 2 段階音響適応手法

Hao Shi, Yuan Gao, Xugang Lu, et al.

外科 AI における比較研究：データセット、ファウンデーションモデル、および Med-AGI への障壁

マルチモーダル

Kirill Skobelev, Eric Fithian, Yegor Baranovski, et al.

テキストデータ統合

自然言語処理

Md Ataur Rahman, Dimitris Sacharidis, Oscar Romero, et al.

フローマッチングによる統一された数値不要のテキストからモーションへの生成

マルチモーダル

拡散モデル

Guanhe Huang, Oya Celiktutan

SEAR：LLM Gateway 向けスキーマベースの評価とルーティング

テキスト生成

Zecheng Zhang, Han Zheng, Yue Xu

拡散 Transformer における文脈空間内でのオンザフライ反発による多様性の向上

テキストから画像生成

拡散モデル

Omer Dahary, Benaya Koren, Daniel Garibi, et al.

EpochX：創発的エージェント文明の基盤構築

エージェント

Huacan Wang, Chaofa Yuan, Xialie Zhuang, et al.

TAPS：Speculative Sampling 用の Task Aware Proposal Distributions

テキスト生成

Mohamad Zbib, Mohamad Bazzi, Ammar Mohanna, et al.

LongTail Driving Scenarios with Reasoning Traces: The KITScenes LongTail Dataset

マルチモーダル

Royden Wagner, Omer Sahin Tas, Jaime Villa, et al.

RealChart2Code：実データとマルチタスク評価によるチャートからコードへの生成の進展

コード生成

マルチモーダル

Jiajun Zhang, Yuying Li, Zhixun Li, et al.

Trace2Skill: 軌道局所的な教訓を転移可能な Agent 技能へ蒸留する

エージェント

Jingwei Ni, Yihao Liu, Xinpeng Liu, et al.

PackForcing：短時間の動画トレーニングが、長時間の動画サンプリングおよび長文脈推論に十分である

拡散モデル

Xiaofeng Mao, Shaohao Rui, Kaining Ying, et al.

ShotStream: 対話型ストーリーテリングのためのストリーミング・マルチショット動画生成

テキストから動画

Yawen Luo, Xiaoyu Shi, Junhao Zhuang, et al.

Generative World Renderer

Generative World Renderer

拡散モデル

Zheng-Hui Huang, Zhixiang Wang, Jiaming Tan, et al.

潜在空間：基盤、進化、メカニズム、能力、および展望

潜在空間：基盤、進化、メカニズム、能力、および展望

ディープラーニング

Xinlei Yu, Zhangquan Chen, Yongbo He, et al.

DataFlex: 大規模言語モデルのデータ中心動的学習のための統合フレームワーク

モデル学習

Hao Liang, Zhengyang Zhao, Meiyi Qiang, et al.

QuitoBench：高品質なオープンタイムシリーズ予測ベンチマーク

ディープラーニング

ベンチマーク

Siqiao Xue, Zhaoyang Zhu, Wei Zhang, et al.

Vision2Web：エージェント検証を備えた視覚的ウェブサイト開発のための階層的ベンチマーク

コード生成

マルチモーダル

Zehai He, Wenyi Hong, Zhen Yang, et al.

ViGoR-Bench：視覚生成モデルはゼロショット視覚推論器からどれほど遠いのか？

マルチモーダル

画像間変換

Haonan Han, Jiancheng Huang, Xiaopeng Sun, et al.

MiroEval: プロセスと成果におけるマルチモーダル深層研究エージェントのベンチマーク評価

マルチモーダル

ベンチマーク

Fangda Ye, Yuxin Hu, Pengxiang Zhu, et al.

エンタープライズ自動化にはターミナル Agent で十分である

エージェント

Patrice Bechard, Orlando Marquez Ayala, Emily Chen, et al.

ClawKeeper: スキル、プラグイン、およびウォッチャーを通じた OpenClaw エージェントのための包括的な安全保護

エージェント

Songyang Liu, Chaozhuo Li, Chenxu Wang, et al.

確率的勾配降下法の高速な不確実性定量化のための安価なブートストラップ

モデル学習

ディープラーニング

Henry Lam, Zitong Wang

Generative AI Enables Structural Brain Network Construction from fMRI via Symmetric Diffusion Learning

拡散モデル

Qiankun Zuo, Bangjun Lei, Wanyu Qiu, et al.

エッジ AI 向けの早期退出型予測符号化ニューラルネットワーク

ディープラーニング

Alaa Zniber, Mounir Ghogho, Ouassim Karrakchou, et al.

二次勾配：ヘッシアンと勾配の統合による勾配降下法とニュートン型手法の架け橋となる統一フレームワーク

ディープラーニング

モデル学習

製品ブロードキャストチャネルのクラスにおける容量領域

Yanlin Geng, Amin Gohari, Chandra Nair, et al.

Colon-Bench: 全手技大腸内視鏡検査動画におけるスケーラブルな高密度病変注釈のためのアジェンティックワークフロー

視覚質問応答

Abdullah Hamdi, Changchun Yang, Xin Gao

TOOLACE：LLM 関数呼び出しにおける優位性の確立

監視付き微調整

Weiwen Liu, Xu Huang, Xingshan Zeng, et al.

LightMover: 色と強度の制御を備えた生成光移動

画像間変換

拡散モデル

Gengze Zhou, Tianyu Wang, Soo Ye Kim, et al.

強化学習と対戦相手のポーズ推定を用いた自律的な追い越し軌道最適化

Matej Rene Cihlar, Luka Šiktar, Branimir Ćaran, et al.

Make It Up：一般化された少数ショット意味セグメンテーションにおける偽造画像による実質的な性能向上

拡散モデル

セマンティックセグメンテーション

Guohuan Xie, Xin He, Dingying Fan, et al.

LLM ベースのマルチトークヤースピーチ認識に向けた、ゲート付きクロスアテンションアダプタを用いた 2 段階音響適応手法

Hao Shi, Yuan Gao, Xugang Lu, et al.

外科 AI における比較研究：データセット、ファウンデーションモデル、および Med-AGI への障壁

マルチモーダル

Kirill Skobelev, Eric Fithian, Yegor Baranovski, et al.

テキストデータ統合

自然言語処理

Md Ataur Rahman, Dimitris Sacharidis, Oscar Romero, et al.

フローマッチングによる統一された数値不要のテキストからモーションへの生成

マルチモーダル

拡散モデル

Guanhe Huang, Oya Celiktutan

SEAR：LLM Gateway 向けスキーマベースの評価とルーティング

テキスト生成

Zecheng Zhang, Han Zheng, Yue Xu

拡散 Transformer における文脈空間内でのオンザフライ反発による多様性の向上

テキストから画像生成

拡散モデル

Omer Dahary, Benaya Koren, Daniel Garibi, et al.

EpochX：創発的エージェント文明の基盤構築

エージェント

Huacan Wang, Chaofa Yuan, Xialie Zhuang, et al.

TAPS：Speculative Sampling 用の Task Aware Proposal Distributions

テキスト生成

Mohamad Zbib, Mohamad Bazzi, Ammar Mohanna, et al.

LongTail Driving Scenarios with Reasoning Traces: The KITScenes LongTail Dataset

マルチモーダル

Royden Wagner, Omer Sahin Tas, Jaime Villa, et al.

RealChart2Code：実データとマルチタスク評価によるチャートからコードへの生成の進展

コード生成

マルチモーダル

Jiajun Zhang, Yuying Li, Zhixun Li, et al.

Trace2Skill: 軌道局所的な教訓を転移可能な Agent 技能へ蒸留する

エージェント

Jingwei Ni, Yihao Liu, Xinpeng Liu, et al.

PackForcing：短時間の動画トレーニングが、長時間の動画サンプリングおよび長文脈推論に十分である

拡散モデル

Xiaofeng Mao, Shaohao Rui, Kaining Ying, et al.

ShotStream: 対話型ストーリーテリングのためのストリーミング・マルチショット動画生成

テキストから動画

Yawen Luo, Xiaoyu Shi, Junhao Zhuang, et al.

DataFlex: 大規模言語モデルのデータ中心動的学習のための統合フレームワーク

QuitoBench：高品質なオープンタイムシリーズ予測ベンチマーク

Vision2Web：エージェント検証を備えた視覚的ウェブサイト開発のための階層的ベンチマーク

ViGoR-Bench：視覚生成モデルはゼロショット視覚推論器からどれほど遠いのか？

MiroEval: プロセスと成果におけるマルチモーダル深層研究エージェントのベンチマーク評価

エンタープライズ自動化にはターミナル Agent で十分である

ClawKeeper: スキル、プラグイン、およびウォッチャーを通じた OpenClaw エージェントのための包括的な安全保護

確率的勾配降下法の高速な不確実性定量化のための安価なブートストラップ

Generative AI Enables Structural Brain Network Construction from fMRI via Symmetric Diffusion Learning

エッジ AI 向けの早期退出型予測符号化ニューラルネットワーク

二次勾配：ヘッシアンと勾配の統合による勾配降下法とニュートン型手法の架け橋となる統一フレームワーク

製品ブロードキャストチャネルのクラスにおける容量領域

Colon-Bench: 全手技大腸内視鏡検査動画におけるスケーラブルな高密度病変注釈のためのアジェンティックワークフロー

TOOLACE：LLM 関数呼び出しにおける優位性の確立

LightMover: 色と強度の制御を備えた生成光移動

強化学習と対戦相手のポーズ推定を用いた自律的な追い越し軌道最適化

Make It Up：一般化された少数ショット意味セグメンテーションにおける偽造画像による実質的な性能向上

LLM ベースのマルチトークヤースピーチ認識に向けた、ゲート付きクロスアテンションアダプタを用いた 2 段階音響適応手法

外科 AI における比較研究：データセット、ファウンデーションモデル、および Med-AGI への障壁

テキストデータ統合

フローマッチングによる統一された数値不要のテキストからモーションへの生成

SEAR：LLM Gateway 向けスキーマベースの評価とルーティング

拡散 Transformer における文脈空間内でのオンザフライ反発による多様性の向上

EpochX：創発的エージェント文明の基盤構築

TAPS：Speculative Sampling 用の Task Aware Proposal Distributions

LongTail Driving Scenarios with Reasoning Traces: The KITScenes LongTail Dataset

RealChart2Code：実データとマルチタスク評価によるチャートからコードへの生成の進展

Trace2Skill: 軌道局所的な教訓を転移可能な Agent 技能へ蒸留する

PackForcing：短時間の動画トレーニングが、長時間の動画サンプリングおよび長文脈推論に十分である

ShotStream: 対話型ストーリーテリングのためのストリーミング・マルチショット動画生成

DataFlex: 大規模言語モデルのデータ中心動的学習のための統合フレームワーク

QuitoBench：高品質なオープンタイムシリーズ予測ベンチマーク

Vision2Web：エージェント検証を備えた視覚的ウェブサイト開発のための階層的ベンチマーク

ViGoR-Bench：視覚生成モデルはゼロショット視覚推論器からどれほど遠いのか？

MiroEval: プロセスと成果におけるマルチモーダル深層研究エージェントのベンチマーク評価

エンタープライズ自動化にはターミナル Agent で十分である

ClawKeeper: スキル、プラグイン、およびウォッチャーを通じた OpenClaw エージェントのための包括的な安全保護

確率的勾配降下法の高速な不確実性定量化のための安価なブートストラップ

Generative AI Enables Structural Brain Network Construction from fMRI via Symmetric Diffusion Learning

エッジ AI 向けの早期退出型予測符号化ニューラルネットワーク

二次勾配：ヘッシアンと勾配の統合による勾配降下法とニュートン型手法の架け橋となる統一フレームワーク

製品ブロードキャストチャネルのクラスにおける容量領域

Colon-Bench: 全手技大腸内視鏡検査動画におけるスケーラブルな高密度病変注釈のためのアジェンティックワークフロー

TOOLACE：LLM 関数呼び出しにおける優位性の確立

LightMover: 色と強度の制御を備えた生成光移動

強化学習と対戦相手のポーズ推定を用いた自律的な追い越し軌道最適化

Make It Up：一般化された少数ショット意味セグメンテーションにおける偽造画像による実質的な性能向上

LLM ベースのマルチトークヤースピーチ認識に向けた、ゲート付きクロスアテンションアダプタを用いた 2 段階音響適応手法

外科 AI における比較研究：データセット、ファウンデーションモデル、および Med-AGI への障壁

テキストデータ統合

フローマッチングによる統一された数値不要のテキストからモーションへの生成

SEAR：LLM Gateway 向けスキーマベースの評価とルーティング

拡散 Transformer における文脈空間内でのオンザフライ反発による多様性の向上

EpochX：創発的エージェント文明の基盤構築

TAPS：Speculative Sampling 用の Task Aware Proposal Distributions

LongTail Driving Scenarios with Reasoning Traces: The KITScenes LongTail Dataset

RealChart2Code：実データとマルチタスク評価によるチャートからコードへの生成の進展

Trace2Skill: 軌道局所的な教訓を転移可能な Agent 技能へ蒸留する

PackForcing：短時間の動画トレーニングが、長時間の動画サンプリングおよび長文脈推論に十分である

ShotStream: 対話型ストーリーテリングのためのストリーミング・マルチショット動画生成