HyperAIHyperAI超神経
ホームニュース最新論文チュートリアルデータセット百科事典SOTALLMモデルGPU ランキング学会
検索
サイトについて
日本語
HyperAIHyperAI超神経
  1. ホーム
  2. SOTA
  3. オーディオキャプション
  4. Audio Captioning On Clotho

Audio Captioning On Clotho

評価指標

BLEU-4
CIDEr
METEOR
ROUGE-L

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

モデル名
BLEU-4
CIDEr
METEOR
ROUGE-L
Paper TitleRepository
VALOR16.20.42317.438.2VALOR: Vision-Audio-Language Omni-Perception Pretraining Model and Dataset-
RNN-GRU-EncDec + VGGish + Word2Vec-0.18--Audio Captioning using Gated Recurrent Units-
VAST190.51919.340.8VAST: A Vision-Audio-Subtitle-Text Omni-Modality Foundation Model and Dataset-
Ensemble-RL-0.468--THE SJTU SYSTEM FOR DCASE2021 CHALLENGE TASK 6: AUDIO CAPTIONING BASED ON ENCODER PRE-TRAINING AND REINFORCEMENT LEARNING
Ensemble-0.400--THE DCASE 2021 CHALLENGE TASK 6 SYSTEM: AUTOMATED AUDIO CAPTIONING WITH WEAKLY SUPERVISED PRE-TRAING AND WORD SELECTION METHODS-
Ensemble-0.319--The NTT DCASE2020 Challenge Task 6 system: Automated Audio Captioning with Keywords and Sentence Length Estimation-
Qwen-Audio-0.441--Qwen-Audio: Advancing Universal Audio Understanding via Unified Large-Scale Audio-Language Models-
SLAM-AAC-0.5150.197-SLAM-AAC: Enhancing Audio Captioning with Paraphrasing Augmentation and CLAP-Refine through LLMs-
LOAE-0.5130.197-Enhancing Automated Audio Captioning via Large Language Models with Optimized Audio Encoding-
Audio Flamingo (Pengi trainset)17.40.48918.739.4Audio Flamingo: A Novel Audio Language Model with Few-Shot Learning and Dialogue Abilities-
0 of 10 row(s) selected.
HyperAI

学習、理解、実践、コミュニティと共に人工知能の未来を構築する

日本語

サイトについて

私たちについてデータセットヘルプ

プロダクト

ニュースチュートリアルデータセット百科事典

リンク

TVM 中国語Apache TVMOpenBayes

© HyperAI超神経

TwitterBilibili