Yambda-5B は、アムステルダム大学が公開した大規模なマルチモーダル音楽分析データセットです。音楽の推奨、情報の検索、ソートなどの大規模言語モデル (LLM) のトレーニングおよび評価リソースを提供することを目的としています。関連する論文の結果は次のとおりです。音楽表現の対照学習”。
データには、100 万人のユーザーと 939 万曲をカバーする 47 億 9000 万件のインタラクション (視聴、いいね、いいねの取り消しなど) が含まれています。これは現在公開されている音楽推奨データセットの中で最大規模のものの 1 つです。
ユーザーインタラクション数グラフ