Million Song 数据集的核心数据是 The Echo Nest 发布的 Taste Profile 子集,它由「用户 ID,歌曲 ID,播放计数」三部分组成。
- 数据分为两部分:
- 训练集包含了超过 1m 用户,完整的历史发布(可在 MSD 网站上获得);
- 验证和测试集合包含 110k 用户,其历史的一半发布(可在 Kaggle 上获得)。
该数据集于 2012 年由 kaggle 发布。
3 做种
0 下载
1901 已完成
- million_song_dataset/README.md 1.04 KB
- million_song_dataset/README.txt 1.04 KB
- million_song_dataset/data/The_Echo_Nest_Taste_Profile_Subset/train_triplets.txt.zip 488.41 MB
- million_song_dataset/data/The_SecondHandSongs_Dataset/shs_dataset_test.txt 312.03 KB
- million_song_dataset/data/The_SecondHandSongs_Dataset/shs_dataset_train.txt 765.58 KB
- million_song_dataset/data/The_musiXmatch_Dataset/full_word_list.txt.zip 1.91 MB
- million_song_dataset/data/The_musiXmatch_Dataset/mxm_779k_matches.txt.zip 30.08 MB
- million_song_dataset/data/The_musiXmatch_Dataset/mxm_dataset.db 2.27 GB
- million_song_dataset/data/The_musiXmatch_Dataset/mxm_dataset_test.txt.zip 4.58 MB
- million_song_dataset/data/The_musiXmatch_Dataset/mxm_dataset_train.txt.zip 34.81 MB
- million_song_dataset/data/The_musiXmatch_Dataset/mxm_reverse_mapping.txt 78.65 KB
- million_song_dataset/data/last.fm/demo_similars_db.py 3.89 KB
- million_song_dataset/data/last.fm/demo_tags_db.py 3.68 KB
- million_song_dataset/data/last.fm/lastfm_similars.db 3.79 GB
- million_song_dataset/data/last.fm/lastfm_subset.zip 12.34 MB
- million_song_dataset/data/last.fm/lastfm_tags.db 566.56 MB
- million_song_dataset/data/last.fm/lastfm_test.zip 131.96 MB
- million_song_dataset/data/last.fm/lastfm_train.zip 1 GB
- million_song_dataset/data/last.fm/lastfm_unique_tags.txt 9.65 MB
- million_song_dataset/data/last.fm/tracks_with_similar.txt 10.6 MB
- million_song_dataset/data/last.fm/tracks_with_tag.txt 9.15 MB