《大西洋月刊》发布可搜索的AI训练音乐数据库
近日,《大西洋月刊》记者亚历克斯·雷斯特纳在其AI Watchdog平台发布了一个可公开检索的音乐数据集数据库,揭示了当前人工智能模型训练背后庞大的音乐素材来源。该数据库收录了四个关键数据集,其中两个规模分别高达1200万与900万首曲目,另外两个亦各超10万首。尽管部分来源允许个人非商业试听,但商业级训练仍需严格授权。 雷斯特纳指出,这些数据集并非直接提供音频文件,而是以YouTube或Spotify等平台的链接列表形式存在。AI开发团队普遍采用自动化工具批量抓取音频,此类操作往往绕开身份验证、广告播放及订阅付费机制,直接违反平台服务条款。数据库已涵盖Lady Gaga、Radiohead、布鲁斯·斯普林斯汀等大量知名艺人的作品。谷歌与Stability AI已在科研论文中确认使用了上述部分数据。目前该数据库已被下载数千次,其公开透明化举措不仅为行业合规使用敲响警钟,也为公众监督AI训练数据的版权来源提供了切实可行的工具。
