17173 > 游戏资讯 > 科技新闻 > 正文

Yandex 发布最大音乐推荐开源数据集 Yambda

2025-05-30 18:27:06 神评论

俄罗斯搜索引擎巨头 Yandex 昨日发布了世界上最大的音乐推荐系统开源数据集 Yambda,包含 47.9 亿条匿名用户的交互数据,旨在帮助开发者创建智能音乐服务。

Yandex 在十个月内收集了近 2800 万 Yandex Music 月度用户的数据,具体为用户与 939 万首歌曲的 47.9 亿次交互,数据集包括听众对歌曲好恶的关键反馈,所有交互都带有时间戳以提高准确度。

Yambda 在 Hugging Face 提供三种大小的数据集供自由下载:Yambda-5B(来自 100 万名用户的行为)、Yambda-500M(10 万用户)和 Yambda-50M(1 万用户)。其中规模最大的 5B 数据集至少需要 85 GB 存储空间

数据集包含音乐听众的偏好信息,以 Apache Parquet 格式存储,可用作研究用途或开发类似 Spotify 等流媒体服务提供的 AI 音乐推荐功能。

Spotify 和 Tidal 等流媒体服务通常不会发布其音乐推荐算法的代码或模型,因为推荐听众喜爱歌曲的能力被视为其成功的商业秘密。

【来源:IT之家】
关于,Yandex,音乐推荐,开源数据集的新闻
17173 首页全新改版规划中!现向各位玩家征集真实使用意见,你的想法将直接影响新版页面设计~动动手指填写问卷,快来共创你心仪的页面布局吧! 参与问卷