本文由第三方AI基于17173文章http://news.17173.com/content/05302025/182706454.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
Yandex 发布最大音乐推荐开源数据集 Yambda
2025-05-30 18:27:06
神评论
俄罗斯搜索引擎巨头 Yandex 昨日发布了世界上最大的音乐推荐系统开源数据集 Yambda,包含 47.9 亿条匿名用户的交互数据,旨在帮助开发者创建智能音乐服务。
Yandex 在十个月内收集了近 2800 万 Yandex Music 月度用户的数据,具体为用户与 939 万首歌曲的 47.9 亿次交互,数据集包括听众对歌曲好恶的关键反馈,所有交互都带有时间戳以提高准确度。
Yambda 在 Hugging Face 提供三种大小的数据集供自由下载:Yambda-5B(来自 100 万名用户的行为)、Yambda-500M(10 万用户)和 Yambda-50M(1 万用户)。其中规模最大的 5B 数据集至少需要 85 GB 存储空间。
数据集包含音乐听众的偏好信息,以 Apache Parquet 格式存储,可用作研究用途或开发类似 Spotify 等流媒体服务提供的 AI 音乐推荐功能。
Spotify 和 Tidal 等流媒体服务通常不会发布其音乐推荐算法的代码或模型,因为推荐听众喜爱歌曲的能力被视为其成功的商业秘密。
【来源:IT之家】
今日热点
热门测试游戏
- 1《深海迷航2》上线12小时累计销量突破200万份
- 2可永久提升属性!韩国MMO《王权与自由》全新赛季上线
- 3《权力游戏国王大道》能不能搬?如何提升战力?9小时游玩感受!
- 4韩国奇幻背景FPS新作《枪与巨龙》公开实机视频
- 5从扮演007特工到2.5D动作,5月这些新游值得一玩!
- 6暗黑4社区左右互搏:一边用新“不死”Build冲层,一边骂游戏已“坏掉”
- 7亚马逊逼开发者做AI游戏,做完了把所有懂AI的人都开了
- 8暗黑4“树的馈赠”回归,经验、金币、材料三倍速毕业?
- 9好莱坞女星艾丽·范宁穿“碎蛋”高跟鞋引发热议
- 10感谢全国网友支持!央视拿下两届世界杯版权 美加墨费用约4亿:揭秘国际足联服软原因




