17173 > 游戏资讯 > 科技新闻 > 正文

微软下架争议博文:教用户用盗版《哈利 · 波特》全集训练 AI

2026-02-21 10:01:34 神评论
17173 新闻导语

微软删除Azure教程,因指导用户用盗版《哈利·波特》训练AI引发版权争议。了解事件详情与专家分析。

2 月 21 日消息,科技媒体 Ars Technica 昨日(2 月 20 日)发布博文,报道称微软遭到舆论强烈反弹后,删除了 Azure 官方博客上一篇发布于 2024 年 11 月的技术教程。

援引博文介绍,该文章由微软高级产品经理 Pooja Kamath 撰写,主要演示如何利用 Azure SQL 数据库和 LangChain 技术快速构建生成式 AI 应用。

不过文章的核心演示案例竟是指导用户下载并使用盗版的《哈利 · 波特》全集来训练大语言模型(LLM)。

图源:已删除的微软博客

为了展示新功能的“亲和力”,该教程设计了两个应用场景:构建问答系统和生成同人小说。作者展示了一个由 AI 生成的营销故事:

在霍格沃茨特快列车上,哈利 · 波特遇到了一位新朋友,这位朋友向哈利热情推销微软 SQL 中的“原生向量支持”(Native Vector Support)功能,并将其比作“麻瓜世界的魔法”。

教程还附带了一张哈利与朋友带有微软 Logo 的生成图片。法律专家 Cathay Y. N. Smith 指出,这种利用受版权保护的角色进行商业营销的行为,极易触犯版权法。

教程中提供的训练数据链接指向数据科学平台 Kaggle 上的一个数据集。该数据集包含《哈利 · 波特》全七册电子书,且被上传者 Shubham Maindola 错误地标记为“公有领域(Public Domain)”。

尽管该数据集已存在多年并积累了超过一万次下载,但《哈利 · 波特》系列显然仍处于版权保护期内。在媒体 Ars Technica 联系上传者后,Maindola 承认标记错误并删除了数据集,称其本无意误导版权状态。

【来源:IT之家】
关于哈利·波特,AI训练,盗版,版权,微软,Azure,LangChain,生成式AI,Kaggle,数据集的新闻
亲爱的 17173 玩家们~我们正在打磨平台的找游戏功能,想听听你平时是怎么筛选、导航找游戏的?你的真实习惯和偏好,能让后续找游戏更顺手哦!立即点击填写问卷 参与问卷