本文由第三方AI基于17173文章http://news.17173.com/content/04242025/185105078.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
Anthropic 示警:Claude 等 AI 被滥用,引导舆论威胁公众认知
2025-04-24 18:51:05
神评论
Anthropic 昨日(4 月 23 日)发布>博文,报告称 Claude 等前沿 AI 模型正被恶意行为者滥用,涉及“舆论引导服务”(influence-as-a-service)操作、凭证填充、招聘诈骗及恶意软件开发等活动。
Anthropic 开发团队为 Claude 采取了多项安全措施,成功阻止了许多有害输出,但威胁行为者仍在尝试绕过这些保护。IT之家援引博文介绍,报告通过多个案例,揭示了恶意行为者如何利用 AI 技术进行复杂操作,包括政治影响力操控、凭证窃取、招聘诈骗及恶意软件开发。
其中最值得关注的一个案例,就是一个营利组织在 X 和 Facebook 上创建了超过 100 个虚假账号,完全无人为干预,能使用多种语言发表评论,伪装成真实用户,成功与数万名真实用户互动,传播政治偏见的叙事内容。
另一个案例涉及凭证填充操作,恶意行为者利用 Claude 增强系统,识别并处理与安全摄像头相关的泄露用户名和密码,同时搜集互联网目标信息以测试这些凭证。
报告还发现,一名技术能力有限的用户,通过 Claude 开发出超出其技能水平的恶意软件。这些案例均未确认实际部署成功,但显示出 AI 如何降低恶意行为的门槛。
研究团队通过 Clio 和分层摘要等技术,分析大量对话数据,识别滥用模式,并结合分类器检测潜在有害请求,成功封禁相关账户。团队强调,随着 AI 系统功能增强,半自主复杂滥用系统可能愈发普遍。
【来源:IT之家】
- 「纯欲天花板」2B花嫁撕破次元!白丝过膝陷肉感,透粉脚底VS发光蛮腰の双重暴击
- 「体操服の‘液态曲线’!橘望顶配身材|白丝厚D呼之欲出,腰臀比秒杀建模」
- CSOL圣诞特别版本上线:全新模式灾变禁区来袭!
- 一看吓一跳:雷死人不偿命的囧图集(986)
- 正惊GIF:对职场骚扰说不!美少妇员工被领导暗示,直接请求丈夫帮助
- 游戏这一年:网易和暴雪分手又复合,它却成了牺牲品!盘点2025网易停运游戏!
- 热点预告:《天下贰》《龙之谷》领衔,多款MMO祭出开年首发新版本
- 【魔兽世界】兽王猎必抓魔暴龙全攻略!环形山稀有刷新点曝光,手慢无!万人蹲守大战一触即发!
- 一看吓一跳:雷死人不偿命的囧图集(987)
- 王者荣耀:定了!S42赛季1月8日更新,段位继承表有变,新英雄大禹携全图传送上线





