本文由第三方AI基于17173文章http://news.17173.com/content/09182025/180608673.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
中文互联网基础语料 3.0 发布:数据量为 120GB,助力大模型训练与 AI 发展
2025-09-18 18:06:09
神评论
17173 新闻导语
中文互联网基础语料3.0发布,120GB数据助力大模型训练与AI发展,丰富高质量中文语料供给,点击了解更多详情!
在昆明召开的 2025 年国家网络安全宣传周人工智能安全治理分论坛上,中文互联网基础语料 3.0 正式向社会发布。
在中央网信办相关部门指导下,中国网络空间安全协会会同国家互联网应急中心等单位,在前期发布中文互联网基础语料 1.0 和 2.0 的基础上,持续发挥企业、高校和科研单位协同优势,依托网安协会人工智能安全治理专委会建立的语料共建共享机制,汇聚一批新的高质量可信数据,经过信源筛选、内容过滤、数据去重等一系列严格细致的数据加工处理措施,形成并对社会发布中文互联网基础语料 3.0。本批语料扩大了优质中文网站信源范围,加强了违法不良信息过滤,数据量为 120GB,可为大模型训练和人工智能发展提供可信数据支持。用户登录中国网络空间安全协会网站 ,点击“中文互联网语料资源平台”链接,通过注册、认证等程序,即可下载相关语料。
网安协会负责人表示,中文互联网基础语料 3.0 是各界协同共建高质量中文语料的又一重要成果,进一步丰富了高质量中文语料的供给。下一步,网安协会将会同国家互联网应急中心等单位,协同各行业领域,持续加强中文互联网基础语料建设,为人工智能技术创新和产业发展提供有力支撑和保障。
【来源:IT之家】
热门测试游戏
- 122年前,这款韩游靠一个玩法惊艳全世界,连魔兽都来拜师学艺
- 2过不了审!《棕色尘埃2》尺度太逆天官方油管被封
- 3《暗黑4》又翻车了?这次是因为一个马虎的员工
- 4暴雪老兵新作《上古守护》宣布停服 Steam破例允许无视游玩时长退款
- 5昆凌发了和周杰伦的vlog 疑似回应周杰伦争议事件
- 6里昂裸体mod再激起性别双标争议 男女性化标准统一这么难
- 7飞翔不设限,归来仍少年 《飞飞:无限宇宙》技术测试4月3日开启
- 8二次元“贫乳”标准越来越离谱?有画师吐槽:现在连D都算小了
- 9腾讯Q版三国回合制RPG《三国志异闻录》3月17日上线
- 10《魔兽世界》玩家热议!银月城重制是暴雪干的最正确的一件事!太美了!


