17173 > 游戏资讯 > 科技新闻 > 正文

美团发布 LongCat-Flash-Lite 轻量化 MoE 模型,智能体与代码表现突出

2026-02-06 18:05:35 神评论
17173 新闻导语

美团发布LongCat-Flash-Lite轻量化MoE模型,685亿参数,智能体与代码表现突出,支持256K上下文,免费API每日5000万tokens。

感谢网友 GreatMOLA 的线索投递!

2 月 6 日消息,美团今日(2 月 6 日)发布 LongCat-Flash-Lite 模型,这是一款拥有 685 亿参数,每次推理仅激活 29 亿 ~45 亿参数的轻量化 MoE 模型。

通过将超过 300 亿参数用于嵌入层,LongCat-Flash-Lite 宣称不仅超越了参数量等效的 MoE 基线模型,还在与同规模现有模型的对比中展现出“卓越的竞争力”,尤其在智能体与代码领域表现突出,并依托 YARN 技术可支持最长 256 K 上下文,能高效处理长文档、大规模代码分析等场景。

同时,该模型基于嵌入扩展的应用与系统级优化,让模型推理效率大幅提升,在输入 4K,输出 1k 的典型负载下,LongCat API 可提供 500-700 token/s 的生成速度。

美团宣布向开发者开放 LongCat-Flash-Lite 版本 API 接口,可登录 LongCat API 开放平台申请,每日免费额度 5000 万 tokens。

附 LongCat-Flash-Lite 开源地址如下:

https://github.com/meituan-longcat/SGLang-FluentLLM

【来源:IT之家】
关于美团,LongCat-Flash-Lite,MoE模型,轻量化模型,智能体,代码,YARN技术,256K上下文,API接口,开源的新闻
亲爱的 17173 玩家们~我们正在打磨平台的找游戏功能,想听听你平时是怎么筛选、导航找游戏的?你的真实习惯和偏好,能让后续找游戏更顺手哦!立即点击填写问卷 参与问卷