京东开源 JoyAI-Echo 长音视频生成框架:实现对话式编辑功能,宣称“进入全球第一梯队”
京东开源JoyAI-Echo长音视频框架,实现对话式编辑,解决角色崩溃、声音乱变等难题,宣称进入全球第一梯队!
6 月 3 日消息,京东今日宣布推出 JoyAI-Echo 长音视频生成框架,号称直接解决行业头疼已久的三大难题 —— 角色易崩、声音乱变、生成缓慢。同时还实现了“对话式编辑”功能,不用再为改一个镜头重跑整条视频。

京东官方表示,JoyAI-Echo 的发布,标志着京东在长视频生成领域进入全球第一梯队。
据介绍,JoyAI-Echo 框架内置了一个专门的记忆库,能在多镜头生成过程中,持续保存并调用角色的外观特征和说话人音色信息。实测结果显示,长达 5 分钟的视频里,角色身份、视觉形象和声音音色都能保持高度一致,再也不会出现“同一个人演着演着变成另一个人”的尴尬情况。
团队提出了记忆驱动后训练流程,结合 SFT、跨模态 RLHF 和 Distribution Matching Distillation(DMD)技术,不仅提升了生成质量,还实现了推理加速,DMD 一项技术就带来约 7.5 倍的速度提升。JoyAI-Echo 还加入了智能“导演助理”——Director Agent,支持自然语言说需求,自动拆分成剧本、角色、场景和镜头。
另外,JoyAI-Echo 还配套了专门的实时超分模块,通过单步超分就能生成高分辨率视频和精细化音频,并支持两档分辨率提升:736×1280 → 1152×1920 和 736×1280 → 1472×2560。
附项目页和 GitHub 代码仓库如下:
GitHub:https://github.com/jd-opensource/JoyAI-Echo
项目主页:https://echo-team-joy-future-academy-jd.github.io/Echo-LongVideo-Page/
- 1《梦幻新诛仙:轻享》今日开启测试!盘点6月扎堆测试的游戏
- 2技术、制作、战斗全到位:拳头从暴雪“成建制”招人,LOL MMO还远吗?
- 3王祖贤担任《天下》IP 18周年品牌代言人,多款重磅新内容定档今夏
- 4《王者荣耀世界》 S1赛季正式上线,腾讯还能逆风翻盘吗?
- 5《诡秘之主》玩法是传奇页游?游戏最新实机放出
- 6实机画面首爆!二次元RPG《阿索拉:星之祈愿》公开预告视频
- 7《影之刃零》官宣跳票,《战神》新作公布!索尼State of Play 发布会抢先看
- 8越战题材FPS网游《人间地狱:越南》临近上线宣布跳票至8月13日
- 9暴雪突然想起《星际2》?这款发行16年的RTS迎来大改
- 10仅由两名开发者打造,多人弹幕MMORPG《Runeward Online》曝光

