声音克隆如何又快又好？游戏赠礼怎样“一键回复”？｜12月互联网专利盘点

2026-01-16 03:34:07 神评论

17173 新闻导语

揭秘12月互联网大厂最新专利：AI一键声音克隆、游戏赠礼智能回复、视频自动剪辑等黑科技盘点，预测未来技术趋势！

互联网企业的专利申请背后，往往藏着全新的产品布局思路。这几年，虚拟人、元宇宙、AI等概念的兴起之前，都伴随着大厂批量申请相关专利的动作。

因此，关注专利的布局方向，有助于外界预测未来1-2年可能落地的技术方向。还有一些专利和游戏新玩法、降本增效、企业社会责任等关系密切。

《预言家游报》的月度专利总结栏目，关注互联网大厂每月在专利方面的举动，对视频、音频、虚拟人、广告等领域进行相关技术溯源，追踪科技赋能商业的全过程。

音视频相关

自动剪辑长视频精华版

专利申请方：北京奇艺世纪科技有限公司

专利名称：速看视频的剪辑方法、装置、存储介质以及电子设备

申请进度：2025年12月23日申请公布

专利摘要：这个专利是一种用AI自动制作视频“速看版”的技术。它能自动分析长视频，找出关键情节和高潮部分，去掉重复、无关的内容，然后把精华片段拼接成一个短小精悍的速看视频。这样就不用人工剪辑了，省时省力，还能保持剧情连贯。

自动剪直播高光并互动点播

专利申请方：上海哔哩哔哩科技有限公司

专利名称：直播视频剪辑方法及装置

申请进度：2025年12月2日授权

专利摘要：这个专利是用来把长直播自动剪成精华短视频的。它会同时分析直播的声音（比如音乐、掌声）和画面（比如跳舞、动作），找出最精彩的部分并自动剪出来。还能把这些片段分类整理成一个“节目单”，观众看回放时，可以通过送不同的礼物来“点播”想看的节目，增加了互动和趣味性。

影视内容自动打标签

专利申请方：北京奇艺世纪科技有限公司

专利名称：一种标签生成方法、装置、电子设备及存储介质

申请进度：2025年12月16日申请公布

专利摘要：这个专利通过一个多模态大模型，分析视频的画面和文字信息，先为每一帧图片打上标签，再把这些标签按场景整理成更高级的语义标签，最后组合成整个视频的全局标签。这样能更准确、连贯地理解视频内容，方便视频的分类、检索和管理。

让搜索结果的时间更准确

专利申请方：北京爱奇艺科技有限公司

专利名称：搜索内容时效性纠正方法、装置、电子设备及存储介质

申请进度：2025年12月16日申请公布

专利摘要：这个专利是帮视频平台解决“搜出来的视频时间不对”的问题，比如你搜“世界杯”，想看最近一届的，却看到几十年前的比赛视频。它会先找到视频，再查相关新闻的发生时间，然后用大模型分析视频内容实际发生的时间，最后用这个时间更新视频的“时效性标签”，让你搜到的结果更符合你想看的时间。

识别PPT类视频，提高压缩比

专利申请方：上海哔哩哔哩科技有限公司

专利名称：视频类型确定方法及装置

申请进度：2025年12月23日授权

专利摘要：如果一个视频是PPT录屏或类似内容，如知识讲解视频，因为画面变动不大，就可以使用更高的压缩比。这个专利通过分析视频画面的“频率指纹”来判断，如果画面有大片纯色背景且包含大量文字，就判定为PPT类视频。娱乐资本论曾经报道过视频网站存储大量视频所面临的带宽困局。所以，如果可以对视频类型做初步判断，平台就能用更合适的参数来压缩这类视频，节省存储和带宽。

游戏相关

游戏内分享内容“一键回复”

专利申请方：网易（杭州）网络有限公司

专利名称：一种游戏互动方法、装置、计算机设备及存储介质

申请进度：2025年12月30日授权

专利摘要：这是一个网易为游戏做的社交互动功能。当你在游戏里收到朋友分享的新皮肤、任务等消息时，消息旁边会直接显示几个快捷按钮，比如“恭喜！”、“想要同款”、“参与任务”等。你点一下，就能直接完成点赞回复、索要道具或跳转到任务页面，不用再自己到处找入口，让游戏里的分享和互动变得更方便快捷。

游戏里租装备、租角色给其他玩家用

专利申请方：完美世界（北京）软件科技发展有限公司

专利名称：游戏资源的控制方法及装置、存储介质、电子装置

申请进度：2025年12月16日授权

专利摘要：带有官方装备交易市场的游戏，往往仅支持买卖而不支持租赁。第三方的游戏装备租赁平台，需要玩家在场外交易后，凭借信任短暂卖出和买回装备所有权，甚至产生了诈骗行为。这个专利让游戏内的市场具备官方的出租装备、角色功能，为保持系统平衡及增加趣味性，该专利构想由系统帮出租方和租用方匹配资源，租用期间双方还能增加亲密度、组队一起玩，资源用完后自动归还等能力。

让游戏碰撞更真实的方法

专利申请方：腾讯科技（深圳）有限公司

专利名称：一种游戏交互方法和相关装置

申请进度：2025年12月2日申请公布

专利摘要：这个专利是让游戏里的碰撞效果更逼真的方法。当游戏角色同时被两个或更多从不同方向来的东西（比如技能或道具）撞到时，它就会进入一种动不了或被限制行动的状态，就像现实中被人从前后左右撞晕了一样。这能让玩家感觉游戏里的打斗和碰撞更真实、更有趣。

AI相关

AI翻译网页内容的省时方法

专利申请方：阿里巴巴（中国）有限公司

专利名称：一种基于大模型的文本翻译的方法、装置和设备

申请进度：2025年12月30日申请公布

专利摘要：出于省钱，节能，安全隐私等考虑，不是所有任务都适合联网用云端大模型处理，在手机和电脑内运转的“端侧大模型”受到重视。不过，因为终端处理能力不足，端侧模型一般运转缓慢，效果也没有联网模型好。所以，需要预处理内容才能让端侧模型更实用。在本机大模型执行网页翻译任务时，这个专利先拿预设词汇表匹配专有名词，然后去缓存里找以前翻译过的词，最后才把剩下的新词交给大模型翻译，由此节省了调用模型的成本。

让AI看视频自动写剧本

专利申请方：腾讯科技（深圳）有限公司

专利名称：视频剧本生成方法、相关装置和介质

申请进度：2025年12月19日申请公布

专利摘要：这是一个用AI帮视频自动写剧本的专利，同样运用了端侧模型处理能力。它会先抽取视频的画面和台词，再根据电脑显存的使用情况，把视频内容分成几块，让多个AI模块同时分析，最后把各块的结果拼成完整的剧本。这样既能让剧本更连贯，又能更高效地利用电脑资源。

影视剧海报自动配文字

专利申请方：上海爱奇艺新媒体科技有限公司

专利名称：海报文字生成方法、装置、电子设备及存储介质

申请进度：2025年12月19日申请公布

专利摘要：去年，图片生成AI模型在文字一致性方面取得了长足进步，可以保证生成的字不错不乱。不过，这个专利更进一步，针对影视剧海报的特性，先让AI分析剧集类型，选一个合适的字体风格，再根据输入的文字生成结构图，最后输出一个带透明背景的文字图层，方便后期改图。

看图调参，低清秒变高清

专利申请方：华为技术有限公司

专利名称：图像处理方法、模型训练方法及相关装置

申请进度：2025年12月16日申请公布

专利摘要：这是一个用AI把模糊、有噪点的低清图片一键修复成高清图片的技术。它会先判断图片的“受损程度”，然后像老中医开药方一样，动态调整处理模型，针对每张图的不同问题（比如模糊、噪声）进行精准修复，让复原效果更好、更自然。

听歌看剧时插入智能语音讲解

专利申请方：华为技术有限公司

专利名称：多媒体内容播放方法、眼练方法、推荐方法及电子设备

申请进度：2025年12月16日申请公布

专利摘要：这是一个在播放音乐、视频时智能插入讲解的技术。当你搜索一首歌或剧集时，它会在前奏、片头等“无词”片段，用语音自动、简短地介绍作品背景或信息，且讲解时长绝不超出该片段，保证不打断正片。还能陪你练歌并打分，并根据你的心情、场景推荐合适内容，让交互更贴心。

数字人/元宇宙

快速声音克隆

专利申请方：腾讯科技（深圳）有限公司

专利名称：一种声音复刻方法、装置、设备及存储介质

申请进度：2025年12月26日申请公布

专利摘要：声音克隆是AIGC的一项重要应用，即梦/剪映、Minimax、魔音工坊等都有类似产品。腾讯的这个专利描述了其中一种实现方法：先分析一段参考语音（比如某人的录音），提取出其声音特征，如音色和语调，并保存为特征文件。之后，当需要用这个声音合成新的说话内容（如导航播报或视频解说）时，直接调用这个特征文件即可快速生成新语音，无需每次都重新分析原录音。这样可以大幅减少等待时间和计算资源消耗。不过，在众多声音克隆竞品中，能否保证快速克隆后的音色真的和本人难以分辨，也是一个有待解决的课题。

给3D模型自动加物理属性

专利申请方：中移（杭州）信息技术有限公司、中国移动通信集团有限公司

专利名称：三维场景构建方法、装置、电子设备、存储介质及产品

申请进度：2025年12月30日申请公布

专利摘要：这个专利是让电脑自动给三维模型加上重量、材质等物理属性的方法。它先识别场景里的各种物体，再把相似的物体归为一类，如果这类里有已知物理属性的物体，就能推测出其他同类物体的物理属性。这样就能快速生成大量带物理属性的三维场景，用于机器人仿真训练。

多人会议录音里，这句话是谁说的？

专利申请方：阿里巴巴（中国）有限公司

专利名称：说话人聚类方法、装置及设备

申请进度：2025年12月16日授权

专利摘要：通义模型及千问客户端，一直提供免费且不限量的语音转文字功能，非常实用。该功能支持区分说话人，用户可以预先选择是单人，双人还是多人对谈。这个专利描述了做出选择以后发生的事情。当用户指定是多人对话以后，它自动把一段长录音切成小片段，分析每个片段的说话人特征，然后把这些片段像社交网络里的好友一样连接起来；声音越像，连线越粗。最后，把这些片段准确地分成几组，每组对应一个说话人。这样就能自动在会议纪要里区分“谁在什么时候说了什么”。

公益民生

会议、监控智能多线显示

专利申请方：腾讯科技（深圳）有限公司

专利名称：视频分屏显示方法、相关装置和介质

申请进度：2025年12月12日申请公布

专利摘要：这个专利设计了一个在看监控或视频会议时，让屏幕智能分屏显示多个视频画面的功能，重点是，它会分析视频中的人物和场景，自动把重要的画面放在屏幕中央显眼位置，不重要的放在周围，还能优化画面背景让显示更清晰。这样，一眼就能看到最重要的内容。

通过视频对口型测试发音水平

专利申请方：阿里巴巴（中国）有限公司

专利名称：发音质量测试方法

申请进度：2025年12月30日授权

专利摘要：这个专利通过视频分析来测试一个人的发音好不好。它不靠听声音，而是拍摄测试者和标准发音者的朗读视频，专门分析他们嘴部动作的细微差别（比如嘴唇怎么动、开合多大）来打分。这样能排除环境噪音的干扰，让发音评估更准，尤其适合语言学习或失语症康复训练。

根据场景动态调整人脸解锁

专利申请方：华为技术有限公司

专利名称：一种人脸注视解锁方法及电子设备

申请进度：2025年12月30日授权

专利摘要：这个专利让手机等设备的人脸解锁更聪明、更准。它会根据你使用时的环境（比如强光、距离、侧脸）自动判断属于什么“场景”，然后调用对应的图像优化器先处理人脸和眼睛特征，再判断你是否真的在看屏幕。在不同场景下还会动态调整解锁的分数要求。这样既提高了复杂环境下解锁的成功率，也增强了安全性。

利用通信信号精准预测车辆轨迹

专利申请方：荣耀终端有限公司

专利名称：一种车辆轨迹预测方法、电子设备、芯片系统及存储介质

申请进度：2025年12月12日授权

专利摘要：这是一个利用手机基站信号来精准预测汽车未来位置和速度的技术。汽车会定期向基站发送探测信号，这个信号会经过周围车辆、行人等物体反射。通过分析这些反射信号的到达时间、角度和频率变化，就能算出包括汽车和周围所有移动物体在内的精确位置、速度和方向，再结合高精度地图和人工智能算法，就能预测它们接下来的行驶轨迹，比单纯用GPS准多了。

【来源：公众号】

关于游戏互动,一键回复,装备租赁,角色租赁,碰撞效果,社交功能,游戏市场,游戏玩法,游戏赠礼,游戏资源的新闻