声音克隆如何又快又好?游戏赠礼怎样“一键回复”?|12月互联网专利盘点
揭秘12月互联网大厂最新专利:AI一键声音克隆、游戏赠礼智能回复、视频自动剪辑等黑科技盘点,预测未来技术趋势!
互联网企业的专利申请背后,往往藏着全新的产品布局思路。这几年,虚拟人、元宇宙、AI等概念的兴起之前,都伴随着大厂批量申请相关专利的动作。
因此,关注专利的布局方向,有助于外界预测未来1-2年可能落地的技术方向。还有一些专利和游戏新玩法、降本增效、企业社会责任等关系密切。
《预言家游报》的月度专利总结栏目,关注互联网大厂每月在专利方面的举动,对视频、音频、虚拟人、广告等领域进行相关技术溯源,追踪科技赋能商业的全过程。

音视频相关
01
自动剪辑长视频精华版
专利申请方:北京奇艺世纪科技有限公司
专利名称:速看视频的剪辑方法、装置、存储介质以及电子设备
申请进度:2025年12月23日申请公布
专利摘要:这个专利是一种用AI自动制作视频“速看版”的技术。它能自动分析长视频,找出关键情节和高潮部分,去掉重复、无关的内容,然后把精华片段拼接成一个短小精悍的速看视频。这样就不用人工剪辑了,省时省力,还能保持剧情连贯。
02
自动剪直播高光并互动点播
专利申请方:上海哔哩哔哩科技有限公司
专利名称:直播视频剪辑方法及装置
申请进度:2025年12月2日授权
专利摘要:这个专利是用来把长直播自动剪成精华短视频的。它会同时分析直播的声音(比如音乐、掌声)和画面(比如跳舞、动作),找出最精彩的部分并自动剪出来。还能把这些片段分类整理成一个“节目单”,观众看回放时,可以通过送不同的礼物来“点播”想看的节目,增加了互动和趣味性。
03
影视内容自动打标签
专利申请方:北京奇艺世纪科技有限公司
专利名称:一种标签生成方法、装置、电子设备及存储介质
申请进度:2025年12月16日申请公布
专利摘要:这个专利通过一个多模态大模型,分析视频的画面和文字信息,先为每一帧图片打上标签,再把这些标签按场景整理成更高级的语义标签,最后组合成整个视频的全局标签。这样能更准确、连贯地理解视频内容,方便视频的分类、检索和管理。
04
让搜索结果的时间更准确
专利申请方:北京爱奇艺科技有限公司
专利名称:搜索内容时效性纠正方法、装置、电子设备及存储介质
申请进度:2025年12月16日申请公布
专利摘要:这个专利是帮视频平台解决“搜出来的视频时间不对”的问题,比如你搜“世界杯”,想看最近一届的,却看到几十年前的比赛视频。它会先找到视频,再查相关新闻的发生时间,然后用大模型分析视频内容实际发生的时间,最后用这个时间更新视频的“时效性标签”,让你搜到的结果更符合你想看的时间。
05
识别PPT类视频,提高压缩比
专利申请方:上海哔哩哔哩科技有限公司
专利名称:视频类型确定方法及装置
申请进度:2025年12月23日授权
专利摘要:如果一个视频是PPT录屏或类似内容,如知识讲解视频,因为画面变动不大,就可以使用更高的压缩比。这个专利通过分析视频画面的“频率指纹”来判断,如果画面有大片纯色背景且包含大量文字,就判定为PPT类视频。娱乐资本论曾经报道过视频网站存储大量视频所面临的带宽困局。所以,如果可以对视频类型做初步判断,平台就能用更合适的参数来压缩这类视频,节省存储和带宽。

游戏相关
01
游戏内分享内容“一键回复”
专利申请方:网易(杭州)网络有限公司
专利名称:一种游戏互动方法、装置、计算机设备及存储介质
申请进度:2025年12月30日授权
专利摘要:这是一个网易为游戏做的社交互动功能。当你在游戏里收到朋友分享的新皮肤、任务等消息时,消息旁边会直接显示几个快捷按钮,比如“恭喜!”、“想要同款”、“参与任务”等。你点一下,就能直接完成点赞回复、索要道具或跳转到任务页面,不用再自己到处找入口,让游戏里的分享和互动变得更方便快捷。
02
游戏里租装备、租角色给其他玩家用
专利申请方:完美世界(北京)软件科技发展有限公司
专利名称:游戏资源的控制方法及装置、存储介质、电子装置
申请进度:2025年12月16日授权
专利摘要:带有官方装备交易市场的游戏,往往仅支持买卖而不支持租赁。第三方的游戏装备租赁平台,需要玩家在场外交易后,凭借信任短暂卖出和买回装备所有权,甚至产生了诈骗行为。这个专利让游戏内的市场具备官方的出租装备、角色功能,为保持系统平衡及增加趣味性,该专利构想由系统帮出租方和租用方匹配资源,租用期间双方还能增加亲密度、组队一起玩,资源用完后自动归还等能力。
03
让游戏碰撞更真实的方法
专利申请方:腾讯科技(深圳)有限公司
专利名称:一种游戏交互方法和相关装置
申请进度:2025年12月2日申请公布
专利摘要:这个专利是让游戏里的碰撞效果更逼真的方法。当游戏角色同时被两个或更多从不同方向来的东西(比如技能或道具)撞到时,它就会进入一种动不了或被限制行动的状态,就像现实中被人从前后左右撞晕了一样。这能让玩家感觉游戏里的打斗和碰撞更真实、更有趣。

AI相关
01
AI翻译网页内容的省时方法
专利申请方:阿里巴巴(中国)有限公司
专利名称:一种基于大模型的文本翻译的方法、装置和设备
申请进度:2025年12月30日申请公布
专利摘要:出于省钱,节能,安全隐私等考虑,不是所有任务都适合联网用云端大模型处理,在手机和电脑内运转的“端侧大模型”受到重视。不过,因为终端处理能力不足,端侧模型一般运转缓慢,效果也没有联网模型好。所以,需要预处理内容才能让端侧模型更实用。在本机大模型执行网页翻译任务时,这个专利先拿预设词汇表匹配专有名词,然后去缓存里找以前翻译过的词,最后才把剩下的新词交给大模型翻译,由此节省了调用模型的成本。
02
让AI看视频自动写剧本
专利申请方:腾讯科技(深圳)有限公司
专利名称:视频剧本生成方法、相关装置和介质
申请进度:2025年12月19日申请公布
专利摘要:这是一个用AI帮视频自动写剧本的专利,同样运用了端侧模型处理能力。它会先抽取视频的画面和台词,再根据电脑显存的使用情况,把视频内容分成几块,让多个AI模块同时分析,最后把各块的结果拼成完整的剧本。这样既能让剧本更连贯,又能更高效地利用电脑资源。
03
影视剧海报自动配文字
专利申请方:上海爱奇艺新媒体科技有限公司
专利名称:海报文字生成方法、装置、电子设备及存储介质
申请进度:2025年12月19日申请公布
专利摘要:去年,图片生成AI模型在文字一致性方面取得了长足进步,可以保证生成的字不错不乱。不过,这个专利更进一步,针对影视剧海报的特性,先让AI分析剧集类型,选一个合适的字体风格,再根据输入的文字生成结构图,最后输出一个带透明背景的文字图层,方便后期改图。
04
看图调参,低清秒变高清
专利申请方:华为技术有限公司
专利名称:图像处理方法、模型训练方法及相关装置
申请进度:2025年12月16日申请公布
专利摘要:这是一个用AI把模糊、有噪点的低清图片一键修复成高清图片的技术。它会先判断图片的“受损程度”,然后像老中医开药方一样,动态调整处理模型,针对每张图的不同问题(比如模糊、噪声)进行精准修复,让复原效果更好、更自然。
05
听歌看剧时插入智能语音讲解
专利申请方:华为技术有限公司
专利名称:多媒体内容播放方法、眼练方法、推荐方法及电子设备
申请进度:2025年12月16日申请公布
专利摘要:这是一个在播放音乐、视频时智能插入讲解的技术。当你搜索一首歌或剧集时,它会在前奏、片头等“无词”片段,用语音自动、简短地介绍作品背景或信息,且讲解时长绝不超出该片段,保证不打断正片。还能陪你练歌并打分,并根据你的心情、场景推荐合适内容,让交互更贴心。

数字人/元宇宙
01
快速声音克隆
专利申请方:腾讯科技(深圳)有限公司
专利名称:一种声音复刻方法、装置、设备及存储介质
申请进度:2025年12月26日申请公布
专利摘要:声音克隆是AIGC的一项重要应用,即梦/剪映、Minimax、魔音工坊等都有类似产品。腾讯的这个专利描述了其中一种实现方法:先分析一段参考语音(比如某人的录音),提取出其声音特征,如音色和语调,并保存为特征文件。之后,当需要用这个声音合成新的说话内容(如导航播报或视频解说)时,直接调用这个特征文件即可快速生成新语音,无需每次都重新分析原录音。这样可以大幅减少等待时间和计算资源消耗。不过,在众多声音克隆竞品中,能否保证快速克隆后的音色真的和本人难以分辨,也是一个有待解决的课题。
02
给3D模型自动加物理属性
专利申请方:中移(杭州)信息技术有限公司、中国移动通信集团有限公司
专利名称:三维场景构建方法、装置、电子设备、存储介质及产品
申请进度:2025年12月30日申请公布
专利摘要:这个专利是让电脑自动给三维模型加上重量、材质等物理属性的方法。它先识别场景里的各种物体,再把相似的物体归为一类,如果这类里有已知物理属性的物体,就能推测出其他同类物体的物理属性。这样就能快速生成大量带物理属性的三维场景,用于机器人仿真训练。
03
多人会议录音里,这句话是谁说的?
专利申请方:阿里巴巴(中国)有限公司
专利名称:说话人聚类方法、装置及设备
申请进度:2025年12月16日授权
专利摘要:通义模型及千问客户端,一直提供免费且不限量的语音转文字功能,非常实用。该功能支持区分说话人,用户可以预先选择是单人,双人还是多人对谈。这个专利描述了做出选择以后发生的事情。当用户指定是多人对话以后,它自动把一段长录音切成小片段,分析每个片段的说话人特征,然后把这些片段像社交网络里的好友一样连接起来;声音越像,连线越粗。最后,把这些片段准确地分成几组,每组对应一个说话人。这样就能自动在会议纪要里区分“谁在什么时候说了什么”。

公益民生
01
会议、监控智能多线显示
专利申请方:腾讯科技(深圳)有限公司
专利名称:视频分屏显示方法、相关装置和介质
申请进度:2025年12月12日申请公布
专利摘要:这个专利设计了一个在看监控或视频会议时,让屏幕智能分屏显示多个视频画面的功能,重点是,它会分析视频中的人物和场景,自动把重要的画面放在屏幕中央显眼位置,不重要的放在周围,还能优化画面背景让显示更清晰。这样,一眼就能看到最重要的内容。

02
通过视频对口型测试发音水平
专利申请方:阿里巴巴(中国)有限公司
专利名称:发音质量测试方法
申请进度:2025年12月30日授权
专利摘要:这个专利通过视频分析来测试一个人的发音好不好。它不靠听声音,而是拍摄测试者和标准发音者的朗读视频,专门分析他们嘴部动作的细微差别(比如嘴唇怎么动、开合多大)来打分。这样能排除环境噪音的干扰,让发音评估更准,尤其适合语言学习或失语症康复训练。
03
根据场景动态调整人脸解锁
专利申请方:华为技术有限公司
专利名称:一种人脸注视解锁方法及电子设备
申请进度:2025年12月30日授权
专利摘要:这个专利让手机等设备的人脸解锁更聪明、更准。它会根据你使用时的环境(比如强光、距离、侧脸)自动判断属于什么“场景”,然后调用对应的图像优化器先处理人脸和眼睛特征,再判断你是否真的在看屏幕。在不同场景下还会动态调整解锁的分数要求。这样既提高了复杂环境下解锁的成功率,也增强了安全性。
04
利用通信信号精准预测车辆轨迹
专利申请方:荣耀终端有限公司
专利名称:一种车辆轨迹预测方法、电子设备、芯片系统及存储介质
申请进度:2025年12月12日授权
专利摘要:这是一个利用手机基站信号来精准预测汽车未来位置和速度的技术。汽车会定期向基站发送探测信号,这个信号会经过周围车辆、行人等物体反射。通过分析这些反射信号的到达时间、角度和频率变化,就能算出包括汽车和周围所有移动物体在内的精确位置、速度和方向,再结合高精度地图和人工智能算法,就能预测它们接下来的行驶轨迹,比单纯用GPS准多了。



