科幻电影变现实:AI“察言观色”、数字人替身来开会|7月互联网专利盘点

2025-08-07 23:27:02 神评论

作者|肉丁

互联网企业的专利申请背后,往往藏着全新的产品布局思路。这几年,虚拟人、元宇宙、AI等概念的兴起之前,都伴随着大厂批量申请相关专利的动作。

因此,关注专利的布局方向,有助于外界预测未来1-2年可能落地的技术方向。还有一些专利和游戏新玩法、降本增效、企业社会责任等关系密切。

《娱乐资本论》的月度专利总结栏目,关注互联网大厂每月在专利方面的举动,对视频、音频、虚拟人、广告等领域进行相关技术溯源,追踪科技赋能商业的全过程。

音视频相关

01

百度:

视频自动转剧本

专利申请方:百度

专利名称:视频剧本生成方法及装置

2025年7月1日公开

先提取视频里的语音转成文字台词,再从说话时的画面中提取人物外貌特征、从语音中提取声纹特征,然后和视频的角色库比对,找到对应的角色。最后结合角色和他们的台词,生成能真实反映视频内容的剧本,既准确识别角色,又完整保留对话信息。

02

芒果tv:

视频情感标记

专利申请方:芒果tv

专利名称:一种视频内容情感标记方法及装置、电子设备、存储介质

2025年7月4日公开

先看视频的剧本和台词,形成角色和故事的基础数据。然后,一方面通过角色的人脸表情和声音特征,提取情感信息;另一方面结合剧情发展和台词内容,分析出视频内容。最后把这些情感信息总结成提示语(比如“第3分钟,主角皱眉+语气急促+台词‘别碰它’,表达愤怒”),得到精准的序列情感标签。

03

优酷:

边逛APP边追剧

专利申请方:优酷

专利名称:视频播放方法及装置

2025年7月8日公开

在视频APP看视频时,如果想退出这个页面、只要做个退出的手势(比如滑动返回),屏幕上会先弹出一个小窗口。退出详情页后,要是你想继续看,再用手势触发小窗模式。既能在新界面上刷其他内容,又能通过小窗同步看视频,不用来回切换页面,看视频和逛APP两不误。

04

哔哩哔哩:

学习工具“嵌”在播放器里

专利申请方:哔哩哔哩

专利名称:基于视频的学习辅助方法及装置

2025年7月8日公开

用户用专利看英语教学视频或带字幕的外语影视剧时,只要发出学习指令(比如点一下屏幕上的学习按钮),播放器就会分成两个区域:一边继续播放视频,另一边弹出工具栏。工具栏里会显示和视频字幕相关的学习内容——比如字幕里某个单词的意思、发音,不用暂停视频切到别的 APP 查资料,边看边学。

05

哔哩哔哩:

弹幕绕着物体转

专利申请方:哔哩哔哩

专利名称:弹幕交互方法及装置

2025年7月8日公开

在看一部剧时,用户对着屏幕里的主角、道具或者某个场景输入预设指令(比如长按画面里的咖啡杯”),系统就会立刻找到和这个“咖啡杯”相关的互动弹幕,这些目标交互弹幕会按预设方式展示(比如围绕咖啡杯浮动),不用翻找普通弹幕、就能直接看到和当前内容相关的反馈。参与感更强,看视频更有意思。

06

哔哩哔哩:

量身定制弹幕风格

专利申请方:哔哩哔哩

专利名称:弹幕风格配置方法和装置

2025年7月8日公开

用户想给某个视频发弹幕时,系统会先调出现成的弹幕风格模板(比如可爱风、古风等),并给每个模板打分——看它们和当前视频的匹配度有多高。同时,系统会找到和用户相关的UP主、好友,参考他们的弹幕风格。最后结合模板和视频的匹配度,以及相关人的偏好,挑出最适合的“目标弹幕风格模板”。

07

咪咕:

用弹幕回答观众提问

专利申请方:咪咕

专利名称:问答交互方法、装置、介质、产品及设备

2025年7月18日公开

当用户提出与当前视频相关的问题(比如“这个演员是谁”),系统会先在视频的已有评论里搜索是否有匹配的答案。如果找到对应的目标答案评论,就会把答案内容以高亮弹幕的形式显示出来——既不用暂停视频,也不用跳转页面,用户在继续看视频的同时就能看到答案。

游戏相关

01

网易:

角色表情更生动

专利申请方:网易

专利名称:虚拟角色的表情生成方法、装置以及计算机设备

2025年7月4日公开

先分析要让虚拟角色说的语音数据,从中提取三层信息:语音的意思、情绪、说话的节奏。接着,根据节奏和情感从“节奏类表情库”里挑出匹配的表情,再根据语义和情感从“情感类表情库”里选对应表情。最后把这两类表情融合,角色会边微笑,边配合语速点头,更适合游戏、虚拟互动等场景。

02

完美世界:

游戏元素检测更灵活

专利申请方:完美世界

专利名称:游戏元素检测方法、装置、设备和存储介质

2025年7月4日公开

该方法通过提供包含游戏元素检测流程的检测模板,让用户无需编写完整文件,只需输入个性化检测条件,即可与模板结合生成可执行文件,快速实现对不同游戏类型、场景中特定元素的检测,简化了文件生成过程,提升了检测灵活性。

03

腾讯:

让虚拟道具“活”起来

专利申请方:腾讯

专利名称:虚拟场景的道具处理方法、装置及电子设备

2025年7月25日公开

系统会先展示虚拟道具集合(比如游戏中的武器、药水、技能等),当玩家对某个目标道具进行查看操作(如点击、长按)时,会自动播放关联的视频片段,直观呈现道具的完整使用过程。更准确、高效地传递道具信息,让虚拟场景中的道具选择交互更流畅、体验更好。

04

网易:

自动揪出游戏外挂

专利申请方:网易

专利名称:外挂识别的方法及装置、电子设备、存储介质

2025年7月29日公开

系统会先记录设备的界面操作数据,比如用户点击、滑动等操作的顺序、位置和时间点,形成一串操作序列。用预设的标准操作模式去匹配这串序列,从中提取出符合标准模式的操作片段。通过检测引擎分析这些数据,判断是否存在不符合正常操作规律的异常,以此识别出是否有外挂程序在运行。

AI相关

01

优酷:

AI检测视频画面“小毛病”

专利申请方:优酷

专利名称:视频缺陷检测方法和装置、电子设备及存储介质

2025年7月8日公开

这个技术就像给视频装了个 “智能质检员”。它会把视频拆成一帧帧画面,先看表面的 “浅层特征”,比如有没有明显的斑点、模糊块;再深入分析 “深层特征”,比如颜色是否突兀、画面衔接是否顺畅。然后综合这两层信息,标出可能有问题的区域,最后判断这一帧画面到底有没有缺陷。这样一来,不用人工逐帧检查,就能又快又准地找出视频里的小毛病,减少漏检和误判,让我们看到的视频质量更有保障。

02

腾讯:

图片发布前先 “安检”

专利申请方:腾讯

专利名称:音频合成方法、装置、计算机可读存储介质及电子设备

2025年7月22日公开

当创作者发布带图片的内容时,系统会先提取图片和它的标记信息,送到专门的识别端去检查。识别端会给图片分类,同时判断这张图是不是容易让人反感(比如低俗、恐怖内容),如果发现是可能引起不适的图片,系统就会把这些信息记录下来,能在内容分发前提前拦截或限制反感图片,避免影响大家的浏览体验。

03

哔哩哔哩:

视频原创快速辨别

专利申请方:哔哩哔哩

专利名称:视频来源识别方法和装置

2025年7月29日公开

系统会双管齐下分析待识别视频:一方面,提取视频里的文字内容(比如字幕、画面中的文字),用大语言模型找到可能的来源信息(比如视频名称、出处);另一方面,从视频里抽多帧画面做人脸识别,把这些信息和可能的原创来源比对,确定是原创的,还是从其他地方转载、剪辑的。

04

阿里巴巴:

给音频加道“防盗锁”

专利申请方:阿里巴巴

专利名称:音频处理方法、装置、存储介质、电子设备

2025年7月11日公开

处理音频时,系统会先把音频分成一段段“音频帧”,对其中一些帧进行位置搜索,找到可用于标记的样本对,对这些样本对进行位置偏移处理,生成带有特殊标记的音频。这种处理方式能让音频里隐藏着和用户相关的“身份信息”,一旦出现盗版就能通过这些标记追溯源头,大大提升了音频版权保护的力度。

05

爱奇艺:

搜索关键词精准推荐

专利申请方:爱奇艺

专利名称:关键词推荐方法、装置、电子设备及存储介质

2025年7月25日公开

这个技术简单说就是帮用户搜东西时“猜用户所想”的智能推荐功能。比如用户输入“悬疑剧”,系统会先列出一堆相关的可能关键词。然后它会分析用户平时爱搜哪种类型等,把这些特征和候选关键词做比对,算出哪个关键词最贴合用户的喜好。哪怕用户一时想不到精准的词,也能快找到想看的内容,让搜索更顺手。

数字人/元宇宙

01

百度:

数字人跨造型带货

专利申请方:百度

专利名称:目标视频生成方法及装置、电子设备和介质

2025年7月4日公开

收集多个包含同一数字人(但形象不同,比如穿休闲装、职业装)的视频素材,验证确认是同一个数字人后,再确定要推荐的商品信息,以及每个商品该对应哪个形象的视频素材。通过大模型把这些素材、商品信息和对应关系整合起来,让这个数字人用不同造型分别介绍对应的商品,高效完成商品推荐。

02

百度:

边做动作边带货

专利申请方:百度

专利名称:基于大模型的数字人视频生成方法、装置、智能体、电子设备及存储介质

2025年7月11日公开

获取需求信息,比如描述“数字人演示泡茶动作并讲解步骤”;接着用语言大模型处理需求,生成匹配动作的口播剧本;再让视觉大模型结合剧本和动作视频片段,生成最终视频,适用于直播、广告、电商等场景,让数字人视频制作更高效贴合需求。

03

百度:

直播实时反馈

专利申请方:百度

专利名称:数字人直播方法、装置、设备以及存储介质

2025年7月25日公开

系统会先从直播间的背景数据(比如观众留言、实时新闻、商品信息等)中提取关键内容,然后生成对应的提示词。接着,用大模型根据提示词写出数字人要播报的文本,把文本转换成数字人的声音。让数字人的动作和声音同步匹配,直播更流畅自然,降低直播运营的成本和难度。

04

网易:

游戏角色也能参与直播互动

专利申请方:网易

专利名称:游戏场景内的直播互动方法、装置、存储介质与电子设备

2025年7月25日公开

主播在玩一款游戏时,系统会从直播平台获取直播数据,在游戏内的虚拟屏幕上同步显示直播画面;当游戏里的第一虚拟角色做出互动行为(比如挥手、发送弹幕),这些行为数据会立刻传给直播平台,让直播间的观众同步看到游戏角色的动作。

公益民生

01

腾讯:

唱歌算出消耗多少卡路里

专利申请方:腾讯

专利名称:一种卡路里消耗检测方法、设备及存储介质

2025年7月11日公开

当用户唱歌时,系统会先录下用户的歌声,从中提取两个关键特征:一是音调的变化,算出用户唱歌时的音高和有效发声长度;二是声音的大小,得到响度特征值。然后结合这三个数据,精准算出用户唱歌过程中消耗的卡路里。

02

华为:

数字人替用户远程参会

专利申请方:华为

专利名称:一种参会方法、装置、设备及存储介质

2025年7月11日公开

这个参会方法让用户能通过数字人便捷参加线上会议,当用户在客户端发起第一操作(比如点击“数字人参会”按钮),客户端会向服务端发送参会请求,申请让用户的数字人加入会议。服务端响应后,客户端会显示会议界面,其中不仅有其他参会者,还会展示该用户的数字人,代表用户参与会议。

03

小米:

智能眼镜相机更精准

专利申请方:小米

专利名称:智能眼镜的控制方法、装置、电子设备及存储介质

2025年7月1日公开

系统会同时获取智能眼镜和耳戴式设备的运动参数(比如移动、转动的幅度和方向),算出两者的运动偏移量,再用这个偏移量校正智能眼镜相机的外参(影响拍摄角度、位置的参数)。这样一来,即使头部活动导致眼镜和耳机有相对运动,相机也能准确对准用户眼部,保证眼动信息采集更可靠。

04

华为:

植入式设备一次监测多项生理参数

专利申请方:华为

专利名称:一种测量方法、系统及相关装置

2025年7月1日公开

植入皮下的电子设备包含两组电极,当它们植入皮下组织后,第一电极组可单独测量第一生理参数(如血糖、血酮、血乳酸或尿酸等);同时,两组电极配合能捕捉心电信号。用户无需佩戴多个设备,就能随时随地同步获取心电信号和其他生理参数,减少监测步骤,让健康数据收集更便捷高效。

05

腾讯:

自动驾驶车会“排队”合流

专利申请方:腾讯

专利名称:车辆控制方法、装置、计算机设备及存储介质

2025年7月25日公开

这个车辆控制技术让自动驾驶汽车在车道合流时更有秩序。比如有多条车道要合并到同一条车道时,系统会先确定目标车辆在合流队列里谁先谁后。根据这个排队顺序,控制车辆的行驶状态(比如速度、跟车距离),让车按顺序依次汇入第二车道。

【来源:公众号】
关于,AI,数字人,互联网专利的新闻

你不知道点进去会是什么