科幻电影变现实：AI“察言观色”、数字人替身来开会|7月互联网专利盘点

2025-08-07 23:27:02 神评论

作者｜肉丁

互联网企业的专利申请背后，往往藏着全新的产品布局思路。这几年，虚拟人、元宇宙、AI等概念的兴起之前，都伴随着大厂批量申请相关专利的动作。

因此，关注专利的布局方向，有助于外界预测未来1-2年可能落地的技术方向。还有一些专利和游戏新玩法、降本增效、企业社会责任等关系密切。

《娱乐资本论》的月度专利总结栏目，关注互联网大厂每月在专利方面的举动，对视频、音频、虚拟人、广告等领域进行相关技术溯源，追踪科技赋能商业的全过程。

音视频相关

百度：

视频自动转剧本

专利申请方：百度

专利名称：视频剧本生成方法及装置

2025年7月1日公开

先提取视频里的语音转成文字台词，再从说话时的画面中提取人物外貌特征、从语音中提取声纹特征，然后和视频的角色库比对，找到对应的角色。最后结合角色和他们的台词，生成能真实反映视频内容的剧本，既准确识别角色，又完整保留对话信息。

芒果tv：

视频情感标记

专利申请方：芒果tv

专利名称：一种视频内容情感标记方法及装置、电子设备、存储介质

2025年7月4日公开

先看视频的剧本和台词，形成角色和故事的基础数据。然后，一方面通过角色的人脸表情和声音特征，提取情感信息；另一方面结合剧情发展和台词内容，分析出视频内容。最后把这些情感信息总结成提示语（比如“第3分钟，主角皱眉+语气急促+台词‘别碰它’，表达愤怒”），得到精准的序列情感标签。

优酷：

边逛APP边追剧

专利申请方：优酷

专利名称：视频播放方法及装置

2025年7月8日公开

在视频APP看视频时，如果想退出这个页面、只要做个退出的手势（比如滑动返回），屏幕上会先弹出一个小窗口。退出详情页后，要是你想继续看，再用手势触发小窗模式。既能在新界面上刷其他内容，又能通过小窗同步看视频，不用来回切换页面，看视频和逛APP两不误。

哔哩哔哩：

学习工具“嵌”在播放器里

专利申请方：哔哩哔哩

专利名称：基于视频的学习辅助方法及装置

2025年7月8日公开

用户用专利看英语教学视频或带字幕的外语影视剧时，只要发出学习指令（比如点一下屏幕上的学习按钮），播放器就会分成两个区域：一边继续播放视频，另一边弹出工具栏。工具栏里会显示和视频字幕相关的学习内容——比如字幕里某个单词的意思、发音，不用暂停视频切到别的 APP 查资料，边看边学。

哔哩哔哩：

弹幕绕着物体转

专利申请方：哔哩哔哩

专利名称：弹幕交互方法及装置

2025年7月8日公开

在看一部剧时，用户对着屏幕里的主角、道具或者某个场景输入预设指令（比如长按画面里的咖啡杯”），系统就会立刻找到和这个“咖啡杯”相关的互动弹幕，这些目标交互弹幕会按预设方式展示（比如围绕咖啡杯浮动），不用翻找普通弹幕、就能直接看到和当前内容相关的反馈。参与感更强，看视频更有意思。

哔哩哔哩：

量身定制弹幕风格

专利申请方：哔哩哔哩

专利名称：弹幕风格配置方法和装置

2025年7月8日公开

用户想给某个视频发弹幕时，系统会先调出现成的弹幕风格模板（比如可爱风、古风等），并给每个模板打分——看它们和当前视频的匹配度有多高。同时，系统会找到和用户相关的UP主、好友，参考他们的弹幕风格。最后结合模板和视频的匹配度，以及相关人的偏好，挑出最适合的“目标弹幕风格模板”。

咪咕：

用弹幕回答观众提问

专利申请方：咪咕

专利名称：问答交互方法、装置、介质、产品及设备

2025年7月18日公开

当用户提出与当前视频相关的问题（比如“这个演员是谁”），系统会先在视频的已有评论里搜索是否有匹配的答案。如果找到对应的目标答案评论，就会把答案内容以高亮弹幕的形式显示出来——既不用暂停视频，也不用跳转页面，用户在继续看视频的同时就能看到答案。

游戏相关

网易：

角色表情更生动

专利申请方：网易

专利名称：虚拟角色的表情生成方法、装置以及计算机设备

2025年7月4日公开

先分析要让虚拟角色说的语音数据，从中提取三层信息：语音的意思、情绪、说话的节奏。接着，根据节奏和情感从“节奏类表情库”里挑出匹配的表情，再根据语义和情感从“情感类表情库”里选对应表情。最后把这两类表情融合，角色会边微笑，边配合语速点头，更适合游戏、虚拟互动等场景。

完美世界：

游戏元素检测更灵活

专利申请方：完美世界

专利名称：游戏元素检测方法、装置、设备和存储介质

2025年7月4日公开

该方法通过提供包含游戏元素检测流程的检测模板，让用户无需编写完整文件，只需输入个性化检测条件，即可与模板结合生成可执行文件，快速实现对不同游戏类型、场景中特定元素的检测，简化了文件生成过程，提升了检测灵活性。

腾讯：

让虚拟道具“活”起来

专利申请方：腾讯

专利名称：虚拟场景的道具处理方法、装置及电子设备

2025年7月25日公开

系统会先展示虚拟道具集合（比如游戏中的武器、药水、技能等），当玩家对某个目标道具进行查看操作（如点击、长按）时，会自动播放关联的视频片段，直观呈现道具的完整使用过程。更准确、高效地传递道具信息，让虚拟场景中的道具选择交互更流畅、体验更好。

网易：

自动揪出游戏外挂

专利申请方：网易

专利名称：外挂识别的方法及装置、电子设备、存储介质

2025年7月29日公开

系统会先记录设备的界面操作数据，比如用户点击、滑动等操作的顺序、位置和时间点，形成一串操作序列。用预设的标准操作模式去匹配这串序列，从中提取出符合标准模式的操作片段。通过检测引擎分析这些数据，判断是否存在不符合正常操作规律的异常，以此识别出是否有外挂程序在运行。

AI相关

优酷：

AI检测视频画面“小毛病”

专利申请方：优酷

专利名称：视频缺陷检测方法和装置、电子设备及存储介质

2025年7月8日公开

这个技术就像给视频装了个 “智能质检员”。它会把视频拆成一帧帧画面，先看表面的 “浅层特征”，比如有没有明显的斑点、模糊块；再深入分析 “深层特征”，比如颜色是否突兀、画面衔接是否顺畅。然后综合这两层信息，标出可能有问题的区域，最后判断这一帧画面到底有没有缺陷。这样一来，不用人工逐帧检查，就能又快又准地找出视频里的小毛病，减少漏检和误判，让我们看到的视频质量更有保障。

腾讯：

图片发布前先 “安检”

专利申请方：腾讯

专利名称：音频合成方法、装置、计算机可读存储介质及电子设备

2025年7月22日公开

当创作者发布带图片的内容时，系统会先提取图片和它的标记信息，送到专门的识别端去检查。识别端会给图片分类，同时判断这张图是不是容易让人反感（比如低俗、恐怖内容），如果发现是可能引起不适的图片，系统就会把这些信息记录下来，能在内容分发前提前拦截或限制反感图片，避免影响大家的浏览体验。

哔哩哔哩：

视频原创快速辨别

专利申请方：哔哩哔哩

专利名称：视频来源识别方法和装置

2025年7月29日公开

系统会双管齐下分析待识别视频：一方面，提取视频里的文字内容（比如字幕、画面中的文字），用大语言模型找到可能的来源信息（比如视频名称、出处）；另一方面，从视频里抽多帧画面做人脸识别，把这些信息和可能的原创来源比对，确定是原创的，还是从其他地方转载、剪辑的。

阿里巴巴：

给音频加道“防盗锁”

专利申请方：阿里巴巴

专利名称：音频处理方法、装置、存储介质、电子设备

2025年7月11日公开

处理音频时，系统会先把音频分成一段段“音频帧”，对其中一些帧进行位置搜索，找到可用于标记的样本对，对这些样本对进行位置偏移处理，生成带有特殊标记的音频。这种处理方式能让音频里隐藏着和用户相关的“身份信息”，一旦出现盗版就能通过这些标记追溯源头，大大提升了音频版权保护的力度。

爱奇艺：

搜索关键词精准推荐

专利申请方：爱奇艺

专利名称：关键词推荐方法、装置、电子设备及存储介质

2025年7月25日公开

这个技术简单说就是帮用户搜东西时“猜用户所想”的智能推荐功能。比如用户输入“悬疑剧”，系统会先列出一堆相关的可能关键词。然后它会分析用户平时爱搜哪种类型等，把这些特征和候选关键词做比对，算出哪个关键词最贴合用户的喜好。哪怕用户一时想不到精准的词，也能快找到想看的内容，让搜索更顺手。

数字人/元宇宙

百度：

数字人跨造型带货

专利申请方：百度

专利名称：目标视频生成方法及装置、电子设备和介质

2025年7月4日公开

收集多个包含同一数字人（但形象不同，比如穿休闲装、职业装）的视频素材，验证确认是同一个数字人后，再确定要推荐的商品信息，以及每个商品该对应哪个形象的视频素材。通过大模型把这些素材、商品信息和对应关系整合起来，让这个数字人用不同造型分别介绍对应的商品，高效完成商品推荐。

百度：

边做动作边带货

专利申请方：百度

专利名称：基于大模型的数字人视频生成方法、装置、智能体、电子设备及存储介质

2025年7月11日公开

获取需求信息，比如描述“数字人演示泡茶动作并讲解步骤”；接着用语言大模型处理需求，生成匹配动作的口播剧本；再让视觉大模型结合剧本和动作视频片段，生成最终视频，适用于直播、广告、电商等场景，让数字人视频制作更高效贴合需求。

百度：

直播实时反馈

专利申请方：百度

专利名称：数字人直播方法、装置、设备以及存储介质

2025年7月25日公开

系统会先从直播间的背景数据（比如观众留言、实时新闻、商品信息等）中提取关键内容，然后生成对应的提示词。接着，用大模型根据提示词写出数字人要播报的文本，把文本转换成数字人的声音。让数字人的动作和声音同步匹配，直播更流畅自然，降低直播运营的成本和难度。

网易：

游戏角色也能参与直播互动

专利申请方：网易

专利名称：游戏场景内的直播互动方法、装置、存储介质与电子设备

2025年7月25日公开

主播在玩一款游戏时，系统会从直播平台获取直播数据，在游戏内的虚拟屏幕上同步显示直播画面；当游戏里的第一虚拟角色做出互动行为（比如挥手、发送弹幕），这些行为数据会立刻传给直播平台，让直播间的观众同步看到游戏角色的动作。

公益民生

腾讯：

唱歌算出消耗多少卡路里

专利申请方：腾讯

专利名称：一种卡路里消耗检测方法、设备及存储介质

2025年7月11日公开

当用户唱歌时，系统会先录下用户的歌声，从中提取两个关键特征：一是音调的变化，算出用户唱歌时的音高和有效发声长度；二是声音的大小，得到响度特征值。然后结合这三个数据，精准算出用户唱歌过程中消耗的卡路里。

华为：

数字人替用户远程参会

专利申请方：华为

专利名称：一种参会方法、装置、设备及存储介质

2025年7月11日公开

这个参会方法让用户能通过数字人便捷参加线上会议，当用户在客户端发起第一操作（比如点击“数字人参会”按钮），客户端会向服务端发送参会请求，申请让用户的数字人加入会议。服务端响应后，客户端会显示会议界面，其中不仅有其他参会者，还会展示该用户的数字人，代表用户参与会议。

小米：

智能眼镜相机更精准

专利申请方：小米

专利名称：智能眼镜的控制方法、装置、电子设备及存储介质

2025年7月1日公开

系统会同时获取智能眼镜和耳戴式设备的运动参数（比如移动、转动的幅度和方向），算出两者的运动偏移量，再用这个偏移量校正智能眼镜相机的外参（影响拍摄角度、位置的参数）。这样一来，即使头部活动导致眼镜和耳机有相对运动，相机也能准确对准用户眼部，保证眼动信息采集更可靠。

华为：

植入式设备一次监测多项生理参数

专利申请方：华为

专利名称：一种测量方法、系统及相关装置

2025年7月1日公开

植入皮下的电子设备包含两组电极，当它们植入皮下组织后，第一电极组可单独测量第一生理参数（如血糖、血酮、血乳酸或尿酸等）；同时，两组电极配合能捕捉心电信号。用户无需佩戴多个设备，就能随时随地同步获取心电信号和其他生理参数，减少监测步骤，让健康数据收集更便捷高效。

腾讯：

自动驾驶车会“排队”合流

专利申请方：腾讯

专利名称：车辆控制方法、装置、计算机设备及存储介质

2025年7月25日公开

这个车辆控制技术让自动驾驶汽车在车道合流时更有秩序。比如有多条车道要合并到同一条车道时，系统会先确定目标车辆在合流队列里谁先谁后。根据这个排队顺序，控制车辆的行驶状态（比如速度、跟车距离），让车按顺序依次汇入第二车道。

【来源：公众号】

关于,AI,数字人,互联网专利的新闻

17173 首页全新改版规划中！现向各位玩家征集真实使用意见，你的想法将直接影响新版页面设计～动动手指填写问卷，快来共创你心仪的页面布局吧！ 参与问卷

今日热点

热点预告：聚焦16号！《冒险岛》怀旧服等扎堆

冒险岛怀旧服封测逆水寒春季资料片三角洲行动新版本

腾讯押宝《王者荣耀世界》,而网易推出了这一款

盘点腾讯网易Q2上线的游戏《影之刃》9月9日全球发售

热门测试游戏

品牌栏目

热门新闻排行

Wan网页游戏免费玩