
翼言商业观察
腾讯会议正在重新定义一件事:如何让会议沉淀的智慧,在AI时代流动起来。
1992年,当第一个基于IP的视频会议工具CU-SeeMe在康奈尔大学诞生时,它的发明者们恐怕不会想到:三十年后,人类依然在为同一件事努力——如何让一场会议的信息,不因散场而消散,而是能够被更高效、更充分地利用。
先看一组数据:2023年,微软Work Trend Index对全球31个国家3.1万名知识工作者的调研显示,在 Microsoft 365 应用中,员工平均花费 57% 的工作时间用于会议、电子邮件和聊天等沟通活动,前 25% 的会议重度用户每周要在会议上花费 7.5小时,而低效的会议被投票选为阻碍生产力的首要因素。而在虚拟会议的体验中,58% 的人表示很难进行头脑风暴,57% 的人认为加入太晚难以跟上节奏,56% 的人觉得难以总结会议内容,55% 的人在会议结束时仍不清楚下一步行动。
无独有偶。麦肯锡的研究也发现,知识工作者平均耗费近 20% 的工作时间用于信息搜索与流程协调,其中大量时间便沉没在信息未被有效留存的会议中。
这不仅是效率问题,更是结构性的资产浪费。

丨汤道生X姚顺雨现场对谈
而6月5日,腾讯会议在2026腾讯云AI产业应用大会现场发布的多项功能升级,或许正在终结这些问题。
正如当天备受关注的《腾讯AI的下半场》对谈中,腾讯首席AI科学家姚顺雨所言,一个好产品的环境非常重要,其中最重要的就是Context。
腾讯会议的升级便是围绕沟通场景的Context沉淀,它通过一系列AI原生功能,以及Skill、CLI等开放能力,推动会议资产能完整留存、被Agent产品便捷调用,并融入用户个性化的工作流,让用户将注意力回归到沟通本身。这些升级,本质上是在回答一个问题:从“会议工具”到“Agent枢纽”的进化,而进化的关键词是一个尚未被充分定义的概念:Agent友好。
腾讯会议正在把真实交流高质量记录下来,沉淀为Agent可懂可用的Context资产。这才是其升级背后真正重要的事:重新定义会议资产,让会议沉淀的智慧,在AI时代流动起来。
一声链和AI同传,沉淀高质量会议Context
先问你一个问题:一个8人团队在开放式工位开会,每人一台笔记本电脑,要实现无感、清晰的多人发言,需要几台专业麦克风?
答案是:以前至少需要2-3台阵列麦,总价至少3000元。如果不买,结果就是,一旦两人同时开麦,啸叫刺耳,其他人被迫暂停。
这是视频会议行业三十年未解的“物理诅咒”:多设备同空间收音必然产生回声和啸叫。倒是也可以同一空间内只用一个麦收音,但这本质上是用限制交流自由来换取声音质量;或者增加专业收音设备,但设备成本对中小企业极不友好。

丨腾讯会议的声链解决了多人同时开麦的啸叫难题
腾讯会议的声链是国内行业内首次通过纯软件方案来解决多人同时开麦的啸叫难题。当多台设备同时收声时,系统会先用天籁实验室首创的跨设备 AI 回声消除技术处理每一路音频,然后由主设备通过最新的多麦克风高精度混音技术完成精准对齐后,统一上传到会议系统。
这不仅让会议不被啸叫打断,音源更加干净清晰,能被Agent理解,它还构建了会议Context的一层基础设施:让会议中的每一句话都获得了自己的“身份证”。声链技术支持下,同空间自由开麦后,系统能自动识别发言人,谁说了什么一清二楚,这对于AI对Context的理解至关重要。

丨腾讯会议AI同传解决了跨语言沟通中的无损传递问题
如果说声链解决的是“会议不被打断”、“同空间内谁在说”的问题,那么AI同传解决的则是“跨语言时说的内容如何无损传递”的问题。
跨语言商业协作中存在一种隐性成本,当发言者使用母语,而听者通过翻译或合成语音接收时,情感传递和信任建立会受到损耗。心理学研究表明,人对声音的情感感知直接影响对信息可信度的判断;合成语音因缺乏原声的细微情绪变化,在说服力和信任感上天然弱于真人原声。保留发言者的音色、语调和节奏,对于跨语言沟通而言具有真实可感的信任价值。
腾讯会议AI同传在技术上实现了两个关键突破:
第一,低延迟翻译。 系统端到端延迟控制在2-3秒,已接近人类同声传译的专业水平,使跨语言对话保持自然节奏。
第二,音色模仿与情感映射。系统先识别发言者的声纹特征:语调、节奏、重音习惯、情感波动模式,然后将这些特征实时映射到目标语言的语音合成输出。结果:你说中文,对方听到的是“你”在说英文,还会带着你的抑扬顿挫和情感色彩。
它的本质不是翻译工具的升级,而是会议翻译从“A语言的文字变成B语言的文字”升级为“A语言的人格在B语言中延续”, 这才是腾讯会议在跨语言沟通领域打出的差异化王牌。
将声链与AI同传这两个腾讯会议代表性的AI功能放在一起审视,会发现它们完成了一个共同任务:会议Context的“保真”。声链保证了沟通的流畅、Context的干净,以及发言内容和发言者的对应。AI同传让沟通者在跨语言环境中保持交流的顺畅、自然、无损,沉淀最贴合用户本意的沟通Context。腾讯会议里这一系列的AI原生功能,正将人与人之间的沟通打磨到极致,也意味着沉淀的Context将是更为还原和精准的,这是“Agent友好”的第一块基石。
二智能录制和元宝纪要:“复现”会议现场、结构化Context的两把利器
要让Agent真正理解一场会议,还需要将每一场会转化为能被AI检索、定位、关联的结构化知识。

丨会议现场讲解让Agent更好地理解沟通
这正是智能录制与元宝纪要的角色:智能录制负责最完整、最细颗粒度的上下文沉淀,元宝纪要负责高密度、高时效的要点提炼——二者构成Agent获取完整会议Context的两把利器。
1.智能录制:让Agent拥有复现现场的能力
智能录制是腾讯会议最基础也最被低估的能力,它不是简单的“录音+转写”,而是一次对会议信息的全息数字化。除了纪要,它产出的内容还包括:
逐字稿:每句话的文字转写,带说话人标签和时间戳;
时间轴锚点:每一句话都可以精确定位到原始音视频中的对应时间点;
视频录制:声纹特征、音量变化、语速曲线……
会议现场的全部物理级细节都被保留。让Agent不是只看一份纪要,而是能回到会议发生的那个时刻,是Agent理解会议的第一手“原始材料”,是其他AI能力的根基。
2.元宝纪要:为Agent提供高密度的“会议快照”
如果说智能录制是高清底片,元宝纪要就是精修过的照片——它在保留关键信息的同时,大幅提升了信息密度。
元宝纪要的核心产出包括两个层面:
第一,时序化摘要。 在会议进行中,元宝纪要每2分钟自动生成一份“内容快照”:提炼当前讨论的主题、关键论点、待办事项,这确保会议的重点不会被淹没在冗长的原始记录中。对Agent而言,元宝纪要是快速理解“这场会议发生了什么”的最佳入口。
第二,情绪与互动记录。 元宝纪要不只有字,还有“温度”。它记录会议过程中每段讨论的情绪倾向——是平静推进、激烈争论还是达成共识,分析哪些节点是高效讨论、哪些节点存在决策阻力。这种对会议“软信息”的结构化捕捉,是传统文字纪要完全做不到的。
数据显示,从 2025年9月上线到今年 5 月,腾讯会议内的元宝纪要月使用时长已增长近 5 倍,不仅让更多参会者从容开会,更让更多“有温度”的Context被保存。

丨腾讯会议智能录制“复现”会议现场、结构化Context
智能录制与元宝纪要提供了AI自动生成的结构化信息,但会议中还有一个“人机交互”的维度同样富有价值:用户主动向元宝提出的问题与获得的回答。
会中或会后,用户可随时基于会议转写内容向“问元宝”发起提问,例如“大家讨论最多的问题是什么”“待办事项中什么最难办”等。每一次问答都不是孤立的一次性交互,而是对会议信息的一次有向挖掘:问题本身标记了用户最关心的焦点,回答则代表了AI对会议内容的提炼与重组,这为Agent还原会议现场提供了又一维度的Context。问元宝就从单一的交互工具,升级为Context资产的动态生成器,补全了从“AI自动总结”到“人类主动追问”的数据拼图。
综上,腾讯会议构建了一个双层Context体系:底层保证信息不丢失,每一句话、每一个细节、每一个情感的微妙波动都被记录;上层保证信息可快速提取,一问即答、多维度速览会议。这样,腾讯会议就将每场会议封装为一个可回溯、可理解的知识资产,便于Agent真正读懂。
三开放CLI与Skill:Agent友好的最后一公里
会议结束后,那些会议上讨论的信息的生命就此结束了吗?
基于腾讯会议的CLI、Skill,像WorkBuddy、OpenClaw、Hermes这些Agent,能直接连接腾讯会议沉淀的Context。这意味着,这些Agent可以
自动提取纪要:Agent能直接调取你的历史录制,生成结构化纪要。
整理个人待办:Agent能扫描你本周所有例会的转写,自动汇总成你的待办清单。
打通工作流:有人已经用腾讯会议Skill搭了个 Meeting Fellow例会系统,会后自动生成待办,按团队格式整理,直接邮件发给大家,彻底告别人工搬运。
除了会后贴心服务,会前还可以让Agent直接帮你预订会议、生成会前材料,让所有与会者更加专注在会中,即沟通本身。

丨MBTI会议人格分析,量化会议中参会人员之间的交互关系
此外,我们都知道,高效会议不仅依赖清晰的信息传递,更依赖对交互规则的敏感——谁在发言、谁在回避决策、谁的沉默意味着反对。过去这些判断只能依赖人类直觉,而Agent+会议资产,正尝试量化这些“软信号”。
通过腾讯会议CLI和WorkBuddy连接后,可以做一个有意思的小互动,根据参会者在会议中的发言频率、(被)打断次数、说话时长、情绪波动曲线等维度,生成用户专属的会议战力分析与MBTI人格测试,如“沉默的思考者”“决策推进器”“气氛破坏者”。表面上看,这是一种社交化互动玩法,但它揭示了一个更深层次的技术探索:AI能否理解会议中的社交结构与信任关系?这意味着AI系统开始学习人类在协作中建立的信任模式:从“理解语义”延伸至“理解语境”和“理解关系”。
综上来看,腾讯会议通过声链解决了多设备同空间啸叫、AI同传解决跨语言信任折损、智能录制+元宝纪要解决会议信息流失、CLI/Skill的开放解决Agent无法调用会议资产,不仅是一个更懂沟通的通讯工具,更升级为一个Agent友好、能让Agent可懂可用的Context底座。
结语: 会议沉淀的智慧,已经流转起来
回望在线会议的发展,从最初消除空间距离的连接,到更高效地协作,再到如今腾讯会议能让会议资产沉淀并被Agent调用,在线会议的角色已经不再仅仅是开会工具,而成了Agent时代的Context枢纽、组织记忆的数字基座。当Agent能够理解你的会议、调用你的决策历史、参与你的工作流,人机协作的边界便会被改写。
下一次当你打开腾讯会议时,可以换一个视角:你所表达的每一句话,不仅在传递给对面的同事,也在构建一个越来越懂你的数字镜像。这场会议的终点,将是你们下一次协作的起点。
这是2026年腾讯云AI产业应用大会上,给我印象最深的一个记忆点。
END