新眸原创·作者 | 李小东
2022年,ChatGPT的横空出世正式开启大模型时代。
随后三年,鉴于思维链(CoT)训练、检索增强生成(RAG)等技术瓶颈的陆续突破,大模型已经完成了从“理解语言”到“逻辑推理”的能力升级,并以包括智能体等在内的多种形式被广泛应用于各个行业。
2025年9月,博西家电基于火山引擎智能营销Agent搭建的全能家电管家“西西子”,上线西门子家电小程序开启灰测,历时3个月累计完成数万次真实用户交互测试,回复准确率稳定在90%以上。
“‘西西子’的定位是全能家电管家,所以在用户视角下,她拥有多重身份。”博西中国新业务部门数智化负责人李一凡介绍,根据用户使用场景的不同,“西西子”可以化身管家、导购、主播、客服、智家等不同角色,以针对性地为用户提供准确且有温度的服务,“同时,在博西家电内部,我们同样也以场景划分积极在探索‘西西子’对内部员工的价值提升。”
01
贯穿用户消费全旅程的贴身服务管家
“西西子”的诞生并非偶然,而是博西家电深耕数智化升级的必然结果。
在搭建“西西子”之前,李一凡就带领团队与火山引擎完成了第一阶段的合作:聚焦私域运营场景,实现数据基础建设并推进系列数智产品在企业内部的升级和运用。
然而随着大模型技术瓶颈逐个攻破,特别是函数调用能力成熟和多模态融合技术发展,使得如今的大模型不再只局限在“对话演示”阶段,而是能够实现自主调用数据、看懂图像、听懂语音,完成从感知到思考,再到决策、执行的完整闭环,这让李一凡对与火山引擎开启第二阶段的合作有了更多想象,“我们会去想,AI到底能够如何与我们的数智产品做结合,如何能更好地去解决我们业务上面临的一些问题。”
以导购场景为例,在电商平台兴起后的很多年里,品牌都只是将线下的导购经验复刻到了线上,但由于线上打破了地域限制,客流相较线下门店/商场呈几何式增长,“一对一交流”被迫裂变为“一对多”甚至是“一对十”,排队进入咨询的等候时间长、咨询期间回复不及时等问题备受用户诟病。
为应对人工导购难以支撑高并发的海量用户咨询情况,在企业市场需求的裹挟下机器人客服应运而生,但新的问题也随之而来:首先是答非所问,机器人客服大多强依赖于前置的单一语料堆积,只能依靠关键词命中来调取回复,所以很多时候并不能真正理解消费者咨询的问题,从而给出错误或不相关的回复;其次,机器人客服给出的回复往往缺乏情感共鸣,消费者在交流过程中的体验感大打折扣,影响转化率。
“西西子”在导购场景下的形象正是基于这两个现实因素应运而生。
李一凡介绍,“对消费者来说,沟通过程中的情感共鸣和回复准确率同样重要”。在导购场景中,“西西子”是以一个面容亲和、服装简约的女性形象出现,这与用户传统认知中的专业导购工作人员印象契合,在体感上就拉近了双方距离;此外,“西西子”还前置完成了语义模型配置,能够模拟真人话语、情绪表达进行内容输出,“所以在与消费者的交流过程中,一定不是一个冷冰冰的机器人,而是有温度、能够与消费者产生情感联动的形象。”
同样地,“西西子”还将以客服助手、主播导购、管家服务、智家帮手等多个形象贯穿于用户在西门子家电消费的全过程,在不同阶段都会以该阶段最贴合的形象设计和语言特征去为用户提供不同服务。
而回归到用户在与“西西子”交互过程中最关心的答复准确率上,李一凡和团队也有“企业数据+企业知识库”的双重保障机制。通过接入包括商品信息、价格数据、活动等多维度的海量私域数据,以及“白色家电”“黑色家电”“一级能效”“直驱变频”等企业知识库,能够最大限度识别用户提出的真实问题,完成语义拆解和意图识别,在匹配对应知识的基础上完成话语融合跟校对,再由前置的人设进行语气模拟后进行回复。
如咨询“为什么冰箱要选一级能效”,“西西子”就能围绕节能环保、节省成本、性能稳定三方面给出行业通用的标准说明,而当消费者进一步咨询“推荐几款一级能效冰箱,并说明优点”时,“西西子”又能准确关联到多款西门子一级能效冰箱商品,给出优点介绍的同时自带商品跳转链接,节省消费者决策、搜索链路。
数据显示,在灰测阶段“西西子”的回复准确率能稳定在90%以上。
02
不止是“准确”还要足够“人性化”
作为率先将智能体运用在家电行业实际业务中的团队,李一凡也坦言“有挑战”。
从今年上半年正式引入火山引擎智能营销Agent,到正式上线开启灰测,其中有小半年的时间李一凡都在带领团队成员与火山引擎团队积极推进企业级知识库与问答引擎的构建工作——通过将原本庞杂且多形态的产品说明书、详情页、售后政策等非结构化数据输入到AI系统,并开启针对性提问测试,以得出准确率基准线并持续优化,这是搭建“西西子”的基础。
9月,“西西子”在博西家电内部上线,随后在微信小程序端面向15%的用户开放灰测。这个阶段主要是在消费者的真实使用场景中不断挖掘被提出的新问题,并监测回复效率和准确率——但从设想到实践,总是会有“出乎预料”的情况发生。
首当其冲的是准确率,“如何定义准确率?”李一凡抛出的这个问题在最初的设想中只有一个答案,但在实际灰测场景中却成了一道多选题。
在设想中,准确率的第一前提是需要规避掉大模型幻觉,第二前提是能够针对消费者的提问给出正确回应。李一凡举例如果消费者提问“西门子的哪一款炒菜锅最好?”,智能体输出了一大篇囊括各系列的炒菜锅产品,并且对每一款产品的介绍都很详细,但实际上西门子根本没有出过炒菜锅产品,“这种大模型导致的无中生有内容,在消费行业是非常有误导性的。”
但在实际操作中,关乎“准确率”却还有其他影响因素,“面对关于洗碗机容量的提问,回复的数据正确,但语气生硬,这算不算准确率的问题?”李一凡补充道,“面对产品推荐的需求提问,回复的产品的确能满足消费者需求但并非最优品,这算不算准确率的问题?”
带着这些在灰测期间实际发生的场景问题,李一凡带领团队和火山引擎智能营销团队再度探讨共建,输出了一套工程化的“人机协同”校验机制:在火山引擎提供模型评估的基础能力之上,博西家电搭建了提问收集反馈平台,将“西西子”接收并反馈的全量问答内容进行实时收录并加以分析,同时引入“专家陪审团”,组织博世和西门子家电品牌内部各产品线专家定期针对“提问-回复”信息抽样评估,在判断准确率的基础上也以“人”的情感判断“西西子”的回复是否能体现品牌的专业性以及服务意识。
这一机制极大保障了“西西子”的准确率调优,并通过人工抽样审核,也确保了“西西子”能在回复的语言表述上能够越来越有“人”的情感温度,学会像“人”一样进行对话。
以“低温烹饪”相关知识的展现为例,“西西子”为消费者提供的绝不仅是百科式的名词解释和技术说明,而是能在阐明意义的基础上,结合消费者居家的厨房场景进行产品关联,为消费者提供“是否需要低温烹饪-如何实现低温烹饪-低温烹饪注意事项-如何做好低温烹饪”的全链路信息支撑,让消费者能够在对话中感知到“原来我在家就能做出低温烹饪美食”。
能够打动用户,才是“西西子”的真正价值。而对李一凡和团队来说,用户还包括博西家电内部的一线员工,“我们也在计划推出面向企业内部员工使用的‘西西子’,她们会以助手的角色服务不同岗位的员工。”
比如针对工程师岗位员工,“西西子”能通过员工与用户的多轮对话完成其中涉及到的产品、型号、问题描述等核心信息抓取和识别,再通过检索关联知识库定位到核心问题点,并自动生成报修单交由工程师岗位员工,这既能避免用户因为不了解产品报错代码或描述不清问题而导致的反复沟通和确认,也能帮助工程师免去指导用户填写报错工单的繁琐步骤,节省人力成本。
03
从智能体到品牌新势力
不但在形象角色和能力专长上持续衍生,在各专业领域的“西西子”本身也会随着业务发展不断成长,通过源源不断的知识输入实现自我进化。
从9月开启灰测至今,“西西子”在导购场景历经了数万次的问答锤炼,其准确率已经稳定在90%左右,“我们的目标是希望能维持在95%以上,”李一凡表示,“这个目标的实现还需要一段时间的持续调优。”
但对于与火山引擎的这一场新合作,在李一凡看来,比数据更有价值的,是合作带来的认知与能力提升。
在“西西子”的筹备和搭建过程中,双方共同经历了从场景挖掘、数据准备、效果评估,再到迭代优化的全流程实践,这既帮团队成员知道在博西家电的场景中“AI能干什么”,也知道了“AI应该怎么干”,这是比引入任何新技术都宝贵的资产。
此外,随着合作的不断深化,火山引擎的角色也从云厂商,转变为能为博西家电带来行业洞察与前沿实践启示的共创伙伴:博西家电欣赏他们的产品化思维与工程能力;而火山引擎智能营销团队则看重博西深厚的行业知识、严谨的业务流程以及对体验的极致追求,为其技术提供了绝佳的落地场景与反馈。
双方规划的未来已清晰可见:博西家电将持续探索对外业务和内部员工两大场景的“西西子”机会,而火山引擎智能营销Agent则负责将验证成熟的智能体能力,封装成更灵活的模块,加速“西西子”在两个场景落地。
而回归到“西西子”的诞生与正式上线,也是为传统制造业、特别是注重品牌与服务的消费品行业,提供了AI时代一个极具参考价值的落地范本:
一方面,聚焦业务价值,传统家电企业可以在自身核心场景中取得突破性应用;另一方面,“体验提升”是比“成本削减”更持久的核心驱动力:项目始终以提升消费者体验与决策效率为指标,这使其价值超越了简单的劳动力替代,直指商业本质——更好地服务用户。
最终,这次合作的价值不仅在于“西西子”,而是验证了一条新路径:AI时代,品牌可以通过与兼具工程化与产品力的伙伴携手,将技术转化为有温度的品牌力,在每一个与消费者接触的瞬间,构建起更深的信任与连接。