近日,科大讯飞AI眼镜首次在MWC上亮相,并于3月4日在各大平台开启了一元预订与预售,此前我们就有相应的报道(讯飞AI眼镜支持“唇动识别”;今年国内AI眼镜销量有望破200万副)。
对于科大讯飞推出主打翻译功能的AI眼镜,笔者还是非常关注和期待的。科大讯飞是翻译领域的领导者,深耕翻译领域多年,先后有推出包括讯飞翻译机、讯飞AI同传耳机、讯飞AI录音笔在内的多款智能硬件,还有包括讯飞翻译APP、讯飞翻译SaaS、讯飞同传等智能软件与服务。
01
大部分AI眼镜并未很好满足翻译场景需求
我们一直认为现阶段翻译场景是带显示类AI眼镜最为刚需且最有潜力的应用场景。随着全球化的进程和我国进一步加大开放力度,进行国际贸易,海外旅游,出国留学等涉外场景的用户越来越多。对于这些人群而言,翻译设备就是生产力和生活工具,也更愿意接受更高的溢价。
我们接触用户的实际感受来看,这一场景确实存在大量的需求。经常会有XR Vision社群的朋友找我们推荐翻译效果好的AI眼镜,并表示只要翻译效果好,5000块以上也都能接受。所以,如果能够把这个场景打磨好,相信一定会拥有不小的市场空间。根据相关信息显示,讯飞翻译机已服务超百万用户,翻译次数高达10亿次;讯飞同传已服务全球50余国家,支持超42万场会议。
▲ 会议交流场景使用讯飞AI眼镜
然而市面上虽然有很多智能眼镜都支持翻译功能,号称可以支持多少种语言,真正做得好的却寥寥无几:要么就是翻译响应滞后,要么就是识别准确率堪忧,要么在专业场景可用性很差。
过年期间笔者有个朋友去国外旅游,他亲自实测下来的体会是,“试了手机Google、某国产手机App,某头部AI眼镜的App实时翻译功能,基本都不可用,翻的都乱七八糟的。参加一些旅游项目,上面有人讲解,我在下面用实时翻译都不行。日常对话语速一般都比较快,如果对方有口音基本ASR都会识别错,只有那种说一句翻一句的模式,对方说慢一点,准确率才高。”
可以看出,产品体验与用户的需求仍存在巨大的差距,真要把这个场景做好还是要下很多功夫的。所以笔者就非常关注在翻译领域深耕多年,对翻译场景和人群有深入理解的龙头——科大讯飞,究竟能做到什么程度,一旦能够很好满足用户需求,相信也能引领主打翻译场景的AI眼镜品类打开市场,也能给主打翻译场景的其他AI眼镜厂商提供示范。
02
讯飞让AI眼镜成为翻译最佳载体
不同于同类产品宣传“提词、导航、翻译、实时字幕”等多元的应用场景,从目前的宣传来看,讯飞这款AI眼镜定位非常聚焦。官方对这一产品的介绍是:“讯飞AI眼镜是一款主打多模态同传翻译的高端智能眼镜,以多模态降噪、全能翻译、多模态记录功能,为商务用户切实解决跨语言沟通和信息记录问题。

▲ MWC现场真机体验
首先,讯飞AI眼镜支持近眼显示功能,这样可以把翻译结果直观地呈现在用户眼前,而无需频繁低头查看手机或者翻译器。该AI眼镜采用的是双目双光机的单绿显示方案,这一显示方案相比于“一拖二方案”成本要更高一些,生产加工难度也更大,但是好处就是显示画面的距离和上下位置可以根据实际需求进行调整调整。另外,每个人的视觉焦点都存在差异,支持远近调节用户可以根据自己的视觉焦点来调整到更为舒适的位置。

▲ MWC现场真机体验曝光
从一些博主MWC现场的视频来看,讯飞AI眼镜的显示区域偏上,这样光栅区域和漏光情况就不会那么明显,看起来更贴近于日常眼镜。再者,这样在办公、开车、骑行等场景也不容易遮挡视线。
讯飞AI眼镜同时了搭载摄像头+双光机,这就意味着需要在镜腿和镜框衔接的有限空间里放下2个核心元器件,还要兼顾散热,这对于结构设计和外观设计挑战很大,,从美国头部媒体DT发布的照片来看,讯飞AI眼镜的2个光机位于摄像头下方,从外观设计来看处理的很好,并不会显得特别突兀。

▲讯飞AI眼镜在MWC 2026获得DigitalTrends(DT)颁发的Digital TrendsTopTechof MWC Awards
笔者猜测讯飞AI眼镜搭载的这款摄像头更多是为翻译场景准备的。一方面是为了实现“唇动识别”,另外一方面,配备了摄像头,也就代表可以支持“看译”的场景,这对于翻译说明书、翻译菜单、翻译路标等海外常见场景非常实用,同时结合近眼显示,“看译”的结果也能直接展示在眼前。同时,搭配的摄像头,还可用于课堂及会议等记录场景、结合AI的识物等视觉智能场景。
从外观图来看,讯飞AI眼镜还搭载了2个扬声器,这样可以支持翻译结果直接播报出来,方便一些移动的场景。

▲ 讯飞AI眼镜正面图,可以看出有扬声器开口
然而真正令人印象深刻的是这款产品在搭载摄像头、采用双光机双目显示、配备扬声器的的情况下重量仅为40克,这和目前绝大多数仅支持拍摄类的AI眼镜重量相当。比市面上同时支持显示+拍摄的AI眼镜产品重量(50克左右)直接轻了20%。40克的重量对用户的佩戴舒适度带来了很大的提升,目前还不清楚科大讯飞是如何在不减配的前提下实现这一重量突破的,从产品图片来看,镜腿要显得要比Ray-ban Meta更纤细。

▲ 讯飞AI眼镜侧面图
从目前我们获取到的最新曝光图片来看,科大讯飞AI眼镜采用磁吸充电的方式,充电口位于镜腿末端,这样可以“边用边充”,无需担心长时翻译场景的续航问题。
值得一提的是,笔者有注意到其左右桩头部分采用了2个多开孔防尘网状设计,这也是我们首次在AI眼镜上看到这一设计,该结构应该是麦克风,推测是为了提升眼镜的收音效果而设计的。

▲ 讯飞AI眼镜桩头部分的防尘网设计
收音效果,对于翻译场景来说至关重要,尤其是用户对话环境复杂多样。一旦识别源头错了,给出来的翻译也就谬以千里。讯飞AI眼镜采用了5颗气导麦克风+1颗骨传导麦克风来提升收音效果,可以支持超过8米的录音距离(意味着坐在教室最后一排也能捕捉到讲台上的声音)。

▲ 讲座场景使用讯飞AI眼镜进行翻译
要实现优秀的识音及识别效果,算法同样至关重要。讯飞AI眼镜采用了创新独有的多模态降噪算法,首创唇动识别多模态降噪方案,将音视频两路信息融合处理,在强噪音背景下的对目标人物的清晰收音与识别,语音识别和翻译的准确率提升50%以上。这一创新的降噪方案使得眼镜能够在多人交谈的嘈杂背景中精准锁定目标讲话人,真正解决了高噪场景下传统翻译设备“听不清、译不准”的痛点。
我们查询到,科大讯飞早在2020年就申请了相关专利(《一种语音识别方法、装置、设备及存储介质》),然而这一技术在耳机、翻译笔、翻译器等产品形态上均不具备落地应用条件。有了唇动识别技术,AI眼镜也有望成为“翻译”场景的最佳智能硬件载体。

▲ 科大讯飞专利《一种语音识别方法、装置、设备及存储介质》配图
另外,讯飞AI眼镜搭载了讯飞自研的星火X2大模型,该模型是2026年2月11日讯飞发布的基于全国产算力训练的大模型,采用293B MoE稀疏架构,结合权重量化、低精度KVCache等技术,实现单台昇腾服务器部署,推理性能较前代提升50%。

▲ 视频通话场景使用AI眼镜进行翻译
不难看出,讯飞AI眼镜是一款定位清晰,且有诸多创新的产品。此次科大讯飞推出AI眼镜也将进一步丰富其翻译的产品矩阵,有望推动AI眼镜在翻译场景实现突破,更多信息,就让我们共同期待接下去讯飞AI眼镜的正式发布了。
结尾