
当Agent工具全面普及,每个人都在被同一件事困扰:Token账单越来越贵。降价、补贴、套餐,都挡不住用量爆炸式增长。
就在行业陷入价格内卷时,一家由清华00后博士带队的公司,连续拿下五源资本、峰瑞资本两轮数千万元融资,给出了一条完全不同的解法 —— 把大模型真正留在端侧,让本地算力吃掉高频轻量任务,从根上省掉Token钱。
这不是又一个轻量化小模型故事,而是一场关于算力分配、内存效率、端云协同的底层重构。
01
连续两轮融资落袋,资本为何押注年轻团队?

AI赛道从不缺融资,但天使和天使+连续两轮、由两家一线VC同步出手,依然释放出强烈信号:端侧智能的窗口期,正式打开。
万格智元此轮融资由五源资本、峰瑞资本联合参与,源合资本担任独家财务顾问,资金明确投向产品研发与市场落地。放在今天的大环境里看,这笔钱投得相当克制且精准 —— 不卷模型参数、不烧云端算力,而是扎进硬件与软件之间的中间层,解决所有人都绕不开的成本与效率问题。
过去一年,大模型API价格战打得火热。头部厂商接连下调定价,最高降幅惊人,但用户体感依然是“越用越贵”。
原因很简单,Agent爆发带来推理请求量级呈指数级上升,降价幅度远追不上用量增速。机构判断高度一致:AI的下一个确定性机会,不在云端继续堆算力,而在端侧把存量硬件用透。
年轻团队的底气,恰恰踩中了这一波产业转移。
02
00后清华博士带队,为什么是他们敢啃硬骨头?
提到万格智元,最直观的标签是年轻、高学历、强工程。
创始人 王冠博 是清华大学计算机系在读博士,标准00后,同时也是连续创业者。团队规模约20人,近九成是00后,核心成员来自清华、北大等高校,也有从亚马逊、OpenAI、字节跳动等企业加入的工程师,整体是学术研究 + 产业落地的双料配置。
他们没有一上来就做模型、做应用,而是盯着一个被长期忽略的痛点:现有推理引擎,几乎都不适合端侧。

市面上主流方案都在追求更快速度,却严重忽视内存开销。而终端设备内存普遍有限,一旦模型变大,要么跑不起来,要么成本飙升。厂商的真实需求很朴素:在不换硬件、不加成本的前提下,跑得更快、能带更大模型。
这支年轻团队选择死磕这件事 —— 用底层算法与全栈优化,把小内存设备的潜力榨干,让普通硬件也能流畅运行大参数模型。在很多人还在观望“端侧是不是太早”时,他们已经用一整年时间完成与多家厂商芯片的深度适配,等到了Agent爆发的风口。
03
不做小模型、不搞后训练,他们的技术路线到底特殊在哪?
万格智元从一开始就定了两条铁律:不做端侧小模型,不做后训练。
小模型场景有限、通用性不足;后训练则会被云端迭代快速覆盖,难以形成长期壁垒。他们的选择是:做端侧大模型的“运行底座”,让设备本地就能用上强能力模型,除硬件成本外,实现本地Token零消耗。
核心产品是cPilot端侧推理引擎 + Amis端侧智能平台,形成 “硬优化 + 软调度” 的完整方案。
cPilot定位为底层中间件,通过自研算法极致压缩内存占用,释放硬件原生能力。常规32GB设备,通常只能留出少量空间推理,勉强跑小参数模型;用上cPilot后,可支持模型规模大幅提升,单台硬件成本显著下降,同时能力翻倍。
更关键的是,他们没有走“牺牲速度换内存”的老路,而是在同等内存下保持高效推理,在真实场景中拉开差距。
在此基础上推出的Amis平台,承担API聚合与算力调度中枢角色:本地搞定高频轻量任务,复杂任务自动上云,用户不用在多个模型平台付费切换,大部分日常需求在本地完成,只有少量任务走云端,成本结构被彻底改写。
他们还在算法层面走出独特路径:针对模型推理的稀疏性,设计动态激活策略,精准预判并加载必要参数,进一步降低实际运行开销;同时在硬件层搭建高效调度与内存管理体系,适配不同厂商芯片,把端侧变成稳定可靠的推理环境。
04
从B端芯片厂到C端设备,落地逻辑为何能跑通?
技术再炫,最终要靠交付说话。万格智元当前以B端商业模式为主,核心客户是芯片厂商与硬件品牌,合作方式非常务实:把引擎与方案预装进AI PC、AI mini PC、AI NAS等终端,让设备出厂就具备本地大模型能力。

对硬件厂商来说,这是一笔划算账:不用升级内存、不用更换高端芯片,就能打出“本地运行大模型”的差异化卖点,成本下降、竞争力提升。对用户来说,则是开箱即用的普惠AI —— 不用再为高频日常请求付费,隐私更安全、响应更流畅。
目前多家合作已进入交付阶段,预计年内有数万台设备预装,营收预期清晰。这种B 端打底、逐步向C端渗透的路径,避开纯C端获客难题,用硬件出货快速铺开生态,比纯软件公司更易形成规模壁垒。
05
端侧会成为AI新计算范式吗?我们的三点判断
看完万格智元的融资与技术,再回看整个行业,有三个趋势正在变得确定:
第一,Token 焦虑会长期存在,降价解决不了根本问题。推理需求仍在高速增长,只有把高频低成本任务放回本地,才能真正稳住成本。端侧不是云端的补充,而是成本结构的重构。
第二,端侧竞争的核心不在模型,而在引擎与调度。谁能让小内存跑大模型、让普通芯片发挥高性能,谁就能占据生态入口。未来不会是某一款模型通吃,而是引擎 + 平台统治终端算力分配。
第三,AI 浪潮正在从云端涌向端侧。这不是退潮,是算力重心下沉。接下来会出现承载Token爆发的杀手级应用,而提供底层引擎与调度能力的公司,将成为最大受益者。
万格智元的选择很清晰:先做好软硬之间的中间层,等芯片技术收敛、供应链成熟,再考虑向硬件延伸。眼下最重要的,是借助B端合作抢占生态位,把cPilot与Amis打造成低内存赛道里跨平台、开箱即用的标准方案。
06
写在最后
从“租赁智能”到“拥有智能”,不只是一句口号,而是每个用户、每台设备的真实诉求。当AI无处不在,算力不该只集中在遥远的云端,更该回到手机、电脑、智能家居这些我们每天触摸的终端里。
清华00后团队拿到的不仅是数千万元融资,更是端侧智能时代的一张入场券。Token账单的焦虑,正在被一种更安静、更扎实、更普惠的技术路径慢慢化解。
AI的下半场,真的要换道了。
往期推荐