一家要做infra的机器人公司,正在解决数据与算法之间的痛

现在大家都知道,数据之于模型的重要性。

可从数据采集到算法训练之间,有个天然的痛点。

如果把数据采集外包,那数据质量难以保证,外包人员很难精准get到算法人员的需求。如果算法人员亲自采,那投产比极低。

这两天去拜访乐聚机器人,发现他们正在解决这个痛点。而且远不止于此,他们正在做具身领域的中间层,或者说infra。

值得跟大家分享一下。

赛道抉择|不止机器人,更要做具身“基础设施”

简单来说,他们用专业算法人员采集高质量数据,并机器人大脑模型做后训练。重点是,他们不只针对自家机器人,而是面向通用,也就是做起了具身领域的中间层,做infra。

但这事没那么容易。

由于具身的发展还在极早期,所以不像其他算法领域,搞个公开数据集,哪家模型厂商都能用。

现阶段,各家采用的技术方案和供应链厂商各不相同,导致机器人本体的差异巨大。比如双足机器人、轮臂机器人、不同的灵巧手,它们的坑都不一样。每家机器人公司,只顾得上解决自己本体的坑。

所以要做具身领域的中间层,是极难的。

但乐聚这么做了。

我问他们,乐聚不是也做自己的机器人吗,比如夸父,为什么你们能做infra。

回答是,乐聚参与过全国多个人形机器人训练场的建设,有大量本体,数据采集需求也非常大。全身运控、灵巧手操作、轮臂基础运控等不同方案的数据,他们本身就在采集。

所以做数据采集和训练对齐是有天然优势的。

技术解法|自研全链路工具链,打通“数据-模型-应用”闭环

然后聊聊乐聚具体是如何做的。

他们基于VLA模型,研发了一套后训练系统。还配套搭建了数据采集处理平台、后训练工具链和部署测评工具链。

这就构成了“数据-模型-现场应用”的完整闭环。

先说后训练系统。

它有针对性地解决VLA模型后训练中的痛点。有两个我比较看重。

一个是“灾难性遗忘”问题,也就是学了新知识忘了老知识。他们提出了基于LoRA的轻量级微调架构。让模型学习新技能的同时,尽可能保留预训练阶段学习的知识。

另一个是只会模仿动作,不理解背后物理规律。他们在后训练中融合了“世界模型”。让模型可以理解物理的因果,并预测操作后的状态,从而生成当前最合理的操作。

此外,还解决了抽象指令与抓取位置和力度对齐、观测视角变化、同物体差异化操作、多摄像头的算力浪费和细节遗漏这些问题。

再看数据采集处理平台、后训练工具链和部署测评工具链。

这一套做的是“数据采集-模型后训练-部署测评”闭环。

数据采集处理平台解决的就是文章开头我提到的痛点。平台上有多种采集方式,还有清洗、标注、质检、管理与输出这些关键环节。

拿数据清洗来说,采完直接输出干净数据,以前花三五天清洗的工作量,现在只需要一天。

这一整套后训练系统,也非常容易上手。

在ICRA 2026的REAL-I挑战赛,学生们直接零帧起手,一天之内就能把模型部署到真机上。

说说这套系统的验证。

前面提了乐聚要做通用,所以他们在4种机器人本体和5个主流模型上,进行了交叉验证。

结果是,LingBot-VLA在5个模型中表现最好,夸父4 Pro在4个机器人中表现最好。

而且夸父4 Pro是其中唯一的双足人形机器人。难度最高,表现最好,它跑通了“真实机数据-模型后训练-多本体部署-真实机评测-失败归因回流”整个闭环。

能力实测|跨机型交叉验证,具身优秀成绩单

说到这,是不是感觉具身智能就要起飞了。但测评数据会告诉你,依然任重道远。

在95个场景的横向测评里,乐聚后训练的平均成功率(SR)是17.59%,平均过程得分(PS)是36.22%的。

17.59%这个数字,心中难免会有疑问,这算高吗?但实际上,这已经是现阶段,具身领域里一张非常优秀的成绩单了。

首先,测评任务是真的难。

95个场景中的很多任务是精细操作,比如精细插入、工具使用、擦拭覆盖、小目标按压、动态接触、稳定搬运、多阶段状态转换。人类操作都没那么容易。

其次,前面提到了,不同机器人本体差异太大,一个模型跑在不同身体中,测评结果也各不相同。

再就是,测评指标本身就很严格。

PS看的是过程推进,不只看最后有没有成功。多步任务里,机器人可能最后没完全完成,但前几步走得比较稳,这些阶段性能力同样值得记录。

而且SR和PS一起看,比只看成功率更有意义。它们会告诉你模型大概卡在哪里,是感知没看懂,还是抓取没抓稳,是中间步骤错了,还是最后收尾失败。

不过,虽然离通用应用还很远,但在垂直场景的表现要优秀很多。

举个例子,在汽车制造里的料箱拆垛场景,综合成功率竟然能超过95%,技能效果从30%变成了80%至90%。

让通用大脑落地单独场景,让通才更容易变成专才,靠的就是这个后训练系统。

如今具身行业的叙事,已经从“小脑”转向“大脑”的落地应用。工业领域遍布着大量尚未被开发的应用场景,机器人的落地部署拥有广阔空间。

这套后训练工具链最大的价值,就是把开发、部署的门槛降到了新低,效率得到大幅提升,同时也方便二次开发。

对于整个行业而言,这无疑会加速各类机器人走进真实工厂,助力具身智能产业走向规模化发展。

声明:本文为维科号作者发布,不代表维科号立场。如有侵权或其他问题,请及时联系我们举报。