你看懂,京东做具身数据的野心了吗?

具身智能 I 人形机器人 I 具身智能融资 I 机器人

京东押注具身智能数据中心:20年场景积淀,锚定AI下半场核心赛道

具身智能的行业发展,正卡在真实场景数据的瓶颈上。当全行业扎堆研发模型、升级硬件,试图突破技术卡点时,京东宣布建设全球规模最大、场景最全的具身智能数据中心,计划两年积累超1000万小时真实场景数据并向全行业开放。这并非京东跨界布局AI,而是其将二十年线下场景积淀转化为核心资产,精准卡位具身智能商用落地的关键一步。

当下的具身智能赛道,热度与困境并存。2026年开年不到三个月,国内具身智能领域披露融资总额近150亿元,估值超百亿的企业增至7家,成为资本和科技企业争抢的下一代AI核心赛道。但行业的现实短板十分突出:实验室固定场景下,具身智能模型完成指定任务的准确率超90%,可投入真实环境后,性能直接腰斩甚至失灵。

这一问题的核心,在于真实场景训练数据的严重匮乏。目前全行业可用于具身智能训练的真实场景数据,累计仅几十万小时,与实现智能涌现所需的千万甚至上亿小时规模,差距悬殊。而此前被寄予厚望的仿真数据,始终无法跨越与现实的鸿沟:仿真环境中,地面、物体、光线均为程序员预设的固定状态,却无法还原真实世界的不确定性——仓库地面因重压的轻微变形、家庭中随意摆放的物品、不同时段的光线变化,这些细微变量直接决定机器人的实际可用性,却是仿真环境难以模拟的。

与此同时,具身智能发展的其他门槛正快速降低。算力方面,IDC数据显示2025年中国智能算力规模达1037.3EFLOPS,同比增长43%,且算力价格持续下探,资金可直接转化为算力支撑;硬件方面,电机、减速器等核心零部件成本下降,人形机器人整机价格从早年的几十万元降至如今数万元;模型层面,开源社区的成熟让架构日趋同质化,创业公司也能基于开源框架快速推出解决方案。行业的核心矛盾,正式从“有没有算力、模型、硬件”,切换为“有没有足够的真实数据喂饱模型”。

正是在这样的行业背景下,京东的具身智能数据中心布局,显得精准且必然。外界对京东的认知多停留在零售电商,但从成立之初,京东的核心业务就扎根物理世界:从商品采购、仓储分拣,到配送售后,全链条都在真实物理场景中完成。如今京东在全国布局超1400个仓库、50余个亚洲一号智能仓储园区,数万台AGV机器人、分拣机器人、码垛机器人24小时运转,每天完成数百万次货物操作,这些真实业务中产生的多维度数据,正是训练具身智能模型的优质素材。

与传统IDC机房、通用智算中心不同,京东打造的具身智能数据中心,是针对具身智能技术特点搭建的“采集-标注-训练-验证”全流程基础设施,核心并非算力存储和通用计算,而是真实物理世界数据的生产、处理与应用。为实现数据规模突破,京东采用“自有场景采集+大规模众包”的模式:内部发动超10万名各职业员工,外部联动最多50万名各行业人员,仅江苏宿迁一地就发动超10万名市民参与,覆盖家庭、办公室、工厂、物流、城市等五大核心场景、上百个细分场景。

按照规划,京东将在一年内积累500万小时人类真实场景视频数据,两年内突破1000万小时,同步采集100万小时机器人本体数据。这一规模不仅远超目前行业公开数据集的总和,更能构建起覆盖人类生产生活全场景、持续更新的真实世界数字孪生体,为具身智能模型训练提供最贴近现实的素材。

对比其他科技巨头的具身智能布局,京东的核心优势在于独一无二的场景资源。华为主打全栈技术闭环,从算力芯片、操作系统到智能体开发平台全链条布局;阿里整合核心技术资源走软硬一体路线,ToB、ToC双线推进;腾讯聚焦机器人操作系统,为第三方机器人提供通用大脑;百度依托大模型技术,推进其与具身智能的结合落地。这些巨头的优势集中在技术层、软件层,但均缺乏大规模、持续运转且完全可控的真实物理场景,难以获取足量的真实训练数据。而京东的场景积淀,恰好补上了行业这一最核心的短板。

更重要的是,京东借此构建了一个数据驱动的正向商业闭环:自有场景产生的真实数据,训练出更优的具身智能模型;模型反哺物流、零售等核心业务,提升供应链效率、降低运营成本,同时产生更多优质数据,进一步优化模型;当模型能力成熟后,向全行业开放数据和模型能力,获得新的服务收入,同时从更多行业场景中获取数据,让整个闭环持续运转。这一闭环,既是京东自身技术升级的基础,也是其从“商品交易平台”向“产业互联网服务商”转型的核心抓手。

当然,京东的这一布局并非毫无挑战。其一,资金投入压力巨大,数据采集设备部署、算力集群搭建、众包采集与数据标注,均需要巨额且持续的资金支持;其二,数据标准化难度高,不同场景的数据格式、标注标准差异显著,实现全行业通用的标准化数据集,是亟待解决的技术难题;其三,数据合规与隐私保护要求严格,大规模众包采集涉及大量个人信息和场景数据,需要完善的机制保障;其四,底层技术仍需补齐,在大模型算法、机器人操作系统等核心技术上,京东与头部科技企业仍有差距。

但从行业发展规律来看,京东的布局踩中了具身智能的核心发展逻辑。2009年ImageNet数据集的出现,推动计算机视觉技术从实验室走向大规模商用,成为行业发展的关键节点。而京东正在构建的千万小时级具身智能真实数据集,有望成为具身智能领域的“ImageNet时刻”,推动整个行业从仿真模拟的实验室阶段,迈入真实数据驱动的商用落地阶段。

互联网的上半场,是数字世界的竞争,拼的是流量、信息分发效率和线上体验优化;而下半场,是数字世界与物理世界的融合竞争,核心是把数字技术落地到真实物理场景,提升现实世界的运行效率。京东用二十年时间,把中国商品流通的效率做到了极致;如今的具身智能数据中心,正是其抓住AI下半场的关键布局——将线下场景积淀转化为数据资产,再将数据资产转化为产业能力,最终实现数字技术与物理世界的深度融合。

对于整个具身智能行业而言,京东的尝试也提供了全新思路:真实场景数据不是模型训练的附属品,而是推动行业发展的核心生产力。唯有实现真实数据的工业化、标准化生产,让具身智能模型在海量真实场景中完成训练,机器人才能真正走出实验室,走进普通人的生活,成为渗透到生产生活各领域的基础设施。

声明:本文为维科号作者发布,不代表维科号立场。如有侵权或其他问题,请及时联系我们举报。