你看懂，京东做具身数据的野心了吗?

2026-03-24 10:41

具身智能 I 人形机器人 I 具身智能融资 I 机器人

京东押注具身智能数据中心：20年场景积淀，锚定AI下半场核心赛道

具身智能的行业发展，正卡在真实场景数据的瓶颈上。当全行业扎堆研发模型、升级硬件，试图突破技术卡点时，京东宣布建设全球规模最大、场景最全的具身智能数据中心，计划两年积累超1000万小时真实场景数据并向全行业开放。这并非京东跨界布局AI，而是其将二十年线下场景积淀转化为核心资产，精准卡位具身智能商用落地的关键一步。

当下的具身智能赛道，热度与困境并存。2026年开年不到三个月，国内具身智能领域披露融资总额近150亿元，估值超百亿的企业增至7家，成为资本和科技企业争抢的下一代AI核心赛道。但行业的现实短板十分突出：实验室固定场景下，具身智能模型完成指定任务的准确率超90%，可投入真实环境后，性能直接腰斩甚至失灵。

这一问题的核心，在于真实场景训练数据的严重匮乏。目前全行业可用于具身智能训练的真实场景数据，累计仅几十万小时，与实现智能涌现所需的千万甚至上亿小时规模，差距悬殊。而此前被寄予厚望的仿真数据，始终无法跨越与现实的鸿沟：仿真环境中，地面、物体、光线均为程序员预设的固定状态，却无法还原真实世界的不确定性——仓库地面因重压的轻微变形、家庭中随意摆放的物品、不同时段的光线变化，这些细微变量直接决定机器人的实际可用性，却是仿真环境难以模拟的。

与此同时，具身智能发展的其他门槛正快速降低。算力方面，IDC数据显示2025年中国智能算力规模达1037.3EFLOPS，同比增长43%，且算力价格持续下探，资金可直接转化为算力支撑；硬件方面，电机、减速器等核心零部件成本下降，人形机器人整机价格从早年的几十万元降至如今数万元；模型层面，开源社区的成熟让架构日趋同质化，创业公司也能基于开源框架快速推出解决方案。行业的核心矛盾，正式从“有没有算力、模型、硬件”，切换为“有没有足够的真实数据喂饱模型”。

正是在这样的行业背景下，京东的具身智能数据中心布局，显得精准且必然。外界对京东的认知多停留在零售电商，但从成立之初，京东的核心业务就扎根物理世界：从商品采购、仓储分拣，到配送售后，全链条都在真实物理场景中完成。如今京东在全国布局超1400个仓库、50余个亚洲一号智能仓储园区，数万台AGV机器人、分拣机器人、码垛机器人24小时运转，每天完成数百万次货物操作，这些真实业务中产生的多维度数据，正是训练具身智能模型的优质素材。

与传统IDC机房、通用智算中心不同，京东打造的具身智能数据中心，是针对具身智能技术特点搭建的“采集-标注-训练-验证”全流程基础设施，核心并非算力存储和通用计算，而是真实物理世界数据的生产、处理与应用。为实现数据规模突破，京东采用“自有场景采集+大规模众包”的模式：内部发动超10万名各职业员工，外部联动最多50万名各行业人员，仅江苏宿迁一地就发动超10万名市民参与，覆盖家庭、办公室、工厂、物流、城市等五大核心场景、上百个细分场景。

按照规划，京东将在一年内积累500万小时人类真实场景视频数据，两年内突破1000万小时，同步采集100万小时机器人本体数据。这一规模不仅远超目前行业公开数据集的总和，更能构建起覆盖人类生产生活全场景、持续更新的真实世界数字孪生体，为具身智能模型训练提供最贴近现实的素材。

对比其他科技巨头的具身智能布局，京东的核心优势在于独一无二的场景资源。华为主打全栈技术闭环，从算力芯片、操作系统到智能体开发平台全链条布局；阿里整合核心技术资源走软硬一体路线，ToB、ToC双线推进；腾讯聚焦机器人操作系统，为第三方机器人提供通用大脑；百度依托大模型技术，推进其与具身智能的结合落地。这些巨头的优势集中在技术层、软件层，但均缺乏大规模、持续运转且完全可控的真实物理场景，难以获取足量的真实训练数据。而京东的场景积淀，恰好补上了行业这一最核心的短板。

更重要的是，京东借此构建了一个数据驱动的正向商业闭环：自有场景产生的真实数据，训练出更优的具身智能模型；模型反哺物流、零售等核心业务，提升供应链效率、降低运营成本，同时产生更多优质数据，进一步优化模型；当模型能力成熟后，向全行业开放数据和模型能力，获得新的服务收入，同时从更多行业场景中获取数据，让整个闭环持续运转。这一闭环，既是京东自身技术升级的基础，也是其从“商品交易平台”向“产业互联网服务商”转型的核心抓手。

当然，京东的这一布局并非毫无挑战。其一，资金投入压力巨大，数据采集设备部署、算力集群搭建、众包采集与数据标注，均需要巨额且持续的资金支持；其二，数据标准化难度高，不同场景的数据格式、标注标准差异显著，实现全行业通用的标准化数据集，是亟待解决的技术难题；其三，数据合规与隐私保护要求严格，大规模众包采集涉及大量个人信息和场景数据，需要完善的机制保障；其四，底层技术仍需补齐，在大模型算法、机器人操作系统等核心技术上，京东与头部科技企业仍有差距。

但从行业发展规律来看，京东的布局踩中了具身智能的核心发展逻辑。2009年ImageNet数据集的出现，推动计算机视觉技术从实验室走向大规模商用，成为行业发展的关键节点。而京东正在构建的千万小时级具身智能真实数据集，有望成为具身智能领域的“ImageNet时刻”，推动整个行业从仿真模拟的实验室阶段，迈入真实数据驱动的商用落地阶段。

互联网的上半场，是数字世界的竞争，拼的是流量、信息分发效率和线上体验优化；而下半场，是数字世界与物理世界的融合竞争，核心是把数字技术落地到真实物理场景，提升现实世界的运行效率。京东用二十年时间，把中国商品流通的效率做到了极致；如今的具身智能数据中心，正是其抓住AI下半场的关键布局——将线下场景积淀转化为数据资产，再将数据资产转化为产业能力，最终实现数字技术与物理世界的深度融合。

对于整个具身智能行业而言，京东的尝试也提供了全新思路：真实场景数据不是模型训练的附属品，而是推动行业发展的核心生产力。唯有实现真实数据的工业化、标准化生产，让具身智能模型在海量真实场景中完成训练，机器人才能真正走出实验室，走进普通人的生活，成为渗透到生产生活各领域的基础设施。

声明：本文为维科号作者发布，不代表维科号立场。如有侵权或其他问题，请及时联系我们举报。