背景 人工智能技术的演进,正从专注于在数字空间生成信息的大型语言模型(LLM)时代,过渡到与物理世界直接交互并自主运作的「实体AI(Physical AI)」阶段。在日本,少子高龄化导致的劳动力短缺与制造业、服务业的自动化需求叠加,加速了市场的扩大。传统的生成式AI主要目的是处理文本和2D图像,而实体AI则被定位为将传感器的环境感知与机器人的实体动作相结合,直接为解决现实世界问题做出贡献的次世代基础设施。 大规模数据是实体AI开发不可或缺的 业界逐渐达成共识,即「缩放定律(Scaling Law)」同样适用于实体AI的开发。为了提高模型的通用性和在真实环境中的控制精度,包含仿真无法完全重现的多样化物理现象和动作模式的大规模且高品质的真实世界数据是不可或缺的。然而,在现实空间收集数据面临环境建构成本高、多个传感器同步与校准困难以及标注负担重等多重问题,已成为开发过程中的最大瓶颈。 为了解决这个课题,Nexdata投资总额超过25亿日圆,建构了总面积超过8,000平方公尺的专属数据收集工厂。我们提供全面的数据解决方案以加速实体AI的开发,包括厂内的数据收集、第一人称视角(Ego-centric)的真实环境数据收集与标注,以及支持环境感知、决策、动作控制的现成数据集。通过大规模生产带来的成本优势以及在开发现场可立即使用的数据资产,我们协助缩短实体AI和VLA模型的开发前置时间,并提升真实世界的适应精度。 8,000平方公尺规模的数据收集工厂实现大规模、低成本的数据供应 Nexdata在实体AI开发专用的数据基础设施建设上,投资总额超过20亿日圆。目前营运两个大型数据收集工厂,在面积超过8,000平方公尺的专属空间内,可同时并行运作人形机器人、四足步行机器人、工业机器手臂、多指机械手等超过400台的多样化机器人平台。 设施内完善建置了家庭、药局、生产线、物流仓库等忠实重现实际营运环境的各种情境,并有超过600名操作员和管理人员常驻。 借此,从大规模基础模型的预训练、针对特定任务的微调,到模仿人类演示进行学习的模仿学习,我们能够高效生产涵盖整个开发阶段的高品质实体AI数据。 综合收集工厂 机器手专用收集工厂 锻炼实体AI「环境感知能力・大脑・小脑」的现成数据集 在实体AI的开发中,沿着分别负责环境理解、行动计划、精密控制的「环境感知层」、「决策层」、「动作运行层」三层架构进行设计已成为标准。Nexdata正是因为配备了大规模的专业数据收集基地和专职的收集人员,才得以实现数据集的快速生产。截至目前为止,我们累计提供了以下具成本效益的数据集: ■ 环境数据库(环境感知层) 收录超过2亿8,800万组高精度3D模型及真实世界场景数据。通过提供包含多样照明条件、物体配置、背景图案且贴近真实环境的仿真基础,支持提升机器人的空间感知能力和物体检测精度。 ■ 大脑(Brain)数据集(决策层) 收录长达4,000小时的第一人称视角(Ego-centric)多任务运行视频。全面涵盖了人类在运行日常任务(如:烹饪、整理、商品陈列等)时的视觉输入和行为串行,最适合用于需要长期依赖性的任务计划,以及根据上下文进行决策模型的学习。 ■ 小脑・身体(Body)数据集(控制层) 收录超过1万组高逼真度轨迹数据、关节角度时间串行,以及力觉回馈信息。可作为基础数据,支持模仿学习或强化学习中低级控制策略的学习,以及在真实环境中的精密动作运行。 此外,在抓取(Grasping)、操作(Manipulation)、力觉回馈(Haptic Feed