NVIDIA 今日发表了 NVIDIA Cosmos 3,这是一款专为物理 AI 设计的开放式世界基础模型,基于突破性的 mixture-of-transformers 架构,将视觉推理、世界生成与动作预测集成至单一系统中。Cosmos 3 是一款完全开放的全能模型(Omni-model),能够原生理解并生成文本、图像、视频、环境音与动作。此外,NVIDIA 还成立了「Cosmos Coalition」,成员包括 Agile Robots 与 Runway 等全球领先的 AI 实验室,共同推动下一代世界模型的发展。首席执行官黄仁勋表示,物理 AI 的「大爆炸」即将来临,开发者将能在机器人与自动驾驶领域取得跨世代的进步。Cosmos 3 解决了在有限训练数据下实现现实世界泛化的内核挑战,并在多项基准测试中名列前茅。目前 Cosmos 3 Super 与 Nano 版本已开放使用,针对边缘运算的 Edge 版本也即将推出。