具身智能,作为当下最炙手可热的产业之一,正吸引着全球科技巨头的目光。在中国,行业龙头宇树科技的上市进程紧锣密鼓;而在国际舞台上,中美科技巨头则在水下进行着更为宏大的布局。其中,英伟达CEO黄仁勋与字节跳动创始人张一鸣,这两位科技界的领军人物,在机器人领域的布局不谋而合,引发了业界的广泛关注。
今年3月,在GTC 2025主题演讲中,黄仁勋亲自演示了挪威机器人公司1X的NEO Gamma人形机器人。这款机器人搭载了基于英伟达GR00T N1模型构建的后训练策略,能够自主执行整理任务,展现了人形机器人在适应性和学习能力上的巨大潜力。黄仁勋的这一举动,无疑是在向世界宣告:人形机器人的未来,在于其“大脑”的适应性和学习能力。
几个月后,全球科技巨头在“机器人大脑”这一核心领域纷纷亮出了新成果。8月,英伟达推出了Jetson AGX Thor,这款能在机器人本体上同时运行多个生成式AI模型的边缘计算平台,被行业公认为“机器人新大脑”。
Jetson AGX Thor(以下简称Thor)作为面向机器人和物理设备的新一代技术栈,基于Blackwell GPU架构打造,峰值算力高达2070 FP4 TFLOPS,AI性能较现有Jetson AGX Orin模块提升多达7.5倍,同时能效提升3.5倍。这一突破,使得过去依赖云端处理或多块芯片的机器人,如今能在单一紧凑的模块上实现实时感知和决策,大大提升了机器人的自主性和灵活性。
目前,亚马逊仓储机器人和波士顿动力等早期用户,已经开始在自家产品上集成Thor,旨在打造出更智能、更独立的机器人产品。这一趋势,预示着机器人技术正朝着更加自主、智能的方向发展。
而在地球的另一边,字节跳动也在机器人领域展开了积极的布局。7月和9月,字节先后推出了自研的通用机器人模型GR-3和Robix,展示了在真实家庭场景下执行复杂任务的能力。7月底,字节Seed团队放出的一条演示视频中,一台搭载了GR-3的机器人成功完成了将衣架插入衬衫并将其挂起来的任务,展现了其在实际应用中的潜力。
上周,Seed团队又掏出了最新的机器人研究成果——Robix。它与GR-3一起,组成了字节新一代机器人模型矩阵。此时,距离黄仁勋在GTC 2025上的感慨仅过去半年时间,两家巨头在机器人赛道的“同频”,让人不禁感叹:黄仁勋和张一鸣,这次真的想到一块去了。
在Thor横空出世前,英伟达就已经是机器人赛道的领头羊。其Jetson平台在高端机器人和自主机器开发领域占据主导地位,生态系统中拥有超过200万名开发人员,超过7000家公司使用上一代产品Orin系列。今年8月,Thor的正式开售,更是巩固了英伟达在这一领域的领先地位。
然而,英特尔、高通等竞争对手的边缘AI产品相对落后,尚无法在单一模块中实现同等水平的集成计算。更关键的是,英伟达将硬件与软件堆栈紧密绑定,并依托CUDA工具包的广泛应用,形成了强大的生态护城河。Thor可以直接调用英伟达完整的Isaac机器人软件平台、AI模型库和仿真工具,实现端到端的深度集成。
其中,英伟达针对机器人场景的最新模型——Isaac GR00T N1,采用了受人类认知启发的双系统架构。一个系统是“快速思考行动模型”,其行为类似于人类的反应和直觉;另一个系统是“慢思考模型”,能够推理周围环境和收到的指令,从而规划行动。这一设计,使得机器人在面对复杂环境时能够做出更加智能、合理的决策。
不过,Thor并非完美无缺。其开发套件的售价高达3499美元,很难成为普通家用产品的选择。此外,Thor平台有着更高的功率要求,这意味着其适配的产品需要稳定的供电能力,如自动驾驶汽车、工厂机器人、送货机器人等。
在“机器人大脑”的赛道上,英伟达很快有了中国竞争对手。7月底,字节发布了全新一代机器人VLA模型GR-3。官方演示中,搭载着GR-3的机器人ByteMini成功完成了拾取家居用品、放置在指定位置等高难度任务。此外,ByteMini还可以区分不同尺寸的物品,并成功执行拿起“较大的盘子”的指令。
拆解演示过程和技术报告可以发现,GR-3能够理解复杂、抽象的语言,如“较大的盘子”“左边的椅子”等。此外,GR-3少样本适配能力较强,采用混合方法训练:首先向GR-3输入大量图像和文本数据,随后借助虚拟现实环境中的人机交互进行微调;最后再让其学习并模仿现实世界中的机器人动作。这套训练策略,使GR-3具备了在复杂且难以预测的环境中保持适应性的能力。
据了解,GR-3相比GR00T系列有着更大的参数规模,实际应用中表现更好。曾在Meta就职的AI科学家Chris Paxton在一篇关于机器人领域VLA的研究中披露,字节的40亿参数GR-3模型,表现似乎优于英伟达GR00T,后者参数量大约20亿。可以合理推测,一旦有足够的数据和算力支撑,“规模定律”依然有效。
GR-3让字节在“机器人大脑”赛道有了一席之地。不过,VLA模型更多是用在执行层面,相比起“大脑”的定义,GR-3更像是机器人肢体的“神经元”。而字节Seed团队的最新成果Robix,则补齐了“机器人大脑”的另一块拼图。
上周,Seed团队发布了最新成果Robix,在机器人系统中负责任务规划、推理、自然语言交互等任务。Seed研究员董恒在个人主页上这样描述Robix:“这是一个集推理、规划和自然交互于一体的统一机器人大脑,其性能优于GPT-4o和Gemini 2.5 Pro。”
不过,Robix并不是“机器人大脑”完全体。根据Robix的技术文档,流程中“身体动作/执行”部分通常由低层控制器模型来完成,也就是对应的VLA模型,如GR-3或类似控制器。换言之,GR-3和Robix需要在驱动机器人的场景中相互配合。
Robix的这套工作逻辑,和英伟达GR00T N1的双系统模式有共通之处,一个系统负责推理,另一个系统负责执行。在官方测试中,搭载GR-3作为控制器的Robix,通过ByteMini机器人完成了餐桌清理、收银装袋和饮料筛选的任务;与其他模型横向对比,仅在饮料筛选项目上略微落后于Gemini 2.5 Pro,其他项目均得分最高。
Robix和GR-3不是字节第一次在机器人VLM领域“秀肌肉”。很多人把字节看作互联网内容公司,但在机器人领域,它其实是一位低调的“隐形巨头”。2023年12月,Seed团队推出了GR-1,该模型也是Seed在机器人VLA领域的前瞻性实验。作为技术验证产品,GR-1采用了先用大规模视频生成式预训练,再无缝用机器人数据微调的模式。
基于GR-1的技术积累,Seed团队2024年推出了GR-2。GR-2使用了3800万段视频、超500亿token的数据作为预训练的基础,然后再用机器人轨迹做动作/视频生成微调。它在超100个操控任务测试中的平均成功率高达97.7%,展现了字节在机器人领域的强大实力。
GR-3和Robix,是字节在大模型时代研究领域延伸的最新一环。《晚点LatePost》在2023年的报道中披露,字节的机器人探索始于2020年。当时张一鸣就对机器人表现出兴趣,此后会不定期参与机器人项目讨论。两年时间过去,字节已经悄悄量产了1000台以上的机器人。这些轮式物流机器人主要用于在仓库、产线上运输包裹与零件,聚焦于“仓储+自动搬运”的一体化方案,能自主学习、规划路线、移动到目的地,服务于自家的抖音电商仓以及顺丰、比亚迪等外部客户。
不过,这些物流机器人更多是早期的技术积累。从Robix、GR-3和ByteMini的技术发展路径不难看出,字节致力于在具身智能领域取得领先地位。近期,字节招聘官网涌现出一批机器人相关的岗位,其中有岗位明确提到“下一代通用机器人”。所有岗位都属于Seed团队,base在北京和上海。南华早报在7月的报道中披露,Seed团队今年人数预计超过300人。
另一方面,字节在机器人产业中也积极投入。此前,国内具身智能头部企业宇树科技完成C轮融资,公司估值超百亿。该轮融资的金主名单中,除了阿里、腾讯系的名字,也出现了与字节渊源颇深的锦秋基金。锦秋基金由原字节财务投资负责人杨洁2022年创立,团队核心成员多来自字节的投资体系。其名称“锦秋”源自张一鸣和字节的创业时的发源地——位于北京海淀区的锦秋家园。
字节正在公司内外加速布局机器人领域。不过,目前字节的技术积累主要是模型侧的“机器人大脑”层面;而英伟达的最新芯片方案,似乎和字节形成优势互补。多年以来,字节是英伟达在中国最重要的客户之一,而黄仁勋也深知中国企业在具身智能市场的重要地位。
今年7月,他现身北京链博会开幕式,并在发言中表示:“AI的下一波浪潮将是机器人,未来的机器人不仅能够推理和执行,还能真正理解物理世界。”对黄仁勋而言,中国市场在这条路径上具有不可替代的意义。
英伟达官方博客显示,多家国内公司已经使用Thor,包括联影医疗、万集科技、优必选、银河通用、宇树科技、众擎机器人和智元机器人等。不过,在这一长串名字中,尚未见到字节的身影。
英伟达博客还引述了宇树科技CEO王兴兴的发言:“Jetson Thor带来了计算能力的巨大飞跃,赋能机器人更强的敏捷性、更快的决策制定以及更高的自主水平,这对于机器人在现实世界中实现导航与交互至关重要。”2025年1月,在CES全球消费电子展上,黄仁勋与14家合作的人形机器人公司一同登台,其中6家来自中国,包括宇树科技和小鹏等企业。
另一方面,字节Seed团队并非只聚焦机器人模型领域。在测试GR-3和Robix的过程中,字节同步推出了ByteMini。尽管看起来更像是测试用途的实验性产品,但浏览Seed团队的技术报告可以发现,这款机器人的技术规格并不低,包含22个自由度,手腕采用球形腕设计,在狭小空间/高灵巧任务中有较高的操作能力。
可以说,ByteMini的出现,已经显示出字节打造下一代具身智能产品的野心。而随着英伟达拿出了新一代机器人芯片方案,想到一块去的黄仁勋和张一鸣,似乎有望在机器人领域,延续这两家头部企业的合作关系,共同推动具身智能技术的发展。