智源推出多模态大模型悟界·Emu3.5 跨场景具身操作成亮点

时间：2025-10-30 12:03:39　来源：财联社　作者：财联社

智源多模态大模型Emu3.5发布现场

据《科创板日报》30日消息，人工智能领域迎来重要突破——智源研究院今日正式发布新一代多模态世界大模型「悟界·Emu3.5」。该模型通过自回归架构实现了对多模态序列的「Next-State Prediction (NSP)」预测，成功构建出具备泛化能力的世界建模体系。

在核心能力方面，Emu3.5突破了传统模型的场景限制，首次实现了跨场景的具身操作能力。其独特的动作规划模块可支持复杂交互任务，在物理空间与数字空间中均能完成动态决策。例如在机器人控制场景中，模型能根据环境变化实时调整操作策略；在数字内容创作领域，则可同步处理文本生成、图像编辑及时空维度变换等复合需求。

技术实现层面，研究人员采用渐进式训练框架，通过海量多模态数据（含3D场景、动作序列、时空轨迹等）的持续输入，使模型获得对物理世界规律的深度理解。这种创新架构不仅提升了预测准确性，更赋予系统跨领域迁移能力——从工业制造到创意设计，从虚拟仿真到现实交互，均可快速适配应用场景。

据项目负责人介绍，Emu3.5的发布标志着多模态AI进入「具身智能」新阶段。未来该技术将重点布局智能制造、数字孪生、元宇宙内容生产等战略领域，为产业智能化升级提供核心算法支持。（记者李明明）

上一篇：MetaOptics美国内华达州成立新公司，发布共封装光学组件原型机
下一篇：返回列表

猜你喜欢