扫描打开手机站
随时逛,更方便!
当前位置:首页 > 智创未来

智源推出多模态大模型悟界·Emu3.5 跨场景具身操作成亮点

时间:2025-10-30 12:03:39 来源:财联社 作者:财联社

智源多模态大模型Emu3.5发布现场

据《科创板日报》30日消息,人工智能领域迎来重要突破——智源研究院今日正式发布新一代多模态世界大模型「悟界·Emu3.5」。该模型通过自回归架构实现了对多模态序列的「Next-State Prediction (NSP)」预测,成功构建出具备泛化能力的世界建模体系。

在核心能力方面,Emu3.5突破了传统模型的场景限制,首次实现了跨场景的具身操作能力。其独特的动作规划模块可支持复杂交互任务,在物理空间与数字空间中均能完成动态决策。例如在机器人控制场景中,模型能根据环境变化实时调整操作策略;在数字内容创作领域,则可同步处理文本生成、图像编辑及时空维度变换等复合需求。

技术实现层面,研究人员采用渐进式训练框架,通过海量多模态数据(含3D场景、动作序列、时空轨迹等)的持续输入,使模型获得对物理世界规律的深度理解。这种创新架构不仅提升了预测准确性,更赋予系统跨领域迁移能力——从工业制造到创意设计,从虚拟仿真到现实交互,均可快速适配应用场景。

据项目负责人介绍,Emu3.5的发布标志着多模态AI进入「具身智能」新阶段。未来该技术将重点布局智能制造、数字孪生、元宇宙内容生产等战略领域,为产业智能化升级提供核心算法支持。(记者 李明明)

猜你喜欢