扫描打开手机站
随时逛,更方便!
当前位置:首页 > 智创未来

明略科技Mano大模型双榜夺冠,引领GUI智能体技术革新

时间:2025-09-22 18:06:42 来源:界面新闻 作者:界面新闻

9月21日,人工智能领域迎来重磅消息:明略科技自主研发的GUI大模型Mano在OSWorld与Mind2Web两大权威基准测试中双双登顶,以创纪录的SOTA(State-of-the-Art)成绩刷新行业纪录,标志着通用GUI智能体技术迈入全新发展阶段。

双榜夺冠:技术突破获国际认可

在OSWorld-Verified的Foundation E2E GUI & Specialized Model测试中,Mano模型展现出惊人实力:单次运行成功率达40.1%,整体表现均值稳定在41.6±0.7%,大幅领先qwen、GUI-Owl、opencua等全球主流模型。该测试聚焦复杂图形界面交互场景,要求模型精准识别按钮、菜单等元素并完成连贯操作,Mano的优异表现验证了其在动态环境中的鲁棒性。

另一项Mind2Web基准测试覆盖137个网站、2350余项真实任务,涵盖机票预订、表单填写、在线购物等高难度场景,对元素精度(Element Accuracy)和步骤成功率(Step SR)提出严苛要求。Mano在面对不断变化的DOM结构和多样化场景时,依然保持卓越的适应能力,展现出超越同类模型的泛化性能。

三大核心技术:构筑技术护城河

Mano的成功源于明略科技在GUI智能体领域的三大创新:

  1. 在线强化学习范式:首次将在线强化学习引入GUI交互领域,通过「探索器」自动采集训练数据,实现交互性能的指数级提升。
  2. 自动化训练数据工厂:搭建虚拟环境集群,利用插件和DOM提取器自动生成交互轨迹、元素信息及语义标注,构建起覆盖千万级场景的高质量数据集。
  3. 三阶段训练体系:通过监督微调(SFT)、离线强化学习(Offline RL)、在线强化学习(Online RL)的渐进式训练,将推理能力与任务适应性深度融合,解决传统模型在动态场景中的「水土不服」问题。

定义GUI智能体新范式

随着生成式AI向「能动性」进化,GUI智能体正成为人机交互的核心载体。Mano的「双榜第一」不仅是技术突破,更验证了明略科技从数据采集到训练范式、从实验室到真实场景的全链路技术积累。其可扩展的架构设计,使其既能处理简单界面操作,也可应对电商、金融等复杂业务场景。

明略科技透露,未来将持续优化数据采集效率、训练推理整合能力及验证码处理技术,推动Mano在真实商业场景和端侧设备的深度部署,为企业智能化转型提供从底层技术到场景落地的完整解决方案。

此次突破印证了中国AI企业在全球前沿领域的创新实力。正如明略科技CTO所言:「通过持续技术深耕,中国企业完全有能力在GUI智能体等核心赛道建立世界级技术优势。」随着Mano的商业化落地,一场由AI驱动的人机交互革命正在拉开帷幕。