9月21日,人工智能领域迎来重磅消息:明略科技自主研发的GUI大模型Mano在OSWorld与Mind2Web两大权威基准测试中双双登顶,以创纪录的SOTA(State-of-the-Art)成绩刷新行业纪录,标志着通用GUI智能体技术迈入全新发展阶段。
双榜夺冠:技术突破获国际认可
在OSWorld-Verified的Foundation E2E GUI & Specialized Model测试中,Mano模型展现出惊人实力:单次运行成功率达40.1%,整体表现均值稳定在41.6±0.7%,大幅领先qwen、GUI-Owl、opencua等全球主流模型。该测试聚焦复杂图形界面交互场景,要求模型精准识别按钮、菜单等元素并完成连贯操作,Mano的优异表现验证了其在动态环境中的鲁棒性。
另一项Mind2Web基准测试覆盖137个网站、2350余项真实任务,涵盖机票预订、表单填写、在线购物等高难度场景,对元素精度(Element Accuracy)和步骤成功率(Step SR)提出严苛要求。Mano在面对不断变化的DOM结构和多样化场景时,依然保持卓越的适应能力,展现出超越同类模型的泛化性能。
三大核心技术:构筑技术护城河
Mano的成功源于明略科技在GUI智能体领域的三大创新:
定义GUI智能体新范式
随着生成式AI向「能动性」进化,GUI智能体正成为人机交互的核心载体。Mano的「双榜第一」不仅是技术突破,更验证了明略科技从数据采集到训练范式、从实验室到真实场景的全链路技术积累。其可扩展的架构设计,使其既能处理简单界面操作,也可应对电商、金融等复杂业务场景。
明略科技透露,未来将持续优化数据采集效率、训练推理整合能力及验证码处理技术,推动Mano在真实商业场景和端侧设备的深度部署,为企业智能化转型提供从底层技术到场景落地的完整解决方案。
此次突破印证了中国AI企业在全球前沿领域的创新实力。正如明略科技CTO所言:「通过持续技术深耕,中国企业完全有能力在GUI智能体等核心赛道建立世界级技术优势。」随着Mano的商业化落地,一场由AI驱动的人机交互革命正在拉开帷幕。