财联社9月27日讯(记者 郭松峤)自《关于深入实施“人工智能+”行动的意见》印发满一个月以来,产业界对AI技术的落地应用已进入加速阶段。9月26日在北京举办的2025人工智能计算大会,成为观察行业趋势的关键窗口。财联社记者现场发现,与会者讨论焦点从政策解读转向技术落地,其中token成本高企与算力优化成为核心议题。
本届大会以“算力为核心牵引”,围绕AI基础设施优化与算法创新展开。中国移动、浪潮信息、智源研究院等30余家企业和机构联合发布《基于超节点创新联合体,打造行业智能体——智算应用“北京方案”》,率先响应国家“人工智能+”战略。方案提出通过超节点架构实现跨地域、跨硬件的算力普惠共享,为行业智能体提供统一计算底座。
西湖大学“可信及通用人工智能实验室”创始人金耀初院士指出,AI发展路径与人脑智能涌现过程相似,需经历演化、发育与学习三阶段。他强调,可信赖AI需兼顾技术能力与治理框架,并分享了实验室在工业AI与类脑通用AI领域的实践。
北京智源人工智能研究院副院长林咏华介绍了“众智FlagOS”系统进展。该平台作为开放统一的软件栈,旨在打破AI算力生态壁垒,支持跨芯片、跨框架、跨场景的统一计算,为全球开发者提供普惠算力资源。
百度首席技术官王海峰回顾了AI技术从规则方法到深度学习、大模型的演进历程,指出大模型技术通用性为通用人工智能(AGI)带来曙光。浪潮信息首席AI战略官刘军则提出,AI算力需从规模导向转向效率导向,通过专用计算架构应对规模、电力与投入的三重挑战。
财联社记者现场采访发现,token成本高企已成为企业推进AI应用规模化的核心障碍。一位电商企业AI平台技术负责人坦言:“平台每日需处理海量客服、推荐、风控场景,token成本如‘达摩克利斯之剑’悬于头顶。随着智能体应用扩展,交互会话的token消耗激增,成本结构让许多创新应用在落地前就因‘经济账’受阻。”
中国电子商务专家服务中心副主任郭涛指出,AI产业正从“模型竞赛”转向“应用落地”,推理成本与交互速度已成为比模型参数更关键的竞争维度。基础设施的“提速降本”成效,将直接决定AI技术在垂直行业的渗透深度。
面对行业痛点,算力基础设施厂商从硬件层面寻求突破。浪潮信息在大会上发布元脑HC1000超扩展AI服务器,采用全对称DirectCom极速架构与无损超扩展设计,聚合海量本土AI芯片,支持极大推理吞吐量。该服务器将推理成本首次击破1元/每百万token,为智能体突破成本瓶颈提供高性能算力支持。
技术层面,HC1000通过16卡计算模组设计与单卡均衡设计,降低单卡成本与系统分摊成本;全对称拓扑结构支持超大规模无损扩展。据测算,其推理性能较传统RoCE提升1.75倍,单卡模型算力利用率最高提升5.7倍。
浪潮信息表示,智能体产业化将带来指数级增长的推理算力需求。公司计划通过软硬件协同设计与深度优化,持续推动AI计算架构创新,实现token生成“提速降本”,促进大模型、智能体技术与实体经济的深度融合,为千行百业注入创新动力。