9月30日,《每日经济新闻》记者获悉,国内大模型企业智谱正式发布并开源新一代大模型GLM-4.6,在Agentic Coding (代理式编码)等核心能力上实现大幅跃升。
智谱官方宣布,GLM-4.6已在寒武纪AI芯片上实现FP8+Int4(一种混合精度计算技术)混合量化推理部署,这也是首次在国产芯片上投产的FP8+Int4模型—芯片一体化解决方案。在保持模型精度不变的前提下,该方案大幅降低了推理成本,为国产芯片本地化运行大模型提供了可行路径和示范意义。
与此同时,摩尔线程基于vLLM推理框架完成了对GLM-4.6的适配,新一代GPU可在原生FP8精度下稳定运行模型,充分验证了 MUSA((Meta-computing Unified System Architecture,元计算统一系统架构)架构及全功能GPU在生态兼容性和快速适配能力方面的优势。
寒武纪与摩尔线程完成对GLM-4.6的适配,标志着国产GPU已具备与前沿大模型协同迭代的能力,加速构建自主可控的AI技术生态。GLM-4.6搭配国产芯片的组合将率先通过智谱MaaS平台面向企业与公众提供服务。