扫描打开手机站
随时逛,更方便!
当前位置:首页 > 智创未来

国庆前夕国产大模型爆发!GLM-4.6编程能力登顶,寒武纪摩尔线程紧急适配

时间:2025-10-01 09:01:17 来源:智东西 作者:智东西


智东西
作者 李水青
编辑 漠影

9月30日国庆前夕,全球AI技术竞赛迎来关键节点,国产大模型领域接连发布重磅成果。智谱AI与DeepSeek两大领军企业同日发布新一代模型,海外巨头Claude、谷歌同步加码,全球大模型竞争进入白热化阶段。

国产双雄同日发力,GLM-4.6编程能力登顶

9月30日下午,智谱AI正式推出新一代大模型GLM-4.6,其核心编程能力实现质的飞跃。就在前夜,DeepSeek刚发布DeepSeek-V3.2-Exp实验版模型。两大国产模型在国庆假期前夕展开技术对决,而海外Claude Sonnet 4.5同期发布,谷歌Gemini 3.0预计10月迎战,形成全球AI技术三足鼎立之势。

作为智谱GLM系列最新版本,GLM-4.6在八大权威基准测试中全面超越DeepSeek-V3.2-Exp,尤其在真实编程场景中表现惊艳。实测数据显示,该模型代码生成质量与Claude Sonnet 4.5、GPT-5持平,但使用成本仅为Claude的1/7,被业界誉为「国产最强Coding模型」。


八大权威测试夺冠,编程性能提升30%

在AIME 25、GPQA、LCB v6等国际权威测试中,GLM-4.6在7项指标中超越DeepSeek-V3.2-Exp,稳居国产模型首位。相比7月发布的GLM-4.5,新模型在代码生成、长文本处理、推理能力等六大维度实现全面升级。

真实编程场景测试显示,GLM-4.6在Claude Code环境下完成74个复杂任务,实测性能超越Claude Sonnet 4。更值得关注的是,其平均token消耗较前代降低30%,达到全球同类模型最低水平。智谱已公开全部测试数据与代码轨迹,确保技术透明性。

技术报告地址:
https://z.ai/blog/glm-4.6

实测编程能力惊艳,媲美国际顶尖水平

智东西深度体验发现,GLM-4.6在复杂编程任务中表现突出。在「旋转六边形弹跳球」模拟测试中,模型精准呈现质量碰撞、能量守恒等物理现象,并提供旋转速度、重力参数等12项可调选项。对比GLM-4.5,新模型成功解决前代边界溢出问题,控制精度提升40%。


在交互式太阳系模拟测试中,GLM-4.6仅凭「创建交互式太阳系」的简单指令,即生成包含3D轨道模型、行星参数调节等功能的完整系统。该成果与Claude Sonnet 4.5表现相当,但在行星运转精度上更胜一筹。

SVG动画生成测试暴露GPT-5短板,当要求生成「水豚骑自行车」动画时,GPT-5因训练数据局限未能完成,而GLM-4.6准确呈现水豚形态与骑行动作。在3D射击游戏开发中,模型736行代码实现包含计分系统、物体碰撞检测的完整游戏引擎。


国产芯片紧急适配,构建自主AI生态

GLM-4.6发布当日,寒武纪、摩尔线程两大国产芯片厂商完成紧急适配。寒武纪实现FP8+Int4混合量化部署方案,在保持模型精度的同时降低60%推理成本。摩尔线程基于vLLM框架完成原生FP8精度适配,验证MUSA架构生态兼容性。


智谱同步升级GLM Coding Plan服务,推出20元包月套餐,以Claude 1/7的价格提供90%性能。企业版套餐支持10+主流编程工具,高频开发者可享三倍于Claude Max的用量。已订阅用户自动升级至GLM-4.6,新增图像识别等AI功能。

技术普惠加速,架构升级与生态协同并行

从GLM-4.5到GLM-4.6,智谱AI仅用两个月实现代际跨越,展现国产大模型技术迭代加速度。价格持续下探的同时,模型性能逼近国际顶尖水平,推动AI技术从实验室走向产业应用。

寒武纪、摩尔线程的快速适配,标志着国产AI芯片与大模型形成协同进化能力。这种深度整合不仅降低技术使用门槛,更为构建自主可控的AI基础设施奠定基础。随着「提质降价」趋势深化,国产AI技术有望在全球市场占据更重要地位。

体验地址:
https://chat.z.ai