在投资领域,一个广为流传的经典方法论是“卖铲子”。回溯历史,加州淘金热中真正赚得盆满钵满的并非那些在河水中辛苦淘金的人,而是那些向淘金者提供必需工具和服务的人,比如售卖铲子、铁镐、牛仔裤,甚至提供住宿和贷款的人。据说,知名牛仔裤品牌“李维斯”便是借此契机起家的。
这一逻辑简单明了:淘金者可能空手而归,但只要有人淘金,铲子就总有市场。
在AI创业浪潮中,这一方法论同样适用。以“美股七姐妹”中的甲骨文和英伟达为例,它们将自己定位为“人工智能时代的基建”。在初创公司层面,AI编程工具Cursor的开发商Anysphere便是一个典型案例。今年6月,Anysphere完成了一轮规模达9亿美元的融资,领投方为Thrive Capital,其他投资方包括A16z、Accel和DST。随着融资金额的飙升,其估值也达到了惊人的99亿美元(约人民币711亿元),而此时距离公司成立仅三年。
这一惊人的成长速度再次印证了“AI”对当前技术范式的颠覆性影响,也给整个创投圈留下了一个清晰的命题:除了算力、电力、编程能力,AI时代还有哪些“铲子”?
在这一追问下,一个关键概念悄然兴起——“算子”(operator),又称“核函数”(kernel)。若将AI计算比作工厂中的高效生产线,每个算子便是一项精心设计的“工序”。基于这些工序,硬件单元能够高效、精准地完成来自上层模型、框架和应用的计算任务。优秀的算子能够合理拆解并执行任务,避免繁琐步骤与不必要延迟,充分利用硬件计算资源,极大加速AI计算的效率、响应速度与准确度。
随着近年来大模型能力的显著提升及其在工作生活中的广泛应用,“算子”的重要性日益凸显。行业专家普遍认为,“算子”是使芯片可用、好用的关键,也是实现软硬件深度结合、释放性能红利的钥匙。高效、自动化、智能化地开发高性能算子,帮助模型在芯片上发挥极致性能,进而推动智能算力落地惠及各行各业,已成为备受期待的潜在创业方向。
今天的主角——智子芯元,便是一家致力于将“算子开发”自动化,用AI加速AI,瞄准“铲子中的铲子”的团队。据投中网获悉,高性能算子自动发现与优化平台智子芯元宣布完成数千万元人民币种子轮融资,本轮由真格基金、英诺天使基金、松禾资本联合投资,后续由深蓝资本担任独家财务顾问。据悉,本轮资金将主要用于核心算法研发、算子自动化工具链产品化,并推动在头部国产算力生态的首批重点客户中落地应用。
成立2个月的“金铲铲”
与AI Coding明星公司Anysphere类似,找到“铲子”的智子芯元同样展现出惊人的成长速度。从公司成立到敲定真格、英诺、松禾的种子轮融资,整个过程仅用了2个月。其首款产品ModelBridge也在9月举办的2025华为全联接大会上亮相,并表现出卓越性能:

(产品示意图)
ModelBridge是一套基于昇腾的自动适配工具,能够将其他生态的模型推理代码自动转化为昇腾的CANN生态代码。简而言之,它帮助来自不同生态的产品更顺利、更快速地在昇腾系统上完成部署,实现丝滑应用。
具体表现方面,ModelBridge可在30分钟内从零开始完成Qwen3‑14B模型在昇腾Atlas硬件上的全自动适配与推理部署;仅需2小时即可将Qwen3-14B在昇腾上的单卡吞吐提升至28 token/s,比官方社区最新镜像(由双卡驱动)提升40%。这意味着,过去一支十人规模的开发团队需要数天完成的适配与调优,如今使用智子芯元的系统可提升至小时级甚至分钟级,实现了全自动算子与模型的适配和调优。
然而,与Anysphere面临的挑战相似,过快的成长速度容易让人忽略“造铲子”的难度。在Anysphere研发Cursor的过程中,最大的挑战在于开发环境各异,且开发需求多变、高度随机。若Anysphere仅推出一款通用型工具,需使用者根据具体需求大量调试,并在使用过程中付出大量精力进行结果优化,那本质上与“大数据时代”的“自动化产品”并无太大差别。
因此,在实际开发过程中,Cursor在产品路线上选择重点提升项目的全面理解能力和对话式交互界面。例如,Cursor的“智能代理模式 (Agent Mode)”可完成开发者给予的复杂指令——如在整个项目中实现身份验证功能——并自动执行这些变更,大幅节省时间。其自适应学习功能则不断感知团队和个人的编程风格,然后定制化地调整工作方向。
本质上,Cursor就是一个由AI扮演的“结对程序员”,它将人类的创造力与机器的精确性相结合。其模型上下文协议 (Model Context Protocol, MCP) 优化了AI的代码上下文理解能力,从而带来更智能、更准确的响应。
智子芯元面临的挑战更为复杂。在代码层面,普通代码多数时只需能跑通即可,而算子开发远不止于此。它不仅需要掌握更复杂的专用编程语言,且要深度结合算法与硬件,追求极致性能。算子优化需通过软硬件的深度协同来实现,因此要承受软硬鸿沟之大、更迭之快。这也直接导致传统人工算子开发因门槛高、耗时长而步履维艰。开发能力的紧缺使得“算子”这一本应是以软补硬的“救命稻草”,却成了比制程工艺更加紧迫的“致命短板”。
智子芯元提出的解决方案是:采用“AI+数学”的双轮驱动架构,将大模型的智能生成能力与运筹优化的数学推演能力深度融合,打造出一个高性能算子自动发现与优化平台。
这一平台打破了传统算子开发对人力的依赖,能够在复杂芯片架构上自动建模、搜索、优化算子算法,并不断自我演化,在算子开发效率上比起传统人工开发拉开代差,并且能创造出突破人类经验局限的极致性能算子。目前,该平台已在数学函数算子、矩阵乘法算子、供应链问题求解算子等多类算子上取得突破性成果,赋能AI系统与垂直领域计算加速。
智子芯元的团队由在大模型、运筹优化与高性能计算领域均处于世界前列的科研与工程人才组成:
根据公开资料显示,创始团队包含华为2012中央研究院“根技术领军”,一线大模型公司的合伙人(CTO)与顶尖科研院所科学家。此外,多位成员拥有 IMO/ICPC 金牌和AI领域顶尖学术成果,并且聘请了运筹优化领域的泰斗罗智泉院士为首席技术顾问。

(合影人从左到右依次为:丁添(智子芯元联合创始人)、林志航(智子芯元联合创始人)、陈罡(华为计算高校科研生态发展资深总监)、康迅(智子芯元联合创始人))
打破“CUDA”的护城河
随着晶体管密度的提升逼近物理极限,传统摩尔定律逐渐失效,硬件堆叠带来的性能红利正在枯竭。计算的极限正悄然转向软件加速的世界,而这场变革当前最耀眼的功勋无疑被英伟达与由它缔造的CUDA摘得。黄仁勋曾说:
“我们创立公司,是为了加速软件,芯片设计反而是次要的。英伟达之所以能快速创新,正是因为我们从底层算法出发,全面掌握计算系统。”
当前主流 AI 算子几乎均围绕英伟达CUDA生态构建。英伟达在软硬件上的先发优势和源源不断的生态投入,将CUDA打造成了当今人工智能开发的事实标准,吸引了近600万开发者自发的贡献算子。完备且深度优化的算子库使得英伟达的显卡在实际性能和使用体验上显著领先,进而再次强化CUDA生态的吸引力。也正是基于这层因素,其他芯片厂商很难有效对CUDA生态形成挑战,开发者们也难以避免地形成对CUDA生态的依赖。
最近几年,人工智能的蓬勃发展加速了软硬件的更新迭代。AI模型从语言、视觉一路扩展到行为与三维世界,从自动驾驶到具身智能,从生物医药到更广阔的AI for Science,新的模型架构层出不穷。每一个AI模型,最终都要落到算子上运行——它不只是连接底层芯片算力与上层模型算法的关键桥梁,而正成为模型自身的微观形态,带来一批更复杂、更关键的算子需求。
我们似乎能预见到,如果不做出改变,英伟达凭借CUDA生态强者恒强,而国产及非CUDA架构芯片始终难以挣脱困局。
智子芯元的出现,正是为了打破这种宿命,以突破性的开发范式,推动计算加速平权,帮助被隔绝在CUDA生态外的芯片产业链构建属于自己的算力生态。
而这或许是智子芯元将“智子”作为团队名称的一个原因:
在小说《三体》里,智子是三体人打造出来的人工智能,它能以基本粒子的形态存在,并可同时攻击地球上的大量基本粒子实验装置,使得实验数据出错,或者随机化,从而锁死地球的基础科学。当物理学家杨冬得知地球基础科学是被“智子”锁死的真相之后,她陷入了绝望的深渊。她毕生所坚信的“自然是客观的、可理解的”理念,在顷刻间被完全推翻。
可以想象的是,当算子自动化开发的逐步成熟,芯片设计终于不必顾虑于软硬件适配的鸿沟,不必苦恼于CUDA的生态霸权,或许那时真正能撼动英伟达霸主地位的新物种才会横空出世,进而推动已经涌动的AI产业进入一段真正的、更多样、更活跃的爆发期。
如同AI淘金热可能会因为某处矿脉枯竭短暂散去,普通的算力铲子也可能一时滞销,但如果手握的是能不断发掘“新矿藏”和不断提升“产出比”的金铲铲,这把“金铲铲”的所有者,极有可能成为新一轮淘金热的指挥官,且淘金者也不必担心“空军”,至少在这新一轮超越摩尔定律的指数级红利穷尽之前。