扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

谷歌Gemini 3发布:AI入口大战全面升级

时间:2025-11-21 11:35:00 来源:中国企业家杂志 作者:中国企业家杂志



段永平:现在市场上的大模型10年后能活下来的不会超过10%。谁会活下来?我会猜Gemini,因为谷歌很强大,而且已经醒了。

文|《中国企业家》记者 王怡洁

见习记者 孙欣

编辑|何伊凡见习编辑|李原

头图来源|视觉中国

蛰伏数月后,谷歌再次发力,推出Gemini 3模型,以近乎“全A”的成绩单震撼大模型圈。11月19日凌晨,谷歌正式发布新一代Gemini 3模型,在多模态、推理、Agent等核心领域的多项国际测试中全面领先,仅在编程能力测试中略逊于GPT-5.1和Claude Sonnet 4.5,其余项目均断档式领先。


Gemini 3在一系列关键AI基准测试中达到最先进水平。

其中,Humanity's Last Exam(HLE)被视为衡量AI解决人类顶尖难题能力的试金石,Gemini 3 Pro在此项测试中得分37.5%,远超GPT-5.1的26.5%和Claude Sonnet 4.5的12.7%。模型发布后,谷歌美股股价一度上涨5.8%,市值突破3.5万亿美元,创历史新高。

OpenAI CEO山姆·阿尔特曼罕见地对谷歌表示赞赏:“这看起来是一个很棒的模型。”而在一年前,阿尔特曼还曾直接嘲讽谷歌的Gemini产品,甚至质疑其发布会布置。然而,今年5月的开发者大会上,谷歌凭借十余种“AI万花筒”产品强势回击,如今Gemini 3的发布更表明谷歌已重新找回技术节奏。

谷歌CEO皮查伊多次强调:“谷歌已不再将自己视为一家搜索公司,而是要成为下一代计算平台的创建者。”2025年,谷歌的搜索、安卓系统、Chrome浏览器、YouTube、硬件乃至手机等核心业务,均围绕基座大模型Gemini进行重构,年资本开支高达900亿美元,工程资源全面向模型倾斜。

基座模型迭代的同时,谷歌还披露了一个关键数据:谷歌浏览器的AI模式月活跃用户已达20亿。这意味着,谷歌正利用其庞大的生态系统,从模型到应用全面重塑AI话语权。

谷歌的全栈布局也引发了行业连锁反应,国内外围绕AI入口的争夺战全面打响。OpenAI上线桌面浏览器并强势进军搜索功能;阿里千问App回归,瞄准ChatGPT入局AI to C;字节通过豆包探索电商新入口;腾讯则计划将微信打造为AI Agent,帮助用户完成内部任务。

几天前,伯克希尔-哈撒韦公司披露的今年三季度持股报告显示,巴菲特在退休前首次建仓买入谷歌。段永平在接受采访时也表示:“现在市场上的大模型很多,10年后能活下来的大概率不会超过10%。我会猜Gemini,因为背后的谷歌很强大,而且已经醒了。”

模型屠榜,应用升级

Gemini 3发布前,谷歌态度低调。2025年11月初,皮查伊在公司财报电话会议上谨慎表示:“前沿大模型的开发需要更多时间,Gemini 3预计不会让人们立刻看到突破性进展。”

然而,结果却令人震惊。据Model Card测试数据,Gemini 3成绩几乎全面碾压当前所有主流大模型;在开放评测平台LMArena上,Gemini 3 Pro以1501分位居通用模型榜首。在博士级科学问答GPQA Diamond上,Gemini 3 Pro成绩为91.9%;数学难题集MathArena Apex上创造23.4%的新纪录;SimpleQA Verified(强调事实性与复杂问答准确度的测试)成绩为72.1%,幻觉率和知识错误率显著降低;在ARC-AGI-2(推理测试)中,成绩为31.1%,而上一代Gemini 2.5 Pro的该项成绩还不到5%。

Gemini 3在多模态的表现同样惊艳。目前,多模态模型上有两项“终极试题”:MMMU-Pro和Video-MMMU,Gemini 3 Pro在这两项的成绩分别为81%和87.6%,创下历史最高纪录。在Agentic Coding上,Gemini 3 Pro在SWE-Bench Verified的成绩比GPT-5.1和Claude Sonnet 4.5分别仅差0.1%、0.9%。

某种程度上,Gemini 3是谷歌第一款给OpenAI构成实质性威胁的模型——它并非以某一项能力出圈,而是在多模态、推理、Agent这三条最难突破的线路上,全线抵达行业天花板。


来源:谷歌开发者公众号

谷歌的反攻不仅限于基座模型,应用层也全面爆发。正是基座模型的能力跨越,为应用页面和交互方式的迭代提供了关键基础。2022年,ChatGPT将行业带入小助手式“对话优先”的交互世界。然而,Gemini新版应用不再是单一对话框——用户发出自然语言请求后,模型并非直接生成答案,而是即时生成一个结构化的、视觉化的界面,用户可以和AI共同操作。

这也让AI跳出了“小助手”的角色,开始和用户共享一个可操作的工作环境,向着真正的“工作伙伴”发展。据悉,Gemini 3将被整合进Gemini应用、谷歌的AI搜索产品AI Mode和AI Overviews,以及企业级产品。

谷歌如何找回节奏?

谷歌在AI上的爆发可以说是“后发先至”。2022年11月底,ChatGPT燃爆硅谷后,同年12月6日,谷歌推出了Gemini 1.0。此后,谷歌的AI研发进程一直不温不火。

模型开发滞后之下,OpenAI、Perplexity、Anthropic等对谷歌的搜索市场虎视眈眈。2024年底,谷歌搜索市场份额首次跌破90%。“大企业病”“掉队”“落伍”曾是外界诟病谷歌的形容词。但谷歌通过对关键技术团队的成功整合,再度找回了自己的研发节奏与产品高度。

2023年4月,谷歌宣布将Google Brain和DeepMind合并,由DeepMind创始人戴米斯·哈萨比斯执掌。此前,两支团队都做出过骄人战绩:Brain创造了Transformer架构,DeepMind则拿出过震惊世界的AlphaGo。

“一山不容二虎”的故事没有在谷歌发生。团队合并后,虽然带头人是哈萨比斯,但Google Brain的联合创始人杰夫·迪恩仍然担任首席科学家。2024年底,在团队的共同努力下,Gemini模型顺利完成了迭代。

接下来,谷歌更力出一孔。到2025年5月,皮查伊在I/O开发者大会上,大胆打破了谷歌搜索的立命之本:“搜索框不重要了,Google要做你的AI助理,直接替你把事办了。”

大会上,谷歌共宣布了23项功能更新,覆盖了AI模型、视觉生产、谷歌搜索、Agent系统、AI眼镜、生态等几乎所有与AI相关的领域。

AI颠覆搜索后,谷歌的野心也被放到了下一代计算平台:其自研了TPU提供底层算力支持;用安卓与Chrome构成交互前台,Workspace承接具体任务执行;YouTube打造流媒体资产,为Gemini在多模态能力上奠定基础。此外,Gmail、Google Docs等成熟应用也逐步被注入AI功能。

Gemini 3的发布会上,谷歌宣布其浏览器AI模式的月活跃用户已达20亿,其中Gemini应用月活用户达6.5亿。皮查伊称:“令人惊叹的是,仅仅两年时间,AI已从单纯处理文本和图像,发展到能够读懂场景。从今天起,Gemini将在谷歌全系产品中全面铺开。”

入口大战开打

谷歌的系统性进击,也意味着AI新入口大战已经打响。AI角逐已从基模大战、技术竞速,转向了关乎下一个10年势力版图的场景落地竞争。

下一代入口在哪里?在移动互联网时代,得流量者胜出。但未来如果把答案扩展到“谁能帮用户解决问题”的效用之争,机会又重新在巨头面前摊平。

某种程度上,谷歌的全栈出击,也是阿里正在尝试“复刻”的道路。周靖人在云栖大会后,对《中国企业家》等媒体表示:阿里云是全球少数几家在大模型和云计算方面都能够做到全栈自研、联合创新的公司。

11月17日,阿里千问App公测版亮相,直接瞄准AI to C入口,计划打造会聊天、能办事的个人AI助手,并整合了阿里全生态的服务能力。次日,蚂蚁集团发布全模态通用AI助手“灵光”,用户可以在30秒内,生成可交互、可编辑、可分享的“闪应用”。这些都昭示着阿里准备抓住“生产力入口”的野心。

在不久前的2025年第三季度财报会上,腾讯集团总裁刘炽平亦明确表示:微信最终将成为一个AI Agent,帮助用户在微信内部完成大量任务。字节豆包则在流量加持下,正在从生态渗透,走向工具赋能,与抖音、剪映深度绑定,将豆包变为字节的生产力引擎。

最近,OpenAI已经将更多目光投向了企业服务与垂直场景落地。今年上半年,OpenAI实现43亿美元营收,其中消费者与企业订阅占据大头。

一位海外文旅开发从业者对《中国企业家》表示:他在使用了国内外多项大模型后,感到GPT-5在上下文理解层面,明显具备优势。“虽然我们海外数据相对匮乏,但因为ChatGPT好用,海外系统反而更容易做。”

不过,靠旧地图未必能拿到新船票。AI时代的赢家,不只属于技术领先者,或者有能力“大水漫灌”的超级App拥有者,更是能理解用户需求、将技术转化为解决问题能力,能将AI与行业场景深度绑定,对AGI有更透彻理解和追求的企业。