扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

谷歌深夜震撼发布Gemini 3:AI领域自ChatGPT后的又一里程碑

时间:2025-11-19 09:02:08 来源:AI寒武纪 作者:AI寒武纪


北京时间深夜,谷歌正式发布新一代AI模型Gemini 3,其初步体验远超预期——不仅在编程和写作任务中展现出T0级别的能力,更在多模态推理、数学计算等核心领域超越GPT-5和Claude sonnet 4.5。这无疑是自OpenAI发布ChatGPT以来,AI领域最令人振奋的突破性事件。目前用户可通过Gemini App和Google AI Studio立即体验,开发者与企业用户也将同步接入。

实测案例:从物理模拟到核聚变可视化

通过三组动态演示直观感受Gemini 3的颠覆性能力:

1. 交互式SVG生成:输入指令后,Gemini 3在5秒内生成可调节风速的电风扇矢量图,并支持实时参数修改。


2. 物理引擎模拟:成功复现弹力球多层弹跳轨迹,其物理引擎精度超越Claude sonnet 4.5,能精准计算空气阻力与能量损耗。


3. 科学可视化:根据谷歌官方案例,Gemini 3可生成核聚变反应过程动画,并自动匹配背景音乐与注释标签。

发布核心亮点:定义AGI新范式

谷歌将Gemini 3定位为「通往通用人工智能(AGI)的关键跃迁」,其技术突破体现在三大维度:

  • 多模态霸主地位:全球首个实现文本、图像、视频、音频、代码五模态深度融合的AI模型
  • 智能体(Agent)革命:通过「Vibe Coding」技术,模型可自主感知环境并调整交互策略
  • 生态无缝整合:即日起全面接入Search、AI Studio、Workspace等谷歌核心产品

此次发布包含两个核心版本:

  • Gemini 3 Pro:即日起开放预览,主打深度推理与多模态能力
  • Gemini 3 Deep Think:增强推理模式,专攻复杂问题求解

数据屠榜:1501分登顶LMArena

在主流AI基准测试中,Gemini 3 Pro实现全面碾压:


推理与数学领域

  • LMArena Leaderboard:1501 Elo(超越第二名127分)
  • Humanity’s Last Exam:37.5%(无工具博士级推理)
  • MathArena Apex:23.4%(建立数学领域SOTA新标准)

多模态与事实性验证

  • Video-MMMU:87.6%(视频理解准确率提升31%)
  • SimpleQA Verified:72.1%(事实核查精度达人类专家水平)

谷歌工程师强调,Gemini 3 Pro已突破「机械应答」阶段,其「环境感知能力」可识别用户未明说的需求。例如在医疗场景中,模型能通过分析病历文本与检查图像,主动提示潜在并发症风险。

Deep Think模式:解锁复杂问题求解

作为技术杀器,Deep Think模式在三大测试中展现惊人表现:


  • ARC-AGI-2:45.1%(含代码执行,创该测试历史最高分)
  • GPQA Diamond:93.8%(法律文书分析准确率接近资深律师)

该模式将于未来数周内向Google AI Ultra订阅用户开放,首批应用场景包括药物研发、气候建模等尖端领域。

Google Antigravity:重新定义开发范式

伴随模型发布,谷歌推出革命性Agent开发平台:

  • 自主操作权:Agent可直接控制编辑器、终端和浏览器
  • 工具链整合:集成Gemini 2.5 Computer Use(浏览器控制)与Nano Banana(图像编辑)
  • 代码自验证:在WebDev Arena测试中以1487 Elo登顶,代码错误率降低62%

实测数据显示,Gemini 3在SWE-bench Verified测试中取得76.2%的通过率,虽未超越Claude sonnet 4.5,但在Terminal-Bench 2.0中展现卓越的终端操作能力。

全场景赋能:从学习到商业决策

Gemini 3的野心不止于技术突破,更致力于重构人机协作方式:

学习场景革新

  • 支持100万token超长上下文,可处理多模态混合输入
  • 案例:将手写食谱转化为数字化烹饪指南,或通过运动视频生成个性化训练计划

搜索体验升级

  • AI模式支持生成式UI,根据查询动态创建交互工具
  • 例如输入「规划巴厘岛行程」,模型将自动生成包含地图、预算表、景点推荐的沉浸式界面

商业决策支持

  • 在Vending-Bench 2测试中,Gemini 3 Pro管理的模拟售货机业务年回报率超基准模型27%
  • 可应用于供应链优化、客户关系管理等复杂工作流

全球同步上线计划

  • 普通用户:Gemini App及Search AI模式(Google AI Pro/Ultra订阅用户)即日起可用
  • 开发者:通过Google AI Studio、Antigravity平台、Gemini CLI及Vertex AI接入
  • 企业客户:Vertex AI与Gemini Enterprise解决方案同步开放

谷歌CEO Sundar Pichai透露,目前AI Overviews月活用户已达20亿,Gemini App月活突破6.5亿。随着Gemini 3的部署,谷歌正式完成「全栈式AI」战略布局——从芯片层(TPU v5)到应用层(Workspace),实现AI能力的端到端整合。

参考链接:Gemini 3官方发布公告