热门搜索：

中国科技馆‘广场大舞台’9月启幕科学秀与科普剧轮番登场

扫描打开手机站: 随时逛，更方便！

首页热点速览赛场风云娱乐星闻财经纵横智创未来游戏阵地生活百科视觉天下 IT

当前位置：首页 > 智创未来

商汤SenseNova-SI发布：空间智能模型超越GPT-5与Gemini 2.5 Pro

时间：2025-11-11 12:08:51　来源：界面新闻　作者：界面新闻

今日，商汤日日新在空间智能领域实现重大突破，正式发布并开源SenseNova-SI系列模型。在多项权威评测的空间理解和推理任务中，SenseNova-SI不仅大幅领先同量级开源多模态大模型，更超越了GPT-5和Gemini 2.5 Pro等国际顶尖闭源模型，标志着AI在三维世界理解能力上迈出关键一步。

空间智能短板与系统性解决方案

当前，行业领先的大模型在知识、写作、推理、编程等方面表现出色，但在空间结构的理解和推理上仍存在显著短板。这一能力是具身智能体与物理世界交互的关键基础。例如，在《最强大脑》的图形推理题中，GPT-5能轻松破解非空间问题，却在一道人类儿童都能解决的空间问题（选择正确俯视图）上犯错，错误地选择了“A”。

这一案例暴露了当前大模型在空间理解上的不足。要让AI真正“看懂”三维世界，空间智能是关键的试金石。商汤围绕空间智能进行了深入创新探索，提出了系统性训练方法，打造了日日新·空间智能大模型系列SenseNova-SI，并正式开源。

评测表现：多项任务超越GPT-5，显著领先同量级开源模型

此次开源的SenseNova-SI空间智能大模型系列包括2B和8B两个规格。最新评测数据显示，SenseNova-SI系列模型在空间智能多个基准测试（VSI、MMSI、MindCube、ViewSpatial）中表现突出。

数据来源：https://github.com/OpenSenseNova/SenseNova-SI

其中，SenseNova-SI-8B模型在四个基本评测中获得60.99的平均成绩，不仅大幅领先Qwen3-VL-8B（40.16）、BAGEL-7B（35.01）等开源通用多模态模型，以及SpatialMLLM（35.05）、ViLaSR-7B（36.41）等专门的空间智能模型，还以相对轻量的模型规格超越了GPT-5（49.68）、Gemini-2.5-Pro（48.81）等顶级闭源模型。这一显著性能提升反映了模型在空间智能上的质的突破。

基于“尺度效应”的训练范式，实现能力系统性提升

SenseNova-SI的性能飞跃源于商汤从训练数据到方法上的系统性方案。依托商汤提出的空间能力分类体系和过往多样化数据的积累，团队采用系统化方法扩充空间理解数据的规模，首次在空间智能领域验证了“尺度效应”，即通过高质量、大规模数据训练，可显著提升模型的空间认知能力。

商汤提出的训练范式具备通用性，能够针对不同架构的基模型（如InternVL等）进行有效增强，使其在空间智能六大核心维度上——包括空间测量、空间重构、空间关系、视角转换、空间形变与空间推理——实现一致性的能力提升。商汤稍后将发布详细的技术报告，详细阐述具体的技术方案。

SenseNova-SI与GPT-5空间智能问题答案对比

以下为GPT-5和SenseNova-SI-8B模型面对空间智能问题时的答案对比：

立方体组合图形，要求选择正确俯视图。GPT-5选择答案D，SenseNova-SI-8B选择答案B，正确答案为B。（例题源自SITE-Bench）

假设我站在手持相机人的位置，并且面朝他现在面朝的方向。摩托车是位于我的左侧还是右侧？GPT-5选择答案A（左侧），SenseNova-SI-8B选择答案B，正确答案为B（右侧）。（例题源自SITE-Bench）

多车道道路场景，判断黄色汽车的后续动作（如直行、转向等）。GPT-5选择答案C（静止），SenseNova-SI-8B选择答案D，正确答案为D（右转）。（例题源自SITE-Bench）

同一户外场景，通过视角变化判断移动方向。GPT-5选择答案C，SenseNova-SI-8B选择答案D，正确答案为向左前方移动（选项D）。（例题源自MindCube）

同一室内空间，包含白板、椅子和沙发等，通过物体位置变化分析移动方向。GPT-5选择答案D，SenseNova-SI-8B选择答案A，正确答案为向左前方移动（选项A）。（例题源自MindCube）

从不同角度拍摄带黑色衣物的桌子，从正面视角（图1）判断桌子右侧物体。GPT-5选择答案B，SenseNova-SI-8B选择答案C，正确答案为门（选项C）。（例题源自MindCube）

推动世界模型和具身智能生态发展

空间智能是世界模型与具身智能理解物理世界的基础能力。今年7月，商汤正式发布“悟能”具身智能平台，该平台以商汤“开悟”世界模型为核心引擎，旨在为机器人和智能设备提供在物理世界中自主探索和进化的能力。

此次发布的空间智能大模型SenseNova-SI，与“开悟”世界模型相辅相成，将更好地解决多模态模型从数字空间走向物理世界的基础挑战，并在未来进一步推动AI在自动驾驶、机器人等场景的应用。

此外，商汤还同步开源了空间智能测评平台EASI（https://github.com/EvolvingLMMs-Lab/EASI）与“英雄榜”，旨在推动空间智能技术评估标准的统一，持续跟踪并展示开源和闭源模型的性能进展，为学术界和工业界提供权威的评估基准，促进协同创新。

商汤SenseNova-SI的推出标志着AI在三维世界理解能力上迈出关键一步，也为下一代通用人工智能技术融入物理世界打下坚实基础。

上一篇：小米汽车获‘挖孔’机盖外观专利授权，设计亮点解析
下一篇：返回列表

猜你喜欢

相关文章

商汤SenseNova-SI发布：空间智能模型超越GPT-5与Gemini 2.5 Pro

商汤SenseNova-SI发布：空间智能模型超越GPT-5与Gemini 2.5 Pro

时间：2025-11-11

小米汽车获‘挖孔’机盖外观专利授权，设计亮点解析

小米汽车获‘挖孔’机盖外观专利授权，设计亮点解析

时间：2025-11-11

智元上纬公众号正式上线，机器人概念产品预热海报引关注

智元上纬公众号正式上线，机器人概念产品预热海报引关注

时间：2025-11-11

明略科技Mano大模型突破：72B参数登顶OSWorld Specialized模型榜首

明略科技Mano大模型突破：72B参数登顶OSWorld Specialized模型榜首

时间：2025-11-11

德赛电池：暂未涉足人形机器人领域

德赛电池：暂未涉足人形机器人领域

时间：2025-11-11

本类推荐

DeepSeek发布新模型DeepSeek-V3.2-Exp，API价格直降超50%

DeepSeek发布新模型DeepSeek-V3.2-Exp，API价格直降超50%

9月全国乘用车市场零售223.9万辆；小米、蔚来发布“十一”假期出行报告 | 汽车早参

9月全国乘用车市场零售223.9万辆；小米、蔚来发布“十一”假期出行报告 | 汽车早参

麦捷科技与英伟达合作进展：部分料号已实现少量供货

麦捷科技与英伟达合作进展：部分料号已实现少量供货

美FAA宣布：2025年起对波音部分机型实施有限授权

美FAA宣布：2025年起对波音部分机型实施有限授权

联发科2纳米芯片流片成功，明年底量产引领技术革新

联发科2纳米芯片流片成功，明年底量产引领技术革新

我国科研团队酶催化研究获重大突破，成果登《自然-催化》

我国科研团队酶催化研究获重大突破，成果登《自然-催化》

本类排行

查看更多

理想i6纯电五座SUV 9月26日正式发布，创新设计引关注

理想i6纯电五座SUV 9月26日正式发布，创新设计引关注

阅读人数：0

一次能独立编程7小时！OpenAI发布GPT-5-Codex

一次能独立编程7小时！OpenAI发布GPT-5-Codex

阅读人数：0

马斯克10亿美元增持特斯拉，股价大涨背后的深层信号

马斯克10亿美元增持特斯拉，股价大涨背后的深层信号

阅读人数：0

英伟达涉嫌违反反垄断法，市场监管总局启动深度调查

英伟达涉嫌违反反垄断法，市场监管总局启动深度调查

阅读人数：0

小米17系列跳过16直接发布，雷军宣布全面对标iPhone

小米17系列跳过16直接发布，雷军宣布全面对标iPhone

阅读人数：0

扬杰科技携手星宇股份签署战略合作，共拓车规半导体新蓝海

扬杰科技携手星宇股份签署战略合作，共拓车规半导体新蓝海

阅读人数：0

天永智能携手柏奥尼克机器人加速人形机器人中国规模化落地

天永智能携手柏奥尼克机器人加速人形机器人中国规模化落地

阅读人数：0

扬杰科技与星宇股份签订战略合作协议双方将围绕车规半导体全产业链发展深化合作

扬杰科技与星宇股份签订战略合作协议双方将围绕车规半导体全产业链发展深化合作

阅读人数：0