Sora 2震撼发布：OpenAI视频生成迈入GPT-3.5时代

时间：2025-10-01 12:01:18　来源：澎湃新闻　作者：澎湃新闻

当地时间9月30日凌晨，人工智能领域迎来重磅消息——OpenAI正式发布新一代旗舰视频与音频生成模型Sora 2。发布会上，一段完全由Sora 2生成的2分01秒视频率先亮相，OpenAI CEO山姆·奥特曼与Sora负责人比尔·皮布尔斯（Bill Peebles）的虚拟形象现身，亲自演示新功能。

Sora 2发布会演示视频截图

物理模拟突破：从“幻想”到“真实”

据介绍，Sora 2解决了此前视频生成模型的两大痛点：物理规律失真与逻辑连贯性不足。例如，在模拟奥运体操动作时，Sora 2能精准呈现运动员在桨板上的后空翻，其浮力与刚性动力学计算接近真实；当虚拟猫抓取物体时，三周半旋转动作的物理轨迹与现实高度一致。相比之下，初代模型可能因“过度优化”指令，导致篮球未命中时球体瞬间传送至篮筐等荒诞场景，而Sora 2会真实呈现球体反弹路径。

可控性升级：多镜头指令与沉浸式音效

Sora 2在指令遵循能力上实现质的飞跃。它不仅能处理跨镜头的复杂指令（如连续切换场景时保持角色状态一致），还可生成高度真实的背景音景、语音及音效。更引人注目的是，用户可直接将现实元素（如人脸、物体）注入生成内容，为创作提供更大自由度。

从“GPT-1”到“GPT-3.5”：视频生成的里程碑

OpenAI将初代Sora模型比作视频领域的“GPT-1时刻”，而Sora 2则直接迈入“GPT-3.5阶段”。奥特曼在社交平台X发文称：“这如同创意领域的ChatGPT时刻，艺术与娱乐质量将迎来寒武纪式爆发。”

Sora App界面演示

Sora App同步上线：安全防护与个性化创作

伴随Sora 2发布的，还有一款由其驱动的Sora App。用户可通过应用创建音视频内容，在定制信息流中“刷视频”，并利用“客串”功能将自己或朋友融入视频场景。为保障青少年安全，App默认限制其每日生成内容数量，并严格管控客串权限。此外，App集成ChatGPT家长控制功能，配备自动化安全防护栈与人工审核团队，可快速处理欺凌等违规内容，同时防范深度伪造与非法信息传播。

推广计划与商业模式

目前，Sora 2仅限受邀用户使用，iOS端应用已开放下载，安卓端可通过网页访问，初期在美国、加拿大推广后将扩展至全球。基础功能免费且使用限制宽松，ChatGPT Pro用户可优先体验更高质量的Sora 2 Pro模型（后续上线App）。OpenAI计划通过API开放Sora 2，同时保留Sora 1 Turbo供用户使用，此前生成的内容将保留在库中。

OpenAI财务与战略布局曝光

据外媒报道，OpenAI上半年营收达43亿美元，同比增长16%，月收入超10亿美元，全年营收预计增至130亿美元。然而，其AI研发与ChatGPT运营成本高昂，同期消耗25亿美元资金，全年预计达85亿美元。截至报告期末，公司持有约175亿美元现金与证券。

在战略层面，OpenAI与英伟达达成合作，将使用数百万台GPU构建至少10GW的AI数据中心，英伟达还计划投资1000亿美元。此外，OpenAI首席财务官萨拉·弗莱尔透露，公司正推进员工股票二次出售，估值已达5000亿美元，并考虑未来上市。