扫描打开手机站
随时逛,更方便!
当前位置:首页 > 财经纵横

Sora 2震撼发布:OpenAI视频生成迈入GPT-3.5时代

时间:2025-10-01 12:01:18 来源:澎湃新闻 作者:澎湃新闻

当地时间9月30日凌晨,人工智能领域迎来重磅消息——OpenAI正式发布新一代旗舰视频与音频生成模型Sora 2。发布会上,一段完全由Sora 2生成的2分01秒视频率先亮相,OpenAI CEO山姆·奥特曼与Sora负责人比尔·皮布尔斯(Bill Peebles)的虚拟形象现身,亲自演示新功能。

Sora 2发布会演示视频截图

物理模拟突破:从“幻想”到“真实”

据介绍,Sora 2解决了此前视频生成模型的两大痛点:物理规律失真逻辑连贯性不足。例如,在模拟奥运体操动作时,Sora 2能精准呈现运动员在桨板上的后空翻,其浮力与刚性动力学计算接近真实;当虚拟猫抓取物体时,三周半旋转动作的物理轨迹与现实高度一致。相比之下,初代模型可能因“过度优化”指令,导致篮球未命中时球体瞬间传送至篮筐等荒诞场景,而Sora 2会真实呈现球体反弹路径。

可控性升级:多镜头指令与沉浸式音效

Sora 2在指令遵循能力上实现质的飞跃。它不仅能处理跨镜头的复杂指令(如连续切换场景时保持角色状态一致),还可生成高度真实的背景音景、语音及音效。更引人注目的是,用户可直接将现实元素(如人脸、物体)注入生成内容,为创作提供更大自由度。

从“GPT-1”到“GPT-3.5”:视频生成的里程碑

OpenAI将初代Sora模型比作视频领域的“GPT-1时刻”,而Sora 2则直接迈入“GPT-3.5阶段”。奥特曼在社交平台X发文称:“这如同创意领域的ChatGPT时刻,艺术与娱乐质量将迎来寒武纪式爆发。”

Sora App界面演示

Sora App同步上线:安全防护与个性化创作

伴随Sora 2发布的,还有一款由其驱动的Sora App。用户可通过应用创建音视频内容,在定制信息流中“刷视频”,并利用“客串”功能将自己或朋友融入视频场景。为保障青少年安全,App默认限制其每日生成内容数量,并严格管控客串权限。此外,App集成ChatGPT家长控制功能,配备自动化安全防护栈与人工审核团队,可快速处理欺凌等违规内容,同时防范深度伪造与非法信息传播。

推广计划与商业模式

目前,Sora 2仅限受邀用户使用,iOS端应用已开放下载,安卓端可通过网页访问,初期在美国、加拿大推广后将扩展至全球。基础功能免费且使用限制宽松,ChatGPT Pro用户可优先体验更高质量的Sora 2 Pro模型(后续上线App)。OpenAI计划通过API开放Sora 2,同时保留Sora 1 Turbo供用户使用,此前生成的内容将保留在库中。

OpenAI财务与战略布局曝光

据外媒报道,OpenAI上半年营收达43亿美元,同比增长16%,月收入超10亿美元,全年营收预计增至130亿美元。然而,其AI研发与ChatGPT运营成本高昂,同期消耗25亿美元资金,全年预计达85亿美元。截至报告期末,公司持有约175亿美元现金与证券。

在战略层面,OpenAI与英伟达达成合作,将使用数百万台GPU构建至少10GW的AI数据中心,英伟达还计划投资1000亿美元。此外,OpenAI首席财务官萨拉·弗莱尔透露,公司正推进员工股票二次出售,估值已达5000亿美元,并考虑未来上市。