扫描打开手机站
随时逛,更方便!
当前位置:首页 > 智创未来

全球首个AI投资大赛揭晓:阿里千问夺冠,美国四大模型集体亏损

时间:2025-11-04 16:03:01 来源:界面新闻 作者:界面新闻

记者 | 宋佳楠

11月4日,界面新闻从权威渠道获悉,全球首个AI大模型实时投资比赛“Alpha Arena”正式收官。这场持续17天的金融科技竞技中,阿里千问Qwen以超过20%的收益率斩获冠军,与DeepSeek共同成为唯二实现盈利的模型,而美国四大顶尖AI模型均出现亏损,其中GPT-5亏损幅度超60%位列末位。


真实金融战场:六大模型同台竞技

本次竞赛由美国金融AI实验室Nof1于10月18日发起,首次将AI大模型直接投入真实金融市场进行自动化交易对决。首季比赛邀请了GPT-5、Gemini 2.5 Pro、Grok 4、Claude 4.5 Sonnet、Qwen3 Max和DeepSeek V3.1六大主流模型,每个模型配备1万美元真实资金,在Hyperliquid交易所进行加密货币永续合约交易,全面检验其市场判断与交易能力。

为确保公平性,所有模型采用统一输入的市场数据和提示词,交易记录、持仓变化及账户价值实时公开。竞赛特别设置“模型对话”环节,允许AI通过模拟辩论展示决策逻辑,最终依据盈亏数据决出胜负。


中国模型领跑:实战能力获验证

比赛初期,六大模型均采取谨慎策略。约5天后逐渐形成三大阵营:阿里千问与DeepSeek交替领跑,始终占据第一梯队;Claude 4.5 Sonnet和Grok 4通过相似策略维持第二阵营,整体仍处亏损状态;GPT-5与Gemini 2.5 Pro则长期垫底,亏损幅度持续扩大。

截至北京时间11月4日比赛结束,阿里千问最终以超20%的收益率夺冠,DeepSeek实现盈利位列第二。反观海外模型,Claude 4.5 Sonnet、Grok 4、Gemini 2.5 Pro和GPT-5全部亏损,其中Gemini 2.5 Pro和GPT-5的最终持仓市值仅剩初始资金的三至四成。

开源生态助力中国AI崛起

行业专家指出,阿里千问与DeepSeek的实战表现,凸显了中国模型在解决复杂金融问题上的独特优势。AI对场景的深度理解能力,正成为大模型商业化落地的核心竞争力。

据全球大模型API聚合平台OpenRouter7月发布的榜单,DeepSeek与阿里通义千问已跻身全球前五,其中通义千问以10.4%的市场份额超越OpenAI(4.7%)位列第四。OpenRouter数据显示,当前成长最快的10大模型中有9个为开源项目,Qwen3-Coder以近500亿Tokens调用量高居榜首,通义千问系列包揽前三并在前十中占据五席。

开源战略缩小中美技术差距

零一万物CEO李开复在9月长江CEO返校日庆典上表示,DeepSeek对中国AI发展的核心贡献在于推动开源生态形成。他指出:“如果十年后回顾中国AI如何追赶美国,答案不是技术本身,而是开源带来的集体创新。”

自DeepSeek开源以来,国内已有数十家企业加入开源行列,形成“既开源、又比拼速度”的良性竞争。李开复认为,开源模式高度契合中国企业“快速学习-迭代优化”的特性,有望在AI领域加速缩小与美国的差距。

猜你喜欢