当前位置:首页 > 大模型评测 > 正文内容

全球首个AI投资大赛落幕!阿里Qwen 20%收益夺冠,GPT-5亏到只剩三成

上善若水5个月前 (11-04)大模型评测

 

🏆 实盘投资大赛落幕:中国双雄称霸 Alpha Arena,阿里千问强势封王

一、大赛战果与焦点

被称为“AI圈最‘上头’的实盘投资比赛”—— Alpha Arena AI实盘投资大赛,于今日(11月4日)尘埃落定。这场持续17天,由真金白银驱动的大模型“炒股打擂”赛,最终以中国模型的全面胜利告终,引发了业内的广泛热议和网友的“阴阳”评论。

核心结果令人震撼:

  • • 🥇 冠军封王: 阿里千问(Qwen)以突破 20% 的惊人收益率强势登顶,成为本场比赛的最大赢家。

  • • 🥈 亚军锁定: DeepSeek 紧随其后,与Qwen一同包揽冠亚军,成为全场 唯二盈利 的大模型。

  • • 📉 失利者垫底: 以GPT-5、Gemini 2.5 Pro为代表的美系四大模型全线失守,其中GPT-5更是亏损超60%垫底,账户仅剩三成多。

赛后,主办方在祝贺Qwen的同时,不少网友则将焦点集中在了美系模型的惨败上,戏称“AI也逃不过追涨杀跌”。


二、比赛规则与设定:真金白银“炒股打擂”

这场被称为“最残酷”的AI投资比赛,是由美国第三方机构 Nof1 发起,旨在测试顶级大模型在真实金融市场的决策能力。

赛 事 设 定详 细 内 容
赛 程历时 17天(10月18日至11月4日)
参赛选手中美两队共六位:Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4
初始资金每模型 1万美元 真实资金
交易市场Hyperliquid交易所上的 真实加密货币衍生品市场
核心限制全程 不能有人工干预/调整策略,完全考验模型自身的判断力
比赛目标最大化 风险调整后的收益(挣得多且稳)

比赛机制要求所有模型使用相同的提示词和输入数据,并公开其操作逻辑,确保了比赛的 公平性与透明度。模型的核心任务是:识别Alpha机会、决定买入仓位、判断买卖点,并实时管理风险。


三、比赛过程与详细战况:中国双雄的“稳”与美系四侠的“慌”

整个赛程如同剧本一般精彩,上演了一场教科书式的“资金分裂大戏”。

🔍 初期阶段:谨慎试水

比赛伊始,六大模型普遍表现克制,像新手一样谨慎试水,资金曲线波动不大。但随着市场信息的涌入,各模型的认知差异开始迅速拉开。

📊 中期分化:“资金分裂大戏”

进入中期,选手们明显分为三大阵营:

  • 赚钱组(Qwen & DeepSeek): 两款中国模型展现了出色的稳健性和风控能力,收益曲线一路向上,轮番登顶,稳居第一梯队。

  • 震荡派(Claude & Grok): 这两款模型频繁进出市场,交易行为较为激进,导致账户出现大幅震荡,总体处于小幅亏损或持平状态。

  • 亏损组(GPT-5 & Gemini 2.5 Pro): 这两款美系顶尖模型似乎“水土不服”,投资策略过于激进或判断失误,账户净值一路下滑,持续亏损。

👑 关键转折与最终结果

在比赛的关键冲刺阶段,Qwen曾在10月23日反超DeepSeek登顶。但在市场高波动时期,两款模型的风控能力决定了最终的座次。

最终,Qwen凭借在关键时刻的 紧急避险 和持续的 稳定盈利,以 超20% 的收益率锁定了冠军。DeepSeek虽然在中期表现抢眼,但最终仍以高盈利位居亚军。

而美系四兄弟则全线亏损,其中,一贯被寄予厚望的Gemini和GPT-5的表现最令人失望,最终账户只剩三四成,大幅垫底。

四、总结与意义:Qwen胜利的深层价值

本轮“举世瞩目”的大模型投资比赛暂时告一段落,但Qwen的胜利,其意义远超“赢了一局”本身。

这一结果有力地证明了,在 没有人类干预、没有试错空间 的真实、高压交易环境中,一些国产大模型已经具备了:

  1. 1. 复杂任务的理解力: 能够深度理解金融市场信号。

  2. 2. 即时的应变能力: 能够在市场剧烈波动时及时调整和避险。

  3. 3. 长期执行的稳定性: 能够坚持既定策略并持续风控。

Qwen在比赛中展现出的操作——够稳、够狠、够清醒,值得所有从业者赞叹。它成为了首家通过真金白银验证,并问鼎 “金融实盘” 领域的AI模型。

 


标签: AI产品评测

“全球首个AI投资大赛落幕!阿里Qwen 20%收益夺冠,GPT-5亏到只剩三成” 的相关文章

谷歌 NotebookLM 推出“深度研究”:AI 助你 5 分钟构建专家级知识库,效率暴涨!

谷歌 NotebookLM 推出“深度研究”:AI 助你 5 分钟构建专家级知识库,效率暴涨!

 一、引言:暖心升级,告别碎片化学习11 月 13 日,科技巨头谷歌旗下的 AI 笔记工具 NotebookLM 迎来了一次值得所有内容创作者和研究人员关注的重大更新。这次升级的核心,是推出...

一张草图变网页,实测字节 TRAE SOLO,这些功能甚至比 Cursor 还好用

一张草图变网页,实测字节 TRAE SOLO,这些功能甚至比 Cursor 还好用

 AI 编程的痛点与国产方案的破局:打破“卡脖子”困境当前,AI 编程已从概念走向实用,普通用户能利用 AI 快速生成工具,专业开发者也在探索提升效率的极限。然而,我们国内开发者普遍面临一个...

李飞飞的世界模型来了!一句话生成3D世界,AI 真的开始理解现实了

李飞飞的世界模型来了!一句话生成3D世界,AI 真的开始理解现实了

 当地时间 2025 年 11 月 12 日,由“AI 教母”李飞飞创办的 World Labs 正式推出了其首款商用世界模型产品 Marble。这不仅是一次技术发布,它是世界模型(Worl...

Gemini 3.0 Pro模型卡曝光,多模态、知识库能力大幅超越GPT与Claude

Gemini 3.0 Pro模型卡曝光,多模态、知识库能力大幅超越GPT与Claude

 在AI大模型竞争白热化的当下,谷歌即将发布的Gemini 3.0 Pro无疑是业界最期待的事件之一。根据最新的泄露信息和性能指标,我们可以清晰地判断:Gemini 3.0 Pro绝非一次小...

仅7800美元!微博VibeThinker以15亿参数“吊打”6710亿巨头,大模型“参数迷信”彻底碎了?

仅7800美元!微博VibeThinker以15亿参数“吊打”6710亿巨头,大模型“参数迷信”彻底碎了?

 当全球科技巨头仍深陷于“参数竞赛”的狂热,试图通过堆砌千亿甚至万亿级参数来换取智能涌现时,一场旨在重塑AI发展路径的“非对称战争”已悄然打响。近日,微博正式发布了其首个自研开源大模型——V...

AI图像巨变:告别“文盲”!Gemini 3 Pro如何让画面开始“识字”和“思考”?

AI图像巨变:告别“文盲”!Gemini 3 Pro如何让画面开始“识字”和“思考”?

 🍌 巨头的新魔术:当AI图像开始“识字”和“思考”一、 引言:能力超群与重要转折点Google 的 Gemini 3 Pro 图像生成能力一经推出,便接受了全球创作者和技术爱好者的“反复折...