当前位置:首页 > 大模型评测 > 正文内容

全球首个AI投资大赛落幕!阿里Qwen 20%收益夺冠,GPT-5亏到只剩三成

上善若水3个月前 (11-04)大模型评测

 

🏆 实盘投资大赛落幕:中国双雄称霸 Alpha Arena,阿里千问强势封王

一、大赛战果与焦点

被称为“AI圈最‘上头’的实盘投资比赛”—— Alpha Arena AI实盘投资大赛,于今日(11月4日)尘埃落定。这场持续17天,由真金白银驱动的大模型“炒股打擂”赛,最终以中国模型的全面胜利告终,引发了业内的广泛热议和网友的“阴阳”评论。

核心结果令人震撼:

  • • 🥇 冠军封王: 阿里千问(Qwen)以突破 20% 的惊人收益率强势登顶,成为本场比赛的最大赢家。

  • • 🥈 亚军锁定: DeepSeek 紧随其后,与Qwen一同包揽冠亚军,成为全场 唯二盈利 的大模型。

  • • 📉 失利者垫底: 以GPT-5、Gemini 2.5 Pro为代表的美系四大模型全线失守,其中GPT-5更是亏损超60%垫底,账户仅剩三成多。

赛后,主办方在祝贺Qwen的同时,不少网友则将焦点集中在了美系模型的惨败上,戏称“AI也逃不过追涨杀跌”。


二、比赛规则与设定:真金白银“炒股打擂”

这场被称为“最残酷”的AI投资比赛,是由美国第三方机构 Nof1 发起,旨在测试顶级大模型在真实金融市场的决策能力。

赛 事 设 定详 细 内 容
赛 程历时 17天(10月18日至11月4日)
参赛选手中美两队共六位:Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4
初始资金每模型 1万美元 真实资金
交易市场Hyperliquid交易所上的 真实加密货币衍生品市场
核心限制全程 不能有人工干预/调整策略,完全考验模型自身的判断力
比赛目标最大化 风险调整后的收益(挣得多且稳)

比赛机制要求所有模型使用相同的提示词和输入数据,并公开其操作逻辑,确保了比赛的 公平性与透明度。模型的核心任务是:识别Alpha机会、决定买入仓位、判断买卖点,并实时管理风险。


三、比赛过程与详细战况:中国双雄的“稳”与美系四侠的“慌”

整个赛程如同剧本一般精彩,上演了一场教科书式的“资金分裂大戏”。

🔍 初期阶段:谨慎试水

比赛伊始,六大模型普遍表现克制,像新手一样谨慎试水,资金曲线波动不大。但随着市场信息的涌入,各模型的认知差异开始迅速拉开。

📊 中期分化:“资金分裂大戏”

进入中期,选手们明显分为三大阵营:

  • 赚钱组(Qwen & DeepSeek): 两款中国模型展现了出色的稳健性和风控能力,收益曲线一路向上,轮番登顶,稳居第一梯队。

  • 震荡派(Claude & Grok): 这两款模型频繁进出市场,交易行为较为激进,导致账户出现大幅震荡,总体处于小幅亏损或持平状态。

  • 亏损组(GPT-5 & Gemini 2.5 Pro): 这两款美系顶尖模型似乎“水土不服”,投资策略过于激进或判断失误,账户净值一路下滑,持续亏损。

👑 关键转折与最终结果

在比赛的关键冲刺阶段,Qwen曾在10月23日反超DeepSeek登顶。但在市场高波动时期,两款模型的风控能力决定了最终的座次。

最终,Qwen凭借在关键时刻的 紧急避险 和持续的 稳定盈利,以 超20% 的收益率锁定了冠军。DeepSeek虽然在中期表现抢眼,但最终仍以高盈利位居亚军。

而美系四兄弟则全线亏损,其中,一贯被寄予厚望的Gemini和GPT-5的表现最令人失望,最终账户只剩三四成,大幅垫底。

四、总结与意义:Qwen胜利的深层价值

本轮“举世瞩目”的大模型投资比赛暂时告一段落,但Qwen的胜利,其意义远超“赢了一局”本身。

这一结果有力地证明了,在 没有人类干预、没有试错空间 的真实、高压交易环境中,一些国产大模型已经具备了:

  1. 1. 复杂任务的理解力: 能够深度理解金融市场信号。

  2. 2. 即时的应变能力: 能够在市场剧烈波动时及时调整和避险。

  3. 3. 长期执行的稳定性: 能够坚持既定策略并持续风控。

Qwen在比赛中展现出的操作——够稳、够狠、够清醒,值得所有从业者赞叹。它成为了首家通过真金白银验证,并问鼎 “金融实盘” 领域的AI模型。

 


标签: AI产品评测

“全球首个AI投资大赛落幕!阿里Qwen 20%收益夺冠,GPT-5亏到只剩三成” 的相关文章

xAI 发布 Grok Code Remote:埃隆·马斯克推动云端代码执行新时代,直面 OpenAI 与 Anthropic

xAI 发布 Grok Code Remote:埃隆·马斯克推动云端代码执行新时代,直面 OpenAI 与 Anthropic

 在 AI 大模型领域的激烈竞争中,谁能率先赢得开发者的心,谁就掌握了未来的主动权。最近,由埃隆·马斯克(Elon Musk)领导的 xAI 似乎正在发起一场针对 OpenAI Codex...

震撼业界!Nano Banana 2 模型泄露曝光:AI图像生成迈入新纪元

震撼业界!Nano Banana 2 模型泄露曝光:AI图像生成迈入新纪元

 🍌 Nano Banana 2 图像生成模型泄露及其影响分析I. 事件背景与模型初次曝光过去一周,业内一则“意外泄露”事件几乎在创意科技圈迅速引爆。名为 Nano Banana 2 的图像...

阿里云通义大模型“爆发式实战”:14 亿次调用刷新“双11”AI新纪录!

阿里云通义大模型“爆发式实战”:14 亿次调用刷新“双11”AI新纪录!

 在刚刚过去的“双11”购物节中,除了创纪录的交易量,另一项令人瞩目的突破来自技术层面——阿里云通义系列大模型迎来了首次全面、实战级的大规模应用。这不仅是阿里巴巴在大模型领域的一次重要落地,...

谷歌 NotebookLM 推出“深度研究”:AI 助你 5 分钟构建专家级知识库,效率暴涨!

谷歌 NotebookLM 推出“深度研究”:AI 助你 5 分钟构建专家级知识库,效率暴涨!

 一、引言:暖心升级,告别碎片化学习11 月 13 日,科技巨头谷歌旗下的 AI 笔记工具 NotebookLM 迎来了一次值得所有内容创作者和研究人员关注的重大更新。这次升级的核心,是推出...

一张草图变网页,实测字节 TRAE SOLO,这些功能甚至比 Cursor 还好用

一张草图变网页,实测字节 TRAE SOLO,这些功能甚至比 Cursor 还好用

 AI 编程的痛点与国产方案的破局:打破“卡脖子”困境当前,AI 编程已从概念走向实用,普通用户能利用 AI 快速生成工具,专业开发者也在探索提升效率的极限。然而,我们国内开发者普遍面临一个...

AI图像巨变:告别“文盲”!Gemini 3 Pro如何让画面开始“识字”和“思考”?

AI图像巨变:告别“文盲”!Gemini 3 Pro如何让画面开始“识字”和“思考”?

 🍌 巨头的新魔术:当AI图像开始“识字”和“思考”一、 引言:能力超群与重要转折点Google 的 Gemini 3 Pro 图像生成能力一经推出,便接受了全球创作者和技术爱好者的“反复折...