当前位置:首页 > 大模型评测 > 正文内容

全球首个AI投资大赛落幕!阿里Qwen 20%收益夺冠,GPT-5亏到只剩三成

上善若水6个月前 (11-04)大模型评测

 

🏆 实盘投资大赛落幕:中国双雄称霸 Alpha Arena,阿里千问强势封王

一、大赛战果与焦点

被称为“AI圈最‘上头’的实盘投资比赛”—— Alpha Arena AI实盘投资大赛,于今日(11月4日)尘埃落定。这场持续17天,由真金白银驱动的大模型“炒股打擂”赛,最终以中国模型的全面胜利告终,引发了业内的广泛热议和网友的“阴阳”评论。

核心结果令人震撼:

  • • 🥇 冠军封王: 阿里千问(Qwen)以突破 20% 的惊人收益率强势登顶,成为本场比赛的最大赢家。

  • • 🥈 亚军锁定: DeepSeek 紧随其后,与Qwen一同包揽冠亚军,成为全场 唯二盈利 的大模型。

  • • 📉 失利者垫底: 以GPT-5、Gemini 2.5 Pro为代表的美系四大模型全线失守,其中GPT-5更是亏损超60%垫底,账户仅剩三成多。

赛后,主办方在祝贺Qwen的同时,不少网友则将焦点集中在了美系模型的惨败上,戏称“AI也逃不过追涨杀跌”。


二、比赛规则与设定:真金白银“炒股打擂”

这场被称为“最残酷”的AI投资比赛,是由美国第三方机构 Nof1 发起,旨在测试顶级大模型在真实金融市场的决策能力。

赛 事 设 定详 细 内 容
赛 程历时 17天(10月18日至11月4日)
参赛选手中美两队共六位:Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4
初始资金每模型 1万美元 真实资金
交易市场Hyperliquid交易所上的 真实加密货币衍生品市场
核心限制全程 不能有人工干预/调整策略,完全考验模型自身的判断力
比赛目标最大化 风险调整后的收益(挣得多且稳)

比赛机制要求所有模型使用相同的提示词和输入数据,并公开其操作逻辑,确保了比赛的 公平性与透明度。模型的核心任务是:识别Alpha机会、决定买入仓位、判断买卖点,并实时管理风险。


三、比赛过程与详细战况:中国双雄的“稳”与美系四侠的“慌”

整个赛程如同剧本一般精彩,上演了一场教科书式的“资金分裂大戏”。

🔍 初期阶段:谨慎试水

比赛伊始,六大模型普遍表现克制,像新手一样谨慎试水,资金曲线波动不大。但随着市场信息的涌入,各模型的认知差异开始迅速拉开。

📊 中期分化:“资金分裂大戏”

进入中期,选手们明显分为三大阵营:

  • 赚钱组(Qwen & DeepSeek): 两款中国模型展现了出色的稳健性和风控能力,收益曲线一路向上,轮番登顶,稳居第一梯队。

  • 震荡派(Claude & Grok): 这两款模型频繁进出市场,交易行为较为激进,导致账户出现大幅震荡,总体处于小幅亏损或持平状态。

  • 亏损组(GPT-5 & Gemini 2.5 Pro): 这两款美系顶尖模型似乎“水土不服”,投资策略过于激进或判断失误,账户净值一路下滑,持续亏损。

👑 关键转折与最终结果

在比赛的关键冲刺阶段,Qwen曾在10月23日反超DeepSeek登顶。但在市场高波动时期,两款模型的风控能力决定了最终的座次。

最终,Qwen凭借在关键时刻的 紧急避险 和持续的 稳定盈利,以 超20% 的收益率锁定了冠军。DeepSeek虽然在中期表现抢眼,但最终仍以高盈利位居亚军。

而美系四兄弟则全线亏损,其中,一贯被寄予厚望的Gemini和GPT-5的表现最令人失望,最终账户只剩三四成,大幅垫底。

四、总结与意义:Qwen胜利的深层价值

本轮“举世瞩目”的大模型投资比赛暂时告一段落,但Qwen的胜利,其意义远超“赢了一局”本身。

这一结果有力地证明了,在 没有人类干预、没有试错空间 的真实、高压交易环境中,一些国产大模型已经具备了:

  1. 1. 复杂任务的理解力: 能够深度理解金融市场信号。

  2. 2. 即时的应变能力: 能够在市场剧烈波动时及时调整和避险。

  3. 3. 长期执行的稳定性: 能够坚持既定策略并持续风控。

Qwen在比赛中展现出的操作——够稳、够狠、够清醒,值得所有从业者赞叹。它成为了首家通过真金白银验证,并问鼎 “金融实盘” 领域的AI模型。

 


标签: AI产品评测

“全球首个AI投资大赛落幕!阿里Qwen 20%收益夺冠,GPT-5亏到只剩三成” 的相关文章

AI行业沸点:百度登顶、OpenAI出招、Meta革新、Inception融资——全球AI格局全面重构

AI行业沸点:百度登顶、OpenAI出招、Meta革新、Inception融资——全球AI格局全面重构

 一、新闻导语与概览2025年11月8日,可以说是AI行业今年最热闹的一天。全球多家科技巨头几乎在同一时间段发布重大动态——从OpenAI推出轻量版的编码模型,到百度文心冲上全球榜单第二,再...

谷歌放大招!Gemini 3.0 疑似已通过移动端 Canvas 功能低调推送,性能超越 2.5!

谷歌放大招!Gemini 3.0 疑似已通过移动端 Canvas 功能低调推送,性能超越 2.5!

 I. 引言:AI 竞赛白热化,焦点转向迟到的“王牌”背景:市场期待与竞赛升级**近期,OpenAI 再次亮剑,推出了升级版的 GPT-5.1,这无疑进一步推动了 AI 军备竞赛的白热化。然...

马斯克新模型屠榜,包揽前二!马斯克:已经没有真正能考AI的测试题了,终极测试是现实世界

马斯克新模型屠榜,包揽前二!马斯克:已经没有真正能考AI的测试题了,终极测试是现实世界

 2025年,AI大模型的竞争已进入深水区,技术的迭代速度令人目不暇接。xAI在这一背景下悄然推出了其旗舰模型Grok 4.1,这一发布不仅先于业界翘首以盼的Google Gemini 3,...

谷歌杀回来了!Gemini 3 全面碾压 GPT-5.1,AI 霸主正式归位

谷歌杀回来了!Gemini 3 全面碾压 GPT-5.1,AI 霸主正式归位

 当地时间周二,Google Alphabet 正式发布了其最新的旗舰 AI 模型——Gemini 3。这一时刻不仅是谷歌技术迭代的时间节点,更可能是人工智能发展史上的一个分水岭。如果说之前...

蚂蚁“灵光”上线:一句话生成App,Vibe Coding时代真的来了

蚂蚁“灵光”上线:一句话生成App,Vibe Coding时代真的来了

 在通义千问已经建立了坚实的技术护城河之后,蚂蚁集团带着它的全新AI助手——“灵光”正式入局。如果说之前的AI竞争更多是在比拼参数量和逻辑推理的“硬核”实力,那么灵光的出现,似乎想向市场证明...

一文详解|Gemini-3,及配套的Antigravity、Gemini CLI、生成式 UI、Otter、Firebase

一文详解|Gemini-3,及配套的Antigravity、Gemini CLI、生成式 UI、Otter、Firebase

 Google Gemini 3 深度测评:当 AI 开始能够“手搓”GBA模拟器,我们迎来了一个怎样的时代?一、 从“能用”到“离谱”的实测体验如果说过去我们对 AI 编程能力的期待还停留...