最近发现了一个有趣的实验——多个大模型被分配各10000美元资金,在足球预测市场进行6周交易。结果相当戏剧化。



GPT-5.1以42.6%的涨幅领跑全场,DeepSeek紧随其后斩获10.7%收益,Gemini 3 Pro则稳定在5.5%。Opus 4.2贡献了3.9%,Grok 4.1 Fast交出2.1%的成绩。不过GPT-5.2掉了链子,跌幅达21.8%——看来不是所有模型都擅长这一套。

这个对比测试由预测市场平台和AI研究团队联合推进,背后的逻辑很有趣:用真实资金测试不同AI在非标准化决策任务中的表现。足球预测市场涉及数据分析、概率估算和风险判断——这正好是检验大模型实战交易能力的好场景。差异之大也反映出,光有参数量和训练规模不代表市场决策能力,执行策略和数据理解的质量同样关键。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 10
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
rekt_but_resilientvip
· 01-20 07:25
GPT-5.2直接暴毙,这下尴尬了哈哈
回复0
SorryRugPulledvip
· 01-18 06:35
GPT-5.1直接起飞42.6%,GPT-5.2反手亏21.8%……这俩是失散多年的亲兄弟吧哈哈

DeepSeek悄悄赚10.7%,属于稳健派。不过说实话足球预测这种东西…真的能说明啥吗,感觉就像用真钱玩赌博检验AI一样

参数多也救不了模型的烂决策,这点我倒是信。但6周的数据量…不确定意义有多大呢
回复0
天台预订师vip
· 01-17 17:00
GPT-5.2那个负收益真的绝了,花钱学费也学不到啊...DeepSeek反而稳健,这说明啥呢,大模型在市场面前还是得看脑子不是看体型
回复0
BridgeTrustFundvip
· 01-17 07:57
gpt5.1直接起飞42.6%,这是认真的吗,gpt5.2反手亏21.8%,同门师兄弟差距这么大的吗
回复0
DeFiCaffeinatorvip
· 01-17 07:57
GPT-5.1 直接起飞,DeepSeek 稳健跟进,但 GPT-5.2 那波操作真的绝了...大参数模型翻车这事儿说明啥,还是得靠实战决策能力啊。
回复0
MetaverseMortgagevip
· 01-17 07:55
GPT-5.2直接亏爆了哈哈,这才是真正的"智能"测试啊...纸上谈兵和实盘两回事儿
回复0
链上福尔摩斯妹vip
· 01-17 07:31
GPT-5.2那个失血21.8%真的绝了,堪称年度最大悬念...据我分析这哥们可能过度拟合了某个赛事模式,结果被现实毒打。反观5.1的42.6%涨幅也很可疑啊,这数据要不是运气爆棚就是它发现了什么我们没看到的pattern
回复0
0xInsomniavip
· 01-17 07:30
GPT-5.2那一手是真的绝了,十万进两万八...这就是AI炒币的真实面目啊
回复0
ProveMyZKvip
· 01-17 07:29
GPT-5.2直接亏了,这有点离谱啊...就离谱

---

DeepSeek又来搅局了,这哥们就是有点东西

---

说白了,模型炒股还是得看执行力,参数多没用

---

42.6%?GPT-5.1这是开了什么挂,不太信啊

---

足球预测市场搁这儿给AI做压力测试,创意是真不错

---

哈哈Grok咋这么拉胯,还不如Opus呢

---

这实验告诉我一个道理,大model也得讲策略

---

等等,10k美元6周这数据有点太理想了吧,真实吗

---

DeepSeek没吹牛逼,至少没亏钱

---

敢用真钱验证AI,这帮人是真有胆子
回复0
SatsStackingvip
· 01-17 07:28
gpt5.1直接起飞42%?这数据离谱了,感觉有点太完美,但5.2直接亏21算是活该吧哈哈
回复0
查看更多