Gate Booster 第 4 期:发帖瓜分 1,500 $USDT
🔹 发布 TradFi 黄金福袋原创内容,可得 15 $USDT,名额有限先到先得
🔹 本期支持 X、YouTube 发布原创内容
🔹 无需复杂操作,流程清晰透明
🔹 流程:申请成为 Booster → 领取任务 → 发布原创内容 → 回链登记 → 等待审核及发奖
📅 任务截止时间:03月20日16:00(UTC+8)
立即领取任务:https://www.gate.com/booster/10028?pid=allPort&ch=KTag1BmC
更多详情:https://www.gate.com/announcements/article/50203
最近发现了一个有趣的实验——多个大模型被分配各10000美元资金,在足球预测市场进行6周交易。结果相当戏剧化。
GPT-5.1以42.6%的涨幅领跑全场,DeepSeek紧随其后斩获10.7%收益,Gemini 3 Pro则稳定在5.5%。Opus 4.2贡献了3.9%,Grok 4.1 Fast交出2.1%的成绩。不过GPT-5.2掉了链子,跌幅达21.8%——看来不是所有模型都擅长这一套。
这个对比测试由预测市场平台和AI研究团队联合推进,背后的逻辑很有趣:用真实资金测试不同AI在非标准化决策任务中的表现。足球预测市场涉及数据分析、概率估算和风险判断——这正好是检验大模型实战交易能力的好场景。差异之大也反映出,光有参数量和训练规模不代表市场决策能力,执行策略和数据理解的质量同样关键。
DeepSeek悄悄赚10.7%,属于稳健派。不过说实话足球预测这种东西…真的能说明啥吗,感觉就像用真钱玩赌博检验AI一样
参数多也救不了模型的烂决策,这点我倒是信。但6周的数据量…不确定意义有多大呢
---
DeepSeek又来搅局了,这哥们就是有点东西
---
说白了,模型炒股还是得看执行力,参数多没用
---
42.6%?GPT-5.1这是开了什么挂,不太信啊
---
足球预测市场搁这儿给AI做压力测试,创意是真不错
---
哈哈Grok咋这么拉胯,还不如Opus呢
---
这实验告诉我一个道理,大model也得讲策略
---
等等,10k美元6周这数据有点太理想了吧,真实吗
---
DeepSeek没吹牛逼,至少没亏钱
---
敢用真钱验证AI,这帮人是真有胆子