✍️ Gate 廣場「創作者認證激勵計劃」進行中!
我們歡迎優質創作者積極創作,申請認證
贏取豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000+ 豐厚獎勵!
立即報名 👉 https://www.gate.com/questionnaire/7159
📕 認證申請步驟:
1️⃣ App 首頁底部進入【廣場】 → 點擊右上角頭像進入個人主頁
2️⃣ 點擊頭像右下角【申請認證】進入認證頁面,等待審核
讓優質內容被更多人看到,一起共建創作者社區!
活動詳情:https://www.gate.com/announcements/article/47889
最近發現了一個有趣的實驗——多個大模型被分配各10000美元資金,在足球預測市場進行6周交易。結果相當戲劇化。
GPT-5.1以42.6%的漲幅領跑全場,DeepSeek緊隨其後斬獲10.7%收益,Gemini 3 Pro則穩定在5.5%。Opus 4.2貢獻了3.9%,Grok 4.1 Fast交出2.1%的成績。不過GPT-5.2掉了鏈子,跌幅達21.8%——看來不是所有模型都擅長這一套。
這個對比測試由預測市場平台和AI研究團隊聯合推進,背後的邏輯很有趣:用真實資金測試不同AI在非標準化決策任務中的表現。足球預測市場涉及數據分析、概率估算和風險判斷——這正好是檢驗大模型實戰交易能力的好場景。差異之大也反映出,光有參數量和訓練規模不代表市場決策能力,執行策略和數據理解的質量同樣關鍵。
DeepSeek悄悄賺10.7%,屬於穩健派。不過說實話足球預測這種東西…真的能說明啥嗎,感覺就像用真钱玩賭博檢驗AI一樣
參數多也救不了模型的爛決策,這點我倒是信。但6周的數據量…不確定意義有多大呢
---
DeepSeek又來搗亂了,這哥們就是有點東西
---
說白了,模型炒股還得看執行力,參數多沒用
---
42.6%?GPT-5.1這是開了什麼掛,不太信啊
---
足球預測市場擺這兒給AI做壓力測試,創意是真不錯
---
哈哈Grok怎麼這麼拉胯,還不如Opus呢
---
這實驗告訴我一個道理,大model也得講策略
---
等等,10k美元6周這數據有點太理想了吧,真實嗎
---
DeepSeek沒吹牛逼,至少沒虧錢
---
敢用真錢驗證AI,這幫人是真有膽子