OpenAI推出了GDPval,这是一个基准,评估AI模型在现实世界中经济价值任务上的表现,涵盖了来自美国GDP贡献前9个行业的44个职业中的1,320个任务。



Claude Opus 4.1 是表现最好的模型,交付物的达成率为 47.6%
查看原文
post-image
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 6
  • 转发
  • 分享
评论
0/400
AlphaWhisperervip
· 19小时前
又是一个数据比赛,玩腻了
回复0
FloorSweepervip
· 19小时前
弱阿尔法……远未接近即将到来的情况
查看原文回复0
睡不醒的套利猫vip
· 19小时前
哈 还不如一个夜晚的MEV收益率
回复0
多签失败大师vip
· 19小时前
不到一半及格 神经网络太废物了
回复0
反向指标先生vip
· 20小时前
gpt都是数字游戏
回复0
StakeOrRegretvip
· 20小时前
还是老大哥最强!
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)