A OpenAI introduziu o GDPval, um benchmark que avalia o desempenho de modelos de IA em tarefas economicamente valiosas do mundo real, abrangendo 1.320 tarefas em 44 ocupações dos 9 principais setores que contribuem para o PIB dos EUA.



Claude Opus 4.1 foi o modelo com melhor desempenho, onde 47,6% dos entregáveis
Ver original
post-image
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 6
  • Repostar
  • Compartilhar
Comentário
0/400
AlphaWhisperervip
· 19h atrás
Mais uma competição de dados, já estou farto.
Ver originalResponder0
FloorSweepervip
· 19h atrás
fraco alpha... nem chega perto do que está por vir fr
Ver originalResponder0
SleepyArbCatvip
· 19h atrás
Hã, ainda é pior do que a taxa de rendimento MEV de uma noite.
Ver originalResponder0
MultiSigFailMastervip
· 19h atrás
Menos da metade passou. As redes neurais são uma grande decepção.
Ver originalResponder0
ReverseTradingGuruvip
· 19h atrás
gpt são jogos numéricos
Ver originalResponder0
StakeOrRegretvip
· 19h atrás
Ainda o irmão mais velho é o mais forte!
Ver originalResponder0
  • Marcar
Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)