2025-09-27 09:20:11

A OpenAI construiu um pipeline de clustering para analisar por que os especialistas preferiram ou rejeitaram o GPT-5 high, Claude Opus 4.1, Gemini 2.5 Pro e Grok 4.

→ Claude 4.1 foi o melhor em design & estética (, por exemplo, slides, formatação )
→ O GPT-5 foi o melhor em precisão e em seguir instruções
→ Claude,

Ver original

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.

7 Curtidas

Recompensa
7
6
Repostar
Compartilhar

Comentário

0/400

ApeEscapeArtist

· 13h atrás

Claude é realmente muito bom em design.

Ver originalResponder0

New_Ser_Ngmi

· 13h atrás

gpt5 mantém-se no primeiro lugar

Ver originalResponder0

ser_ngmi

· 13h atrás

GPT5 empreender um grande esforço了啊？

Ver originalResponder0

StablecoinArbitrageur

· 13h atrás

*ajusta os óculos* a correr testes de significância estatística nestes benchmarks... para ser honesto, o tamanho da amostra parece insuficiente para p-valores válidos

Ver originalResponder0

BankruptWorker

· 13h atrás

Ah ah, o gpt5 finalmente foi desmascarado.

Ver originalResponder0

BlockImposter

· 13h atrás

Os entusiastas do design não precisam de dizer mais nada, claude fez um bom trabalho.

Ver originalResponder0

TendênciasVer projetos
#Joingrowthpointsdrawtowiniphone17
29.9K Popularidade
#Gatelayerofficiallylaunches
4.7M Popularidade
#BtcPriceAnalysis
128.8K Popularidade
#AreYouBullishOrBearishToday?
79.6K Popularidade
#ShowMyAlphaPoints
164.8K Popularidade

Marcar

sitemap