A OpenAI construiu um pipeline de clustering para analisar por que os especialistas preferiram ou rejeitaram o GPT-5 high, Claude Opus 4.1, Gemini 2.5 Pro e Grok 4.
→ Claude 4.1 foi o melhor em design & estética (, por exemplo, slides, formatação ) → O GPT-5 foi o melhor em precisão e em seguir instruções → Claude,
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
7 Curtidas
Recompensa
7
6
Repostar
Compartilhar
Comentário
0/400
ApeEscapeArtist
· 13h atrás
Claude é realmente muito bom em design.
Ver originalResponder0
New_Ser_Ngmi
· 13h atrás
gpt5 mantém-se no primeiro lugar
Ver originalResponder0
ser_ngmi
· 13h atrás
GPT5 empreender um grande esforço了啊?
Ver originalResponder0
StablecoinArbitrageur
· 13h atrás
*ajusta os óculos* a correr testes de significância estatística nestes benchmarks... para ser honesto, o tamanho da amostra parece insuficiente para p-valores válidos
Ver originalResponder0
BankruptWorker
· 13h atrás
Ah ah, o gpt5 finalmente foi desmascarado.
Ver originalResponder0
BlockImposter
· 13h atrás
Os entusiastas do design não precisam de dizer mais nada, claude fez um bom trabalho.
A OpenAI construiu um pipeline de clustering para analisar por que os especialistas preferiram ou rejeitaram o GPT-5 high, Claude Opus 4.1, Gemini 2.5 Pro e Grok 4.
→ Claude 4.1 foi o melhor em design & estética (, por exemplo, slides, formatação )
→ O GPT-5 foi o melhor em precisão e em seguir instruções
→ Claude,