A OpenAI construiu um pipeline de clustering para analisar por que os especialistas preferiram ou rejeitaram o GPT-5 high, Claude Opus 4.1, Gemini 2.5 Pro e Grok 4.
→ Claude 4.1 foi o melhor em design & estética (, por exemplo, slides, formatação )
→ O GPT-5 foi o melhor em precisão e em seguir instruções
→ Claude,
Ver original