OpenAI создала кластерный конвейер для анализа причин, по которым эксперты предпочли или отвергли GPT-5 high, Claude Opus 4.1, Gemini 2.5 Pro и Grok 4.
→ Claude 4.1 был лучше всего в дизайне и эстетике (, например, слайды, форматирование )
→ GPT-5 был лучше всего в точности и следовании инструкциям
→ Клод,
Посмотреть Оригинал