Claude supera GPT-5 em tarefas reais de trabalho, segundo estudo da própria OpenAI : as tarefas incluíam responder e-mails de clientes insatisfeitos, otimizar a disposição de mesas e auditar preços. O Claude Opus 4.1 liderou com uma taxa de acerto de 47,6%, seguido por GPT-5 high (38,8%) e o3 high (34,1%), enquanto GPT-4o teve o pior desempenho (12,4%), ficando atrás do Grok 4 (24,3%) e do Gemini 2.5 Pro (25,5%). O Claude também se destacou em atividades relacionadas a serviços públicos, saúde e assistência social. As informações são do site TechRadar.
Notícias e insights sobre o universo da tecnologia da informação, com foco em inovações, segurança digital e tendências que moldam o futuro.