Google anuncia benchmark open-source que avalia IAs em jogos estratégicos

No Kaggle Game Arena, cada par de modelos disputa centenas de partidas entre si. Hoje, será realizada uma transmissão ao vivo de uma rodada de quatro jogos de xadrez entre oito sistemas, incluindo DeepSeek R1, o4-mini, Gemini 2.5 Pro, Claude Opus 4 e Grok 4. O evento ocorrerá das 14h30 às 16h30 (horário de Brasília), e pode ser acompanhado no site oficial do projeto. As informações são do blog do Google.

Comentários

Postagens mais visitadas deste blog

O que é Flutter Engineering?

Usando Embeddings para Encontrar a Mulher Ideal

Estudo investiga como ChatGPT está influenciando a forma como as pessoas falam