Google DeepMind lança modelo visão-linguagem-ação para robôs que opera sem internet

O sistema, baseado no Gemini 2.0, permite que os dispositivos atuem de forma totalmente autônoma, garantindo maior confiabilidade em ambientes desafiadores, e mais privacidade em aplicações sensíveis, como na área da saúde. Além disso, por meio de um SDK, desenvolvedores podem adaptar o modelo para diferentes tarefas com apenas 50 a 100 demonstrações. As informações são do site Ars Technica

Comentários

Postagens mais visitadas deste blog

O que é Flutter Engineering?

Usando Embeddings para Encontrar a Mulher Ideal

Estudo investiga como ChatGPT está influenciando a forma como as pessoas falam