Google DeepMind lança modelo visão-linguagem-ação para robôs que opera sem internet
O sistema, baseado no Gemini 2.0, permite que os dispositivos atuem de forma totalmente autônoma, garantindo maior confiabilidade em ambientes desafiadores, e mais privacidade em aplicações sensíveis, como na área da saúde. Além disso, por meio de um SDK, desenvolvedores podem adaptar o modelo para diferentes tarefas com apenas 50 a 100 demonstrações. As informações são do site Ars Technica
Comentários
Postar um comentário