Publicado hace 1 año por elvecinodelquinto a deepmind.com

Inspirados por el modelado de lenguaje a gran escala, se aplica un enfoque similar para construir un único agente generalista más allá del procesamiento de texto. El agente, al que nos referimos como Gato, funciona como una entidad multimodal, multitarea y multientorno. La misma red con los mismos pesos puede reproducir Atari, subtitular imágenes, chatear, apilar bloques con un brazo robótico real y mucho más, decidiendo en función de su contexto si generar texto, torsión conjunta, pulsaciones de botones u otros tokens.

Comentarios

D

La misma red con los mismos pesos puede reproducir Atari, subtitular imágenes, chatear, apilar bloques con un brazo robótico real y mucho más

Pero dedicará su tiempo a tirar jarrones y arañar cortinas

Jakeukalane

Muy interesante aunque la capital de Francia no es Marsella.

KernelPanic

Todos pensando que la IA que dominará sería Skynet y a final va resultar que va a ser un gato clap lol

elvecinodelquinto

Pues eso, que esto empieza a acojonar.

#1 Yo empecé a acojonarme cuando vi lo que podía hacer GPT3. Luego DALL-E. Antes tenía alguna duda, ahora estoy convencido de que en cincuenta años como muchísimo llegamos a la singularidad tecnológica.