Tecnología, Internet y juegos
13 meneos
225 clics
¿Cómo puede la IA identificar a un gato? Guía ilustrada [ENG]

¿Cómo puede la IA identificar a un gato? Guía ilustrada [ENG]  

Mira la foto de un gato y lo reconocerás al instante. Pero intenta programar un ordenador para que reconozca fotos de gatos y te darás cuenta de que no es nada sencillo. La detección de gatos es un ejemplo de lo que los investigadores llaman una tarea de clasificación. Dado un objeto —en este caso, una imagen—, el objetivo es asignarlo a la categoría correcta. Hay mucho que los investigadores aún desconocen sobre el funcionamiento interno de las redes neuronales. Pero no son completamente inescrutables. ¿Por dónde empezar?

| etiquetas: ia , ai , inteligencia , artificial , gato , clasificador , neurona , red
11 2 0 K 97
11 2 0 K 97
Echándole un vistazo rápido, como introducción muy básica está bastante, bastante bien. Luego la cosa se puede complicar tremendamente, pero eso, está bastante bien.
#8, cuando un futbolista golpea el balón para hacer una vaselina, está haciendo una aproximación de cálculo de tiro parabólico en su cabeza de acuerdo a las leyes y constantes de la física aunque no lo parezca. Cuando clasificamos gatos en imagenes, hacemos algo parecido.

Puede que la forma de operar sea distinta a la de una máquina, pero la lógica subyacente sobre la que se sustentan es la misma, una aproximación biológica a problemas fundamentalmente matemáticos.
#6, un ser humano también necesita haber visto antes unos cuantos perros para identificar los patrones que los caracterizan, y aunque te suene contra-intuitivo también se basa en estadística, nada de alma, inspiración divina o algo intangible.

Hay muchos papers de clasificación de imágenes basándose en una aproximación zero-shotz, es decir, solo necesitan haber visto un objeto una sola vez para identificarlo y estos modelos cada vez tienen mejor desempeño.…   » ver todo el comentario
#7 aunque te suene contra-intuitivo también se basa en estadística, nada de alma, inspiración divina o algo intangible

Un humano no hace nada de estadística. Observa las características del gato y las asocia al concepto de gato.
Una IA no sabe identificar nada. Lo que hace es comparar con fotos. En su entrenamiento hay miles de fotos de gatos debidamente etiquetadas como gato. Las han etiquetado personas baratas. Si le enseñas la foto de un gato, la IA busca alguna foto que se parezca a la enseñada, lo que quiere decir que el gato debe estar en la misma posición.
#2 that’s not because a clever programmer discovered a way to isolate the essence of “catness.”

A un humano le enseñas un gato y dice: "Ahhh, un gato es esto" y ya está. Ya puede identificar a cualquier gato. Esto es porque ha adquirido el concepto de gato.

Un LLM no puede hacer nada parecido, no adquiere conceptos, de ahí que necesite miles y miles de fotos para poder decir que algo es un gato.

Una de las consecuencias de no usar conceptos es la imposibilidad de razonar.
#2, no es así como funciona una red neuronal. No compara nada con nada etiquetado anteriormente.

Lo que ocurre es que hay un tipo de transformación matemática llamada convolución que depende de cómo esté configurada se excita más o menos en función de la forma o textura que se dibuja en la imagen (una convolución puede excitarse cuando hay un borde recto, otra cuando tiene forma curva, otra cuando tiene una textura tipo ropa, etc, etc). El resultado de la excitación que produce una convolución…   » ver todo el comentario
#4 Estás confundiendo el qué con el cómo. Muy bien la explicación de cómo lo hace, pero en definitiva lo que hace es comparar la imagen con las imágenes de su entrenamiento.
#4 aprende a conocer por si sóla qué características de la imagen son relevantes para determinar si hay un gato o no.

Una red neuronal no hace absolutamente nada de esto. Lo que hace es calcular valores medios. Pero no puede sacar valores medios de dos imágenes muy distintas, ya que eso no serviría para nada. De ahí que necesite miles de fotos de gatos vistos en todas las posiciones posibles.

ni se utilizan als imágenes de entrenamiento cuando llega una imagen sobre la que queremos hacer una predicción

Puers claro que se usan esas imágenes. No va a usar los resultados de la bonoloto. Es que hay cosas que da vergüenza tener que decirlas.

menéame