Mira la foto de un gato y lo reconocerás al instante. Pero intenta programar un ordenador para que reconozca fotos de gatos y te darás cuenta de que no es nada sencillo. La detección de gatos es un ejemplo de lo que los investigadores llaman una tarea de clasificación. Dado un objeto —en este caso, una imagen—, el objetivo es asignarlo a la categoría correcta. Hay mucho que los investigadores aún desconocen sobre el funcionamiento interno de las redes neuronales. Pero no son completamente inescrutables. ¿Por dónde empezar?
|
etiquetas: ia , ai , inteligencia , artificial , gato , clasificador , neurona , red
Puede que la forma de operar sea distinta a la de una máquina, pero la lógica subyacente sobre la que se sustentan es la misma, una aproximación biológica a problemas fundamentalmente matemáticos.
Hay muchos papers de clasificación de imágenes basándose en una aproximación zero-shotz, es decir, solo necesitan haber visto un objeto una sola vez para identificarlo y estos modelos cada vez tienen mejor desempeño.… » ver todo el comentario
Un humano no hace nada de estadística. Observa las características del gato y las asocia al concepto de gato.
A un humano le enseñas un gato y dice: "Ahhh, un gato es esto" y ya está. Ya puede identificar a cualquier gato. Esto es porque ha adquirido el concepto de gato.
Un LLM no puede hacer nada parecido, no adquiere conceptos, de ahí que necesite miles y miles de fotos para poder decir que algo es un gato.
Una de las consecuencias de no usar conceptos es la imposibilidad de razonar.
Lo que ocurre es que hay un tipo de transformación matemática llamada convolución que depende de cómo esté configurada se excita más o menos en función de la forma o textura que se dibuja en la imagen (una convolución puede excitarse cuando hay un borde recto, otra cuando tiene forma curva, otra cuando tiene una textura tipo ropa, etc, etc). El resultado de la excitación que produce una convolución… » ver todo el comentario
Una red neuronal no hace absolutamente nada de esto. Lo que hace es calcular valores medios. Pero no puede sacar valores medios de dos imágenes muy distintas, ya que eso no serviría para nada. De ahí que necesite miles de fotos de gatos vistos en todas las posiciones posibles.
ni se utilizan als imágenes de entrenamiento cuando llega una imagen sobre la que queremos hacer una predicción
Puers claro que se usan esas imágenes. No va a usar los resultados de la bonoloto. Es que hay cosas que da vergüenza tener que decirlas.