La publicación que puede cambiar cómo trabajamos con IA

8 meneos

77 clics

La publicación que puede cambiar cómo trabajamos con IA

Deepseek lanzó reciemente la publicación "Deepseek OCR", que además de ser un nuevo modelo de OCR, propone una arquitectura que podría cambiar como trabajamos con LLMs: En lugar de enviar el texto directamente al modelo de lenguaje, convertirlo en una imagen, y procesar dicha imagen por medio de tokens de visión, pasando por modelos como SAM y CLIP. Con esto se ha logrado una compresión de tokens de hasta 10x con un 97% de precisión, y 20x con un 60% de precisión. Las implicaciones de esto pueden ser grandes.

| etiquetas: ia , llm , deepseek , ocr

6 2 0 K 76 actualidad

3 comentarios

6 2 0 K 76 actualidad

#2 Torrezzno

Recomiéndo leer a Andrej sobre el tema, poca gente sabe más que el del tema

x.com/karpathy/status/1980397031542989305

Quizás tiene más sentido que todas las entradas a los LLM sean siempre imágenes. Incluso si tienes una entrada de texto puro, tal vez preferirías renderizarla y luego introducirla así:
- más compresión de información (ver el artículo) => ventanas de contexto más cortas, más eficiencia
- flujo de información significativamente más general => no solo texto,

… » ver todo el comentario

2 43

#1 rojo_separatista

Me parece super interesante por lo contraintuitiva que es la idea de que utilizando tokens de imagen en lugar de un embeding de texto se pueda obtener algo tan funcional.

1 34

#3 rogerius *

Estos chinos son la monda. Lironda.

1 34

edición general

más visitadas

Guerra de Ucrania: Pokrovsk, Myrnograd y Kupiansk, en situación crítica

No es un pájaro, no es Clark Kent, es "perro con gafas": los tuiteros resumen las pullas de Sánchez y el show de las derechas en la comisión del Senado

Precipitaciones medias anuales en Europa (2023)

“Aparcas como un gilipollas”. Las pegatinas imposibles de quitar que están triunfando contra los que no saben dejar su coche entre las cuatro líneas

Qué es la línea de Wallace, la frontera invisible que los animales nunca traspasan

más votadas

El Gobierno comunica oficialmente a la Fundación Franco la apertura del proceso para extinguirla

El día que un apagón reveló el truco detrás del precio de la electricidad

El culmen de las invitaciones ‘fake’ para cribados de cáncer: un hombre algecireño (Cádiz) es invitado a una prueba para cuello uterino

Madrid Network, el chiringuito de Esperanza Aguirre y Ayuso, dio un préstamo de 730.000 euros al cabecilla de la trama “eólica”, del PP

Bochorno general ante la ovación de los cargos del Govern a Carlos Mazón en el aniversario de la DANA: "Los aplausos de la vergüenza"

suscripciones por RSS

La publicación que puede cambiar cómo trabajamos con IA