Tecnología, Internet y juegos
57 meneos
220 clics

El modelo de IA de código abierto DeepSeek-OCR cambia la forma en que los modelos de IA leen y procesan texto sin formato (inglés)

DeepSeek lanzó el lunes un nuevo modelo de inteligencia artificial (IA) de código abierto que cambia la forma en que estas máquinas analizan y procesan texto sin formato. Apodado DeepSeek-OCR, utiliza mapeo 2D para convertir texto en píxeles y comprimir un contexto largo a un tamaño digerible. La startup de inteligencia artificial afirma que los modelos de lenguaje grandes (LLM) son más eficientes en el procesamiento de píxeles sobre texto y la compresión les permite capturar información relevante para generar la respuesta. Además, también...

| etiquetas: ia , código abierto , deepseek-ocr , tratamiento , textos , imágenes
43 14 0 K 349
43 14 0 K 349
#2 ¿crees que en una H100 se puede probar?
#4 ...yo probaré en mi cluster de Casios fx-850.
#4 segun veo son 3 billones de parámetros, debería funcionar en GPUs normales no muy viejas.
#2 ¿Está en huggingface?
"Además, también se dice que el nuevo enfoque genera resultados más precisos en comparación con los métodos tradicionales.

DeepSeek-OCR presenta una técnica novedosa para procesar texto
Basado en tecnología de reconocimiento óptico de caracteres (OCR), lo último Búsqueda profunda El modelo de IA utiliza un nuevo método para procesar información. Primero convierte texto simple en imágenes y luego analiza el contenido para generar respuestas. La promesa es que al leer el texto de una…   » ver todo el comentario
#1 Y encima, mientras tanto, te va ganando un dinerito en criptos y con inversiones en bolsa... :-D
Una idea parecida tuvo Google.
como hacen los humanos.. :-)

menéame