Tecnología, Internet y juegos
67 meneos
376 clics
Los creadores de DeepSeek, la IA china que noqueó a Silicon Valley, desvelan sus secretos

Los creadores de DeepSeek, la IA china que noqueó a Silicon Valley, desvelan sus secretos

Una pequeña y desconocida empresa china, DeepSeek, revolucionó en enero de este año la industria de la inteligencia artificial (IA) generativa. Su modelo R1 funcionaba tan bien o mejor que la última versión de ChatGPT, pero era gratuita y de código abierto. La clave está en su apuesta por el llamado aprendizaje por refuerzo. La IA generativa, la que es capaz de producir textos, imágenes, vídeos o audios a partir de una serie de instrucciones del usuario, se apoya en el aprendizaje profundo (deep learning). Se trata de una estrategia dentro de

| etiquetas: creadores , secretos , deepseek , ia china , silicon valley
46 21 0 K 297
46 21 0 K 297
Unos publican lo que han hecho para el progreso de la humanidad. Otros intentan ver cómo cerrarlo y hacerlo de pago.
#2 Ya no copian, dan lecciones.
#2 Y lo mas gracioso es que empezaron así, con la intención de ser abiertos hasta el punto de tener "abierto" en el nombre y se fundaron como organización sin animo de lucro... y en 2019 crearon una estructura para incluir una división con animo de lucro y como dice un Youtuber al que seguía "Las perras son mu golosas".
El equipo de DeepSeek publica hoy en la revista Nature un artículo en el que desgrana los avances que le permitieron poner patas arriba el sector. Aquí los papeles :

www.nature.com/articles/s41586-025-09422-z
Vaya puñetazo en la mesa, publicando en Nature consiguen otro punto en la carrera.

#1 Gracias Uno de los autores es ¿profesor? de instituto, no quiero pensar en el nivel de sus clases preparatorias para el gaokao (El EBAU chino)
#3 El gaokao consiste en memorizar michísimo. Se trata de la explotación de los alumnos, vistos como material descartable, para el bien del sistema.

El sistema en sí no es tan malo, si lo comparamos con España y la mierda de políticos que hay. Pero en definitiva son humanos y eso está lleno de corrupción igualmente, sólo que no son analfabetos como en España.
#1 Seguro que el papel incluye detalles interesantes, pero lo fundamental ya se sabía.
Porque tienen la siguiente en marcha y lo publican para que la competencia se entretenga con esta
El artículo es penoso con ganas. Esos símiles que usa no funcionan. Luego queda gente diciendo tonterías, no por culpa propia, sino por culpa de divulgadores como esto.

Un par de ejemplos:

se dieron cuenta de que las respuestas llegaban a ser larguísimas, de hasta 10.000 palabras, lo que hacía que fueran difíciles de seguir por el usuario

Un LLM funciona generando la siguiente palabra más probable, algo que puede hacer hasta el infinito. Si esa respuesta se corta, es porque hay un…   » ver todo el comentario
#10 "Un LLM funciona generando la siguiente palabra más probable, algo que puede hacer hasta el infinito. Si esa respuesta se corta, es porque hay un código aparte que lo decide".
No es verdad, la condición de parada es la aparición de un token específico (<end▁of▁sentence>, <eos>...) en la salida del modelo. El resto de lo que has escrito es tan confuso o vago que ni siquiera se puede decir que sea conceptualmente incorrecto.
No es la única. Hay unas cuantas empresas chinas de IA (la mayoría son pequeñas y desconocidas) que le están dando de palos a EEUU consiguiendo entrenar a IAs por una fracción del coste con innovaciones como la de deepseek, y encima publican esas IAs como pesos abiertos y publican como lo hacen. Pero la gente tarda en enterarse, por eso a la burbuja aun le queda un rato.
Su mayor secreto es que DeepSeek es sincebollista...

Y que crear un ecosistema de código abierto es clave para liderar el sector de la IA en el futuro, o eso me pareció entender.
¿Nos debería importar que la forma de razonar es ininteligible si pese a ello llega a la respuesta correcta?”.

Sí y mucho. Porque no dan la respuesta correcta siempre, sino sólo a veces, y sin avisar. Por lo tanto esa respuesta no tiene ninguna fiabilidad. Una respuesta no confiable depende totalmente de cómo se ha llegado a ella. Si no se sabe, esa respuesta es descartable.

menéame