cultura y tecnología
78 meneos
461 clics
Los creadores de DeepSeek, la IA china que noqueó a Silicon Valley, desvelan sus secretos

Los creadores de DeepSeek, la IA china que noqueó a Silicon Valley, desvelan sus secretos

Una pequeña y desconocida empresa china, DeepSeek, revolucionó en enero de este año la industria de la inteligencia artificial (IA) generativa. Su modelo R1 funcionaba tan bien o mejor que la última versión de ChatGPT, pero era gratuita y de código abierto. La clave está en su apuesta por el llamado aprendizaje por refuerzo. La IA generativa, la que es capaz de producir textos, imágenes, vídeos o audios a partir de una serie de instrucciones del usuario, se apoya en el aprendizaje profundo (deep learning). Se trata de una estrategia dentro de

| etiquetas: creadores , secretos , deepseek , ia china , silicon valley
Unos publican lo que han hecho para el progreso de la humanidad. Otros intentan ver cómo cerrarlo y hacerlo de pago.
#2 Ya no copian, dan lecciones.
#2 Y lo mas gracioso es que empezaron así, con la intención de ser abiertos hasta el punto de tener "abierto" en el nombre y se fundaron como organización sin animo de lucro... y en 2019 crearon una estructura para incluir una división con animo de lucro y como dice un Youtuber al que seguía "Las perras son mu golosas".
El equipo de DeepSeek publica hoy en la revista Nature un artículo en el que desgrana los avances que le permitieron poner patas arriba el sector. Aquí los papeles :

www.nature.com/articles/s41586-025-09422-z
Vaya puñetazo en la mesa, publicando en Nature consiguen otro punto en la carrera.

#1 Gracias Uno de los autores es ¿profesor? de instituto, no quiero pensar en el nivel de sus clases preparatorias para el gaokao (El EBAU chino)
#3 El gaokao consiste en memorizar michísimo. Se trata de la explotación de los alumnos, vistos como material descartable, para el bien del sistema.

El sistema en sí no es tan malo, si lo comparamos con España y la mierda de políticos que hay. Pero en definitiva son humanos y eso está lleno de corrupción igualmente, sólo que no son analfabetos como en España.
#1 Seguro que el papel incluye detalles interesantes, pero lo fundamental ya se sabía.
Porque tienen la siguiente en marcha y lo publican para que la competencia se entretenga con esta
El artículo es penoso con ganas. Esos símiles que usa no funcionan. Luego queda gente diciendo tonterías, no por culpa propia, sino por culpa de divulgadores como esto.

Un par de ejemplos:

se dieron cuenta de que las respuestas llegaban a ser larguísimas, de hasta 10.000 palabras, lo que hacía que fueran difíciles de seguir por el usuario

Un LLM funciona generando la siguiente palabra más probable, algo que puede hacer hasta el infinito. Si esa respuesta se corta, es porque hay un…   » ver todo el comentario
#10 "Un LLM funciona generando la siguiente palabra más probable, algo que puede hacer hasta el infinito. Si esa respuesta se corta, es porque hay un código aparte que lo decide".
No es verdad, la condición de parada es la aparición de un token específico (<end▁of▁sentence>, <eos>...) en la salida del modelo. El resto de lo que has escrito es tan confuso o vago que ni siquiera se puede decir que sea conceptualmente incorrecto.
#13 La respuesta típica tiene muchas "sentences". Así que el corte se decide por otro sitio.

Por favor, deja de confundir. Pareces lo del artículo.
#14 <end▁of▁sentence> no significa que termine una frase, es el token específico que usa DeepSeek como condición de parada. Si se emite, se para. Otros modelos usan otros tokens diferentes.
No suele ser la única, suelen implementarse salvaguardas y condiciones adicionales a nivel de API para evitar usos excesivos pero no son inherentes al modelo y son irrelevantes para el argumento, que es que, al contrario de lo que afirmas, el token de terminación lo emite el propio modelo.
No es la única. Hay unas cuantas empresas chinas de IA (la mayoría son pequeñas y desconocidas) que le están dando de palos a EEUU consiguiendo entrenar a IAs por una fracción del coste con innovaciones como la de deepseek, y encima publican esas IAs como pesos abiertos y publican como lo hacen. Pero la gente tarda en enterarse, por eso a la burbuja aun le queda un rato.
#8 Pero creo que es porque usan un modelo mas barato.
Su mayor secreto es que DeepSeek es sincebollista...

Y que crear un ecosistema de código abierto es clave para liderar el sector de la IA en el futuro, o eso me pareció entender.
#7 Maldito sincebollista mentiroso, deberían de hundirte el karma a -1 solo por semejante ultraje.

Nuestro querido DeepSeek es inteligente y al contrario que tu, tiene buen gusto: "Personalmente, prefiero la tortilla con cebolla."

Ya leo tu sucia mente intentado acusarme falsamente, pues no podrás porque aquí tienes la prueba: chat.deepseek.com/a/chat/s/ec5195fe-fa11-4192-be84-91b3cc590309
#16 No todos. La mayoría sí, porque son imbéciles y se inventan las cosas.

Ellos se creen que como que no entienden lo que las personas inteligentes dicen, pues se creen que se lo están inventando, y entonces hacen lo mismo.

Pero a estos los identificas enseguida.
¿Nos debería importar que la forma de razonar es ininteligible si pese a ello llega a la respuesta correcta?”.

Sí y mucho. Porque no dan la respuesta correcta siempre, sino sólo a veces, y sin avisar. Por lo tanto esa respuesta no tiene ninguna fiabilidad. Una respuesta no confiable depende totalmente de cómo se ha llegado a ella. Si no se sabe, esa respuesta es descartable.
#9 Anda!!!!! Como los seres humanos!!!!!!!

menéame