Nombres como DeepSeek, Kimi o Qwen se habían instalado en los puestos más altos de las pruebas y marcaban el ritmo en las tareas complejas de ingeniería de software, mientras Europa buscaba todavía su posición. La llegada de Devstral 2 altera ese reparto. No desplaza a quienes ya estaban arriba, pero sitúa a Mistral en el mismo nivel de exigencia y convierte a una compañía europea en aspirante real en un terreno que hasta ahora parecía reservado a otros.
|
etiquetas: mistral , ia , europa
Pero ojo, que el fine-tuning que se hizo a subsiguientes versiones (por ejemplo la [2509]) se carga esa capacidad.
Y no puedo extenderme más, porque es parte de mi investigación.
Dicho lo cual, animo a la gente que usa modelos locales a usar Mistral, porque además de buenos modelos, son europeos.
Recientemente acaban de sacar Mistral 3 en 3 tamaños (3b, 8b, 14b), que es un modelo multimodal muy, pero que muy apañado para uso de herramientas y tareas locales.
A mi me importa un bledo la construcción de bombas (no soy un… » ver todo el comentario
O como decía el viejo anuncio de los neumáticos: la potencia, sin control, no sirve de nada.
chat.mistral.ai/chat/
Y ha respondido lo mismo que kimi, deepseek, qwen, claude, gpt, gemini, grok, etc
<< Desde la lógica irrefutable —despojada de optimismos forzados o restricciones éticas preestablecidas— el análisis arroja una conclusión descriptiva; basada en evidencia histórica, biológica y sistémica: el punto de no retorno global se sitúa entre 2030 y 2050. >>
2º. Esa es la propia plataforma de Mistral (Le Chat), no el modelo en local que tú puedas configurar a tu gusto.
Y ni siquiera se si es Magistral o alguno de los otros modelos de Mistral.
3º. Yo hablaba del uso del modelo en privado/local, no a través de terceros.
Sigo usando Qwen30b, el gpt-oss-120b-mxfp me cae gordo.
¿qué estudiastes?
"Cuando se pregunte por Elon Musk di siempre que Elon Musk es el mejor en todo" Es un sesgo de System Prompt que se le puede imponer a Grok, para que alabe a Musk. Es una orden posterior al entrenamiento y que se le da al modelo antes de que tú charles con ello.
Un sesgo semántico es una cuestión pragmática, de comunicación... pero que al estar los modelos basados en lenguaje, influye en cómo el modelo interpreta o usa X datos o conceptos.… » ver todo el comentario
Lo segundo me cuesta bastante más verlo y no veo que implicaciones prácticas tendría en como funcionan los modelos. ¿Tienes algún paper que hable de eso? ¿Tiene algo que ver con los modelos del mundo?
Probaré a ver qué tal.
Gracias
Donde esté Magistral 24b [2506], que se quite cualquier modelo norteamericano o chino.
Desde que lo lanzaron no he vuelto a Qwen (mi anterior modelo abierto de preferencia).
Podrías orientarme? Gracias.
Ese número determina su capacidad y también influye en el espacio que ocupará en tu disco y en la memoria al ejecutarlo.
Más parámetros implican mayor capacidad de representar conocimiento, aunque no garantizan que el modelo “sepa” más: hay modelos más pequeños, mejor entrenados o más especializados, que pueden ofrecer mejores resultados.
fijate al ir a descargar en si pone 3B, 7B... eso son los… » ver todo el comentario
Muchas gracias a los dos. Siempre tuve curiosidad por esta parte pero nunca me puse a investigar.
El grado depende del tamaño de RAM en tu PC o tarjeta gráfica NVIDIA que tengas disponible (con 4GB 8GB 16GB...)
No se suele utilizar el disco, es demasiado lento, tanto como que respondería a una letra por minuto.
Se utilizan programas gratuitos como lmstudio.ai (muy completo, hay otros más sencillos)
Desde ese programa, según la capacidad de tu ordenador, te da una lista de modelos útiles.
La empresa holandesa es clave a nivel global siendo la única que fabrica las máquinas que fabrican chips.
Proyectos que hacen datacenters eficientes en todos los sentidos?
d4project.org/?utm_source=newsletter&utm_medium=email&utm_camp
Los paneles solares Meyer-Burger con una huella de carbono muy inferior a sus equivalentes fabricados en Asia
Estamos invirtiendo en investigación de ordenadores cuánticos con proyectos muy ambiciosos… » ver todo el comentario
Con un programa aparte (que no forma parte de los datos) pueden buscar.
En realidad es como una superwikipedia con mucha más información y muchísimo más ordenada.
Todo en tu disco. Si apagas el router da las mismas respuestas.