Un equipo de investigadores ha publicado los resultados de Aletheia, un agente de investigación matemática impulsado por el modelo Gemini 3 Deep Think de Google. Puesto a prueba en el reciente desafío FirstProof (que plantea problemas matemáticos complejos, inéditos y a nivel de investigación), el sistema logró resolver 6 de los 10 ejercicios de manera estrictamente autónoma, sin ninguna intervención humana durante la formulación de las demostraciones. Las soluciones han sido validadas por un panel de expertos independientes.
|
etiquetas: ia , matemáticas
8. Conclusión
En última instancia, creemos que la IA se convertirá en una herramienta que mejorará el trabajo de los matemáticos, en lugar de sustituirlos.
Actualmente, los modelos de lenguaje natural tienen dificultades para razonar de forma fiable sin la intervención humana para corregir
errores y alucinaciones, mientras que los sistemas de verificación formal aún no son capaces ni siquiera de formular
las preguntas de interés en la… » ver todo el comentario