Selon le suivi Beating Monitoring, Google DeepMind a publié un co-mathématicien IA, une plateforme de recherche interactive multi-agent destinée aux mathématiciens.
Ce système a obtenu un taux de réussite de 47,9 % sur le benchmark mathématique de recherche le plus difficile actuellement, FrontierMath Tier 4 (résolution de 23/48 problèmes), dépassant directement le record précédent de GPT-5.5 Pro à 39,6 %.
Ce système n’utilise pas de nouvelle génération de base, il fonctionne directement avec Gemini 3.1 Pro.
Ce modèle seul, en mode brut sur Tier 4, n’atteint que 19 %, mais avec l’ajout du cadre d’agent, ses performances doublent ou plus.
DeepMind lui a construit une architecture à plusieurs couches : une « coordination de projet » au sommet décompose la tâche de recherche en plusieurs flux de travail, qui sont ensuite distribués à des sous-agents spécialisés dans la recherche documentaire, la programmation et le raisonnement.
Les preuves produites doivent passer par une revue par plusieurs « agents de révision », formant une séance de révision, avant d’être soumises.
Ce cadre lourd démontre que, dans le raisonnement mathématique de haut niveau, la capacité supplémentaire exploitée par une orchestration bien conçue peut dépasser celle d’un simple changement de modèle.
Le test à l’aveugle a été réalisé par Epoch AI, et pour éviter toute tricherie, l’équipe de DeepMind n’a pas vu les questions tout au long du processus, chaque problème pouvant être traité pendant 48 heures.
Les résultats ont non seulement permis de dominer le classement, mais le système a également résolu 3 problèmes que tous les modèles précédents n’avaient pas réussi à résoudre.
Bien que nommé « assistant », il ressemble davantage à un collègue capable d’avoir des idées originales.
L’expert en théorie des groupes Marc Lackenby l’a utilisé dans ses recherches pour résoudre une conjecture publique dans le Cahier Kourovka.
Fait intéressant, la stratégie initiale proposée par le système a été jugée « défectueuse » par son propre agent de révision, mais Lackenby a repéré la brillante idée cachée dans cette ébauche, a comblé le trou, et a finalement achevé la preuve.
Actuellement, le co-mathématicien IA n’est accessible en version bêta qu’à un petit nombre de mathématiciens.