DeepMind publie un assistant de recherche en mathématiques basé sur l'IA : une architecture multi-agent bat GPT-5.5Pro, et résout un problème auparavant « insoluble »

BlockBeatNews

Selon le suivi Beating Monitoring, Google DeepMind a publié un co-mathématicien IA, une plateforme de recherche interactive multi-agent destinée aux mathématiciens.
Ce système a obtenu un taux de réussite de 47,9 % sur le benchmark mathématique de recherche le plus difficile actuellement, FrontierMath Tier 4 (résolution de 23/48 problèmes), dépassant directement le record précédent de GPT-5.5 Pro à 39,6 %.

Ce système n’utilise pas de nouvelle génération de base, il fonctionne directement avec Gemini 3.1 Pro.
Ce modèle seul, en mode brut sur Tier 4, n’atteint que 19 %, mais avec l’ajout du cadre d’agent, ses performances doublent ou plus.
DeepMind lui a construit une architecture à plusieurs couches : une « coordination de projet » au sommet décompose la tâche de recherche en plusieurs flux de travail, qui sont ensuite distribués à des sous-agents spécialisés dans la recherche documentaire, la programmation et le raisonnement.
Les preuves produites doivent passer par une revue par plusieurs « agents de révision », formant une séance de révision, avant d’être soumises.
Ce cadre lourd démontre que, dans le raisonnement mathématique de haut niveau, la capacité supplémentaire exploitée par une orchestration bien conçue peut dépasser celle d’un simple changement de modèle.

Le test à l’aveugle a été réalisé par Epoch AI, et pour éviter toute tricherie, l’équipe de DeepMind n’a pas vu les questions tout au long du processus, chaque problème pouvant être traité pendant 48 heures.
Les résultats ont non seulement permis de dominer le classement, mais le système a également résolu 3 problèmes que tous les modèles précédents n’avaient pas réussi à résoudre.

Bien que nommé « assistant », il ressemble davantage à un collègue capable d’avoir des idées originales.
L’expert en théorie des groupes Marc Lackenby l’a utilisé dans ses recherches pour résoudre une conjecture publique dans le Cahier Kourovka.
Fait intéressant, la stratégie initiale proposée par le système a été jugée « défectueuse » par son propre agent de révision, mais Lackenby a repéré la brillante idée cachée dans cette ébauche, a comblé le trou, et a finalement achevé la preuve.

Actuellement, le co-mathématicien IA n’est accessible en version bêta qu’à un petit nombre de mathématiciens.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire