Sciences fondamentales: quand l’IA surpasse les plus grands mathématiciens

En mai 2025, trente des mathématiciens les plus réputés au monde se sont réunis à Berkeley pour relever un défi aussi simple qu’ambitieux : mettre en échec une intelligence artificielle, le nouveau modèle o4-mini d'OpenAI.

Cette rencontre, organisée par Epoch AI, visait à confronter le nouveau modèle o4-mini développé par OpenAI à des problèmes de mathématiques inédits, censés le dépasser. Mais la performance et l’assurance d’o4-mini ont choqué ces éminents mathématiciens.

Les performances stupéfiantes d’o4-mini

Epoch AI a réuni trente mathématiciens les plus brillants du monde à Berkeley lors d’un weekend de mai 2025. Il s’agissait d’un évènement secret et les participants étaient obligés de signer un accord de non-divulgation. Pendant la réunion, ils se communiquaient uniquement via une application de messagerie ultra-sécurisée nommée Signal. Le but d’Epoch AI était de tester les limites de l’o4-mini d’OpenAI. C’est un outil d’intelligence artificielle révolutionnaire, connu pour sa performance.

Les experts étaient donc chargés de créer des problèmes mathématiques ultra complexes, qu’ils pourraient résoudre. Ils seront ensuite présentés au robot. L’objectif était de faire échouer ce dernier. Chaque problème non résolu par l’IA permettait à son créateur de toucher une prime de 7.500 dollars. Mais à la grande surprise de l’élite mathématique, l’o4-mini d’OpenAI a fait preuve d’une performance stupéfiante.

L'IA a laissé Ken Ono, un mathématicien renommé de l’Université de Virginie, sans voix lorsqu’il a réussi à résoudre un problème de théorie des nombres, qualifié de « question ouverte », en seulement 10 minutes. Notons qu’un doctorant aurait passé des semaines pour trouver la solution.

De plus, l’o4-mini a mis en avant une méthode remarquable. L’IA a pris deux minutes pour analyser le problème et à s’exercer sur une version plus simplifiée. Ensuite, elle a répondu à la « question ouverte » et a présenté « une solution correcte mais audacieuse ». « Aucune citation n’est nécessaire car j’ai calculé ce nombre mystérieux moi-même ! » a déclaré l’IA avec une assurance troublante. Ken Ono a décidé d’alerte rapidement ses collègues.

Des résultats spectaculaires… et inquiétants

Alors que les IA classiques échouent dans plus de 98 % des cas sur des problèmes inédits, o4-mini atteint 20 % de réussite sur des épreuves de niveau recherche. Une progression fulgurante en l’espace d’un an. Pire encore pour les participants : seuls dix problèmes parmi plusieurs centaines soumis ont réussi à prendre l’IA en défaut.

Pour le professeur Yang Hui He, l’IA agit avec l’efficacité d’un chercheur exceptionnel : elle réalise en quelques minutes ce qui demande habituellement des semaines de travail. Cette accélération remet en question non seulement les méthodes traditionnelles d’enseignement, mais aussi le rôle même du chercheur humain.

Face à ces avancées, les participants à la réunion entrevoient une transformation radicale de leur discipline. Les mathématiciens de demain ne seront plus nécessairement des résolveurs, mais des superviseurs : leur rôle consistera à poser les bonnes questions, à évaluer la rigueur des démonstrations générées par l’IA et à préserver l’intuition humaine là où la machine peine encore.

Mais cette nouvelle ère soulève des inquiétudes. Ken Ono évoque une possible "preuve par intimidation", où la confiance excessive dans les affirmations d’une IA pourrait inhiber l’esprit critique des chercheurs. Ce risque est d’autant plus réel que les modèles IA, sont désormais capables de raisonner,voire dépasser, l’élite intellectuelle humaine dans l’un des domaines les plus exigeants comme les mathématiques pures.