Sciences fondamentales: quand l’IA surpasse les plus grands mathématiciens
Photo by Steve Johnson / Unsplash

Sciences fondamentales: quand l’IA surpasse les plus grands mathématiciens


Partager cet article

En mai 2025, trente des mathématiciens les plus réputés au monde se sont réunis à Berkeley pour relever un défi aussi simple qu’ambitieux : mettre en échec une intelligence artificielle, le nouveau modèle o4-mini d'OpenAI.

Cette rencontre, organisée par Epoch AI, visait à confronter le nouveau modèle o4-mini développé par OpenAI à des problèmes de mathématiques inédits, censés le dépasser. Mais la performance et l’assurance d’o4-mini ont choqué ces éminents mathématiciens.  

Les performances stupéfiantes d’o4-mini

Epoch AI a réuni trente mathématiciens les plus brillants du monde à Berkeley lors d’un weekend de mai 2025. Il s’agissait d’un évènement secret et les participants étaient obligés de signer un accord de non-divulgation. Pendant la réunion, ils se communiquaient uniquement via une application de messagerie ultra-sécurisée nommée Signal. Le but d’Epoch AI était de tester les limites de l’o4-mini d’OpenAI. C’est un outil d’intelligence artificielle révolutionnaire, connu pour sa performance.

Les experts étaient donc chargés de créer des problèmes mathématiques ultra complexes, qu’ils pourraient résoudre.  Ils seront ensuite présentés au robot. L’objectif était de faire échouer ce dernier. Chaque problème non résolu par l’IA permettait à son créateur de toucher une prime de 7.500 dollars. Mais à la grande surprise de l’élite mathématique, l’o4-mini d’OpenAI a fait preuve d’une performance stupéfiante.

L'IA a laissé Ken Ono, un mathématicien renommé de l’Université de Virginie, sans voix lorsqu’il a réussi à résoudre un problème de théorie des nombres, qualifié de « question ouverte », en seulement 10 minutes. Notons qu’un doctorant aurait passé des semaines pour trouver la solution. 

De plus, l’o4-mini a mis en avant une méthode remarquable. L’IA a pris deux minutes pour analyser le problème et à s’exercer sur une version plus simplifiée. Ensuite, elle a répondu à la « question ouverte » et a présenté « une solution correcte mais audacieuse ». « Aucune citation n’est nécessaire car j’ai calculé ce nombre mystérieux moi-même ! » a déclaré l’IA avec une assurance troublante. Ken Ono a décidé d’alerte rapidement ses collègues.

Des résultats spectaculaires… et inquiétants

Alors que les IA classiques échouent dans plus de 98 % des cas sur des problèmes inédits, o4-mini atteint 20 % de réussite sur des épreuves de niveau recherche. Une progression fulgurante en l’espace d’un an. Pire encore pour les participants : seuls dix problèmes parmi plusieurs centaines soumis ont réussi à prendre l’IA en défaut.

Pour le professeur Yang Hui He, l’IA agit avec l’efficacité d’un chercheur exceptionnel : elle réalise en quelques minutes ce qui demande habituellement des semaines de travail. Cette accélération remet en question non seulement les méthodes traditionnelles d’enseignement, mais aussi le rôle même du chercheur humain.

Face à ces avancées, les participants à la réunion entrevoient une transformation radicale de leur discipline. Les mathématiciens de demain ne seront plus nécessairement des résolveurs, mais des superviseurs : leur rôle consistera à poser les bonnes questions, à évaluer la rigueur des démonstrations générées par l’IA et à préserver l’intuition humaine là où la machine peine encore.

Mais cette nouvelle ère soulève des inquiétudes. Ken Ono évoque une possible "preuve par intimidation", où la confiance excessive dans les affirmations d’une IA pourrait inhiber l’esprit critique des chercheurs. Ce risque est d’autant plus réel que les modèles IA, sont désormais capables de raisonner,voire dépasser, l’élite intellectuelle humaine dans l’un des domaines les plus exigeants comme les mathématiques pures.


Partager cet article
Commentaires

S'abonner au Courrier des Stratèges

Abonnez-vous gratuitement à la newsletter pour ne rien manquer de l'actualité.

Abonnement en cours...
You've been subscribed!
Quelque chose s'est mal passé
Iran : le pic imminent d'inflation en Europe calme la fureur guerrière, par Vincent Clairmont

Iran : le pic imminent d'inflation en Europe calme la fureur guerrière, par Vincent Clairmont

L'essentiel : Le retour de la "Realpolitik du portefeuille" Alors que les tambours de guerre résonnent, une force invisible freine l'ardeur des chancelleries européennes : l'inflation. Philip Lane, économiste en chef de la Banque centrale européenne (BCE), a lancé un avertissement glacial : un conflit prolongé entraînerait un « pic substantiel » de l'inflation et une chute brutale de la production en zone euro. En Europe, la "fureur guerrière" se heurte désormais à une réalité implacable : le


Rédaction

Rédaction

IA, Pentagone et deuxième amendement : quand l’algorithme redessine le rapport de force, par Eric Lemaire

IA, Pentagone et deuxième amendement : quand l’algorithme redessine le rapport de force, par Eric Lemaire

L’affaire entre Anthropic et le Pentagone ne se résume pas à un différend contractuel. Elle révèle une transformation silencieuse mais décisive du pouvoir dans les démocraties modernes. L’intelligence artificielle n’est plus un simple outil d’optimisation. Elle devient une infrastructure stratégique capable de modifier l’équilibre historique entre l’État et les citoyens. Les faits Anthropic, entreprise américaine spécialisée dans les modèles d’intelligence artificielle avancée, collaborait av


Rédaction

Rédaction

Ukraine vs. Iran : la crise du « deux poids, deux mesures »

Ukraine vs. Iran : la crise du « deux poids, deux mesures »

Pour qui observe avec un tant soit peu de lucidité la comédie du pouvoir, le spectacle est à la fois fascinant et tragique. Nous assistons, en direct, à l’effondrement moral d’une caste politique qui a tenté de faire du « Droit international » une religion universelle en Ukraine, avant de le transformer en variable d’ajustement, voire en absurdité, au Moyen-Orient. Le Droit international : un totem à géométrie variable Depuis février 2022, on nous explique — à juste titre sur le plan formel —


Éric Verhaeghe

Éric Verhaeghe

Iran, guerre régionale aujourd'hui, guerre mondiale demain? par Thibault de Varenne

Iran, guerre régionale aujourd'hui, guerre mondiale demain? par Thibault de Varenne

Le 28 février 2026 restera dans les annales diplomatiques comme le jour où l'illusion de la « frappe chirurgicale » s'est fracassée sur les réalités brûlantes du Levant. En lançant l'opération Epic Fury (ou Rising Lion), Washington et Tel-Aviv n'ont pas seulement visé les centrifugeuses de Natanz ou les centres de commandement de Téhéran ; ils ont, par une réaction en chaîne dont la maîtrise leur échappe déjà, acté la naissance du premier conflit régional total de cette décennie. Mais au-delà de


Rédaction

Rédaction