Sciences fondamentales: quand l’IA surpasse les plus grands mathématiciens
Photo by Steve Johnson / Unsplash

Sciences fondamentales: quand l’IA surpasse les plus grands mathématiciens


Partager cet article

En mai 2025, trente des mathématiciens les plus réputés au monde se sont réunis à Berkeley pour relever un défi aussi simple qu’ambitieux : mettre en échec une intelligence artificielle, le nouveau modèle o4-mini d'OpenAI.

Cette rencontre, organisée par Epoch AI, visait à confronter le nouveau modèle o4-mini développé par OpenAI à des problèmes de mathématiques inédits, censés le dépasser. Mais la performance et l’assurance d’o4-mini ont choqué ces éminents mathématiciens.  

Les performances stupéfiantes d’o4-mini

Epoch AI a réuni trente mathématiciens les plus brillants du monde à Berkeley lors d’un weekend de mai 2025. Il s’agissait d’un évènement secret et les participants étaient obligés de signer un accord de non-divulgation. Pendant la réunion, ils se communiquaient uniquement via une application de messagerie ultra-sécurisée nommée Signal. Le but d’Epoch AI était de tester les limites de l’o4-mini d’OpenAI. C’est un outil d’intelligence artificielle révolutionnaire, connu pour sa performance.

Les experts étaient donc chargés de créer des problèmes mathématiques ultra complexes, qu’ils pourraient résoudre.  Ils seront ensuite présentés au robot. L’objectif était de faire échouer ce dernier. Chaque problème non résolu par l’IA permettait à son créateur de toucher une prime de 7.500 dollars. Mais à la grande surprise de l’élite mathématique, l’o4-mini d’OpenAI a fait preuve d’une performance stupéfiante.

L'IA a laissé Ken Ono, un mathématicien renommé de l’Université de Virginie, sans voix lorsqu’il a réussi à résoudre un problème de théorie des nombres, qualifié de « question ouverte », en seulement 10 minutes. Notons qu’un doctorant aurait passé des semaines pour trouver la solution. 

De plus, l’o4-mini a mis en avant une méthode remarquable. L’IA a pris deux minutes pour analyser le problème et à s’exercer sur une version plus simplifiée. Ensuite, elle a répondu à la « question ouverte » et a présenté « une solution correcte mais audacieuse ». « Aucune citation n’est nécessaire car j’ai calculé ce nombre mystérieux moi-même ! » a déclaré l’IA avec une assurance troublante. Ken Ono a décidé d’alerte rapidement ses collègues.

Des résultats spectaculaires… et inquiétants

Alors que les IA classiques échouent dans plus de 98 % des cas sur des problèmes inédits, o4-mini atteint 20 % de réussite sur des épreuves de niveau recherche. Une progression fulgurante en l’espace d’un an. Pire encore pour les participants : seuls dix problèmes parmi plusieurs centaines soumis ont réussi à prendre l’IA en défaut.

Pour le professeur Yang Hui He, l’IA agit avec l’efficacité d’un chercheur exceptionnel : elle réalise en quelques minutes ce qui demande habituellement des semaines de travail. Cette accélération remet en question non seulement les méthodes traditionnelles d’enseignement, mais aussi le rôle même du chercheur humain.

Face à ces avancées, les participants à la réunion entrevoient une transformation radicale de leur discipline. Les mathématiciens de demain ne seront plus nécessairement des résolveurs, mais des superviseurs : leur rôle consistera à poser les bonnes questions, à évaluer la rigueur des démonstrations générées par l’IA et à préserver l’intuition humaine là où la machine peine encore.

Mais cette nouvelle ère soulève des inquiétudes. Ken Ono évoque une possible "preuve par intimidation", où la confiance excessive dans les affirmations d’une IA pourrait inhiber l’esprit critique des chercheurs. Ce risque est d’autant plus réel que les modèles IA, sont désormais capables de raisonner,voire dépasser, l’élite intellectuelle humaine dans l’un des domaines les plus exigeants comme les mathématiques pures.


Partager cet article
Commentaires

S'abonner au Courrier des Stratèges

Abonnez-vous gratuitement à la newsletter pour ne rien manquer de l'actualité.

Abonnement en cours...
You've been subscribed!
Quelque chose s'est mal passé
Le New York Times révèle la probable identité du fondateur du Bitcoin, par Renaud Jacobs

Le New York Times révèle la probable identité du fondateur du Bitcoin, par Renaud Jacobs

Un article et un podcast associé du New York Times (notamment dans l'émission The Daily d'avril 2026) présentent une enquête menée par le journaliste d'investigation John Carreyrou qui s'intéresse à la véritable identité du fondateur du Bitcoin. Une enquête stupéfiante. 1. L'identité du "suspect" L'enquête désigne Adam Back, un cryptographe britannique de renom et actuel PDG de Blockstream, comme étant la personne la plus probable derrière le pseudonyme de Satoshi Nakamoto, le créateur du


Rédaction

Rédaction

Lecornu échoue à réduire le chômage des cadres menacés par l'IA, par Elise Rochefort

Lecornu échoue à réduire le chômage des cadres menacés par l'IA, par Elise Rochefort

Le Palais Bourbon a des airs de fin de règne en ce printemps 2026. Ce jeudi 16 avril, alors que le Premier ministre tentait de faire passer, presque en catimini, la transposition de l’avenant n°3 sur l’assurance chômage, l’Hémicycle lui a opposé un refus cinglant. Un échec qui ne raconte pas seulement une maladresse législative, mais bien le séisme qui secoue le monde des cadres à l’heure de l’intelligence artificielle. L’objectif de Jean-Pierre Farandou et de Matignon était clair : s’attaquer


Rédaction

Rédaction

Dettes publiques : comment la Grèce et le Portugal se sont sortis d'affaire quand la France s'enfonçait, par Thibault de Varenne

Dettes publiques : comment la Grèce et le Portugal se sont sortis d'affaire quand la France s'enfonçait, par Thibault de Varenne

Beaucoup croient que "on ne peut rien faire" pour réduire la dette. Ben si ! Pendant que la France et la Belgique s'enfonçaient, la Grèce et le Portugal se sont sortis d'affaire. Voici comment. C’est un retournement de l’histoire qui devrait nous faire méditer, mes chers lecteurs. Il n'y a pas si longtemps, les cercles financiers et les chancelleries du Nord n'avaient qu'un acronyme à la bouche pour désigner les "pestiférés" de la zone euro : les PIGS (Portugal, Italie, Grèce, Espagne). Ce term


Rédaction

Rédaction

Bitcoin 2026, l'illusion du calme plat et le grand pivot des stratèges, par Vincent Clairmont

Bitcoin 2026, l'illusion du calme plat et le grand pivot des stratèges, par Vincent Clairmont

Ne vous y trompez pas : si le prix du Bitcoin semble s'assoupir dans un tunnel entre $70 000 et $76 000 depuis quelques semaines, nous ne sommes pas face à une stagnation, mais face à une mutation profonde de votre patrimoine numérique. Pour ceux qui, parmi vous, gèrent activement leur épargne salariale ou leur trésorerie d'entreprise, la période actuelle est sans doute la plus critique de ce cycle. Après le sommet euphorique d'octobre 2025 à $126 198, le marché a fait son ménage. Ce que nous o


Rédaction

Rédaction