Sciences fondamentales: quand l’IA surpasse les plus grands mathématiciens
Photo by Steve Johnson / Unsplash

Sciences fondamentales: quand l’IA surpasse les plus grands mathématiciens


Partager cet article

En mai 2025, trente des mathématiciens les plus réputés au monde se sont réunis à Berkeley pour relever un défi aussi simple qu’ambitieux : mettre en échec une intelligence artificielle, le nouveau modèle o4-mini d'OpenAI.

Cette rencontre, organisée par Epoch AI, visait à confronter le nouveau modèle o4-mini développé par OpenAI à des problèmes de mathématiques inédits, censés le dépasser. Mais la performance et l’assurance d’o4-mini ont choqué ces éminents mathématiciens.  

Les performances stupéfiantes d’o4-mini

Epoch AI a réuni trente mathématiciens les plus brillants du monde à Berkeley lors d’un weekend de mai 2025. Il s’agissait d’un évènement secret et les participants étaient obligés de signer un accord de non-divulgation. Pendant la réunion, ils se communiquaient uniquement via une application de messagerie ultra-sécurisée nommée Signal. Le but d’Epoch AI était de tester les limites de l’o4-mini d’OpenAI. C’est un outil d’intelligence artificielle révolutionnaire, connu pour sa performance.

Les experts étaient donc chargés de créer des problèmes mathématiques ultra complexes, qu’ils pourraient résoudre.  Ils seront ensuite présentés au robot. L’objectif était de faire échouer ce dernier. Chaque problème non résolu par l’IA permettait à son créateur de toucher une prime de 7.500 dollars. Mais à la grande surprise de l’élite mathématique, l’o4-mini d’OpenAI a fait preuve d’une performance stupéfiante.

L'IA a laissé Ken Ono, un mathématicien renommé de l’Université de Virginie, sans voix lorsqu’il a réussi à résoudre un problème de théorie des nombres, qualifié de « question ouverte », en seulement 10 minutes. Notons qu’un doctorant aurait passé des semaines pour trouver la solution. 

De plus, l’o4-mini a mis en avant une méthode remarquable. L’IA a pris deux minutes pour analyser le problème et à s’exercer sur une version plus simplifiée. Ensuite, elle a répondu à la « question ouverte » et a présenté « une solution correcte mais audacieuse ». « Aucune citation n’est nécessaire car j’ai calculé ce nombre mystérieux moi-même ! » a déclaré l’IA avec une assurance troublante. Ken Ono a décidé d’alerte rapidement ses collègues.

Des résultats spectaculaires… et inquiétants

Alors que les IA classiques échouent dans plus de 98 % des cas sur des problèmes inédits, o4-mini atteint 20 % de réussite sur des épreuves de niveau recherche. Une progression fulgurante en l’espace d’un an. Pire encore pour les participants : seuls dix problèmes parmi plusieurs centaines soumis ont réussi à prendre l’IA en défaut.

Pour le professeur Yang Hui He, l’IA agit avec l’efficacité d’un chercheur exceptionnel : elle réalise en quelques minutes ce qui demande habituellement des semaines de travail. Cette accélération remet en question non seulement les méthodes traditionnelles d’enseignement, mais aussi le rôle même du chercheur humain.

Face à ces avancées, les participants à la réunion entrevoient une transformation radicale de leur discipline. Les mathématiciens de demain ne seront plus nécessairement des résolveurs, mais des superviseurs : leur rôle consistera à poser les bonnes questions, à évaluer la rigueur des démonstrations générées par l’IA et à préserver l’intuition humaine là où la machine peine encore.

Mais cette nouvelle ère soulève des inquiétudes. Ken Ono évoque une possible "preuve par intimidation", où la confiance excessive dans les affirmations d’une IA pourrait inhiber l’esprit critique des chercheurs. Ce risque est d’autant plus réel que les modèles IA, sont désormais capables de raisonner,voire dépasser, l’élite intellectuelle humaine dans l’un des domaines les plus exigeants comme les mathématiques pures.


Partager cet article
Commentaires

S'abonner au Courrier des Stratèges

Abonnez-vous gratuitement à la newsletter pour ne rien manquer de l'actualité.

Abonnement en cours...
You've been subscribed!
Quelque chose s'est mal passé
L'OPEP-monde se meurt, le pétrole s'embrase : vers un Brent à 150$, par Vincent Clairmont

L'OPEP-monde se meurt, le pétrole s'embrase : vers un Brent à 150$, par Vincent Clairmont

Le marché pétrolier n'est plus une mécanique de précision, mais une boucherie à ciel ouvert. Le Brent frôle les 120 dollars le baril et, tandis que les chancelleries s'agitent, les faits, eux, sont têtus : nous assistons à la démolition contrôlée de l'ordre énergétique mondial. Ce n'est pas une simple "crise de volatilité", c'est le grand découplage entre la géopolitique de la force et les illusions d'un marché physique en état de mort cérébrale. Pourquoi l’asphyxie mondiale impose une stratég


Rédaction

Rédaction

La Directive UE sur les rémunérations ou la fin programmée de la liberté contractuelle...

La Directive UE sur les rémunérations ou la fin programmée de la liberté contractuelle...

Plusieurs lecteurs m'ont demandé ce que je pensais de la directive européenne sur les rémunérations, qui va révolutionner ce sujet tabou en France. Voici une première réponse... Sous le vernis moralisateur de l'« égalité femme-homme », la Directive (UE) 2023/970 vient d’achever ce qui restait de l’autonomie de gestion dans nos entreprises. Ce n'est plus du droit social, c'est de l'ingénierie bureaucratique pure, une tentative désespérée de la Caste européenne de substituer le plan à la réalité


Éric Verhaeghe

Éric Verhaeghe

Directive rémunérations : quelles sont les surtranspositions françaises qui nuiront aux entreprises? par Elise Rochefort

Directive rémunérations : quelles sont les surtranspositions françaises qui nuiront aux entreprises? par Elise Rochefort

Alors que l'échéance du 7 juin 2026 approche, la France s'apprête à transformer son Index de l’égalité professionnelle pour l'aligner sur la directive (UE) 2023/970. Si l'intention de réduire l'écart salarial (toujours de 14,2 % en France) est louable, le projet de loi français choisit d'aller bien au-delà des exigences européennes minimales. Pour les entreprises, ces « surtranspositions » ne sont pas neutres : elles créent une charge administrative et un risque juridique inédit que j'analyse p


Rédaction

Rédaction

Vers l’ère de l’entrepreneur innovant souverain, par Eric Lemaire
Photo by Luigi Estuye, LUCREATIVE® / Unsplash

Vers l’ère de l’entrepreneur innovant souverain, par Eric Lemaire

La numérisation débouchant sur l’intelligence artificielle est une innovation originale car elle ne bouleverse pas seulement l’économie par ses capacités mais par la vitesse inédite à laquelle elle diffuse ses effets. Uber n’a pas supprimé les chauffeurs, il a transformé leur environnement en quelques années. En Ukraine, les soldats n’ont pas disparu, leur métier a été redéfini en temps réel. La puissance ne repose plus uniquement sur la taille ou les ressources mais sur la capacité d’adaptation


Rédaction

Rédaction