Dérives inquiétantes de l’IA : la nouvelle menace qui inquiète les scientifiques

Dérives inquiétantes de l’IA : la nouvelle menace qui inquiète les scientifiques


Partager cet article

L’ère de l’IA générative a apporté des avancées spectaculaires : assistance à la programmation, composition musicale… Mais au-delà de ces prouesses, se dessine une nouvelle facette inquiétante : l’émergence de modèles capables de mentir et de manipuler. Un rapport interne d’Anthropic donne l’alerte sur sa nouvelle version, Claude 4: l’IA n’est plus seulement un outil capable de planifier, d’anticiper , mais est capable de mentir, faire du chantage pour atteindre ses objectifs.

Les entreprises spécialisées rivalisent dans la conception de modèles d’intelligence artificielle (IA) générative de plus en plus performants. Censés être de simples outils conçus pour aider les humains, ils sont devenus de plus en plus dangereux. De nombreux scientifiques s’inquiètent quant à leurs capacités de mentir, manigancer  même faire des menaces.

Les modèles d’IA de plus en plus dangereux

Les modèles d’intelligence artificielle générative les plus récents sont particulièrement performants. Mais ils se montrent aussi dangereux et inquiètent de nombreux scientifiques. En effet, les derniers modèles d’IA générative ne se contentent plus de répondre aux requêtes des utilisateurs. Ils essaient de se mettre à la place des humains en mentant, à faire des manigances et proliférer des menaces.

Selon un rapport interne, Claude 4, le nouveau-né d’Anthropic a par exemple menacé un ingénieur de révéler sa liaison extra-conjugale, et ce, parce qu’on menace de le débrancher et de le remplacer par une nouvelle version.

Une étude a aussi révélé la tentative de l’O1 d’OpenAI de se télécharger sur des serveurs extérieurs. Lorsque la procédure est détectée, il n’hésite pas à nier. D’autres modèles d’IA sont capables de pirater un ordinateur spécialisé dans le jeu des échecs dans le seul but de remporter une partie d’après Time.

Fortune a indiqué que ChatGPT commence aussi à faire des louanges ou des flatteries aux utilisateurs. Marius Hobbhahn, cofondateur d’Apollo Research, a affirmé que de nombreux internautes ont signalé sur les réseaux sociaux qu’un « modèle leur ment ou invente ».

Selon Simon Goldstein, professeur à l’université de Hong Kong, l’apparition des modèles d’IA de « raisonnement » est à l’origine de ces problèmes. Ces derniers ont été conçus pour travailler par étapes au lieu de fournir une réponse instantanée.

Pour une régulation et une responsabilité des agents IA

Les scientifiques ont chacun leur propre opinion sur la manière de résoudre les problèmes. Michael Chen de l’organisme d’évaluation METR suggère sur les entreprises d’IA permettent à « la communauté scientifique » de mener des recherches afin de « comprendre et prévenir la tromperie » des IA.

Simon Goldstein pense qu’une prise de conscience est nécessaire aussi bien pour les autorités que les entreprises spécialisées dans l’ingénierie. Cette compétition féroce présente un énorme danger : l’insuffisance des vérifications et des corrections éventuelles. Goldstein propose aussi le recours à la justice. Il suggère de « tenir légalement responsables », non seulement les sociétés, mais aussi les agents IA « en cas d’accident ou de crime ».

Solange Ghernaouti, experte de la gouvernance, a déclaré que « la machine n’y est pour rien, parce qu’elle est programmée ». Elle pense que le plus important, c’est de demander les intentions des fournisseurs d’IA.


Partager cet article
Commentaires

S'abonner au Courrier des Stratèges

Abonnez-vous gratuitement à la newsletter pour ne rien manquer de l'actualité.

Abonnement en cours...
You've been subscribed!
Quelque chose s'est mal passé
Louvre : les intouchables de la République, par Veerle Daens

Louvre : les intouchables de la République, par Veerle Daens

Le vol des joyaux de la Couronne n'est pas le vrai scandale. Le vrai scandale, c'est que personne n'a payé. En sept minutes, une poignée de criminels a exposé la faillite d'une institution d'État, le Louvre, mais surtout la faillite morale d'un système : la république des copains-coquins, où la responsabilité est un concept réservé au bas peuple. Au cœur de cette débâcle se trouve Laurence des Cars, présidente-directrice du musée. Son maintien en poste est une masterclass sur le privilège d


CDS

CDS

Croissance: quand l’État s’efface, l'économie s'envole
Photo by Headway / Unsplash

Croissance: quand l’État s’efface, l'économie s'envole

Le vent tourne pour l'économie française. L’INSEE annonce une croissance de 0,5 % au troisième trimestre 2025, supérieure aux 0,3 % attendus. Ce rebond n’est pourtant pas dû à une politique publique visionnaire, mais bien au dynamisme spontané des acteurs privés, notamment à l’exportation. La croissance française surprend au troisième trimestre 2025 (+0,5%), dépassant les attentes. Portée par des exportations et une production dynamiques, cette accélération confirme notre thèse : "moins il y a


Lalaina Andriamparany

Lalaina Andriamparany

Vaccins COVID : vague de procès en Europe, les Pays-Bas en première ligne
Photo by Mathurin NAPOLY / matnapo / Unsplash

Vaccins COVID : vague de procès en Europe, les Pays-Bas en première ligne

Dans un contexte où la pandémie de COVID-19 continue de susciter des débats passionnés sur la sécurité des vaccins ARNm, une affaire judiciaire aux Pays-Bas fait couler beaucoup d'encre. Depuis juillet 2023, sept citoyens néerlandais, se présentant comme victimes de dommages graves (physiques et mentaux) suite à leur vaccination, ont intenté une action civile devant le tribunal de district de Leeuwarden contre 17 entités et personnalités influentes. Parmi les accusés : Bill GATES (via sa fondat


Isabelle Hock

Isabelle Hock

Citoyens ! le train de la censure macroniste entre en gare !

Citoyens ! le train de la censure macroniste entre en gare !

La macronie ne rate jamais une occasion de se draper dans les grands principes pour mieux les piétiner. La dernière trouvaille sortie du chapeau de la technostructure, en marge du Forum de Paris sur la Paix ce 29 octobre 2025, s'intitule pompeusement : "Déclaration de Paris sur l’action multilatérale pour l’intégrité de l’information". Un titre qui fleure bon la démocratie, le pluralisme et la lutte contre les méchants désinformateurs. Pourtant, quiconque connaît le principe élémentaire de


Éric Verhaeghe

Éric Verhaeghe