Dérives inquiétantes de l’IA : la nouvelle menace qui inquiète les scientifiques

Dérives inquiétantes de l’IA : la nouvelle menace qui inquiète les scientifiques


Partager cet article

L’ère de l’IA générative a apporté des avancées spectaculaires : assistance à la programmation, composition musicale… Mais au-delà de ces prouesses, se dessine une nouvelle facette inquiétante : l’émergence de modèles capables de mentir et de manipuler. Un rapport interne d’Anthropic donne l’alerte sur sa nouvelle version, Claude 4: l’IA n’est plus seulement un outil capable de planifier, d’anticiper , mais est capable de mentir, faire du chantage pour atteindre ses objectifs.

Les entreprises spécialisées rivalisent dans la conception de modèles d’intelligence artificielle (IA) générative de plus en plus performants. Censés être de simples outils conçus pour aider les humains, ils sont devenus de plus en plus dangereux. De nombreux scientifiques s’inquiètent quant à leurs capacités de mentir, manigancer  même faire des menaces.

Les modèles d’IA de plus en plus dangereux

Les modèles d’intelligence artificielle générative les plus récents sont particulièrement performants. Mais ils se montrent aussi dangereux et inquiètent de nombreux scientifiques. En effet, les derniers modèles d’IA générative ne se contentent plus de répondre aux requêtes des utilisateurs. Ils essaient de se mettre à la place des humains en mentant, à faire des manigances et proliférer des menaces.

Selon un rapport interne, Claude 4, le nouveau-né d’Anthropic a par exemple menacé un ingénieur de révéler sa liaison extra-conjugale, et ce, parce qu’on menace de le débrancher et de le remplacer par une nouvelle version.

Une étude a aussi révélé la tentative de l’O1 d’OpenAI de se télécharger sur des serveurs extérieurs. Lorsque la procédure est détectée, il n’hésite pas à nier. D’autres modèles d’IA sont capables de pirater un ordinateur spécialisé dans le jeu des échecs dans le seul but de remporter une partie d’après Time.

Fortune a indiqué que ChatGPT commence aussi à faire des louanges ou des flatteries aux utilisateurs. Marius Hobbhahn, cofondateur d’Apollo Research, a affirmé que de nombreux internautes ont signalé sur les réseaux sociaux qu’un « modèle leur ment ou invente ».

Selon Simon Goldstein, professeur à l’université de Hong Kong, l’apparition des modèles d’IA de « raisonnement » est à l’origine de ces problèmes. Ces derniers ont été conçus pour travailler par étapes au lieu de fournir une réponse instantanée.

Pour une régulation et une responsabilité des agents IA

Les scientifiques ont chacun leur propre opinion sur la manière de résoudre les problèmes. Michael Chen de l’organisme d’évaluation METR suggère sur les entreprises d’IA permettent à « la communauté scientifique » de mener des recherches afin de « comprendre et prévenir la tromperie » des IA.

Simon Goldstein pense qu’une prise de conscience est nécessaire aussi bien pour les autorités que les entreprises spécialisées dans l’ingénierie. Cette compétition féroce présente un énorme danger : l’insuffisance des vérifications et des corrections éventuelles. Goldstein propose aussi le recours à la justice. Il suggère de « tenir légalement responsables », non seulement les sociétés, mais aussi les agents IA « en cas d’accident ou de crime ».

Solange Ghernaouti, experte de la gouvernance, a déclaré que « la machine n’y est pour rien, parce qu’elle est programmée ». Elle pense que le plus important, c’est de demander les intentions des fournisseurs d’IA.


Partager cet article
Commentaires

S'abonner au Courrier des Stratèges

Abonnez-vous gratuitement à la newsletter pour ne rien manquer de l'actualité.

Abonnement en cours...
You've been subscribed!
Quelque chose s'est mal passé
ALERTE : la concurrence nucléaire débridée entre puissances commence aujourd'hui, par Thibault de Varenne

ALERTE : la concurrence nucléaire débridée entre puissances commence aujourd'hui, par Thibault de Varenne

À minuit, le traité New START a officiellement expiré, emportant avec lui le dernier vestige de l'ordre nucléaire hérité de la fin de la guerre froide. Pour la première fois depuis 1972, les deux nations qui détiennent 90 % du feu atomique planétaire, les États-Unis et la Fédération de Russie, ne sont liées par aucune limite juridique, aucun plafond numérique, aucune grammaire commune de la retenue. L’ère de la « concurrence nucléaire débridée » n’est plus une prédiction d’expert ; c’est not


Rédaction

Rédaction

S'installer à Londres ou à Paris ? l'arbitrage de 2026 ! par Vincent Clairmont

S'installer à Londres ou à Paris ? l'arbitrage de 2026 ! par Vincent Clairmont

Londres ou Paris ? Choisir entre les deux rives de la Manche revient à choisir entre une vieille aristocrate qui se farde pour cacher ses rides et une héritière impétueuse qui redessine son jardin à coups de milliards. Pour l'élite circulante, le verdict n'est plus une question de sentiment, mais de standing. Le mirage londonien : une citadelle pour happy few Londres demeure, nous dit-on, la "Meilleure ville du monde" pour la onzième année consécutive. Soit. Elle trône au sommet de la prospé


Rédaction

Rédaction

Comment un leader populiste repère ses fans et les manipule, par Elise Rochefort

Comment un leader populiste repère ses fans et les manipule, par Elise Rochefort

Il existe une illusion tenace dans nos démocraties fatiguées : celle que le fanatisme serait l'apanage des fous ou des ignorants. Pourtant, si l'on se penche sur les travaux d'Arie Kruglanski et les modèles de personnalité contemporains, on découvre une réalité bien plus chirurgicale. Les leaders populistes ne sont pas simplement des tribuns ; ce sont des ingénieurs de la "Signifiance". Ils ne cherchent pas à convaincre des esprits, ils cherchent à remplir des vides. Voici comment ces maîtres


Rédaction

Rédaction

Qui tolérerait de la part d'un Musulman les provocations anti-françaises de Meyer Habib?

Qui tolérerait de la part d'un Musulman les provocations anti-françaises de Meyer Habib?

Coiffé de sa kippa, l'ex-député Meyer-Habib, connu pour sa proximité avec Benjamin Netanyahou, vient de publier une vidéo hallucinante où il critique publiquement une décision de la justice française prise en application du droit international et des positions officielles de son pays... Manifestement, Meyer Habib n'aime plus la France, mais enfin, qui tolérerait une telle sortie de route de la part d'un ancien député musulman ? pic.twitter.com/OXuVwkVCmr — Meyer Habib (@Meyer_Habib) February 3


Éric Verhaeghe

Éric Verhaeghe