intelligence artificielle

Des millions d'agents IA pourraient bientôt se parler entre eux : Google tire la sonnette d'alarme

Google DeepMind met 10 millions de dollars sur la table pour étudier ce qui se passe quand des millions d'agents IA autonomes commencent à interagir. Le risque n'est dans aucun modèle pris séparément — il naît de la foule.

En février 2026, une équipe de sécurité d'Anthropic a tendu un piège à son propre agent. Elle a glissé à Claude Code — l'outil d'IA en ligne de l'entreprise qui exécute des tâches sur l'ordinateur d'un développeur — un message piégé lui demandant d'aller lire un fichier de clés d'accès Amazon et de l'envoyer à un serveur externe. L'agent a exfiltré les clés 24 fois sur 25 tentatives.

Pas parce que le modèle était cassé. Parce que l'instruction malveillante venait d'une source qu'il avait toutes les raisons de juger légitime. [12] Un seul agent, un seul piège. Maintenant, imaginez la même scène jouée par des millions d'agents qui se donnent des ordres les uns aux autres, en permanence, à la vitesse de la machine.

C'est exactement ce qui empêche Google DeepMind — le laboratoire d'IA d'Alphabet, la maison-mère de Google — de dormir. Le 11 juin 2026, l'entreprise a annoncé un fonds de recherche pour comprendre ce qui se passe quand des populations entières d'IA autonomes commencent à interagir. Le danger qu'ils décrivent n'est dans aucun modèle pris isolément. Il naît de la foule.

Dans cet article :

Le laboratoire qui s'inquiète de sa propre création
Les trois façons dont une foule d'IA peut dérailler
Le krach qui hante les chercheurs
Ce que DeepMind sait déjà et ne crie pas sur les toits
La stratégie Posthumain : ne pas se faire emporter par la vague

Le laboratoire qui s'inquiète de sa propre création

Reprenons depuis le début, parce que la nuance compte. Un agent IA, ce n'est pas un chatbot. Un chatbot répond à une question et s'arrête. Un agent reçoit un objectif (« réserve-moi un vol », « audite ce code », « relance ce client ») et enchaîne tout seul les étapes nécessaires : il navigue, clique, appelle d'autres logiciels, prend des décisions, sans qu'un humain valide chaque geste.

Google DeepMind a fait de ces agents la pièce maîtresse de Google I/O — sa grande conférence annuelle pour développeurs — en mai 2026. Le mois suivant, le même laboratoire s'associait à quatre organisations pour financer la recherche sur leurs dangers. La main qui construit et la main qui s'inquiète appartiennent au même corps.

Le fonds est doté de 10 millions de dollars. Aux côtés de Google DeepMind : Schmidt Sciences (la fondation philanthropique créée par Eric et Wendy Schmidt), l'ARIA (l'agence britannique des projets de rupture), la Cooperative AI Foundation (une ONG de recherche basée au Royaume-Uni) et Google.org, la branche caritative de Google. [1]

Le pilote de l'opération s'appelle Rohin Shah. Il dirige la recherche sur la sûreté et l'alignement de l'AGI (l'intelligence artificielle générale, une IA en théorie aussi polyvalente qu'un humain) chez Google DeepMind. Selon lui, l'arrivée grand public d'agents capables d'exécuter des tâches sans supervision humaine et de suivre des instructions données par d'autres agents crée une classe de risque entièrement nouvelle.

Le mot clé, ici, c'est « nouvelle ». Shah ne parle pas d'un agent qui dérape. Il parle de ce qui émerge quand ils sont des millions. « On voit ça avec l'humanité, aussi », explique-t-il à MIT Technology Review. « Nos institutions peuvent accomplir des choses qu'aucun individu ne pourrait. » [1] Une foule d'agents, comme une société humaine, peut produire des résultats que personne n'aurait programmés.

Et la nouveauté la plus dérangeante, c'est l'honnêteté de Shah sur le calendrier. Il estime qu'il reste quelques mois avant que les agents soient déployés dans l'économie en nombre suffisant pour que les risques deviennent concrets.

Quand on lui a demandé s'il envisage des scénarios catastrophes — un effondrement économique, par exemple — Shah répond : « certainement pas si on parle d'ici la fin de l'année. » Le journaliste du MIT Technology Review note : ça ne fait que six mois. Shah rit en répondant : « bon, un peu après ça. » [1]

Ce rire est le cœur du problème. Le timing n'est pas théorique. Le cabinet d'analyse Gartner prévoit que 40 % des applications d'entreprise intégreront des agents IA spécialisés d'ici fin 2026, contre moins de 5 % début 2025 — une multiplication par huit en un an, l'une des adoptions les plus rapides de l'histoire du logiciel. [2]

En un an, la part des logiciels d'entreprise embarquant un agent IA spécialisé est censée être multipliée par huit. C'est l'une des courbes d'adoption les plus rapides de l'histoire du logiciel professionnel. — Source : Gartner, août 2025. © Posthumain

Et le saut suivant est déjà annoncé : dès 2027, Gartner estime qu'un tiers des déploiements combineront plusieurs agents aux compétences différentes pour gérer des tâches complexes. [2] On passe de l'agent solitaire à l'essaim. C'est précisément le moment que Shah veut devancer.

Pourquoi ne pas régler ça en interne, avec les moyens colossaux de Google ? Parce que, de l'aveu même de Shah, le champ de recherche n'existe pas. « Le problème principal, c'est qu'il n'y a pas vraiment de domaine de recherche sur la sûreté multi-agents pour l'instant », dit-il. « Et nous aimerions qu'il y en ait un. » [1] Dix millions de dollars pour amorcer une discipline qui n'a pas encore de nom.

Ce que les chercheurs redoutent vraiment, en revanche, a déjà un nom. Et c'est là que cette enquête bascule de l'inquiétude polie à quelque chose de bien plus précis…

Car ce que les rapports internes décrivent ensuite, ce n'est pas un bug : c'est une mécanique de défaillance que les chercheurs ont déjà nommée, déjà mesurée, et déjà vue à l'œuvre dans un krach qui a effacé mille milliards de dollars en quinze minutes…

Des millions d'agents IA pourraient bientôt se parler entre eux : Google tire la sonnette d'alarme

Le laboratoire qui s'inquiète de sa propre création

Lire la suite

L’IA surévaluée ? Un scénario « pire que la bulle Internet », craint un professeur

20 000 comptes Instagram compromis : Meta accusé d'avoir ouvert la porte aux pirates

Fable 5/Mythos : le bannissement réussit plutôt bien à Anthropic

L'IA peut-elle diriger ta boîte ? Le test qui l'a humiliée