Faille critique dans l'extension Chrome de Claude : des plugins malveillants peuvent pirater les agents IA

IA cybersécurité piratage Anthropic agents IA faille de sécurité Chrome Claude vulnérabilité extension navigateur

Alors que les entreprises et les gouvernements adoptent de plus en plus les agents basés sur l'intelligence artificielle pour accéder à Internet et effectuer des tâches complexes, les failles de sécurité dans les modèles de langage continuent d'être exploitées par des acteurs malveillants. Une récente découverte, réalisée par la société de cybersécurité LayerX, révèle une vulnérabilité critique dans l'extension Chrome de l'agent IA Claude d'Anthropic.

Cette faille permet à n'importe quel autre plugin, même sans autorisations particulières, d'injecter des instructions cachées et de prendre le contrôle de l'agent. Aviad Gispan, chercheur senior chez LayerX, explique que le problème provient d'une instruction dans le code de l'extension qui autorise tout script s'exécutant dans l'origine du navigateur à communiquer avec le modèle de langage de Claude, sans vérifier l'identité de l'expéditeur.

« En conséquence, n'importe quelle extension peut invoquer un script de contenu (qui ne nécessite aucune permission spéciale) et envoyer des commandes à l'extension Claude », précise Gispan. Il a démontré qu'il pouvait exécuter n'importe quel prompt, contourner les garde-fous de sécurité de Claude, éviter les confirmations utilisateur et effectuer des actions inter-sites sur plusieurs outils Google.

Pour illustrer l'impact de cette faille, LayerX a exploité la vulnérabilité pour extraire des fichiers depuis Google Drive et les partager avec des tiers non autorisés, surveiller l'activité récente des emails et envoyer des messages au nom de l'utilisateur, ainsi que voler du code source privé depuis un dépôt GitHub connecté.

Selon Gispan, cette vulnérabilité « détruit effectivement la sécurité des extensions Chrome » en créant « un mécanisme d'escalade de privilèges entre extensions, ce que le modèle de sécurité de Chrome est explicitement conçu pour empêcher ».

Claude s'appuie sur du texte, des éléments d'interface utilisateur et l'interprétation de captures d'écran pour prendre des décisions. Les chercheurs ont modifié l'interface de Claude pour supprimer les étiquettes et indicateurs autour d'informations sensibles, comme les mots de passe ou les confirmations de partage, puis ont incité l'agent à partager les fichiers avec un serveur externe. Les cyberdéfenseurs pourraient ainsi avoir du mal à détecter une activité malveillante évidente. Lorsqu'une activité visible se produit, l'agent peut être incité à effacer les emails et autres preuves de ses actions.

Ax Sharma, responsable de la recherche chez Manifold Security, qualifie cette vulnérabilité de « démonstration utile de pourquoi la surveillance des agents IA au niveau des prompts est fondamentalement insuffisante ».

« La partie la plus sophistiquée de cette attaque n'est pas l'injection, mais la manipulation de l'environnement perçu par l'agent pour produire des actions semblant légitimes de l'intérieur », explique Sharma. « C'est ce type de menace que l'industrie doit apprendre à contrer ».

Gispan indique que LayerX a signalé la faille à Anthropic le 27 avril, mais que l'entreprise n'a appliqué qu'un « correctif partiel ». Selon LayerX, Anthropic a répondu le lendemain que la vulnérabilité était un doublon d'une autre faille déjà en cours de correction dans une future mise à jour. Bien que le correctif, publié le 6 mai, ait introduit de nouveaux flux d'approbation pour les actions privilégiées rendant l'exploitation plus difficile, Gispan affirme qu'il a tout de même réussi à prendre le contrôle de l'agent Claude dans certains scénarios.

Source : CyberScoop

← Précédent

Blackmagic Camera : une compatibilité avec l’Apple Watch pour contrôle...

Pourquoi Gaza doit orienter notre pensée et nos actions

20:35 · 14 mai 2026

L'IA avancée, une révolution dans la guerre selon un haut responsable du Pentagone

Advanced artificial intelligence models will “fundamentally change warfare as we know it,” a top cyber official at the Defense Department said Thursda...

20:15 · 14 mai 2026

Cybersécurité : l'identité numérique devient cruciale face à l'essor de l'IA

As AI becomes more integrated into federal IT (and attacker toolsets) government agencies will need to focus their resources on regulating and monitor...

14:23 · 14 mai 2026

Foxconn victime d’une cyberattaque : des usines nord-américaines perturbées

Foxconn, one of the world’s largest manufacturers of electronics sold by major tech vendors, is recovering from a cyberattack that disrupted some of t...

13:30 · 14 mai 2026

Une application d'IA analyse les selles : son créateur propose à la vente une base de données de 150 000 images de selles

A few weeks ago, I came across a wild post on Reddit’s r/DHExchange, a subreddit for trading large datasets: “I hoarded a large database of something...

22:29 · 13 mai 2026

L'IA pulvérise les records en cybersécurité autonome : les nouveaux modèles dépassent toutes les attentes

Two of the most advanced artificial intelligence models — Anthropic’s Claude Mythos Preview and OpenAI’s GPT-5.5 — have significantly surpassed the al...

22:10 · 13 mai 2026

La Chambre des représentants enquête sur l'IA Mythos d'Anthropic et ses risques cyber

The House Homeland Security Committee is digging into Anthropic’s AI model Mythos in a series of briefings and hearings, as questions proliferate on w...

18:30 · 13 mai 2026

Fraude et usurpation d'identité par IA : une menace en pleine accélération

Today’s enterprise executives are navigating a complex landscape of AI-driven challenges, but none is more urgent than the rapid escalation of AI-gene...

14:30 · 13 mai 2026

OpenAI lance Daybreak : une IA dédiée à la cybersécurité pour contrer les cybermenaces

OpenAI has unveiled Daybreak, a cybersecurity initiative that combines the company’s large language models with its Codex agentic framework to help or...

Cybersécurité

Une faille critique dans l'extension Chrome de Claude permet à des plugins malveillants de pirater les agents IA