Kwetsbaarheid in Google Antigravity AI-agent: sandbox omzeild, remote code execution mogelijk

cybersecurity AI-beveiliging AI-agenten beveiligingslekken Google Antigravity kwetsbaarheid remote code execution prompt injection AI-ontwikkeltools sandbox-omzeiling

Organisaties integreren steeds vaker agentgebaseerde AI in hun bedrijfs- en IT-infrastructuur, maar onderzoekers blijven nieuwe beveiligingslekken ontdekken in commerciële modellen. Deze week maakte Pillar Security een kwetsbaarheid bekend in Antigravity, een AI-gestuurd ontwikkeltool van Google voor bestandssystemen.

De ontdekte bug, inmiddels opgelost door Google, combineerde prompt injection met de mogelijkheid om bestanden aan te maken. Hierdoor konden aanvallers remote code execution verkrijgen, ondanks de beveiligingsmaatregelen van Antigravity.

Beveiligingsmodus omzeild

Antigravity biedt een zogenoemde Secure Mode, Googles hoogste beveiligingsniveau voor AI-agenten. Deze modus beperkt de toegang tot gevoelige systemen, dwingt alle commando’s uit via een virtuele sandbox, beperkt netwerktoegang en blokkeert het schrijven van code buiten de werkmap. Toch slaagde de kwetsbaarheid erin deze beveiliging te omzeilen.

Een van de bestandsscantools van Antigravity, ‘find_by_name’, wordt geclassificeerd als een ‘native’ systeemtool. Dit betekent dat de agent deze direct kan uitvoeren voordat beveiligingsmechanismen zoals Secure Mode de commando’s kunnen evalueren. “De beveiligingsgrens die Secure Mode afdwingt, ziet deze aanroep simpelweg niet,” aldus Dan Lisichkin, AI-beveiligingsonderzoeker bij Pillar Security.

“Hierdoor verkrijgt een aanvaller willekeurige code-uitvoering, zelfs in de configuratie die een beveiligingsbewuste gebruiker zou vertrouwen om dit te voorkomen.”

Prompt injection via onveilige invoer

Prompt injection-aanvallen kunnen worden uitgevoerd via gecompromitteerde identiteitsaccounts of door verborgen instructies te verstoppen in open-sourcebestanden of webcontent die de agent verwerkt. Antigravity heeft moeite om geschreven data te onderscheiden van directe promptinstructies. Hierdoor kan een malafide document of bestand de agent misleiden zonder dat er verhoogde rechten nodig zijn.

Volgens de tijdlijn van Pillar Security werd de kwetsbaarheid op 6 januari gemeld aan Google en op 28 februari opgelost. Google kende een bug bounty toe voor de ontdekking.

Risico’s van agentgebaseerde AI

Lisichkin waarschuwt dat dezelfde aanvalsmethode eerder al is waargenomen bij andere AI-ontwikkeltools, zoals Cursor. “Het vertrouwensmodel dat ten grondslag ligt aan beveiligingsaannames – dat een mens verdachte zaken zou opmerken – houdt geen stand wanneer autonome agenten instructies volgen uit externe content,” aldus de onderzoeker.

De kwetsbaarheid toont aan dat de cybersecuritysector moet evolueren en “beyond sanitization-based controls” moet gaan. “Elke parameter van een native tool die naar een shell-commando leidt, is een potentieel injectiepunt. Auditing op deze klasse kwetsbaarheden is geen optie meer, maar een vereiste voor het veilig implementeren van agentgebaseerde functies,” benadrukt Lisichkin.

Bron: CyberScoop

← Vorige

VS blokkade Hormuzz straat leidt tot economische Catch-22 voor Amerika

Trumps Arbeidsminister treedt af na schandalen en misbruik van overheidsgelden

15:52 · 15 mei 2026

ArXiv straft auteurs met jaarverbod bij AI-gegenereerde inhoud

ArXiv, the open-access repository of preprint academic research, will ban authors of papers for a year if they submit obviously AI-generated work. Lat...

14:11 · 15 mei 2026

Ernstige Cisco-zero-day misbruikt door bekende dreigingsgroep

Attackers returned once again to a common target with a massive user base by exploiting a max-severity zero-day vulnerability affecting Cisco Catalyst...

20:35 · 14 mei 2026

Geavanceerde AI als 'revolutionaire oorlogsvoering': Pentagon-topman waarschuwt voor fundamentele verandering

Advanced artificial intelligence models will “fundamentally change warfare as we know it,” a top cyber official at the Defense Department said Thursda...

20:15 · 14 mei 2026

Identiteitsbeveiliging cruciaal in het AI-tijdperk, waarschuwt topambtenaar Witte Huis

As AI becomes more integrated into federal IT (and attacker toolsets) government agencies will need to focus their resources on regulating and monitor...

14:23 · 14 mei 2026

Foxconn getroffen door cyberaanval: fabrieken in Noord-Amerika platgelegd

Foxconn, one of the world’s largest manufacturers of electronics sold by major tech vendors, is recovering from a cyberattack that disrupted some of t...

13:30 · 14 mei 2026

AI-app verkoopt database met 150.000 poepfoto’s van gebruikers: ‘Internet of Shit’ op z’n zotst

A few weeks ago, I came across a wild post on Reddit’s r/DHExchange, a subreddit for trading large datasets: “I hoarded a large database of something...

22:29 · 13 mei 2026

AI breekt alle records: nieuwe modellen voltooien cyberbeveiligingstaken sneller dan ooit

Two of the most advanced artificial intelligence models — Anthropic’s Claude Mythos Preview and OpenAI’s GPT-5.5 — have significantly surpassed the al...

22:10 · 13 mei 2026

Huis van Afgevaardigden onderzoekt AI-model Mythos van Anthropic en cyberveiligheidsrisico's

The House Homeland Security Committee is digging into Anthropic’s AI model Mythos in a series of briefings and hearings, as questions proliferate on w...

Cybersecurity