Microsoft-onderzoekers slaan alarm: AI is nog niet klaar voor complexe taken
Automatisering met kunstmatige intelligentie (AI) wordt vaak gepresenteerd als een manier om productiviteit en efficiëntie te verhogen. Vaak gaat dit gepaard met het vervangen van menselijke taken door machines, soms met ontslagen tot gevolg. Maar een recent, nog niet peer-reviewed onderzoek van Microsoft-onderzoekers toont een verrassende bevinding: de beste AI-systemen van dit moment presteren bedroevend slecht op complexe werkplektaken.
Fouten in 25% van de gegenereerde documenten
Het team onderzocht geavanceerde AI-modellen, waaronder OpenAI’s GPT 5.4, Anthropic’s Claude Opus 4.6 en Google’s Gemini 3.1 Pro. Bij complexe opdrachten bleken deze systemen gemiddeld 25% van de inhoud in documenten te vervormen of fouten te introduceren. Oudere modellen presteerden nog slechter. De onderzoekers concluderen dat deze modellen "niet klaar zijn voor delegatie in de meeste domeinen".
Opvallend is dat Microsoft zelf niet meedeed aan het onderzoek. Het bedrijf investeert miljarden in AI en probeert de technologie in elk aspect van Windows 11 te integreren, vaak met teleurstellende resultaten.
AI op de werkvloer: een risico voor bedrijven
De bevindingen van Microsoft sluiten aan bij een groeiende trend die experts "workslop" noemen: AI gegenereerde rommel die medewerkers op hun collega’s afschuiven, maar uiteindelijk door mensen moet worden hersteld. Dit fenomeen kan bedrijven uiteenrukken, blijkt uit onderzoek van Stanford.
"Blind vertrouwen in AI voor interne documenten leidt bijna zeker tot fouten, dataverlies en extra werk voor medewerkers."
Waarschuwing voor bedrijven die AI willen implementeren
De resultaten van het onderzoek zijn opmerkelijk, omdat Microsoft zelf een groot voorstander is van AI-integratie. Toch tonen de cijfers aan dat bedrijven voorzichtig moeten zijn met het volledig vervangen van menselijke taken door AI. Fouten in documenten en inefficiënties kunnen leiden tot extra kosten en vertragingen.
Experts benadrukken dat AI nog niet volwassen genoeg is voor complexe werkplektaken. Het risico op "workslop" – waarbij AI gegenereerde inhoud meer schade aanricht dan oplevert – blijft groot.
Conclusie: AI is nog niet klaar voor de werkvloer
Hoewel AI veel belooft, blijkt uit het onderzoek van Microsoft dat de technologie nog niet betrouwbaar genoeg is voor complexe taken op de werkvloer. Bedrijven die AI willen implementeren, doen er goed aan om kritisch te blijven en menselijke controle niet uit het oog te verliezen.