Künstliche Intelligenz soll Arbeitsprozesse optimieren, indem sie repetitive Aufgaben übernimmt und so Produktivität und Effizienz steigert. Doch eine aktuelle, noch nicht begutachtete Studie von Microsoft-Forschern wirft ein ernüchterndes Licht auf die Leistungsfähigkeit moderner KI-Systeme im Berufsalltag.
Wie IT Pro berichtet, untersuchte das Team führende KI-Modelle wie OpenAI’s GPT 5.4, Anthropic’s Claude Opus 4.6 und Google’s Gemini 3.1 Pro. Das Ergebnis: Bei komplexen Aufgaben beschädigten die Systeme im Schnitt 25 Prozent der Inhalte in Dokumenten. Ältere Modelle schnitten noch schlechter ab. Die Forscher zogen daraus den Schluss, dass diese KI-Systeme „für delegierte Arbeitsabläufe in den meisten Bereichen nicht bereit“ seien.
Besonders brisant ist diese Erkenntnis aus dem Hause Microsoft. Der Konzern investiert Milliarden in KI und versucht, die Technologie in nahezu alle Bereiche von Windows 11 zu integrieren – oft mit fragwürdigen Ergebnissen. Interessanterweise wurde in der Studie Microsofts eigener Copilot-KI nicht evaluiert.
Die Studie zeigt: Trotz aller Fortschritte sind KI-Systeme noch nicht zuverlässig genug, um sensible Arbeitsprozesse zu übernehmen. Blindes Vertrauen in Large Language Models (LLMs) kann zu Fehlern, Datenverlust oder sogar vollständiger Zerstörung von Dokumenten führen.
KI-generierter „Workslop“: Ein wachsendes Problem
Die Microsoft-Studie reiht sich in eine wachsende Zahl von Untersuchungen ein, die sich mit dem Phänomen des sogenannten „Workslop“ beschäftigen. Dabei handelt es sich um fehlerhafte oder unvollständige KI-generierte Arbeitsergebnisse, die von Mitarbeitern unreflektiert weitergegeben werden. Oft müssen Kollegen diese Fehler anschließend korrigieren – ein zusätzlicher Aufwand, der die erhoffte Effizienzsteigerung zunichtemacht.
Eine Studie der Stanford University warnte bereits vor den Folgen von „Workslop“: Unternehmen könnten dadurch an Produktivität verlieren und sogar interne Konflikte verschärfen, wenn Mitarbeiter KI-Ergebnisse ungeprüft übernehmen.
Die Microsoft-Forscher betonen, dass ihre Ergebnisse keine pauschale Ablehnung von KI darstellen. Vielmehr zeige die Studie, dass Unternehmen verantwortungsvoll mit der Technologie umgehen müssen. Eine sorgfältige Prüfung und menschliche Kontrolle seien weiterhin unverzichtbar, um kostspielige Fehler zu vermeiden.