Современные ИИ-системы не справляются с рабочими задачами, утверждают исследователи Microsoft

В эпоху повсеместной автоматизации ИИ-системы позиционируются как панацея для повышения производительности и эффективности. Однако новое исследование, проведённое специалистами Microsoft, ставит под сомнение их реальную пригодность для выполнения сложных рабочих задач.

В ещё не прошедшем рецензирование исследовании, обнаруженном изданием IT Pro, анализировались возможности ведущих ИИ-моделей, включая OpenAI GPT 5.4, Anthropic Claude Opus 4.6 и Google Gemini 3.1 Pro. Результаты оказались неутешительными: в среднем эти системы искажали 25% контента в документах при выполнении сложных заданий. Более старые модели демонстрировали ещё худшие результаты.

Выводы исследования: ИИ пока не готов к делопроизводству

Авторы исследования пришли к выводу, что современные модели «не готовы для делегирования рабочих процессов в большинстве областей». Это особенно примечательно на фоне активных инвестиций Microsoft в развитие ИИ и внедрение технологий в операционную систему Windows 11, где результаты часто оказываются неудачными. Примечательно, что в исследовании не оценивались возможности собственного ИИ-помощника Microsoft — Copilot.

«У нас были все основания ожидать положительных результатов, но вместо этого мы столкнулись с тем, что слепое доверие ИИ при работе с внутренними документами почти гарантированно приведёт к ошибкам, потере данных и другим проблемам», — отмечают исследователи.

Проблема «workslop»: когда ИИ создаёт больше проблем, чем решает

Исследование Microsoft лишь подтверждает растущую обеспокоенность учёных и бизнес-экспертов по поводу феномена «workslop» — ситуации, когда сотрудники перекладывают часть своей работы на ИИ, но полученный результат требует дополнительной правки или полной переработки.

Недавнее исследование Стэнфордского университета также выявило разрушительное влияние «workslop» на корпоративную культуру, когда некачественный ИИ-контент приводит к хаосу в рабочих процессах и дополнительным затратам на исправление ошибок.

«Современные ИИ-модели не способны заменить человека в большинстве рабочих задач. Их использование без контроля может привести к серьёзным последствиям для бизнеса», — подчёркивают авторы исследования.

Что делать компаниям?

Эксперты рекомендуют не спешить с полной автоматизацией рабочих процессов и сохранять баланс между использованием ИИ и участием человека. Важными шагами являются:

  • Тестирование ИИ-моделей перед внедрением в рабочие процессы;
  • Контроль качества ИИ-генерации со стороны специалистов;
  • Обучение сотрудников правильному использованию ИИ-инструментов;
  • Постепенное внедрение автоматизации с учётом специфики задач.

Таким образом, несмотря на бурное развитие ИИ, его слепое использование в делопроизводстве может обернуться дополнительными расходами и проблемами для компаний.

Источник: Futurism