Проблема, которую игнорирует индустрия
Почему самые передовые ИИ-модели мира способны решать задачи олимпиадного уровня, но не могут надёжно извлечь итоговую сумму из счёта-фактуры? Этот вопрос остаётся без ответа в корпоративном ПО. Мой двадцатилетний опыт работы с автоматизацией документооборота для крупнейших предприятий показывает: проблема не в моделях, а в их восприятии реальных данных.
Математика vs. реальные документы
Распространённое объяснение звучит так: математика — это задача рассуждений, а ИИ с этим справляется. Счёты — это задача восприятия: грязные сканы, сложные макеты, которые требуют «лучших моделей». Но это неверно.
Математика — это не чистое рассуждение. Олимпиадные задачи строятся из ограниченного набора стандартных техник. Модель обучается на тысячах решений и комбинирует их, как конструктор. Это композитное сопоставление шаблонов, а не глубокий анализ.
В отличие от этого, шахматы — это задача, где каждая позиция уникальна. Даже зная все тактические приёмы, нельзя предсказать исход жертвы без конкретных расчётов. Шахматные движки решили эту проблему, создав систему вокруг нейросети, а не увеличивая саму сеть.
Где скрывается основной риск
Большинство канцелярских задач похожи на математику: применяются известные правила к новым данным. ИИ справляется с 85–95% случаев — это реальная польза. Но оставшиеся 5–15% — это зона риска. Здесь шаблоны не совпадают, но модель не осознаёт свою ошибку и выдаёт уверенный, но неверный ответ.
Мы тестировали ИИ на извлечении данных из самых простых документов: счёт-фактур. Задача — прочитать число и поместить его в нужное поле. Никаких рассуждений, только чтение. Даже лучшие модели не достигают 100% точности. Опытный человек справляется лучше.
«Мы проверяли несколько моделей. Результат был одинаковым. Проблема не в нашем пайплайне, а в самой природе задачи».
Почему это важно для бизнеса
Ошибки в обработке документов могут привести к финансовым потерям, юридическим рискам и сбоям в бизнес-процессах. ИИ не способен распознать свои ошибки в сложных случаях, а значит, требуется система контроля и валидации.
Решение не в том, чтобы ждать «лучших моделей». Оно в том, чтобы признать: ИИ не заменит человека полностью. Даже в самых простых задачах.