Проблема, которую игнорирует индустрия

Почему самые передовые ИИ-модели мира способны решать задачи олимпиадного уровня, но не могут надёжно извлечь итоговую сумму из счёта-фактуры? Этот вопрос остаётся без ответа в корпоративном ПО. Мой двадцатилетний опыт работы с автоматизацией документооборота для крупнейших предприятий показывает: проблема не в моделях, а в их восприятии реальных данных.

Математика vs. реальные документы

Распространённое объяснение звучит так: математика — это задача рассуждений, а ИИ с этим справляется. Счёты — это задача восприятия: грязные сканы, сложные макеты, которые требуют «лучших моделей». Но это неверно.

Математика — это не чистое рассуждение. Олимпиадные задачи строятся из ограниченного набора стандартных техник. Модель обучается на тысячах решений и комбинирует их, как конструктор. Это композитное сопоставление шаблонов, а не глубокий анализ.

В отличие от этого, шахматы — это задача, где каждая позиция уникальна. Даже зная все тактические приёмы, нельзя предсказать исход жертвы без конкретных расчётов. Шахматные движки решили эту проблему, создав систему вокруг нейросети, а не увеличивая саму сеть.

Где скрывается основной риск

Большинство канцелярских задач похожи на математику: применяются известные правила к новым данным. ИИ справляется с 85–95% случаев — это реальная польза. Но оставшиеся 5–15% — это зона риска. Здесь шаблоны не совпадают, но модель не осознаёт свою ошибку и выдаёт уверенный, но неверный ответ.

Мы тестировали ИИ на извлечении данных из самых простых документов: счёт-фактур. Задача — прочитать число и поместить его в нужное поле. Никаких рассуждений, только чтение. Даже лучшие модели не достигают 100% точности. Опытный человек справляется лучше.

«Мы проверяли несколько моделей. Результат был одинаковым. Проблема не в нашем пайплайне, а в самой природе задачи».

Почему это важно для бизнеса

Ошибки в обработке документов могут привести к финансовым потерям, юридическим рискам и сбоям в бизнес-процессах. ИИ не способен распознать свои ошибки в сложных случаях, а значит, требуется система контроля и валидации.

Решение не в том, чтобы ждать «лучших моделей». Оно в том, чтобы признать: ИИ не заменит человека полностью. Даже в самых простых задачах.

Источник: Fast Company