Применение ИИ в задачах классического документооборота

Сегодня ИИ используется в различных областях, и, конечно, в процессах обработки документов, так как сценарии обработки типовых документов совпадают, а ключевые факторы определения характера обработки документов часто зависят от вида и содержания конкретного документа. Рассмотрим несколько типичных сценариев использования ИИ в задачах классического документооборота:

Категоризация документов

Данная задача сводится к выявлению категории документов из потока входящих, определение его вида и некоторых базовых параметров для последующей обработки. Примеры таких задач:

  • Выявление документа, содержащего обращение граждан и определение класса жалобы согласно единому классификатору.
  • Выявление входящего документа в системе делопроизводства и определение необходимого уровня контроля.
  • Определение вида финансового документа (счёт-фактура, акт, товарная накладная и пр.) для передачи его в соответствующую систему обработки.

В этом случае используются классические методы ИИ мультиклассовой или мультилейбельной классификации и соответствующие модели машинного обучения, но могут применяться и другие формальные алгоритмы, не требующие применения ИИ (например, анализ атрибутивного состава документов, поиск связанных документов и пр.).

Автоматическая маршрутизация документов, определение исполнителя и параметров задания по обработке документов

Эта группа моделей может применятся в большом количестве кейсов, например, при определении подразделения при обработке входящей корреспонденции, определении типа маршрута обработки входящего финансового документа, автоматическое формирование задание на исполнение документа.  Для данных задач можно применять те же алгоритмы ИИ, что и в предыдущем классе задач, но в каждом конкретном случае определяется набор значимых параметров для определения целевого показателя и применяются наиболее чувствительные алгоритмы.

Выделение сущностей в документе

Классическая задача IDP (Intelligent Document Processing) систем – найти в документе сущности (атрибуты и их группы), важные для дальнейшей обработки. Например, определить атрибуты отправителя или получателя в корреспонденции, значимые учётные данные в первичных документах и т.п.  Здесь применяется NER (named entity recognition) или задача распознавания именованных сущностей, который также представляет собой сочетание алгоритмических подходов (зонального определения, использование регулярных выражений и пр.) и нейросетях моделей, например, YOLO. Сочетание различных подходов для выделения сущностей позволяет достичь довольно высокого качества её работы.

Интеллектуальная обработка текста документа: автореферирование, поиск схожих документов, поиск аномалий в оформлении типовых документов, выявление полноты и правильности заполнения пакета документов и пр. 

Это довольно значительный корпус задач, решение которых специфично для каждого конкретного типа задачи. Здесь применяется большое количество различных инструментов – абстрактивной суммаризации текста, Bert-like языковые модели для сверки текста, faiss модели поиска близости и т.д.

Перечисленные подходы применения ИИ в практике документооборота проверены и показали свою эффективность в процессе решения практических кейсов, однако этим задачи ИИ не ограничиваются, так как технологии постоянно развиваются. Одной из перспективных технологий является использование больших языковых моделей (LLM), которые уже зарекомендовали себя для решения большого количества задач и ждут своего применения в задачах корпоративного управления, и, в частности, в задачах работы с документами.

Похожие публикации
6 июня 2024
Давайте рассмотрим использование платформы Docsvision для конфиденциального документооборота.
13 мая 2024
К 1 сентября необходимо адаптировать внутренние процессы и ИТ-системы под законодательные требования для работы с ЭП и МЧД.
Подпишитесь на рассылку
Нажимая на кнопку «Отправить», вы даёте согласие на обработку ваших персональных данных, в соответствии с политикой «ДоксВижн» в отношении обработки персональных данных.
Поддержка МЧД в СЭД Как изменится порядок подписания? Как подготовить предприятие к изменениям? Как адаптировать СЭД?