RU

Потоковый ввод документов в СЭД

Традиционно основу документооборота каждой организации составляют бумажные документы. Переход на электронный документооборот подразумевает постепенное уменьшение количества бумажных документов за счёт перевода их в электронный вид.

Если в организации внедрена и используется система электронного документооборота (СЭД), то все документы создаются и регистрируются в этой системе, и дальнейшая работа пользователей с этими документами также производится в СЭД. Входящие же документы из других организаций в большинстве случаев по-прежнему поступают в бумажном виде, тем не менее, они тоже должны быть переведены в электронный вид и зарегистрированы в СЭД данной организации.

До сих пор, как правило, этот процесс производится тем же сотрудником, который регистрирует документ в СЭД, непосредственно в момент регистрации (создания карточки документа и прикрепления к ней отсканированного изображения). Так происходит в большинстве не только небольших, но и достаточно крупных компаний. Но наступает момент, когда у организации-получателя количество бумажных входящих документов становится настолько значительным, что становятся ощутимыми трудозатраты сотрудников, выполняющих эту операцию, а само время ввода становится недопустимо длительным. Так возникает задача разделения составной операции регистрации на шаги, выполнения однотипных шагов параллельно разными сотрудниками и повышения степени автоматизации ввода документов в СЭД.

Потоковый ввод документов позволяет решить задачу массового ввода электронных образов бумажных документов в СЭД. Чаще всего технология основывается на использовании штрих-кодов, которые наклеиваются или печатаются на первой странице бумажного документа или на отдельном чистом листе-разделителе. Затем набор разброшюрованных бумажных документов со штрих-кодами помещается в потоковый сканер. В результате электронные образы документов в заданном формате, полученные при сканировании, автоматически прикрепляются к соответствующим регистрационным карточкам документов в СЭД. Это позволяет существенно сократить количество ручных операций и значительно ускорить перевод бумажных документов в электронный вид и сохранение их в СЭД. Происходит это благодаря распараллеливанию операций, автоматизации таких процессов как разделение потока сканируемых документов на отдельные файлы, поиск в СЭД карточки зарегистрированного документа и прикрепление к ней электронного образа документа.

Потоковый ввод документов, как правило, реализуется в виде отдельного программного модуля, интегрированного в СЭД организации. Собственно операции разделения потока отсканированных образов документов на файлы (и распознавание текста, если требуется) могут выполняться самим этим модулем или внешними программными средствами. Интеграция модуля потокового ввода с внешними средствами распознавания может осуществляться на уровне программного взаимодействия или через файлообмен.

Второй способ позволяет обеспечить поддержку широкого спектра внешних средств сканирования и распознавания по выбору заказчика. Практически любое ПО сканирования и распознавания умеет сохранять результаты своей работы в виде файлов. Флагманские модели документных сканеров содержат в своей поставке ПО распознавания штрих-кодов.

Образ документа может помещаться в папку различными способами. Например, большинство современных потоковых сканеров поддерживают встроенные средства распознавания штрих-кодов, также для этого могут быть использованы специализированные средства, например, ABBYY Scan Station. Обнаруженные в папках файлы автоматически добавляются в карточки документов СЭД, например, по следующему правилу: имя файла должно быть сформировано по заданной маске и содержать в себе значение штрих-кода, по этому штрих-коду производится поиск карточки документа. Если карточка в СЭД найдена – файл автоматически прикрепляется к этой карточке, если карточка не найдена, или в имени файла не обнаружено значение штрих-кода, – автоматически создаётся новая карточка документа заданного в настройках вида, и к этой карточке прикрепляется файл.

В большинстве случаев прикрепления отсканированного изображения документа к карточке в СЭД достаточно, так как поступившие извне документы не подлежат редактированию. В основном они нужны только для чтения и поэтому не требуется распознавания их текста. Но распознавание текста и сохранение его вместе с изображением может оказаться полезным для возможности поиска этих документов в системе. Для распознавания текста также рационально использовать внешние средства OCR (Optical Character Recognizing), например, распространенный в России ABBY Recognition Server. Это целая отрасль индустрии ПО, и в организациях могут использоваться различные программные системы этого класса, в соответствии с корпоративными ИТ-стандартами. Модуль потокового ввода СЭД должен поддерживать прикрепление распознанных текстов к карточке документа независимо от используемых средств OCR.

Как известно, в бизнесе наряду с произвольными (неформализованными) документами используются так называемые формы – формализованные по внешнему виду документы. Примеры таких форм – платёжные документы, бланки, квитанции и пр. Современные средства OCR умеют при распознавании отсканированных изображений выделять атрибуты таких документов и сохранять их в структурированных текстовых файлах (например, формата XML). Примером такого ПО является ABBYY FlexiCapture. Модуль потокового ввода должен иметь возможность при вводе таких документов в СЭД автоматически заполнять атрибуты карточки документа, используя эту информацию. Следует иметь в виду, что при этом требуется настройка как средств распознавания форм, так и модуля потокового ввода под каждую форму.

В общем случае схема организации потокового ввода бумажных документов в СЭД выглядит следующим образом:


Потоковый ввод документов в СЭД - архитектура решения
Рис.1. Архитектура решения с использованием модуля потокового ввода

Когда же следует задуматься о том, что необходим потоковый ввод документов, и соответствующий модуль? Как правило, когда величина потока документов составляет сотни документов в день и более.

Чаще всего потоковый ввод используется такими предприятиями и организациями:

  • Крупные госучреждения – большой поток входящей корреспонденции.
  • Банки, страховые компании – большой поток клиентских документов.
  • Мелкооптовая и сетевая розничная торговля – большой поток финансовых документов (первички).

Использование потокового ввода даёт им преимущества:

  • Повышение оперативности ввода документов в СЭД.
  • Снижение затрат на ввод документов в СЭД.
  • Уменьшение количества ошибок при вводе документов в СЭД.
Похожие публикации
30 мая 2025
Сегодня ситуация с обработкой электронных документов постоянно меняется: развивается нормативная база, появляются новые отраслевые требования и технологические решения, что влияет на функциональность корпоративных СЭД. Дайджест новостей ЭДО от Docsvision помогает пользователям СЭД своевременно узнавать обо всех этих изменениях.
12 мая 2025
Как разрешить противоречие между долгосрочным планом развития СЭД и потребностями в новом функционале, возникшими «здесь и сейчас»? Один из возможных путей показывает проект модернизации ИТ-решения на платформе Docsvision, выполненный для крупной FMCG-компании.
Подпишитесь на рассылку
Нажимая на кнопку «Отправить», вы даёте согласие на обработку ваших персональных данных, в соответствии с политикой «ДоксВижн» в отношении обработки персональных данных.