Потоковый ввод документов в СЭД

Традиционно основу документооборота каждой организации составляют бумажные документы. Переход на электронный документооборот подразумевает постепенное уменьшение количества бумажных документов за счёт перевода их в электронный вид.

Если в организации внедрена и используется система электронного документооборота (СЭД), то все документы создаются и регистрируются в этой системе, и дальнейшая работа пользователей с этими документами также производится в СЭД. Входящие же документы из других организаций в большинстве случаев по-прежнему поступают в бумажном виде, тем не менее, они тоже должны быть переведены в электронный вид и зарегистрированы в СЭД данной организации.

До сих пор, как правило, этот процесс производится тем же сотрудником, который регистрирует документ в СЭД, непосредственно в момент регистрации (создания карточки документа и прикрепления к ней отсканированного изображения). Так происходит в большинстве не только небольших, но и достаточно крупных компаний. Но наступает момент, когда у организации-получателя количество бумажных входящих документов становится настолько значительным, что становятся ощутимыми трудозатраты сотрудников, выполняющих эту операцию, а само время ввода становится недопустимо длительным. Так возникает задача разделения составной операции регистрации на шаги, выполнения однотипных шагов параллельно разными сотрудниками и повышения степени автоматизации ввода документов в СЭД.

Потоковый ввод документов позволяет решить задачу массового ввода электронных образов бумажных документов в СЭД. Чаще всего технология основывается на использовании штрих-кодов, которые наклеиваются или печатаются на первой странице бумажного документа или на отдельном чистом листе-разделителе. Затем набор разброшюрованных бумажных документов со штрих-кодами помещается в потоковый сканер. В результате электронные образы документов в заданном формате, полученные при сканировании, автоматически прикрепляются к соответствующим регистрационным карточкам документов в СЭД. Это позволяет существенно сократить количество ручных операций и значительно ускорить перевод бумажных документов в электронный вид и сохранение их в СЭД. Происходит это благодаря распараллеливанию операций, автоматизации таких процессов как разделение потока сканируемых документов на отдельные файлы, поиск в СЭД карточки зарегистрированного документа и прикрепление к ней электронного образа документа.

Потоковый ввод документов, как правило, реализуется в виде отдельного программного модуля, интегрированного в СЭД организации. Собственно операции разделения потока отсканированных образов документов на файлы (и распознавание текста, если требуется) могут выполняться самим этим модулем или внешними программными средствами. Интеграция модуля потокового ввода с внешними средствами распознавания может осуществляться на уровне программного взаимодействия или через файлообмен.

Второй способ позволяет обеспечить поддержку широкого спектра внешних средств сканирования и распознавания по выбору заказчика. Практически любое ПО сканирования и распознавания умеет сохранять результаты своей работы в виде файлов. Флагманские модели документных сканеров содержат в своей поставке ПО распознавания штрих-кодов.

Образ документа может помещаться в папку различными способами. Например, большинство современных потоковых сканеров поддерживают встроенные средства распознавания штрих-кодов, также для этого могут быть использованы специализированные средства, например, ABBYY Scan Station. Обнаруженные в папках файлы автоматически добавляются в карточки документов СЭД, например, по следующему правилу: имя файла должно быть сформировано по заданной маске и содержать в себе значение штрих-кода, по этому штрих-коду производится поиск карточки документа. Если карточка в СЭД найдена – файл автоматически прикрепляется к этой карточке, если карточка не найдена, или в имени файла не обнаружено значение штрих-кода, – автоматически создаётся новая карточка документа заданного в настройках вида, и к этой карточке прикрепляется файл.

В большинстве случаев прикрепления отсканированного изображения документа к карточке в СЭД достаточно, так как поступившие извне документы не подлежат редактированию. В основном они нужны только для чтения и поэтому не требуется распознавания их текста. Но распознавание текста и сохранение его вместе с изображением может оказаться полезным для возможности поиска этих документов в системе. Для распознавания текста также рационально использовать внешние средства OCR (Optical Character Recognizing), например, распространенный в России ABBY Recognition Server. Это целая отрасль индустрии ПО, и в организациях могут использоваться различные программные системы этого класса, в соответствии с корпоративными ИТ-стандартами. Модуль потокового ввода СЭД должен поддерживать прикрепление распознанных текстов к карточке документа независимо от используемых средств OCR.

Как известно, в бизнесе наряду с произвольными (неформализованными) документами используются так называемые формы – формализованные по внешнему виду документы. Примеры таких форм – платёжные документы, бланки, квитанции и пр. Современные средства OCR умеют при распознавании отсканированных изображений выделять атрибуты таких документов и сохранять их в структурированных текстовых файлах (например, формата XML). Примером такого ПО является ABBYY FlexiCapture. Модуль потокового ввода должен иметь возможность при вводе таких документов в СЭД автоматически заполнять атрибуты карточки документа, используя эту информацию. Следует иметь в виду, что при этом требуется настройка как средств распознавания форм, так и модуля потокового ввода под каждую форму.

В общем случае схема организации потокового ввода бумажных документов в СЭД выглядит следующим образом:


Потоковый ввод документов в СЭД - архитектура решения
Рис.1. Архитектура решения с использованием модуля потокового ввода

Когда же следует задуматься о том, что необходим потоковый ввод документов, и соответствующий модуль? Как правило, когда величина потока документов составляет сотни документов в день и более.

Чаще всего потоковый ввод используется такими предприятиями и организациями:

  • Крупные госучреждения – большой поток входящей корреспонденции.
  • Банки, страховые компании – большой поток клиентских документов.
  • Мелкооптовая и сетевая розничная торговля – большой поток финансовых документов (первички).

Использование потокового ввода даёт им преимущества:

  • Повышение оперативности ввода документов в СЭД.
  • Снижение затрат на ввод документов в СЭД.
  • Уменьшение количества ошибок при вводе документов в СЭД.
Похожие публикации
21 марта 2024
Практические аспекты и опыт миграции БД в рамках СЭД на базе платформы Docsvision с использованием утилиты миграции.
20 марта 2024
Как оптимизировать настройки платформы, изменить обслуживание системы.
Подпишитесь на рассылку
Нажимая на кнопку «Отправить», вы даёте согласие на обработку ваших персональных данных, в соответствии с политикой «ДоксВижн» в отношении обработки персональных данных.
Поддержка МЧД в СЭД Как изменится порядок подписания? Как подготовить предприятие к изменениям? Как адаптировать СЭД?