Интеллектуальная база знаний СЭД
Решение "Интеллектуальная база знаний СЭД" предназначено для повышения качества базы знаний организации и повышения повторного использования данных, накопленных в СЭД, т.е. в конечном счете на повышение ценности одного из главных информационных активов организации.
За счёт интеграции Docsvision и системы понимания и анализа текстов на естественных языках ABBYY Compreno решение обеспечивает реализацию ряда задач при работе с большими объёмами неструктурированных документов. Технологии ABBYY Compreno — практическая реализация подхода Big Data в области СЭД, превращающая накопленные архивы из «полумертвого» справочного ресурса в реальный информационный актив организации, увеличивающий эффективность обработки входных потоков информации, скорость и качество принятия управленческих решений.
Решение обеспечивает:
- Автоматическое определение/заполнение реквизитов неструктурированных документов путем интеллектуального анализа их содержания.
Автоматическая классификация документов в СЭД по их содержанию позволяет полностью избавиться от ручной категоризации, быстро и легко находить нужные документы, контролировать доступ к конфиденциальным данным. Решение автоматически распределяет информацию по заданным категориям: назначению, содержанию, и, что гораздо сложнее, по уровню секретности, отрасли, ответственному подразделению и т.д. Интеллектуальное атрибутирование документов при вводе осуществляется на основе ABBYY InfoExtractor SDK. - Интеллектуальную классификацию документа при регистрации на основании его содержания с использованием «обучающего множества» документов, распознанных ранее. Это позволяет перейти на автоматическую классификацию документов с сохранением фактически используемых бизнес-правил. Интеллектуальное атрибутирование делает информацию доступной и управляемой. С этой возможностью компании экономят время сотрудников за счет отказа от ручного труда: на этапе ввода документов в систему тегирование выполняется автоматически, при этом обрабатываются документы любого объема, даже 50-страничные. Интеллектуальная классификация и категоризация документов по их содержанию осуществляется на основе ABBYY Text Classifier SDK.
- Интеллектуальный поиск документов по смыслу содержания.
Семантический поиск документов по содержанию, базирующийся на ABBYY Intelligent Search SDK, существенно увеличивает качество (точность и полноту) поиска, практически сочетая точность атрибутивного и удобство полнотекстового поиска.
Бизнес-эффект от использования решения
1. Повышение эффективности ввода неструктурированных данных в СЭД за счет автоматизации категоризации и атрибутирования документов, в том числе, в процессе ретро-конверсии.
2. Повышение надежности распознавания документов, в том числе, из произвольных форм.
3. Использование накопленного массива документов СЭД в качестве интеллектуальной базы знаний для аналитики, поиска и поддержки процесса принятия решений.
Скриншоты
Демонстрационный стенд
Протестировать решение, в том числе и на своих данных, можно на специальном демонстрационном стенде, подготовленном совместно Docsvision и ABBYY. Стенд развернут на виртуальной машине VMWare. Установленное ПО:
- Windows 7 Корпоративная. Триал. Билд 7601
- MS SQL Server 2012
- Docsvision 5.3 2559
- ABBYY Compreno Server 1.2.128
- ABBYY InfoExtractor 1.2.128
- ABBYY IntelligentExploration Kit 1.2.109
- ABBYYText Classifier 2.0.285
Минимальная конфигурация компьютера для установки виртуальной машины:
- Оперативная память: от 4Гб
- Примечание: если на компьютере, где запускается стенд, мало оперативной памяти, то в настройках VMware Player уменьшите объем оперативной памяти для виртуальной машины.
- Свободное место на жестком диске: от 40Гб
- Примечание: использование SSD-диска ускорит работу системы.
Настроенные сценарии:
1) ABBYY InfoExtractor — иллюстрация процесса регистрации договора
В Docsvision настроен служебный бизнес-процесс (Папки\ABBYY InfoExtractor\Служебная), который выполняет мониторинг папки файловой системы C:\ABBYY InfoExtractor\XML. При появлении в этой папке XML, созданного с помощью ABBYY InfoExtractor. Обнаружив новый XML, процесс создает в Docsvision карточку договора, прикладывает в карточку файл договора и заполняет в карточке распознанные атрибуты. XML формируется вручную. Для этого используется файл Договор, расположенный в папке C:\ABBYY InfoExtractor. При регистрации из него извлекаются атрибуты: Сумма, Контрагент, контактное лицо контрагента.
2) ABBYY TextClassifier — иллюстрация автоматической категоризации документа по обучающему множеству
В Docsvision настроен служебный бизнес-процесс (Папки\ABBYY Text Classifier\Служебная), осуществляющий мониторинг файловой папки C:\ABBYY Text Classifier\Папка поиска. При появлении в ней нового файла процесс производит его классификацию с помощью ABBYY Text Classifier, по результатам которой, создается карточка документа с автоматическим присвоением категории из Справочника категорий Docsvision. Обучающее множество документов располагается в папке C:\TrainingSet.
3) ABBYY Intelligent Search — иллюстрация интеллектуального семантического поиска
Интерфейс поиска ABBYY Intelligent Search подключен к папке Docsvision: Папки\ABBYY Intelligent Search. Выполняется поиск по заданной семантике.