Интеллектуальная база знаний СЭД

Решение "Интеллектуальная база знаний СЭД" предназначено для повышения качества базы знаний организации и повышения повторного использования данных, накопленных в СЭД, т.е. в конечном счете на повышение ценности одного из главных информационных активов организации.

За счёт интеграции Docsvision и системы понимания и анализа текстов на естественных языках ABBYY Compreno решение обеспечивает реализацию ряда задач при работе с большими объёмами неструктурированных документов. Технологии ABBYY Compreno — практическая реализация подхода Big Data в области СЭД, превращающая накопленные архивы из «полумертвого» справочного ресурса в реальный информационный актив организации, увеличивающий эффективность обработки входных потоков информации, скорость и качество принятия управленческих решений.

Решение обеспечивает:

Автоматическое определение/заполнение реквизитов неструктурированных документов путем интеллектуального анализа их содержания.
Автоматическая классификация документов в СЭД по их содержанию позволяет полностью избавиться от ручной категоризации, быстро и легко находить нужные документы, контролировать доступ к конфиденциальным данным. Решение автоматически распределяет информацию по заданным категориям: назначению, содержанию, и, что гораздо сложнее, по уровню секретности, отрасли, ответственному подразделению и т.д. Интеллектуальное атрибутирование документов при вводе осуществляется на основе ABBYY InfoExtractor SDK.
Интеллектуальную классификацию документа при регистрации на основании его содержания с использованием «обучающего множества» документов, распознанных ранее. Это позволяет перейти на автоматическую классификацию документов с сохранением фактически используемых бизнес-правил. Интеллектуальное атрибутирование делает информацию доступной и управляемой. С этой возможностью компании экономят время сотрудников за счет отказа от ручного труда: на этапе ввода документов в систему тегирование выполняется автоматически, при этом обрабатываются документы любого объема, даже 50-страничные. Интеллектуальная классификация и категоризация документов по их содержанию осуществляется на основе ABBYY Text Classifier SDK.
Интеллектуальный поиск документов по смыслу содержания.
Семантический поиск документов по содержанию, базирующийся на ABBYY Intelligent Search SDK, существенно увеличивает качество (точность и полноту) поиска, практически сочетая точность атрибутивного и удобство полнотекстового поиска.

Бизнес-эффект от использования решения

1. Повышение эффективности ввода неструктурированных данных в СЭД за счет автоматизации категоризации и атрибутирования документов, в том числе, в процессе ретро-конверсии.
2. Повышение надежности распознавания документов, в том числе, из произвольных форм.
3. Использование накопленного массива документов СЭД в качестве интеллектуальной базы знаний для аналитики, поиска и поддержки процесса принятия решений.

Скриншоты

Демонстрационный стенд

Протестировать решение, в том числе и на своих данных, можно на специальном демонстрационном стенде, подготовленном совместно Docsvision и ABBYY. Стенд развернут на виртуальной машине VMWare. Установленное ПО:

Windows 7 Корпоративная. Триал. Билд 7601
MS SQL Server 2012
Docsvision 5.3 2559
ABBYY Compreno Server 1.2.128
ABBYY InfoExtractor 1.2.128
ABBYY IntelligentExploration Kit 1.2.109
ABBYYText Classifier 2.0.285

Минимальная конфигурация компьютера для установки виртуальной машины:

Оперативная память: от 4Гб
- Примечание: если на компьютере, где запускается стенд, мало оперативной памяти, то в настройках VMware Player уменьшите объем оперативной памяти для виртуальной машины.

Свободное место на жестком диске: от 40Гб
- Примечание: использование SSD-диска ускорит работу системы.

Настроенные сценарии:

1) ABBYY InfoExtractor — иллюстрация процесса регистрации договора
В Docsvision настроен служебный бизнес-процесс (Папки\ABBYY InfoExtractor\Служебная), который выполняет мониторинг папки файловой системы C:\ABBYY InfoExtractor\XML. При появлении в этой папке XML, созданного с помощью ABBYY InfoExtractor. Обнаружив новый XML, процесс создает в Docsvision карточку договора, прикладывает в карточку файл договора и заполняет в карточке распознанные атрибуты. XML формируется вручную. Для этого используется файл Договор, расположенный в папке C:\ABBYY InfoExtractor. При регистрации из него извлекаются атрибуты: Сумма, Контрагент, контактное лицо контрагента.

2) ABBYY TextClassifier — иллюстрация автоматической категоризации документа по обучающему множеству
В Docsvision настроен служебный бизнес-процесс (Папки\ABBYY Text Classifier\Служебная), осуществляющий мониторинг файловой папки C:\ABBYY Text Classifier\Папка поиска. При появлении в ней нового файла процесс производит его классификацию с помощью ABBYY Text Classifier, по результатам которой, создается карточка документа с автоматическим присвоением категории из Справочника категорий Docsvision. Обучающее множество документов располагается в папке C:\TrainingSet.

3) ABBYY Intelligent Search — иллюстрация интеллектуального семантического поиска
Интерфейс поиска ABBYY Intelligent Search подключен к папке Docsvision: Папки\ABBYY Intelligent Search. Выполняется поиск по заданной семантике.

Заявка на консультацию

Я даю согласие на обработку персональных данных в соответствии с Федеральным законом от 27.07.2006 г. № 152-ФЗ «О персональных данных», которая осуществляется согласно политике ООО «ДоксВижн» в отношении обработки персональных данных, в которой также содержатся сведения о реализуемых требованиях к защите персональных данных.