Рассмотрим как работает индексация документов в Oracle UCM.

Любой документ, который загружается в UCM сначала попадает в хранилище оригинальных версий (native) – Vault. Затем, если настроена конвертация документов, он отправляется на сервер конвертации (Inbound Refinery). Полученное Web-представление загружается в хранилище Web-представлений – WebLayout. Если для типа документа, который загружается установлен тип конвертации Pass-Thru (стоит по умолчанию для всех типов), то документ автоматически загружается в хранилище WebLayout, минуя стадию конвертации. Если для документа применим некоторый процесс обработки (Workflow), то он запускается, в противном случае документ отправляется на индексацию. Индексация – это процесс, который включает в себя в первую очередь полнотекстовую индексацию тела документа и дополнительно полнотекстовую индексаци атрибутов, которые помечены как полнотекстовые (Zone Fields). Для индексации UCM использует технологию OutsideIn и в частности утилиту textexport, которая входит в состав платформо-зависимых компонентов ContentAccess. Например, для Linux она располагается в папке: [ECM_HOME]/ucm/idc/components/ContentAccess-linux/linux/textexport. Задача данной утилиты преобразовать файл любого формата (поддерживаются +400 форматов) в текстовый файл. Затем этот текстовый файл индексируется базой данных. По умолчанию UCM использует хранилище WebLayout для индексации. Для того, чтобы настроить индексацию файлов из хранилища Vault, надо в конфигурационном файле config.cfg установить параметр:
UseNativeFormatInIndex=true.
Тэги:
indexing,
UCM,
vault
28 сентября 2010 года прошел семинар “Oracle Enterprise Content Management 11g“, в котором рассматривались следующие вопросы:
- Единое централизованное пространство учета и хранения документов;
- Единые процедуры и алгоритмы классификация и поиска документов;
- Эффективные, прозрачные и гибкие бизнес-процессы документооборота;
- Управление жизненным циклом документов;
- Постоянный и удобный доступ к электронным образам документов;
- Высокая степень безопасности и защищенности документооборота;
- Сквозной контроль исполнительской дисциплины;
- Автоматизация процессов сканирования и оцифровки образов документов;
- Интеграция с бизнес-приложениями;
- Обеспечение соблюдения законодательных и нормативных требований к документообороту
Корпорация Oracle является единственным поставщиком всего стека программного обеспечения для построения надежных, устойчивых, производительных и масштабируемых систем управления контентом высокой готовности.
Кроме того Oracle предлагает полный набор функций для управления корпоративным контентом для решения задач управления документами, образами, веб-контентом, цифровыми активами, записями и отчетами. Единый подход позволяет всего лишь за несколько лет получить гораздо больший возврат инвестиций, в особенности, если используются различные функции управления контентом. Объединение всей архитектуры на базе одного кода, модели безопасности и API устраняет необходимость интеграции, позволяет использовать общую ИТ-инфраструктуру, а также сводит к минимуму разработки и затраты на техническую поддержку. [нажмите для продолжения…]
Тэги:
BPM,
ECM,
Oracle,
Workshop