ECM: рынок, технология и границы понятия

Давид Харатишвили

Системы управления контентом — взгляд сверху

Системы управления контентом — взгляд снизу

Система ввода (Input/Capture)

Автоматизация бизнес-процессов (Workflow/BPM)

Управление документами (Document Management)

Управление веб­контентом (CMS/WCMS)

ПО для совместной работы (Collaboration software/GroupWare)

Управление цифровыми активами (DAM)

Управление записями (Records Management)

Типовое ЕСМ-решение

Прогнозы Gartner по рынку ЕСМ

Рынок ECM и его лидеры

 

Системы управления корпоративным контентом (Content Management Systems, ECM) с каждым годом становятся всё более востребованными. Аналитические компании пытаются количественно оценить рынок программного обеспечения в области ECM и описать его структуру.

Хорошо известна склонность западных ИТ-аналитиков к применению аббревиатур. Различные источники говорят о том, что ECM-рынок включает программные решения в области DMS, WCMS, RMS, DAMS, BPMS и ряда других компонентов. Проблема не в том, что сходу запомнить все эти аббревиатуры нелегко — толкование каждого из вышеперечисленных терминов можно найти в энциклопедии; проблема в том, что все эти определения не создают целостной картины. Во­первых, перечисленные технологии частично перекрывают друг друга; во-вторых, термины быстро эволюционируют; в­третьих, появляются новые технологии, которые внедряются в существующие. Поэтому без сравнительного толкования и наглядных структурных схем разобраться в таксономии очень трудно. В настоящей статье мы постараемся не только привести количественные оценки мирового рынка ECM, но и пояснить его структуру на графических схемах, а также дать сравнительное толкование основных терминов, обозначающих сегменты данного рынка.

Системы управления контентом — взгляд сверху

Под «взглядом сверху» в данном случае мы подразумеваем рассмотрение категории ECM по отношению к более общим понятиям. Прежде всего следует сказать, что термин «ECM» используется для обозначения не только класса программного обеспечения, но и концепции организации управления контентом на предприятии.

Согласно рис. 1, ECM можно представить как комбинацию стратегий, методов и инструментов, находящуюся на пересечении средств управления информацией и ИКТ-инструментария, как средство повышения эффективности HR и управления знаниями на предприятии.

 

Рисунок

Рис. 1. Соотношение понятий KM (Knowledge Management)
и ECM (Enterprise Content Management)

ECM имеет отношение к организационному обучению (Organizational learning) — области знаний, которая изучает, как организация получает новые знания и адаптируется к изменениям окружающей среды. Организационное обучение включает такие аспекты, как обучение сотрудников общим принципам управления информацией, конкретным инструментам ECM и использованию этих инструментов таким образом, чтобы соблюдать политики и процедуры, регламентируемые HR-отделом. ЕСМ-системы (ECMS) призваны обеспечить управление информационными активами с учетом прав собственности, адаптировать лучшие практики, способствовать изменению поведения сотрудников, эффективному обмену информацией между инстанциями и управлению знаниями, применению передового опыта в области управления информацией на предприятии.

Системы управления контентом — взгляд снизу

Под «взглядом снизу» мы понимаем анализ ключевых элементов, входящих в ECM. Прежде всего рассмотрим условную схему ECM (по данным AIIM) — рис. 2.

На рис. 2 показан цикл обработки корпоративного контента на предприятии. Информация поступает на предприятие или создается на нем, обрабатывается, используется для поддержки принятия разного рода решений, хранится, доставляется пользователям (публикуется на корпоративном портале или путем других средств доставки информации пользователям), архивируется и утилизируется.

На рисунке показаны два вида хранилища информации. Одно из них (в документах AIIM оно обозначается как Store — Хранение) представляет собой некое расширенное, постоянно доступное хранилище данных (структурированных и неструктурированных), которое регулярно пополняется из разных источников с помощью различных процедур.

Второе хранилище (в документах AIIM оно обозначается как Рreserve — Архивирование) — это архивы, которые обычно хранятся на внешних носителях и, как правило, удалены от основной системы. Последнее подразумевает долгосрочное, надежное хранение и резервное копирование статичной, неизменной информации и, как правило, сопровождается системой управления записями (RMS), призванной помочь компаниям соответствовать государственным и отраслевым нормам. В качестве систем управления информацией применяются системы автоматизации бизнес-процессов (Workflow/BPM), управления документами (Document Management Systems), управления веб­контентом (CMS/WCMS), управления цифровыми активами (Digital Aasset Management Systems), управления записями (Records Management Systems, RMS). Далее эти понятия будут рассмотрены более подробно.

В ряде случаев при наличии более дешевых предложений и отсутствии внутренней компетенции отдельные работы могут быть переданы на аутсорсинг сторонним организациям. Например, аутсорсинговые услуги могут включать такие операции, как сканирование документов, распознавание текста, ввод данных в базы данных и информационные системы заказчика, ввод и обработка данных с анкет, ввод и редактирование текстов, проверка документов, преобразование документов к заданному виду, сортировка документов и т.п. К разновидностям аутсорсинга можно отнести также хостинг обслуживания и администрирования ECM-ПО, который подразумевает централизованное управление тиражируемым программным обеспечением при условии, что приложения находятся на территории поставщика услуг, а заказчик имеет удаленный доступ к этому ПО. Это также могут быть хостинговые услуги по длительному хранению документов (как бумажных, так и электронных) в больших складах с контролируемыми условиями хранения.

Рассмотрим более подробно ключевые компоненты схемы на рис. 2, которые, как правило, представляются в виде отдельных одноименных программных комплексов.

Система ввода (Input/Capture)

Система ввода документов включает функции создания, захвата и обработки вводимой информации. Контент может поступать из двух источников (см. рис. 2) — это могут быть документы, создаваемые в офисных приложениях или получаемые путем заполнения форм, и информационные материалы, импортированные из различных корпоративных приложений (они могут передаваться из ERP-приложений, финансовых приложений, электронных форм и т.п.).

Если документ вводится с бумажного носителя, то на первом этапе производится его сканирование и создается электронная копия документа. Затем, если это необходимо, выполняется распознавание отсканированных документов с помощью OCR-программ.

Перевод документов разных видов в электронный формат имеет свою специфику: для ввода фотографий достаточно электронного изображения, если документ содержит текст — требуется распознать его, если это анкета — то обычно нужна только содержащаяся в ней информация. Под обработкой форм подразумевается способность программного обеспечения принять отсканированные формы, извлечь данные из ячеек и распознать строки и столбцы в таблицах для заполнения баз данных. Особенностью ввода форм, заполненных от руки, является необходимость распознавания «рукопечатного» текста. Рукопечатным называется текст, вписываемый от руки печатными буквами по одной в каждый квадратик анкеты для автоматического распознавания машиной. Технология распознавания рукопечатных символов (Handprint Character Recognition, HCR) позволяет переводить изображения рукопечатных символов в ASCII-коды. Задачи распознавания при вводе форм необязательно связаны с текстом — также может потребоваться распознавание различных меток. Технология OMR (Optical Mark Recognition — оптическое распознавание меток) позволяет обнаружить наличие или отсутствие отметок в определенных областях.

Технология IDR (Intelligent Document Recognition) означает интеллектуальное распознавание документов, то есть способность автоматически определять тип документа, исходя из его макета и структуры.

Далее производится агрегация — процесс объединения данных из разных источников ввода, систем авторинга и др.

На этапе классификации осуществляется индексация — определение специфических атрибутов документа или записей в базе данных для облегчения поиска.

Решения по автоматизации ввода предлагают такие компании, как EMC (Captiva), ABBYY и Cognitive Technologies.

Автоматизация бизнес-процессов (Workflow/BPM)

Выигрыш от внедрения ECM-системы можно получить только при интеграции ее с основными бизнес-системами предприятия. ПО для управления рабочим процессом следует рассматривать как связующее звено между средствами управления контентом и транзакционными системами. Управление Workflow позволяет организациям автоматизировать бизнес-процессы и существенно сократить необходимость в дополнительных контактах в виде электронных писем и других средств коммуникации. Системы ECM, как правило, включают автоматизацию бизнес-процессов, сопряженных с жизненным циклом документа. В ходе разработки документа и после его создания участники бизнес-процессов передают документ по определенным маршрутам переходов (например, утвердить документ или отправить его на доработку).

Workflow-система — это система автоматизации бизнес-процессов, которая обеспечивает передачу документов, информации или заданий от одного участника к другому для выполнения действий в соответствии с определенным набором правил.

Бизнес­процесс — это логически связанный набор рабочих потоков (workflows), рабочих шагов и задач. Система управления бизнес-процессами (Business Process Management System) — это совокупность приложений, поддерживающих задачи управления бизнес-процессами, включая задачи моделирования, оперативного управления, администрирования, мониторинга, анализа показателей эффективности и обеспечения поддержки слаженного взаимодействия людей и информационных систем. Прежде чем управлять процессом, нужно его описать. Для этого есть множество инструментов — как встроенных в BPM-системы, так и существующих в виде отдельных продуктов. К задачам Workflow/BPM обычно относят: визуализацию процессов и организационных структур; ввод, администрирование, визуализацию и доставку сгруппированной информации с ассоциированными документами или данными; средства напоминания, установки дедлайнов и делегирования задач. Системы для управления рабочим процессом присутствуют в продуктах таких компаний, как IBM (FileNet), EMC (Documentum), Open Text (Hummingbird) и Microsoft (SharePoint). К этой группе также можно отнести компании SAP и Oracle, в составе ERP-систем которых есть развитые модули управления потоками работ.

Управление документами (Document Management)

ПО для управления документами (Document Management Systems, DMS) — это программное обеспечение, которое автоматизирует процесс создания, извлечения, совместного использования, отслеживания, ревизии, распределения и хранения документов.

К основным задачам DMS можно отнести: контроль документов на вход-выход, контроль целостности документа; управление версионностью; поиск информации; визуализацию информации для представления в структурах типа виртуальных файлов или папок.

Лидерами данного сегмента рынка являются компании EMC (Documentum), Open Text (Hummingbird) и IBM (FileNet).

Управление веб­контентом (CMS/WCMS)

С термином CMS происходит путаница, на которую следует обратить внимание читателей. Несмотря на то что более корректное название категории WCMS, на практике чаще всего используется его короткая версия — CMS, в России даже прижился жаргонизм «ЦМСКА». Проблема в том, что при буквальном переводе между терминами CMS и ECMS не прослеживается большой разницы: «управление контентом» и «управление контентом корпорации». Однако под ними понимаются разные вещи. CMS — это, как правило, системы управления контентом для размещения его в Интернете или интранете. Под термином «контент» в данном случае обычно подразумевают веб­материалы (новости, маркетинговые материалы, корпоративные справочники и т.д.). Очень часто (но не всегда) этот контент представлен в веб­ориентированных форматах, таких как HTML, XHTML и т.д., хотя по мере развития Веб аудио­ и видеоформаты становятся всё более распространенными. Сравнительный анализ CMS и ECMS сделан в табл. 1.

Таким образом, CMS/WCMS — это технология, которая поддерживает процесс создания, согласования, публикации и постоянного обновления информации на сайтах и может интегрироваться с системой управления документами. CMS-cистемы для управления контентом помогают распределить между сотрудниками обязанности по созданию содержания и обеспечивают возможность его публикации.

ПО для управления веб­контентом предусматривает:

  • создание/редактирование контента в рамках контролируемого процесса опубликования информации в веб;
  • доставку и администрирование информации для наполнения веб­сайта;
  • автоматическое преобразование контента под различные форматы представления;
  • надежное разграничение доступа к публичной и непубличной информации.

Основными поставщиками подобного ПО являются компании EMC (Documentum), IBM (FileNet), Open Text (Hummingbird) и Microsoft (SharePoint).

ПО для совместной работы (Collaboration software/GroupWare)

ПО для совместной работы — это приложения, созданные с целью поддержки взаимодействия между сотрудниками, работающими совместно над решением общих задач. ПО для совместной работы обеспечивает работу виртуальных распределенных команд, включая ведение дискуссий, обсуждение документов, а также проектно-ориентированные методы взаимодействия.

К инструментам совместной работы можно отнести широкий класс ПО, включая электронную почту, календари, текстовый чат, вики, корпоративные закладки, видеоконференц-связь и т.п.

Средства для организации совместной работы обычно предусматривают:

  • совместное использование баз данных;
  • совместную одновременную контролируемую обработку информации;
  • применение систем знаний, созданных с учетом тематики данных и позволяющих совместно обрабатывать информацию;
  • использование коммуникационных приложений для мозгового штурма, согласования планов, проведения совещаний, управления проектами и т.п.;
  • применение социального ПО для совместной работы;
  • интеграцию информации из разных приложений в формат коллективного приложения.

В данном сегменте рынка лидируют компании EMC (Documentum), Open Text (Hummingbird), Microsoft (SharePoint), Oracle (Collaboration Suite) и Xerox (DocuShare).

Управление цифровыми активами (DAM)

Управление цифровыми активами (Digital Asset management, DAM) решает задачи, связанные с приемом, редактированием, каталогизацией, хранением, поиском и распространением цифровых активов (цифровые фотографии, анимация, видео и музыка). Чтобы лучше понять содержание термина, рассмотрим, чем DAM отличается от WCM. В области WCM контент — это нечто, являющееся средством передачи информации. В области DAM контент — это синоним актива. В DAM некая дискретная часть контента не является активом, пока она не классифицирована и не индексирована, пока не определена ее версия, пока ей не присвоен уникальный идентификатор и не установлен владелец. Ключом к созданию этой технологии является использование метаданных. Наличие метаданных делает объект доступным для поиска.

Например, использование формата XMP (eXtensible Metadata Platform — гибкая платформа метаданных) позволяет добавлять информацию о метаданных в графические файлы.

DAM-системы, как правило, хранят файлы в файловой системе, в то время как связанные с ними метаданные находятся в реляционной базе данных. Реже метаданные управляются как XMP , встроенные в актив.

DAM отличаются от систем управления документами и систем управления веб­контентом по своей направленности на мультимедиаресурсы — изображения, видео и аудио. Обычно DAM-системы предоставляют функции управления правами.

Управление записями (Records Management)

Запись — это документ или набор данных, который считается законченным и неизменяемым, в то время как документ — это единица контента, которая может быть доработана или изменена. Записи — это свидетельства о событиях и политиках, действующих в данной организации. Запись может существовать на бумаге, в виде сканированного изображения или другого электронного файла. Если управление документами обычно осуществляется на протяжении всего их жизненного цикла: создание, коллективная работа с документами, управление версиями, контроль доступа и архивирование, — то управление записями предполагает их сохранение без изменений и предоставление доступа к ним. Управление записями направлено на обеспечение работы с архивами документов длительного хранения и связано с процессами архивирования, возвращения или удаления.

Как правило, записи имеют жесткие требования относительно их сохранения и уничтожения. Обычно необходимо, чтобы записи хранились в их оригинальном формате на тот случай, если они понадобятся в ходе юридического разбирательства.

Таким образом, RM-приложения предназначены в первую очередь для идентификации, хранения и управления данными, которые используются для описания событий в технологическом цикле организации, связанных с соблюдением нормативных или финансовых правил или оперативной деятельностью. Данное ПО позволяет компаниям специфицировать правила хранения электронных архивных материалов, которые могут основываться на государственных законах или бизнес-требованиях компании.

Среди функций Records Management обычно выделяют следующие:

  • визуализация структуры файлов и других структурирующих индексов для упорядоченного хранения информации;
  • однозначная индексация информации, поддерживаемая словарем;
  • управление графиком хранения и уничтожения записей;
  • защита информации в соответствии с ее характеристиками.

Лидерами данного сегмента рынка являются те же компании — EMC (Documentum), Open Text (Hummingbird) и Tower Software.

Типовое ЕСМ-решение

Схема, представленная на рис. 2, отражает траекторию движения информации в ECM-системе. Для того чтобы лучше представить технологическую схему типового ECM-решения, обратимся к рис. 3. Как следует из этой схемы, решения по управлению документами и контентом могут иметь общие элементы. То есть из отдельных модулей может строиться то или иное ECM-решение.

 

Рисунок

Рис. 3. Схема построения типового ECM-решения

Рис. 4 подтверждает то, что системы документооборота и управления веб­контентом имеют области пересечения.

 

Рисунок

Рис. 4. Соотношение категорий «документооборот», «управление веб-контентом»
и «управление е-коммерцией» (источник: Ovum)

Прогнозы Gartner по рынку ЕСМ

Инструменты ECM постоянно развиваются, появляются новые социальные технологии, новые формы потребления ПО в виде «облачных» услуг, происходят слияния и поглощения среди ECM-вендоров — всё это влияет на рынок ECM-решений. В частности, в отчете за 2010 год Gartner выделила четыре перспективных направления развития ЕСМ, назвав их «четыре мира ECM»:

  • транзакционный ECM — включает такие направления, как оцифровка и управление образами документов, управление рабочими потоками (Workflow/BPM), контроль за соблюдением нормативных требований к оформлению документов, использование электронных форм, архивирование, управление записями. Процессы эти, как правило, стабильные, длительные. Контент представляет собой многочисленные формы и документы, которые требуют масштабируемости, управления жизненным циклом и утверждения человеком. Примеры вендоров: EMC, Hyland Software, IBM и Open Text;
  • социальный ECM — направлен на решение задач автоматизации работы с носителями контента и библиотечного обслуживания; совместной работы с документами; отслеживания исполнения задач, контроля версий, работы с сервисами социального контента, такими как вики, блоги и социальное видео. Подобные решения активно используются, например, для подбора сотрудников, профессиональной подготовки и управления проектами. Примеры вендоров: Alfresco, IBM / Lotus, Microsoft и Open Text;
  • ECM-решения в области оптимизации онлайновых каналов передачи контента — включают широкий спектр технологий, связанных с доставкой контента посредством Веб. Среди них — системы WCM (Web Сontent management), DAM, порталы, электронные формы, системы веб­аналитики, социальные приложения, приложения для сотрудничества посредством социальных сетей, приложения XML-авторинга, системы управления мультимедийным контентом, системы поддержки мобильных устройств для обращения к Веб и т.д. Примеры вендоров: Autonomy, Adobe, Open Text и Oracle;
  • ECM как инфраструктурное решение — предлагается такими компаниями, как IBM, Oracle и Microsoft, встраивающими возможности управления контентом в свои инфраструктурные решения, которые всё чаще становятся инфраструктурными платформами для поддержки нескольких приложений управления контентом. Например, когда в организации внедряется Microsoft SharePoint, пользователи начинают исследовать его возможности для управления контентом, что часто приводит к замене существующих решений. Примеры вендоров: IBM, Microsoft и Oracle.

В своем отчете по рынку ECM, выпущенном в 2010 году, Gartner также сформулировала ряд ключевых направлений развития ECM на два года, включая следующие:

  • совершенствование систем управления унаследованной информацией (legacy information management) — речь идет о том, что компании накопили огромные объемы электронного контента в виде файловых архивов, архивов e-mail, различных порталов, хранилищ и локальных систем ЭД. Множественные копии одного и того же файла существуют практически в каждой организации, особенно если мы говорим о крупной корпорации с множеством филиалов, и сегодня перед компаниями встает проблема консолидации управления этими разрозненными источниками или миграции на современные ECM-системы. Gartner прогнозирует, что к 2013 году доминирующим решением для архивирования будут интегрированные решения, позволяющие архивировать контент различных типов, включая почтовые сообщения, файлы, базы данных, изображения, веб­содержание и т.п.;
  • прогресс в области систем поиска и аналитической обработки контента (search and content analytics) — развитие средств поиска и анализа существующего контента для решения задач автоматической классификации контента, уменьшение доли дублирующего и неактуального контента, поддержка миграции контента между хранилищами и т.д.;
  • развитие систем, позволяющих использовать электронные документы в суде и досудебных мероприятиях (electronic discovery);
  • внедрение новых методов доставки ECM-сервисов в виде «облачных» услуг или на базе решений с открытым исходным кодом (shared services and alternative delivery models for ECM) — доля сервисов подобного рода будет увеличиваться;
  • «облачные» вычисления влияют на ECM-рынок за счет экономичных предложений — особенно большое влияние на рынок могут оказать крупнейшие «облачные» провайдеры, такие как Google, IBM и Microsoft.

Рынок ECM и его лидеры

По данным Gartner, в 2009 году мировой рынок ECM-приложений составил около 3,5 млрд долл. и будет расти на уровне около 10% CAGR до 2014 года, когда он составит 5,7 млрд долл. В табл. 2 представлена структура ECM-рынка, характерная для него в 2009-2010 годах.

Если в целом по миру доля управления веб­контентом (WCM) составила в 2009-2010 годах всего 15%, то в регионе EMEA доля WCM-оборота равна около 30%.

Gartner приводит схему позиционирования лидирующих игроков ECM-рынка (рис. 5 и 6).

 

Рисунок

Рис. 5. Позиции основных игроков на ECM-рынке в 2009 г.
(источник: Gartner, октябрь 2009)

Рисунок

Рис. 6. Позиции основных игроков на ECM-рынке в 2010 г.
(источник: Gartner, ноябрь 2010)

При сравнении квадрантов 2009 и 2010 годов видно, что состав лидеров (верхний правый квадрат: Microsoft, IBM, Oracle, Open Text и EMC) практически не изменился — другими стали только их позиции. В квадрант лидеров вошла компания Hyland Software.

По данным компании Real Story Group (рис. 7), рынок ECM-приложений несколько больше: уже в 2010 году он составлял порядка 6 млрд долл. Интересно отметить, что этот рынок весьма консолидирован. На нем работают сотни компаний, однако 80% рынка составляют первые шесть компаний (IBM, Oracle, Microsoft, Open Text, EMC и Oracle) и на них приходятся практически все крупнейшие проекты в области построения ECM-систем.

 

Рисунок

Рис. 7. Игроки ECM-рынка (источник: Real Story Group)

Высокая степень консолидации рынка ECM объясняется многочисленными слияниями и поглощениями последних лет (рис. 8). Из слияний и поглощений, не отмеченных на рис. 8, следует упомянуть, что Lexmark приобрела Perceptive Software, Adobe — фирму Day Software, а IBM — компанию Datacap.

 

Рисунок

Рис. 8. История слияний и поглощений в области ECM в период 2001-2010 гг.

Компания Real Story Group приводит также весьма интересную схему основных игроков ECM-рынка с указанием профиля компаний (рис. 9). Как видно из рис. 9, Microsoft, которая отмечена как лидер в квадранте Gartner, и на схеме Real Story Group является единственной компанией, присутствующей во всех категориях. Совсем немного отстают от нее IBM и Oracle — они есть в шести категориях: во всех, кроме «Sharepoint-экосистема». Так что обе аналитические компании, Gartner и Real Story Group, несколько расходясь в оценках размера рынка, примерно одинаковы во мнении относительно его лидеров.

 

Рисунок

Рис. 9. Схема вендоров, занятых технологиями управления контентом (источник: Real Story Group, 2011)

 

В начало В начало

КомпьютерПресс 02'2012

Наш канал на Youtube

1999 1 2 3 4 5 6 7 8 9 10 11 12
2000 1 2 3 4 5 6 7 8 9 10 11 12
2001 1 2 3 4 5 6 7 8 9 10 11 12
2002 1 2 3 4 5 6 7 8 9 10 11 12
2003 1 2 3 4 5 6 7 8 9 10 11 12
2004 1 2 3 4 5 6 7 8 9 10 11 12
2005 1 2 3 4 5 6 7 8 9 10 11 12
2006 1 2 3 4 5 6 7 8 9 10 11 12
2007 1 2 3 4 5 6 7 8 9 10 11 12
2008 1 2 3 4 5 6 7 8 9 10 11 12
2009 1 2 3 4 5 6 7 8 9 10 11 12
2010 1 2 3 4 5 6 7 8 9 10 11 12
2011 1 2 3 4 5 6 7 8 9 10 11 12
2012 1 2 3 4 5 6 7 8 9 10 11 12
2013 1 2 3 4 5 6 7 8 9 10 11 12
Популярные статьи
КомпьютерПресс использует