Системы управления контентом

Николай Прохоров

Данные и контент

Концепция Enterprise Content Management

Системы ввода (Capture)

Управление документами (Document Management)

Управление web-контентом (Web Content Management)

Управление записями (Records Management)

Управление рабочими потоками (Workflow/Business Process Management)

Управление в рабочих группах (GroupWare)

Распределение сил на рынке EСM

 

Документы — это кровь, снабжающая тело (компанию) кислородом (информацией),
который позволяет ему функционировать (делать бизнес).
Xerox

Данные и контент

Сегодня вместо термина «автоматизация документооборота» все чаще употребляется термин «системы управления контентом», или ECM (Enterprise Content Management). Да и сам термин «документ» теперь трактуется все более широко. С чем же это связано?

В развитии документооборота можно выделить две тенденции: переход от автоматизации структурированных данных к автоматизации неструктурированных данных и от использования узкоспециализированных решений к применению интегрированных систем масштаба предприятия.

Первые системы электронного документооборота появились еще в 70-е годы. Это были преимущественно автономные приложения, фокусирующиеся на отдельных задачах, таких как оцифровка документа, его распознавание и управление записями о документах, реализованных на уровне отдела предприятия.

Приложения для документооборота, как и офисные приложения Word, Excel и PowerPoint, в начале 80-х годов существовали в виде отдельных продуктов и лишь со временем были интегрированы в комплексные решения.

Первые системы документооборота в основном были предназначены для управления структурированными записями. По сути, они представляли собой специализированные базы данных, хранящие записи о документах: о поступающем документе делалась запись, а далее к ней привязывались все действия, которые выполнялись с документом.

Со временем подобные системы стали включать и сами документы в электронном виде, понятие «запись» расширилось и стало обозначать не только запись в базе данных, но и, например, электронное письмо, документ и его индекс и т.д. Постепенно изменилось само понятие «документ».

Действительно, в организацию документ может поступить в бумажном виде, затем его отсканируют, распознают и поместят на web-сайте. С точки зрения содержания это будет один и тот же документ, а по формату файла и способу хранения — разные.

В компаниях осознали, что ручной перевод документа из одного формата в другой, из одной формы хранения в другую, а также повторное создание одного и того же содержания для web-хранения или хранения в другом виде — это неоправданные затраты. Так появилась концепция ECM, в соответствии с которой внимание стали акцентировать на автоматизации контента.

Говоря о трансформации понятия «документ», хотелось бы привести результаты опроса компании IDC (рис. 1), в ходе которого 956 руководителей европейских компаний ответили на вопрос: «Что следует понимать под термином “документ”?»

 

Рисунок

Рис. 1. Результаты опроса «Что следует
понимать под термином “документ”?»
(источник: IDC, 2006)

Как свидетельствуют результаты опроса, почти 50% респондентов отнесли к понятию «документ» web-странички и почти 80% — сообщения электронной почты.

Что же такое документ? Безусловно, что этот термин постоянно изменяется. По всей видимости, наиболее удачным следует признать определение компании Xerox: «Документы — это кровь, снабжающая тело (компанию) кислородом (информацией), который позволяет ему функционировать (делать бизнес)». Из этого определения становится понятно, что многим организациям пора сделать анализ крови, чтобы оценить свое состояние здоровья и принять соответствующие меры.

Понятие «документооборот», подразумевающее полную автоматизацию работы с документами на предприятии, невозможно свести к какому-то одному общеупотребимому английскому ИТ-термину. Наиболее полно такому подходу соответствует современная концепция Enterprise Content Management.

В последнее десятилетие стратегия использования ИТ в большинстве компаний была нацелена на снижение расходов. Сегодня акцент постепенно смещается в область привлечения и удержания клиентов за счет предоставления им более качественных информационных сервисов. Дальнейшее развитие информационных технологий приведет к увеличению спроса на качественные информационные услуги, и те фирмы, которые не смогут обеспечить подобных сервисов, будут вынуждены уйти с рынка. Одна из главных тенденций развития ИТ — резкий рост контента в компаниях. Современные дешевые средства хранения данных позволяют накапливать контент, но для эффективного управления им требуются новые, интегрированные технологии ввода, хранения, управления и дистрибьюции контента. Управление контентом в условиях жесткого ИТ-бюджета — это мощный стимул для организаций внедрять корпоративные системы управления контентом.

Управление контентом становится первоочередной задачей для большинства современных компаний. При этом очень многие руководители хорошо понимают, сколь существенные вложения требуются для построения интегрированной системы управления контентом, однако плохо представляют себе, сколько они теряют из-за недоавтоматизированности подобных систем и как много операций приходится дублировать. Более 90% руководителей организаций, участвовавших в вышеупомянутом опросе IDC, не смогли даже примерно оценить, сколько они тратят на управление контентом при той степени автоматизации, которая принята на их предприятии. Две трети признались, что такие расчеты (оценка расходов на управление контентом) в организации не проводились.

Для того чтобы понять, каковы же затраты на работу с контентом, обратимся к расчетам компании IDC. На рис. 2 представлено распределение затрат на выполнение типичных задач сотрудниками среднестатистической организации, занятыми в сфере обработки информации. Авторы исследования исходили из западных норм оплаты труда (в среднем 60 тыс. долл. в год); для российских предприятий в количественном выражении картина, конечно же, будет несколько иная, однако качественное распределение (временные затраты) останется примерно таким же.

 

Рисунок

Рис. 2. Средняя стоимость выполнения информационных операций
на одного сотрудника в неделю (источник: IDC, 2006), долл.

Как следует из рис. 2, в среднем организации в США тратят около 270 долл. (из расчета на одного сотрудника в неделю) только на поиск информации и 195 долл. — на ручное заполнение форм и создание документов.

Результаты еще более интересного исследования представлены на рис. 3. Здесь анализируются дополнительные затраты по разным категориям задач из-за потерь времени на неавтоматизированную работу с контентом. Очевидно, что оптимизация работы с контентом сулит большую экономию.

 

Рисунок

Рис. 3. Ежегодные потери, связанные с тратой времени на неавтоматизированную
работу с контентом (для американской компании с тысячей сотрудников, занятых
в сфере обработки информации), млн долл.

Все больше руководителей компаний понимают, что нужна такая интеграция контента в рамках организации, при которой сотрудникам не приходится повторно создавать документы с одним и тем же содержанием в разных форматах.

Концепция Enterprise Content Management

ЕСМ — это сравнительно новая концепция, терминология для которой еще окончательно не сложилась. Ее логическая структура представлена на рис. 4.

 

Рисунок

Рис. 4. Логическая структура ECM

Рассмотрим ключевые элементы, входящие в данную схему.

Системы ввода (Capture)

Система ввода документов включает функции создания, захвата и обработки вводимой информации. Документы могут вводиться со сканера или импортироваться из любого приложения.

Если документ вводится с бумажного носителя, то на первом этапе производится его сканирование и создается электронная копия документа (образ). В процессе сканирования может выполняться программная обработка изображения, а также визуальный контроль качества. Сканеры для корпоративного применения обычно оснащены рядом дополнительных функций, например могут принимать разноформатные документы. На втором этапе (если это необходимо) полученный образ переводится в текстовый документ, то есть выполняется распознавание отсканированных документов. Для этого используются программы оптического распознавания символов (Optical Character Recognition, OCR).

Документы, переводимые в электронный вид, условно делят на формализованные, неформализованные и специальные. В формализованных документах заранее определена форма — расположение и размер обязательных полей, в которые заносятся данные (бланки, накладные, анкеты, картотеки и т.д). К неформализованным относятся документы произвольной формы: договоры, письма и т.д. В качестве специальных документов можно назвать карты или отпечатки пальцев.

Перевод документов каждого из перечисленных выше видов в электронный формат имеет свою специфику: для ввода фотографий достаточно электронного изображения, если документ содержит текст — его необходимо распознать, если это анкета — то обычно нужна только содержащаяся в ней информация, например при обработке избирательных бюллетеней обычно не требуется изображение самого документа — достаточно информации о том, за кого отдан голос.

Особенностью ввода форм в компьютер является необходимость распознавания текстов, заполненных от руки, — так называемого рукопечатного текста. Технологии распознавания рукопечатных символов получили название Intelligent Character Recognition (ICR). Задачи распознавания при вводе форм необязательно связаны с текстом. При вводе форм может потребоваться распознавание различных меток и знаков, или Optical Mark Recognition (OMR), например в избирательных бюллетенях. При массовом вводе документов производятся распознавание, верификация и индексирование. Далее система определяет, куда должен направиться каждый документ и под каким именем, то есть происходит автоматическое управление потоком ввода.

Решения по автоматизации ввода предлагают такие компании, как EMC (Captiva), ABBYY и Cognitive Technologies.

Управление документами (Document Management)

Управление документами — старейший компонент ECM. Он позволяет контролировать документ с момента его создания до архивирования. Назначение технологии — снабжать документы метаданными (атрибутами) для того, чтобы связывать их с бизнес-процессами. Она предоставляет основные библиотечные функции, включая хранение, поиск, контроль версионности и выписку документов.

К основным задачам управления документами можно отнести:

  • контроль документов на вход/выход, контроль целостности документа;
  • управление версионностью (отслеживание версий с той же информацией на разных стадиях работы над документом, а также одной и той же информации в различных форматах);
  • поиск и навигация с целью поиска информации;
  • визуализация информации для представления в структурах типа виртуальных файлов или папок.

Функции Document Management все в большей степени пересекаются с управленческой функциональностью офисных приложений, таких как Outlook/Exchange и Notes/Domino, и с функциями Library Services по администрированию хранения информации.

Лидерами данного сегмента рынка являются компании EMC (Documentum), Open Text (Hummingbird) и IBM (FileNet).

Управление web-контентом (Web Content Management)

Данная технология поддерживает процесс создания, согласования, публикации и постоянного обновления информации на сайтах и обычно интегрируется с системой управления документами. Она позволяет организациям публиковать информацию и документы в Web, не ограничиваясь Интернетом, экстранетом или интранетом. Использование ПО для управления web-контентом позволяет публиковать информацию быстро и безопасно в разных каналах, даже не зная языка HTML. Благодаря этому организации могут возложить задачу публикации документов в Web на бизнес-пользователей — владельцев контента. Эффективность применения такого ПО заключается в том, что разным службам не нужно повторно вносить изменения в документ, а следовательно, контент содержит меньше ошибок и нестыковок.

ПО для управления web-контентом предусматривает:

  • создание/редактирование контента в рамках контролируемого процесса опубликования информации;
  • доставку и администрирование информации для создания web-презентаций;
  • автоматическое преобразование контента под различные форматы представления;
  • надежное разграничение доступа к публичной и непубличной информации;
  • визуализацию интернет-презентаций.

Системы для управления контентом помогают распределить между сотрудниками обязанности по созданию содержания и обеспечивают возможность его публикации. По мере роста контента на сайте техническим сотрудникам (web-мастерам) все труднее поддерживать его. Основными поставщиками подобного ПО являются компании EMC (Documentum), IBM (FileNet), Open Text (Hummingbird) и Microsoft (SharePoint).

Управление записями (Records Management)

Данная технология обеспечивает работу с архивами документов длительного хранения, как электронных, так и бумажных. Она поддерживает полный жизненный цикл документа — от его создания до уничтожения — и связана с процессами архивирования, возвращения или удаления документов. Сейчас компании предпочитают создавать архивы критически важных документов вне офиса, однако при этом необходимо вовремя восстанавливать документы и обеспечивать их хранение в соответствии с госстандартами. ПО для управления записями позволяет компаниям специфицировать бизнес-правила для электронных документов, определять, когда документы должны архивироваться, а когда — уничтожаться, и т.п. Эти правила могут основываться на государственных законах или на бизнес-требованиях самой компании.

Программное обеспечение Records Management не зависит от среды хранения данных и позволяет управлять информацией, хранящейся не в электронном виде. Среди его функций обычно выделяют следующие:

  • визуализация структуры файлов и других структурирующих индексов для упорядоченного хранения информации;
  • однозначная индексация информации, поддерживаемая словарем;
  • управление графиком хранения и уничтожения записей;
  • защита информации в соответствии с ее характеристиками.

Лидерами данного сегмента рынка являются те же компании — EMC (Documentum), Open Text (Hummingbird) и Tower Software.

Управление рабочими потоками (Workflow/Business Process Management)

ПО для управления рабочим процессом служит для автоматизации деловых процедур, управления потоками автоматизации бизнес-процессов, включая разработку маршрутов, контроль исполнения и т.д. К его задачам обычно относят:

  • визуализацию процессов и организационных структур;
  • ввод, администрирование, визуализацию и доставку сгруппированной информации с ассоциированными документами или данными;
  • средства напоминания, установки дедлайнов и делегирования задач.

Реальный выигрыш от внедрения ECM-системы можно получить только при ее интеграции с основными бизнес-системами предприятия. ПО для управления рабочим процессом следует рассматривать как связующее звено между средствами управления контентом и транзакционными системами. Управление Workflow позволяет организациям автоматизировать бизнес-процессы и существенно снизить необходимость в дополнительных контактах в виде электронных писем, телефонных звонков и других средств коммуникации. Процесс глобализации требует лучшего контроля над хранимой информацией. Обмен данными с партнерами и поставщиками должен происходить с соблюдением правил безопасности, чтобы исключить утечки критичных сведений.

Системы для управления рабочим процессом присутствуют в продуктах таких компаний, как IBM (FileNet), EMC (Documentum), Open Text (Hummingbird) и Microsoft (SharePoint). К этой группе также можно отнести компании SAP и Oracle, в составе ERP-систем которых есть развитые модули управления потоками работ.

Управление в рабочих группах (GroupWare)

Системы GroupWare обеспечивают работу виртуальных распределенных команд, включая ведение дискуссий, обсуждение документов, а также проектно-ориентированные методы взаимодействия. Средства организации совместной работы позволяют наладить совместную работу в случаях, не поддающихся строгой формализации.

С ростом числа мобильных сотрудников и при все чаще применяемом удаленном взаимодействии совместная работа становится весьма актуальной. Традиционный порядок хранения информации в системе хранения данных конкретного отдела уходит в прошлое, при этом необходимость в коллаборативных инструментах внутри организации возрастает. Такие системы, как Instant Messaging, управление web-базированными проектами и даже видеоконференц-связь, рассматриваются в качестве элементов ECM. Средства для организации совместной работы обычно предусматривают:

  • коллективное совместное использование баз данных;
  • совместную одновременную контролируемую обработку информации;
  • применение систем знаний, созданных с учетом тематики данных и позволяющих совместно обрабатывать информацию;
  • использование «белых досок» (whiteboards) для мозгового штурма, согласования планов, проведения совещаний, управления проектами и т.п.;
  • интеграцию информации из разных приложений в формат коллективного приложения.

Одним из первых решений, направленных на организацию совместной работы, был продукт Lotus. Сегодня в данном сегменте рынка лидируют компании EMC (Documentum), Open Text (Hummingbird), Microsoft (SharePoint), Oracle (Collaboration Suite) и Xerox (DocuShare).

***

Следует отметить, что те логические системы, которые мы рассмотрели выше, нельзя назвать технологическими модулями, из которых складывается то или иное решение ECM. Они представляют собой, скорее, наборы функций, объединенных неким маркетинговым термином. При интеграции их в единую ECM-систему многие технологические модули оказываются общими, что поясняет схема, приведенная на рис. 5.

 

Рисунок

Рис. 5. Схема построения типового ECM-решения (источник: ABBYY, 2007)

Согласно схеме, в систему ввода документов (Capture) входят модули «Средства сканирования и импорта» и «Автоматическое индексирование, OCR, ICR, классификация», а также WorkFlow, который будет определять, куда должны направляться отсканированные и обработанные документы.

Безбумажный офис — далекая перспектива

EMC-системы призваны снизить долю бумажного документооборота. Несмотря на то что многие компании продолжают инвестировать в решения, позволяющие им стать менее зависимыми от бумажных документов, бумага по-прежнему остается важным носителем информации в процессе обмена информацией. Однако при этом роль бумаги несколько изменилась. Сегодня бумажные документы применяются уже не для долговременного хранения информации, как это было раньше, а для оперативного, тогда как электронные - именно для долговременного.

 

Рисунок

Статистика изменения расхода бумаги за 2006 год

Правда, смена ролей не привела к снижению объемов печати документов. Напротив, необходимость в их распечатывании возросла, поскольку электронный документ приходится печатать всякий раз, когда он требуется тому или иному пользователю. Конечно, электронные документы позволяют экономить бумагу, но при современном уровне внедрения ECM-систем ее расход продолжает расти.

Естественно, бумажные документы имеют недостатки. Они занимают много места. Их нельзя сжать, как электронный архив. В бумажных носителях трудно осуществлять поиск. Они медленно рассылаются. К бумажному документу нельзя обратиться удаленно.

Однако бумага обладает и явными преимуществами, главные из которых:

  • дешевизна;
  • легкость и портативность;
  • эластичность и надежность;
  • на ней можно поставить подпись и печать.

Большинство людей предпочитает записывать и считывать информацию с бумаги. Проблемы с бумажными документами начинаются только тогда, когда требуется их распределять, редактировать, архивировать и уничтожать. В этих случаях электронные данные имеют неоспоримое преимущество.

Опросы IDC (см. рисунок) показали, что в ближайшем будущем не будет реализована не только концепция безбумажного офиса, но и концепция «офис с меньшим объемом использования бумажных документов».

Разговоры о том, что скоро офисы станут безбумажными, ведутся уже более 30 лет. Однако хотим мы того или нет, но расходы на бумагу продолжают увеличиваться по мере роста количества информации, и данная тенденция будет наблюдаться по крайней мере еще несколько лет.

Постепенно черно-белая печать уступает место цветной, а значит, печатный документ тоже постепенно приобретает цвет. Наличие сканеров и возможность цветной печати приводят к дополнительному росту потребления бумаги.

Офисные сотрудники продолжают распечатывать контракты, статьи из Интернета, послания электронной почты, формы и т.д., несмотря на то, что могут просмотреть их в электронном виде. Это стимулирует рост рынка печати и требует лучшего управления работой с документами в бумажном виде, формируя так называемый рынок Document Solutions - рынок программных решений, которые предлагают производители печатной техники.

Данный рынок включает ПО и профессиональный сервис, позволяющие больше получить от периферийного печатного оборудования - повысить его производительность и эффективность. Решения Document Solutions обеспечивают:

  • упрощение печати многих копий документа, когда каждая копия имеет элементы, отличные от предыдущей, например при печати текста с индивидуальными персональными обращениями;
  • оцифровывание бумажных документов для облегчения их поиска и хранения в электронном виде;
  • предотвращение неавторизованного использования печатного оборудования, в том числе с целью экономии бумаги (применение в нем паролей и средств биометрического контроля доступа);
  • контроль за тем, кто печатает и для кого, чтобы можно было выставить счет за расходные материалы именно тому, кто их потратил;
  • удаленное управление печатными периферийными устройствами по локальной и Глобальной сети.

Рынок решений Document Solution растет быстрыми темпами, а его объем составляет сотни миллионов долларов.

В систему Document Management должны входить модули «Средства редактирования и просмотра», «Интерфейсные средства поиска и навигации», «Поисковый сервис», «Средства управления информацией» и «Базы данных». Если к этому набору добавить модуль «Web-публикация и web-доступ», мы получим систему для управления web-контентом. Очевидно, что в рассматриваемых системах будут присутствовать одни и те же элементы. Таким образом, из показанных на схеме модулей, как из деталей конструктора, можно составлять необходимые конфигурации управления контентом.

Современным заказчикам нужна поддержка всего жизненного цикла документа — чтобы информация правильно вводилась, хранилась, вовремя уничтожалась и быстро находилась; чтобы были внешний (B2B) и внутренний порталы для сотрудников. Поэтому нужны именно интегрированные системы управления контентом. Сейчас в области ECM происходит конвергенция ранее монолитных систем в новую, открытую архитектуру, в которой из отдельных модулей можно собрать нужное решение, обеспечивающее управление информацией на протяжении всего ее жизненного цикла (рис. 6).

 

Рисунок

Рис. 6. Схема управления жизненным циклом информации

Распределение сил на рынке EСM

На рынке ECM работают сотни компаний. Данный рынок очень разноплановый и слабо структурированный, что затрудняет его анализ. По данным IDC, в 2005 году объем продаж ECM-продуктов составил около 3,4 млрд долл. В компании Forrester полагают, что к 2008 году доходы от продаж лицензий ECM-продуктов достигнут около 4 млрд долл.

В последние годы на рынке ECM-продуктов произошла существенная реструктуризация. Две крупные сделки, завершившиеся в октябре 2006 года (компания Hummingbird вошла в состав фирмы Open Text и корпорация IBM купила компанию FileNet), привели к некоторой консолидации рынка. Разделение рынка EMC-систем между компаниями показано на рис. 7.

 

Рисунок

Рис. 7. Разделение рынка EMC-систем
между компаниями (источник: Gartner,
октябрь 2006)

Насколько важными для рынка являются данные слияния, можно судить на основе рейтинга лидеров, составленного IDC в 2005 году до вышеуказанных слияний (см. таблицу), а также из расстановки сил игроков на рынке ECM Suites в 2005 году (рис. 8).

 

Рисунок

Рис. 8. Рынок ECM-систем в III квартале
2005 года (источник: Forrester)

Очевидно, что последние слияния произошли среди ключевых игроков рынка ECM-систем, а не за счет покупки лидерами компаний третьего уровня.

Рейтинг лидеров рынка EMC-систем

Место в рейтинге

Название компании

1

FileNet

2

IBM

3

Open Text

4

Microsoft

5

Hummingbird Ltd

6

Stellnet

7

Interwoven

8

Vignette

9

Mobius Management Systems, Inc.

Рынок EMC быстро меняется по мере создания новых EMC-приложений пользовательского уровня в компаниях Microsoft, Oracle и IBM, а также вследствие осознания потребителями того факта, что для компаний разного уровня нужны различные решения.

 

В начало В начало

КомпьютерПресс 8'2007