Зачем компьютеру зрение

Часть 5. Интеллектуальные помощники

Юрий Морзеев

Защищать и помогать

Системы-помощники

   Интеллектуальный дом

   Электронные помощники

Нужно ли компьютеру зрение

Защищать и помогать

В предыдущих статьях данного цикла был достаточно подробно рассмотрен ряд областей, где машинное зрение уже реализовалось как технология или по крайней мере стратегия его развития и пути совершенствования определились на долгие годы. Наряду с этим существуют такие технологические области, где компьютерное зрение еще делает первые шаги, только начинает пробовать свои силы. Характерными примерами здесь служат биометрические технологии и технологии зрения роботов. Это развитие напрямую связано с увеличением вычислительной мощности процессоров, с совершенствованием систем ввода и передачи информации, с ростом компьютерных сетей, с удешевлением техники при расширении ее функциональных возможностей и т.д. В частности, рост вычислительной производительности персональных компьютеров при одновременном снижении их стоимости привел к тому, что большое число действующих приложений и прототипов будущих систем в области современных технологий компьютерного зрения строится именно на их платформе.

В этой статье рассказывается о системах компьютерного зрения, которые уже сейчас входят или пытаются войти в частную жизнь человека, в каждый дом, в учреждение, в офис, в автомобиль и т.п. Иными словами, завершая цикл статей, посвященных компьютерному зрению, прежде чем подводить итоги, рассмотрим ряд принципиально новых технологий и решений в области машинного зрения. Поговорим о системах-помощниках, которые посредством электронных «глаз» (видеокамер) и «мозга» (компьютера) призваны помогать человеку в его ежедневных делах и заботах. После этого попытаемся подвести итоги и ответить на главный вопрос данной серии публикаций: нужно ли современному компьютеру зрение.

В начало В начало

Системы-помощники

Первую группу систем-помощников охватывает понятие «интеллектуальный дом». Вторая группа этих систем включает компьютерные приложения, которые при помощи набора датчиков помогают представителям различных специальностей выполнять свой профессиональный долг, решают различные задачи мониторинга, а также предназначены для оказания помощи людям с ограниченными физическими возможностями. Подобные приложения служат не только для облегчения общения страдающих различными заболеваниями людей с внешним миром, но и позволяют создавать принципиально новые средства дистанционного управления различными устройствами. Далее мы рассмотрим эти две группы систем-помощников.

В начало В начало

Интеллектуальный дом

Понятие «интеллектуальный дом» появилось сравнительно недавно, но уже прочно завоевало умы многих разработчиков современных компьютерных систем. При этом на данный момент не существует четкого его определения и каждый вкладывает в это понятие свой собственный смысл. Если попытаться обобщить существующие позиции, то под интеллектуальным домом понимается помещение (дом или офис), в котором наряду с уже привычными для нас обстановкой и бытовыми приборами существует некая скрытая служба электронного сервиса, разработанная на основе современных цифровых технологий. В настоящее время проблему построения интеллектуального дома решают двумя способами (рис. 1).

Первый способ связан с совершенствованием самой бытовой техники путем оснащения ее дополнительной аппаратурой. Создавая новые образцы интеллектуальной бытовой техники, производители используют имеющийся у большинства современных бытовых приборов микропроцессор для проведения дополнительных интеллектуальных вычислительных или логических операций, а многие производители уже всерьез задумываются о встраивании в свою продукцию недорогих видеокамер, чтобы в дальнейшем оснастить эти приборы и устройства алгоритмами цифрового зрения. Несмотря на то что концепция «интеллектуального дома» пока еще преимущественно не выходит за рамки теории, рассмотрим наиболее интересные примеры систем и устройств, в которых потенциально могут быть использованы технологии машинного зрения.

В качестве первого примера приведем хорошо всем знакомый и самый важный предмет бытовой техники, имеющийся в каждом доме, — холодильник. Если на минуту призадуматься, то можно обнаружить, что, оборудовав холодильник набором недорогих видеокамер, можно отслеживать ассортимент находящихся в нем продуктов и при необходимости автоматически его пополнять. При этом холодильник может находиться в постоянном режиме обучения с первого дня своего пребывания в доме, неустанно изучая вкусы и пристрастия хозяев. Это может быть достигнуто с помощью специальных алгоритмов самообучения, таких, например, на основе которых мы учим наших детей узнавать те или иные предметы. Более того, «умный» холодильник, изучив потребности семьи, сможет самостоятельно прогнозировать ее продуктовые потребности и через Интернет или другие альтернативные каналы будет производить заказ недостающих продуктов в виртуальных магазинах. Здесь открывается большое поле деятельности для широкого спектра алгоритмов компьютерного зрения, начиная от алгоритмов структурного анализа и заканчивая нейросетевыми алгоритмами. Другой задачей, которую могут решать такие системы, является контроль авторизованного доступа членов семьи к какой-либо бытовой технике. Например, телевизор или музыкальный центр, оборудованный видеокамерой наблюдения, станет включаться только после определенного (например, запрограммированного родителями) времени или вообще не будет включаться, если система распознает, что ее пытается включить ребенок. Или же ребенок не сможет посмотреть телевизионный канал для взрослых, поскольку телевизор «узнает» его и откажется переключаться на этот канал. В этом случае на помощь приходят биометрические алгоритмы компьютерного зрения.

Третьей задачей, которую можно будет решать в таких домах, может стать роботизация. Идея создания роботов-уборщиков, роботов-охранников и т.п. уже давно интересует японских и южно-корейских инженеров, и, как показывают последние выставки, посвященные робототехнике, многие компании уже добились в этой области значительных результатов (рис. 2).

Снижение цен на технику позволяет оборудовать роботов нового поколения несколькими камерами и алгоритмами стереоскопического зрения без существенного их удорожания. Сейчас разработчики таких систем работают над интеллектуальной начинкой своих электронных машин, которая позволит роботам не только узнавать своих хозяев и членов их семьи, свободно ориентироваться в квартире, не натыкаясь на мебель и другие предметы, но и выполнять несложные и в то же время трудоемкие операции по дому и за его пределами, такие как домашняя уборка, стрижка газонов, слежение за детьми, охрана и т.п. Характерным примером или прообразом таких систем может служить появившаяся пару лет назад собачка-робот Aibo компании Sony. Оборудованная камерой и нехитрыми алгоритмами компьютерного зрения собачка без труда распознавала специальный красный мячик. Не углубляясь в анализ этой игрушки с потребительской точки зрения, можно отметить саму революционность подхода и оригинальность конструкторского и алгоритмического решений.

Еще одним примером использования систем компьютерного зрения в рамках программы «Интеллектуальный дом», о котором хотелось бы упомянуть в рамках данной статьи, являются так называемые системы охраны внутреннего и внешнего периметра здания или квартиры. Сюда можно отнести различные интеллектуальные детекторы движения, способные отличить движущегося на четвереньках человека от кошки или собаки, биометрические домофоны, ключи и т.п. Такая система может стать надежным противоугонным устройством для автомобиля. Она подает сигнал при наличии любого заданного движения в охранной зоне автомобиля и практически не подвержена воздействию со стороны злоумышленников, что выгодно отличает ее от существующих электронных или механических систем. При этом назначение описываемых систем может меняться в зависимости от ситуации. Например, если система находится в режиме охраны внутреннего периметра помещения, то при появлении движущегося объекта она включит запись и передаст сигнал тревоги на пункт охраны. Если же хозяин находится в доме, то эта же система способна вовремя автоматически включить свет при появлении человека в комнате и выключить его, если в комнате никого нет или если она не переведена на ручное управление.

Количество вариантов применения систем компьютерного зрения в быту ограничивается только фантазией и здравым смыслом. Однако у всех вышеперечисленных систем есть существенный недостаток — это несогласованность работы. Я думаю, что не нуждается в доказательствах тот факт, что зачастую для согласованности действий или для бездействия необходимо владеть комплексной информацией о происходящем. В настоящее время немногие бытовые приборы могут похвастаться умением отыскивать «соседа», а тем более плодотворно с ним сотрудничать. Устранить этот недостаток позволяет второй способ построения интеллектуальных домов (рис. 3).

Этот способ целиком подпадает под юрисдикцию компаний, которые занимаются такой деятельностью, как построение и развитие локальных и глобальных вычислительных сетей, IP-телефония и т.п. Хотя описание этого способа не вполне соответствует тематике данной статьи, я хотел бы вкратце остановиться на этих вопросах. Дело в том, что разработчики и проектировщики подобных сетей в настоящее время не только нацелены на глобальный охват цифровыми сетями наших жилищ, но также стремятся осуществить автоматизацию и унификацию силовых сетей с целью предупреждения перебоев и сбоев в подаче электроэнергии. При этом они намерены создать единую систему гарантированного электроснабжения здания на основе мощных источников бесперебойного питания, которые в исключительном случае страхует дизель-генератор. Таким образом создаются единые сети. Закладывая уже при строительстве зданий необходимые коммуникационные сети, достигают единственной, но поистине революционной цели — возможности связать в единую сеть все устройства в доме или в офисе, сделать эти устройства дистанционно контролируемыми или управляемыми не только в рамках квартиры либо офиса, но и практически из любой точки мира.

Так что же такое интеллектуальный дом? Обобщая все вышесказанное, можно выделить несколько характерных признаков этого понятия. Основная черта, отличающая данное решение, заключается в том, что сложнейшие технологии разного рода (в числе которых — и технология компьютерного зрения, и технология распознавания речи и голоса, и всевозможные технологии, связанные с приемом-передачей данных) объединяются в комплексную систему, которая, благодаря простому и доступному для каждого пользователя внешнему интерфейсу, способна решать весьма сложные технологические задачи.

В начало В начало

Электронные помощники

Ни для кого не секрет, что человек всегда стремился обзавестись помощниками в своих разнообразных начинаниях. Основной целью, которую он при этом преследовал, было избавление от однообразного и рутинного труда. В предыдущих статьях этого цикла мы уже приводили примеры таких систем. Сейчас же нам хочется представить на суд читателей несколько иные системы, которые в силу своей революционности, с одной стороны, и технологической сложности — с другой, еще не получили достаточно широкого распространения и признания. Может быть, это происходит отчасти из-за того, что заложенные в них технологии компьютерного зрения не удовлетворяют в достаточной степени высоким потребительским требованиям, предъявляемым к современным высокотехнологичным продуктам.

Первую группу «зрячих» электронных помощников, которую мы рассмотрим, можно охарактеризовать как устройства, выступающие в роли средств активной безопасности. О таких системах и устройствах, а также о компаниях, занимающихся разработкой подобных систем (в частности, о российских компаниях, специализирующихся на области компьютерного зрения), уже рассказывалось на страницах нашего журнала. В этой статье мы хотели бы остановиться на таких системах поподробнее.

Современные тенденции развития рынка информационных технологий свидетельствуют о возрастающей потребности в системах, позволяющих наблюдать за человеком, находящимся в поле зрения камеры, и оценивать его состояние на основании анализа его поведенческих характеристик. Такие системы могут применяться в довольно широком спектре приложений, например использоваться для слежения и оценки состояния водителя, авиационного диспетчера, диспетчера атомной станции, оператора за пусковым пультом баллистических ракет и т.п., иными словами — применяться в тех отраслях, где невыполнение человеком своих должностных обязанностей может привести к человеческим жертвам, к порче техники и имущества.

Большое количество катастроф на современном этапе развития техники и технологий связано с так называемым человеческим фактором. Зачастую помимо разного рода ошибок и низкой квалификации персонала решающую роль здесь играет фактор усталости человека. Недостаток сна и его нарушения становятся все более острой проблемой в современном обществе, где людям хронически не хватает времени. Снижение количества несчастных случаев вследствие анализа и предупреждения срабатывания фактора усталости человека даст возможность не только сберечь значительные материальные и моральные ресурсы, но и сохранит жизни многих людей. Обнаружение симптомов усталости человека на ранних стадиях и принятие превентивных мер позволит избежать значительного количества несчастных случаев.

Ученые многих стран работают над созданием систем активной безопасности. Но лишь немногие из них знают, что именно в этом случае на выручку могут прийти системы компьютерного зрения. Они способны с помощью так называемых бесконтактных методов, основанных на слежении за человеком при помощи одной или двух камер, без труда справиться с этой нелегкой задачей. Сегодня уже существуют опробованные системы, которые хорошо зарекомендовали себя при решении вышеописанных задач (рис. 4).

Очевидно, что такие системы могут найти самое широкое применение, причем не только для детектирования состояния водителя, авиационного диспетчера, диспетчера атомной станции и т.п. С помощью таких технологий можно управлять компьютером, периферийными устройствами, различной бытовой техникой, набирать тексты при помощи взгляда, что особенно важно для людей с разными физическими недостатками, строить системы оценки Web-дизайна и реализовывать еще множество различных интересных и полезных проектов. Перечисленные технологии входят в понятие «gaze tracking» («слежение за взглядом») и являются сегодня одними из самых передовых и бурно развивающихся. Хочется подчеркнуть, что в основе большинства подобных систем лежат технологии стереозрения, о которых шла речь в предыдущих статьях. В частности, совсем недавно появилась информация о том, что австралийские ученые закончили разработку системы оценки состояния водителя и выпустили первые серийные образцы стоимостью около 40 тыс. долл. По оценкам промышленников, в ближайшие несколько лет стоимость установки таких систем не будет превышать 5 тыс. долл., что сделает эти технологии доступными более широкому кругу автолюбителей.

Заметим, что в рамках данного направления мы рассмотрели только те приложения, которые осуществляют слежение за человеком. Если же развернуть камеру в направлении от человека, то мы получим еще одну возможность применения этих систем компьютерного зрения — слежение за дорожной ситуацией и предотвращение столкновения с препятствиями или с другими транспортными средствами. Технологии компьютерного зрения играют в этом случае роль систем жизнеобеспечения и безопасности.

Если говорить об автомобильной промышленности, то в этой области также создана концепция «умного автомобиля», согласно которой «умная машина» будущего поможет водителю лучше понимать окружающую обстановку и ориентироваться в ней. Она также будет участвовать в принятии решений, не снимая с водителя всей полноты ответственности. В частности, согласно информации, имеющейся на сайте Peugeot (http://www.peugeot.ru/), эта компания с 1994 года активно ведет работу по созданию такого автомобиля. При движении по маршруту машина за счет приема специальных сигналов сможет получать информацию о состоянии поверхности дороги, имеющихся препятствиях, интенсивности движения транспорта, погоде, ведущихся строительных работах, рекомендуемой скорости, происшествиях, приближающихся съездах с шоссе и другие необходимые сведения. Например, разрабатываемая компанией электронная система детектирования пересечения белых линий разметки сможет предупредить водителя о неверном направлении движения и исправить курс при отсутствии необходимой реакции (например, если водитель заснул). А система интеллектуального контроля скорости поможет оставаться на безопасном расстоянии от других машин на дороге. В результате достигается высокая степень интеграции между различными электронными системами внутри одного сложного механизма, когда электронный мозг автомобиля координирует свои действия и принимает решения, основываясь на дополнительном источнике информации, поступающей от электронных глаз (рис. 5).

Во вторую группу входят системы, помогающие людям с различными физическими недостатками не чувствовать себя изгоями в обществе. Идея сделать таких людей полноценными членами социума — не нова. Известны многие механические, электронные и электронно-механические устройства, которые помогают десяткам тысяч людей передвигаться, слышать и т.п. Но вряд ли широкому кругу читателей известен тот факт, что и в области машинного зрения ведутся весьма серьезные исследования в этом направлении. Отметим, что особый интерес к развитию данных технологий проявляют такие страны, как Япония и Южная Корея. В этих технологически высокоразвитых странах возлагают большие надежды на технологии компьютерного зрения как в глобальном масштабе, так и в рамках помощи инвалидам и больным людям. На подобные проекты государственные структуры этих стран выделяют весьма солидные ассигнования.

Возьмем, к примеру, такой раздел компьютерного зрения, как распознавание жестов. В настоящее время в этом русле идут очень важные исследования. Причем работа проводится по двум направлениям: распознавание статических и распознавание динамических жестов. В случае успеха этой работы выигрыш очевиден. Сколько глухонемых смогут общаться со слышащими людьми при помощи простых интерпретаторов «жесты-речь» и «речь-жесты»! Такая система позволит этим людям спокойно чувствовать себя практически в любой обстановке и не бояться, что они будут неправильно поняты. Однако с точки зрения современного уровня развития технологии все не так просто, как кажется. В настоящее время многие исследователи «уперлись» в проблему так называемой разделимости жестов. Поясним это на примере потенциальной системы распознавания жестов, состоящей из видеокамеры и обычного персонального компьютера, оснащенного устройством ввода видеосигнала. Наиболее очевидный подход к решению данной задачи — рассматривать любой статический жест как некую фиксированную структуру, состоящую из элементарных элементов (отрезков, окружностей и т.п.), которые, объединяясь, образуют уникальный объект. Соответственно любой динамический жест можно рассматривать как последовательный набор статических жестов. Для простоты далее мы будем рассматривать только статические жесты. Итак, каждый жест можно разделить на элементарные составляющие, которые, объединяясь и сочетаясь тем или иным образом, всякий раз образуют данный или новый жест. Все было бы вполне решаемо, если бы не внешние условия: одежда и окружающая обстановка. Наш многообразный мир таит в себе миллионы различных сочетаний. Поэтому созданная на таких алгоритмах система без труда должна найти искомый жест в причудливом узоре портьеры или на рубашке проходящего мимо человека. Кроме того, прежде чем решить задачу распознавания жеста, необходимо выделить сам объект распознавания, создающий эти самые жесты, то есть руку. А это задача очень и очень непростая, учитывая вариации цвета кожи, одежды и т.п. Безусловно, существуют определенные возможности с помощью различных ограничений на условия работы такой системы добиться относительной надежности и стабильности работы приложений. Правда, такие приложения не могут считаться потребительскими в полном смысле этого слова. Читателю может показаться, что данная задача неразрешима или же что для работы с такой системой пользователю необходимо облачаться в уникальный костюм и надевать на руки специальные перчатки. Однако это не так. В столь сложной ситуации на помощь разработчикам приходят специальные камеры с особыми характеристиками, которые без труда позволяют справиться с многими существующими трудностями. Характерным примером может служить разработанная несколько лет назад корпорацией Toshiba камера-дальномер — предмет гордости компании. Она визуализирует расстояние до объекта в виде интенсивности полутонового сигнала. В соответствии с принципом работы этого устройства, чем ближе предмет расположен к камере, тем он темнее визуализируется на изображении. Работая в диапазоне от десятка сантиметров до трех метров, такая камера без труда способна решить большую часть задач из области распознавания жестов. Да и цена в несколько сот долларов делает данную камеру вполне доступной для создания подобного рода приложений (рис. 6).

Вышеописанным приложением не ограничиваются возможности применения систем распознавания жестов. Спрос на такие технологии может возникнуть у представителей абсолютно разных технологических областей. Это могут быть создатели современных средств управления бытовой техникой, которые предполагают оборудовать бытовую технику камерами, чтобы ею можно было управлять при помощи определенного набора жестов. Например, предполагается осуществлять включение, выключение, регулирование громкости и переключение программ телевизионных приемников с помощью системы распознавания жестов. Кроме того, в странах с передовыми компьютерными технологиями проявляют интерес к разработке систем управления периферийными устройствами компьютера (такими как мышь) и запуском стандартного набора программ при помощи жестов. В Японии даже рассматривались проекты по управлению роботами-няньками в больницах самими лежачими и малоподвижными больными посредством нехитрых жестов.

Таким образом, электронные помощники все настойчивее стремятся проникнуть в наш быт. И может быть, очень скоро, спеша на работу или приезжая в незнакомый город на экскурсию, мы сможем пользоваться бескнопочными электронными информаторами, которые будут управляться легкими жестами руки, что сделает нашу жизнь комфортнее и приятнее. И благодарить за это мы должны будем различные технологии машинного зрения.

В начало В начало

Нужно ли компьютеру зрение

В начале статьи мы подчеркнули, что данным материалом завершаем серию публикаций, посвященную проблемам компьютерного зрения. Настало время подводить итоги и делать выводы. Но прежде хотелось бы еще раз вкратце остановиться на тех задачах, которые решает современная технология, называемая компьютерным, или машинным, зрением, и к которым мы постарались привлечь внимание читателей. В рамках данных публикаций были рассмотрены различные области, где технологии компьютерного зрения наиболее распространены и востребованы. К ним относятся зрение роботов, средства автоматизации обработки визуальных данных и информации, биометрия и безопасность, распознавание буквенно-символьной информации, распознавание жестов, детектирование наличия движущихся объектов в поле зрения камеры, распознавание зрительных образов, задачи мультисенсорного распознавания, задачи медицинской диагностики, различного рода системы мониторинга и ряд других направлений. В результате были достаточно подробно проанализированы все технологические аспекты, которые кроются в недрах этих систем. В основу анализа был положен подход, основанный как на изучении потребительской ценности технологии компьютерного зрения, так и на описании ее практической значимости.

Отдельного внимания заслуживают пакеты программ по обработке изображений общего назначения, которые, к сожалению, мы не смогли рассмотреть в рамках данного цикла. В настоящее время получили широкое распространение такие библиотеки, как Open CV, бесплатно распространяемая компанией Intel (http://www.intel.com/), специальные библиотеки по обработке изображений в пакете MatLab, библиотеки по обработке изображений российских компаний, такие как ИИТ со своей библиотекой PISoft (http://www.iitvision.ru/), и ряд других библиотек общего назначения. Преимущество таких программных продуктов достаточно очевидно — с помощью этих библиотек любой мало-мальски посвященный в проблемы компьютерного зрения читатель сможет построить весьма сложные алгоритмы компьютерного зрения, основываясь на сравнительно высокоуровневых процедурах обработки и анализа изображений. Еще одно достоинство таких систем — все они предназначены для использования на персональном компьютере, а значит доступны большинству наших читателей.

Многие также могли бы задаться вопросом об источнике получения видеоинформации для своих будущих систем. Ответ лежит на поверхности: рынок современных Web-камер — прекрасный источник видеоинформации для всех, кто желает попробовать свои силы в компьютерном зрении. Такая камера, подключаемая к персональному компьютеру через USB-порт, поможет вам разработать интересные, осмысленные и в то же время оригинальные решения в области компьютерного зрения, такие, например, как собственный screensaver или специальная система доступа в компьютер, основанная на биометрической технологии распознавания лица; или создать основанную на технологии детектирования движения систему безопасности, следящую за охранной зоной вокруг личного автомобиля, оставленного на ночь под окном; или попытаться сконструировать прообраз интеллектуального дома, которому посвящена первая часть настоящей статьи.

Подобных примеров можно привести огромное количество. Ведь там, где человек вынужден выполнять монотонную, четко формализованную работу, в большинстве случаев его может заменить компьютер. Причем, если раньше такие автоматические комплексы опирались на различные специальные механические и измерительные источники информации, то теперь, имея видеосенсор или любой другой цифровой датчик двумерной информации, в автоматическую систему управления можно заложить формализованную зрительную модель, аналогичную той, что использует в этом случае человек. И после формализации этой модели система, оснащенная электронными «глазами» и цифровым «мозгом», вполне сумеет заменить человека. Хочется особо подчеркнуть, что именно заменить, а не подменить. Ведь, как мы показали в своих предыдущих публикациях, еще не создана система, которая могла бы действовать столь же эффективно, универсально и надежно, как человек.

Например, в компьютер можно заложить множество партий игры в шахматы и он будет способен обыгрывать гроссмейстера; в него можно заложить модели практически всех объектов нашего мира. Компьютер можно оборудовать самыми современными камерами и другими датчиками. Но он вряд ли справится с теми задачами, которые в тысячные доли секунды решает мозг человека. И несмотря на всю серьезность последнего утверждения, именно в нем кроется оптимизм данной ситуации. Компьютерное зрение, по нашему глубокому убеждению, — одно из звеньев в цепи развития высоких технологий. Поэтому многие современные ученые ставят перед собой задачу создания электронного подобия человека, который был бы способен не только видеть мир при помощи заложенных внутри него моделей, но и обладал бы способностью самообучения в окружающем его изменчивом мире, как это делают наши дети, как это ежедневно делаем мы.

Хочется также остановиться еще на одном принципиальном моменте. В рамках данного цикла мы намеренно не давали подробных пояснений алгоритмов и подходов к решению технологических задач, которые используются в компьютерном зрении. В лучшем случае упоминались лишь некоторые из них. Тому было несколько причин.

Во-первых, таких подходов великое множество и им посвящены целые специализированные издания. Ежегодно во всем мире издаются десятки книг, посвященных машинному зрению. Причем цена на эти книги отнюдь не низкая и колеблется от полусотни до нескольких сот долларов. К сожалению, в нашей стране, в силу того что данная технология еще только развивается, найти специализированную литературу по компьютерному зрению на русском языке крайне проблематично. Последние специализированные издания в этой области датированы серединой 80-х — началом 90-х годов. Тем не менее достать литературу по компьютерному зрению сегодня намного легче, чем, скажем, пять или десять лет назад. Поэтому мы направляем всех интересующихся в Интернет-магазины, где можно заказать зарубежную литературу по этой теме. Отметим лишь, что в упомянутых книгах, как правило, дается достаточно подробное описание самих технологий и наиболее часто используемых методов. Большинство западных издателей снабжают свои книги дисками с примерами программной реализации описанных в учебной литературе алгоритмов.

Во-вторых, многие из таких подходов являются конфиденциальной информацией их владельцев и не подлежат разглашению. В современном мире в области компьютерного зрения наблюдается весьма жесткая борьба за поиск ниш, где данные технологии могли бы быть востребованы. По различным темам, которые мы затронули в рамках этого цикла, существуют сотни, а может быть, и тысячи патентов. Никому доселе не известно, где та золотая жила, что принесет счастливчику удачу, но компании и частные лица упорно патентуют различные технологии в означенной области. Многие компании в последние несколько лет пытались «выстрелить» своими разработками по рынку информационных технологий. Характерные тому примеры — компания Reality Fusion, которая выпустила пакет игр, управляемых с помощью движений перед камерой; фирма Visionics со своей биометрической системой; фирма Eyematic с системой анимации виртуальных персонажей на основе анализа поведения находящегося перед камерой человека и др. Однако потребительский рынок счел данные технологии сырыми, далекими от совершенства и требующими доработки и новых инвестиций. А это значит только одно — борьба за рынки и ниши (даже потенциальные) будет продолжаться и усиливаться.

В-третьих, основная цель, которую мы ставили перед собой, приступая к работе над этим циклом публикаций, — заинтересовать читателя данной темой и побудить молодежь заняться этой весьма непростой проблемой. Несмотря на кажущуюся внешнюю простоту данной технологии, внутри нее сокрыто большое количество ненайденных алгоритмических «изюминок» и нерасколотых «орешков». Хотелось бы, чтобы, прочитав этот материал, хотя бы некоторые молодые люди задумались над вопросом: «А не посвятить ли мне свои силы решению этой современной задачи?» Давайте совместными усилиями распахнем двери навстречу технологии, которая позволит компьютеру прийти на помощь человеку благодаря способности заменять его уникальный инструмент — зрение, тем самым спасая, защищая и оберегая человека. И тогда можно будет с уверенностью сказать, что зрение компьютеру нужно.

КомпьютерПресс 2'2003