Возможности современных фотоаппаратов
Часть 1. Распознавание лиц
Данная публикация открывает цикл статей, посвященный функциональным возможностям современных цифровых фотоаппаратов и практическим аспектам их применения в процессе съемки. В первой части речь пойдет о решениях, основанных на технологии распознавания лиц в кадре.
Предисловие
Цифровые фотоаппараты являются ярким примером того, как переход на цифровые технологии за очень короткий срок радикально изменил представления о возможностях и сфере применения уже давно используемых устройств. Всего за одно десятилетие из простого (с нынешних позиций можно даже сказать примитивного) инструмента для получения изображений окружающего мира в цифровом виде эти аппараты превратились в специализированные компьютеры, оснащенные мощными микропроцессорами, работающие под управлением сложного программного обеспечения и обладающие огромным количеством разнообразных функций.
Впрочем, не стоит слепо восторгаться торжеством технологий. Далеко не все возможности современных цифровых фотоаппаратов имеют непосредственное отношение к съемочному процессу. Более того — без большинства «интеллектуальных» помощников вполне можно обойтись, имея даже минимальный опыт.
Со стороны может показаться, что производители избрали не самый логичный путь развития: вместо того, чтобы сосредоточить усилия на совершенствовании наиболее критичных, с точки зрения качества получаемых изображений, аппаратных компонентов (светочувствительных сенсоров, оптики и т.д.), они уже на протяжении нескольких лет занимаются разработкой и внедрением всё новых и новых функций.
В какойто мере такой вариант развития является вынужденным. К середине минувшего десятилетия рынок цифровых фотоаппаратов достиг уровня насыщения. Неизбежным следствием стало обострение конкурентной борьбы, усугубленное значительным падением доходности. С одной стороны, понятно, что в подобной ситуации совершенствование характеристик ключевых аппаратных компонентов является неприемлемым вариантом, поскольку установка светочувствительного сенсора и оптики более высокого класса автоматически означает существенное увеличение себестоимости продукта. С другой стороны, новые модели фотоаппаратов должны хоть в чемто превосходить своих предшественников и конкурентов — в противном случае возникнут серьезные трудности с их продвижением. Именно поэтому производители предпочли сосредоточить усилия на развитии встроенных функций. Такой путь требует гораздо меньших затрат, а кроме того, является весьма эффективным способом наглядно продемонстрировать, чем именно новая модель фотокамеры лучше выпущенной полгода назад. Действительно, убедить покупателя, не искушенного в тонкостях оценки качества фотографий, что в новой модели удалось немного повысить четкость изображения и точность цветопередачи — дело практически безнадежное. А тут всё просто: у старой модели было 16 сюжетных программ, а у новой — целых 30! И еще набор художественных фильтров. Весьма убедительный аргумент, особенно для людей несведущих.
Впрочем, и здесь есть свои подводные камни. Наращивание функциональных возможностей цифровых фотокамер порождает проблему, присущую многим современным гаджетам. Разобраться с обилием имеющихся возможностей становится всё труднее: не у каждого пользователя хватит терпения, чтобы проштудировать руководство по эксплуатации толщиной с энциклопедический словарь и закрепить полученные знания выполнением практических упражнений. Не секрет, что многие владельцы современных фотоаппаратов (а также смартфонов и пр.) в реальных условиях эксплуатации задействуют от силы 20-30% имеющихся функций, а о существовании некоторых даже не подозревают.
Технология распознавания лиц в кадре является основой
для целой группы функций современных цифровых фотоаппаратов
Мы надеемся, что публикации этого цикла помогут начинающим (и не только) фотолюбителям разобраться с многочисленными возможностями современных цифровых фотоаппаратов и научиться максимально эффективно использовать их для решения творческих задач. А начнем мы с рассмотрения функций, базирующихся на технологии распознавания лиц в кадре.
Зачем камере узнавать людей
Масштабная кампания по популяризации функции распознавания лиц началась в 2007 году. Именно тогда в продаже появились первые модели цифровых фотоаппаратов с такой возможностью. Тем не менее многие пользователи и сегодня весьма смутно представляют себе, зачем нужна эта функция.
Отчасти в этом виноваты маркетологи. Фраза «функция автоматической коррекции настроек, базирующаяся на распознавании лиц в кадре», которая позволяет понять суть этого новшества, оказалась чересчур длинной для рекламных проспектов. А сокращенный вариант («функция распознавания лиц»), который в итоге и получил широкое распространение, способен лишь ввести в заблуждение. У людей неискушенных возникает вполне закономерный вопрос: а зачем вообще цифровой камере уметь распознавать лица? Что ж, давайте разбираться.
Прежде всего необходимо пояснить, что сама по себе технология распознавания лиц на цифровом изображении — это лишь основа, на базе которой разработчики цифровых фотоаппаратов реализовали целый ряд функций, обеспечивающих автоматическую помощь в выборе настроек и управления процессом съемки. В рамках данной публикации мы не будем вдаваться в технические детали и особенности реализации конкретных алгоритмов распознавания лиц, используемых в фотоаппаратах тех или иных производителей. Наша цель — рассказать о тех функциях, которые созданы на базе этой технологии.
Вообщето алгоритмы распознавания лиц на цифровых изображениях применялись в серийно выпускаемых цифровых фотоаппаратах еще до 2007 года. Одним из пионеров данного направления стала компания НР (к настоящему времени, увы, уже покинувшая сегмент цифровых фотокамер). Именно в ее фотоаппаратах и фотопринтерах была впервые внедрена функция автоматического устранения эффекта красных глаз, в основу которой был положен алгоритм распознавания лиц на цифровом изображении. Первоначально это был фильтр постобработки, обеспечивающий коррекцию уже сделанных снимков. Однако по мере появления более совершенных алгоритмов и роста производительности процессоров фотокамер появилась возможность выполнять эту операцию «на лету» в процессе первичной обработки цифрового изображения перед записью файла на карту памяти. В настоящее время функция автоматического устранения эффекта красных глаз как в процессе съемки, так и на уже сделанных кадрах имеется во многих моделях цифровых фотоаппаратов ведущих производителей — Canon, Nikon, Sony и др.
Результаты работы функции коррекции экспозиции и фокусировки
с учетом обнаруженных в кадре лиц. Снимок, расположенный слева,
сделан без использования данной функции; справа — изображение,
полученное при съемке с включенной коррекцией
Принципиальным новшеством, реализованным в моделях 2007 года, стало применение технологии распознавания лиц на изображении для автоматической коррекции настроек экспозиции и фокусировки при съемке людей. В режиме предварительной готовности (то есть после того, как спусковая кнопка наполовину нажата) камера производит анализ поступающего с сенсора изображения с целью поиска в кадре объектов, соответствующих заложенному разработчиками описанию человеческого лица. Если таковые найдены, настройки фокусировки и экспозиции автоматически корректируются таким образом, чтобы обеспечить максимальную четкость и оптимальную проработку лиц (в том случае, если с первоначальными настройками они получаются слишком светлыми или, наоборот, темными).
Поскольку портреты и групповые снимки неизменно входят в число наиболее популярных сюжетов любительской фотографии, успех описанной выше функции был вполне предсказуем. Не секрет, что горе-фотографы довольно часто списывают недостатки получаемых изображений (например, когда лица на портретах и групповых снимках получаются темными и невыразительными) на несовершенство используемой камеры. Идя навстречу пожеланиям массового потребителя, разработчики смастерили своего рода универсальный «костыль», позволяющий во многих случаях исправить ошибки фотографа или, по крайней мере, сгладить их последствия.
Впоследствии данная функция была неоднократно усовершенствована. Информацию о наличии и расположении в кадре лиц стали использовать для коррекции большего количества настроек, включая баланс белого, мощность и режим работы вспышки и т.д. Благодаря коррекции баланса белого значительно снижается вероятность получения изображений с синюшными лицами, что нередко случается, если фотографируемый находится в тени. В ряде камер была реализована функция следящего автофокуса, который можно настроить на одно из обнаруженных в кадре лиц.
Стараниями разработчиков происходил рост как качественных, так и количественных характеристик. Если поначалу применяемые алгоритмы позволяли находить лишь несколько лиц, то в последующих моделях это ограничение было снято. Например, алгоритм распознавания, реализованный в моделях 2007 года Fujifilm FinePix Z100fd и FinePix F47fd, позволял обнаруживать до десяти лиц одновременно. А представленная во второй половине 2009 года камера Pentax Optio WS80 уже позволяла распознавать до 32 лиц в кадре.
В начале 2008 года Fujifilm представила камеру Fujifilm S100FS, в которой реализована новая версия технологии распознавания лиц — Face Detection 2.0. Основным усовершенствованием алгоритма распознавания стала возможность обнаружения на изображении лиц, не только обращенных непосредственно к объективу, но и расположенных под углом до 90° (в том числе в профиль), а также наклоненных вниз. Схожие усовершенствования были внедрены в ряде выпущенных во второй половине 2008 года моделей фотоаппаратов Canon, оснащенных процессором DIGIC 4.
Многие современные фотоаппараты способны обнаруживать улыбку на лицах…
… а некоторые модели даже умеют измерять степень улыбчивости каждого из персонажей
В конце 2008 года Fujifilm внедрила технологию Face Detection 3.0. Модернизированный алгоритм обеспечил более уверенное распознавание лиц, расположенных под углом, а кроме того, позволил находить лица, повернутые относительно вертикали (например, если ктото наклонил голову). Кроме того, благодаря оптимизации алгоритма удалось сократить время распознавания. Например, время, необходимое для обнаружения в кадре десяти лиц, сократилось до 36 мс.
По мере совершенствования используемых алгоритмов стало возможно не только обнаруживать в кадре абстрактные образы лиц, но и идентифицировать конкретных людей. Так, в ряде компактных фотокамер Exilim была внедрена технология FSE (Face Sensing Engine), разработанная специалистами компании OKI. Владелец фотоаппарата может выделить на снимке одно из лиц и зарегистрировать его в памяти камеры под произвольным именем. Зарегистрированные лица имеют приоритет над прочими: например при съемке группы людей камера будет фокусироваться и корректировать параметры экспозиции таким образом, чтобы именно «знакомые» ей лица были максимально четкими.
Похожая функция появилась в ряде моделей фотокамер Lumix (в частности, DMC-FX40), выпущенных в 2009 году. Каждому из зарегистрированных лиц можно присвоить произвольное имя, которое будет отображаться при появлении его в кадре, а также возраст. При обнаружении зарегистрированных в памяти лиц детей младше трех лет камера автоматически активирует сюжетную программу для съемки детей. В режиме просмотра можно делать выборку снимков, на которых присутствует выбранный зарегистрированный персонаж.
Функция узнавания лиц была реализована и у ряда выпущенных в 2010 году моделей Fujifilm (в частности, FinePix JX400). Пользователь может отметить на полученном снимке лицо какого-либо человека и задать его имя. После этого камера позволяет находить среди сохраненных в памяти снимков кадры, на которых присутствует данный персонаж.
Улыбнитесь: вас снимают
В современных цифровых фотоаппаратах технология распознавания лиц помогает не только корректировать различные настройки, но и управлять так называемым интеллектуальным автоспуском.
В традиционном варианте реализации функция автоспуска позволяет отсрочить срабатывание затвора на фиксированный промежуток времени (например, 10 с), что в реальных условиях не всегда удобно. Функция интеллектуального автоспуска позволяет автоматически сделать снимок при выполнении определенного условия, в частности при появлении в кадре лица с улыбкой. В настоящее время подобная функция под разными названиями реализована в фотоаппаратах многих производителей: Casio Exilim (Auto Shutter), Fujifilm (Smile and Shoot), Nikon (Smile detection), Pentax (Smile Capture), Sony (Smile Shutter) и т.д. Во многих ныне выпускаемых фотокамерах предусмотрена возможность определять не только выражение найденного в кадре лица, но и степень чувствительности к этому признаку.
При активации функции Group Timer затвор срабатывает
при обнаружении в кадре заданного количества лиц
(в данном случае трех)
Условием для срабатывания «умного» автоспуска может служить не только выражение найденных лиц, но и количество обнаруженных персонажей. В конце 2008 года в ряде фотоаппаратов Canon была реализована функция FaceSelf Timer. Эта разновидность интеллектуального автоспуска срабатывает через пару секунд после того, как новое лицо попадает в кадр.
В 2009 году в моделях Fujifilm серии FinePix Z появились дополнительные режимы работы интеллектуального автоспуска. При выборе режима Group Timer пользователь имеет возможность задать количество персонажей группового снимка: затвор сработает тогда, когда в кадре будет найдено соответствующее количество лиц. А при установке режима Couple Timer снимок будет автоматически сделан в том случае, когда два обнаруженных в кадре лица окажутся в непосредственной близости.
Еще одна функция, основанная на использовании алгоритма распознавания лиц, — детектор моргания (blinking detection). При ее активации камера анализирует отснятые кадры и в случае обнаружения одного или нескольких лиц с закрытыми или не полностью открытыми глазами выводит на экран соответствующее предупреждение. Таким образом, если ктото из фотографируемых моргнул в момент съемки, у фотографа будет возможность сразу же сделать дубль.
Достоинства и недостатки
Завершая рассказ о функциях, базирующихся на применении технологий распознавания лиц в кадре, попробуем вкратце оценить их достоинства и недостатки. С одной стороны, внедрение подобных систем действительно позволяет снизить процент технического брака при съемке портретов и групповых фото — особенно в тех случаях, когда пользователь не обременен даже элементарными знаниями и практическими навыками в области фотографии. Иногда возникают ситуации, когда думать об освещении и композиции просто некогда — успеть бы «поймать» интересный сюжет. Разумеется, в подобной ситуации система коррекции настроек «по лицам» может пригодиться не только начинающему, но и опытному фотографу.
Функция детектора моргания предупредит о наличии
на снятом изображении лиц с закрытыми глазами
С другой стороны, использование «умной» автоматики не всегда позволяет задействовать весь арсенал технических приемов, известных еще со времен пленочной фотографии. Например, чтобы получить эффектный силуэт в контровом освещении, имеет смысл заранее отключить функцию распознавания лиц. Нередко коррекция экспозиции с высоким приоритетом имеющихся в кадре лиц может сделать фотографию неинтересной, особенно когда более светлый фон выбеляется до такой степени, что различить на снимке какиелибо детали, за исключением попавших в кадр людей, становится практически невозможно.
В любом случае окончательное решение относительно того, задействовать автоматическую систему помощи или полностью полагаться на свои знания и опыт, остается за фотографом. И хорошо, что производители компактных камер, изобретающие всё новые и новые вспомогательные функции, оставили пользователям право выбора.
На этом мы завершаем обзор функций, базирующихся на технологии распознавания лиц в кадре. Часть 2 будет посвящена функциям съемки панорамных и стереоскопических изображений.
Продолжение следует