Поисковые ресурсы и их сервисы

Родион Насакин

Рынок в цифрах и фактах

Новостные потоки

Утилитарная география

Другие векторы

 

Ежедневно поисковые системы служат отправной точкой web-серфинга для миллионов интернетчиков, индексируют гигабайты нового контента, проверяют на актуальность миллиарды записей в своих базах данных. По сути, данные сервисы превратились в центральные узлы Сети, стали самыми привлекательными площадками для интернет-рекламы, а их владельцы — самыми желанными партнерами для любого доткома. При этом корпорации, уже долго и успешно работающие в данной отрасли, не собираются почивать на лаврах. Чуть ли не каждую неделю на рынке интернет-поиска анонсируются новые проекты по оптимизации и наращиванию системной функциональности.
Рамки целевой аудитории непрерывно расширяются за счет географической локализации сервисов и появления специализированных услуг, интересных ограниченному кругу пользователей. Крупнейшие игроки рынка делают все, чтобы потребитель мог находить не просто ссылки по запросу, но и наиболее востребованный контент, не покидая поискового ресурса. На любом мало-мальски известном портале такого типа можно обнаружить тематический каталог популярных сайтов и «желтые страницы», прогноз погоды и телепрограмму, курсы валют и котировки акций, словари и переводчики.

Рынок в цифрах и фактах

Неудивительно, что именно эти ресурсы послужили основой для создания мультифункциональных порталов, в которых большая часть сервисов уже не имеет ни малейшего отношения собственно к поиску. Усиленно расширяются и продвигаются такие проекты, как файловые хранилища, социальные сети, видеохостинг, онлайн-софт (текстовые и графические редакторы, электронные таблицы, игры и даже ОС) и т.д.

На мировом уровне наиболее активно работают над совершенствованием своей универсальности владельцы AOL, Ask.com, Google, MSN и Yahoo!. Они же являются лидерами рынка интернет-поиска. По данным исследования Nielsen/NetRatings, результаты которого были опубликованы в июле текущего года, лидирующие позиции удерживает Google. За месяц поисковик принял примерно 2,67 млрд запросов, захватив 49,4% рынка. Его главный конкурент — Yahoo! — обработал за тот же период около 1,24 млрд запросов, таким образом, он занимает 23% рынка. Замыкает тройку лидеров Microsoft MSN с рыночной долей в 10,3%. На AOL и Ask.com приходится 6,9 и 2,3% соответственно. Причем за последний год владельцам Ask.com удалось существенно повысить популярность своего сервиса — рост числа запросов составил 66%. Для сравнения: соответствующий показатель у Google — 31%, Yahoo! — 29%, а MSN и AOL вообще находятся в стагнации — прирост запросов к ним не превышает 4%.

В Рунете, по данным LiveInternet.ru, подсчитавшего переходы на сайт с различных поисковых систем за три месяца (с 22 июня по 22 августа текущего года всего было сделано более 6,5 млн переходов, так что исследование заслуживает внимания), позиции поисковиков распределились следующим образом: 60,1% переходов у «Яндекса», 21% у Rambler и 7,8% у Google. Пятерку замыкают поисковый сервис Mail.ru, работающий на движке «Яндекса», c 6,3% и MSN — с 1,7%.

Google также продемонстрировал впечатляющие финансовые результаты. По итогам II квартала этого года прибыль компании выросла почти в два раза по сравнению с аналогичным показателем прошлого года. Положение же основного его соперника — Yahoo! — менее стабильно — за тот же период прибыль доткома упала на 78%. Интересно, что Yahoo!, начавшая свою поисковую карьерус того, что арендовала движок у Google, который и использовала вплоть до 2004 года, пыталась поглотить удачливого конкурента. Окончательно от этой идеи в Yahoo! отказались только к маю текущего года. В ходе переговоров владельцы Google сначала потребовали за свое детище 1 млрд долл., однако к моменту получения согласия от Yahoo! цена поднялась втрое. На такие траты корпорация оказалась не готова. Прикупить акции конкурентов также неоднократно пытались в Microsoft. В прошлом году компания хотела приобрести кусочек AOL, но в итоге 5-процентный пакет достался Google. В мае текущего года просочилась информация о ведении аналогичных переговоров с Yahoo!, однако о результатах пока ничего не известно.

Между тем поиск остается одной из наиболее востребованных функций у большинства порталов и по сей день. По данным аналитического отчета Hitwise, опубликованного в мае этого года, несмотря на широчайший ассортимент пользовательского инструментария у Google (см. врезку), непосредственно на текстовый поиск (Google Search) приходится 47,4% всего трафика портала. Среди следующих по востребованности сервисов также преобладают связанные с поиском услуги. Так, на втором месте с 9,5% всех посещений портала находится сервис нахождения изображений в Интернете Google Image. Третье место и 2,5% — у непрофильной службы Gmail, а дальше вновь идут услуги узкоспециализированного поиска — новостей и финансовой информации: Google News (1,9%) и Google Finance (0,3%) соответственно. Кроме того, аналитики вынесли из общего рейтинга показатели сервисов географического поиска: Google Maps — 7,5% и Google Earth — 2,0%. Столь сильный крен в сторону Google Search обусловлен изначальной «заточенностью» портала под данный сервис.

У Yahoo! и MSN, с момента их появления претендовавших на универсальность, распределение носит несколько иной характер, хотя и у них поиск остается одной из наиболее популярных услуг. Так, большинство посещений Yahoo! обусловлено необходимостью проверить почту на этом сервере. Yahoo! Mail обеспечивает 42,4% всех посещений. Второе, третье и четвертое место удерживают финансовый, географический и текстовый поиск соответственно. У Yahoo! Finance — 34,9%, Yahoo! Maps привлекает 20,5% пользователей, а Yahoo! Search — только 16,0%. Схожая ситуация у портала от Microsoft. Ради почтового сервиса MSN Hotmail на сайт заходят 22,9% пользователей. Еще 13,4% интересуются финансовыми данными на MSN Money Central. Текстовый поиск MSN Search занимает третье место с 11,5%.

Интересно, что если Google существенно уступает конкурентам по привлекательности финансового сервиса, то слабым местом MSN является картография (MSN Virtual Earth), формирующая лишь 4,3% трафика. Кроме того, как следует из данных онлайн-мониторинга компании VisitorVille Intillegence, сотрудники Microsoft предпочитают искать информацию в Сети с помощью не MSN Search, а своего главного конкурента: согласно подсчетам, поиск через Google осуществляют 66,3% работников, «родной» сервис привлекает только 19,6% работников, и еще 10% пользуются Yahoo!.

Впрочем, качество поиска на MSN может существенно измениться в лучшую сторону уже в ближайшем будущем. В марте текущего года Microsoft заявила о намерении до конца года запустить новый поисковый движок, который будет выдавать более точные результаты по сравнению с Google. Первоначально обновленный сервис будет доступен жителям США и Великобритании, а через три месяца — всем европейцам. Никаких подробностей относительно новых возможностей системы MSN Search пока не сообщается. Известно лишь, что разработчики постарались, чтобы сервис выдавал не просто ссылки, а именно информацию, интересующую пользователя. Впрочем, на начальном этапе подобные функции, по всей видимости, реализованы не будут. В Windows Vista движок не встроят, чтобы лишний раз не раздражать антимонопольные органы, но в Windows Messenger и MSN Hotmail обновленный поиск появится.

Смена или кардинальное обновление механизмов поиска — дорогостоящее мероприятие, к которому интернет-компании прибегают лишь в случае крайней необходимости. Точнее, лишь тогда, когда становится очевидной невозможность переманить посетителей с других порталов за счет улучшения отдельных сервисов. Далее будут рассмотрены дополнительные возможности современных поисковых систем, минимально необходимые любому порталу для завоевания своей аудитории и удерживания рыночных позиций под натиском конкурентов.

Новостные потоки

Поиск и чтение новостей неизменно остаются одной из основных целей ежедневного посещения Сети миллионами пользователей. Люди постоянно будут стремиться узнать о событиях, произошедших за неделю/сутки/час. Пренебречь такой аудиторией было бы непростительно. И если первоначально для поиска новостей использовались интернет-СМИ, то в настоящее время все больше пользователей отдают предпочтение соответствующим службам поисковых порталов.

Неформальный стандарт преподнесения новостей в Сети за последние несколько лет существенно изменился. Этому способствовал как ряд обычных для отрасли факторов, вроде роста широкополосных подключений или распространения RSS, так и активное внедрение в новостные ресурсы поисковых технологий. Возможность получить уже агрегированный поток новостей с нескольких сотен ресурсов сразу показалась пользователям очень удобной. К тому же в рамках такого подхода стало гораздо проще оценить отношение того или иного новостного источника к описываемым событиям в сравнении с другими ресурсами. Скрыть тенденциозность, ангажированность и т.п. в таком случае на порядок сложнее.

До последнего времени стандарт для новостного сайта выглядел следующим образом. На главной странице размещались список главных новостей, несколько тематических категорий, содержащих описание прочих событий дня («Политика», «Экономика», «Культура», «Спорт» и т.п.), ссылка на архив и служба поиска по ключевым словам. Страница, содержащая новость, как правило, комплектовалась иллюстрацией, и иногда на ней публиковались ссылки на схожие по тематике тексты на сайте и в Сети.

В 2002 году была запущена служба Google News, на главной странице которой помимо стандартной поисковой формы публиковались заголовки новостей, сгруппированные по нескольким категориям и важности. Изначально сервис производил поиск в архивах таких наиболее популярных источников, как BBC, CNN, Guardian, International Herald Tribune, CBS, Salon и Washington Post, и этот список продолжает расширяться. Только в январе текущего года разработчики сочли Google News окончательно доведенным до ума проектом и избавили его от четырехлетнего статуса бета-версии. К этому времени сервис имел более двадцати региональных версий и был доступен пользователям не только ПК, но и мобильных устройств.

 

Google News

Google News

За время совершенствования сервиса компания Google неоднократно подавала заявки на получение патентов, описывающих новые методы поиска и сортировки новостей в Сети. Суть новизны заключается в следующем. Классические принципы работы такого ресурса предполагают сортировку новостей по релевантности, запросу и дате публикации. Таким образом, текст, содержащий большое количество ключевых слов, да еще и в значимых местах (в заголовке, в подписях к иллюстрациям), и размещенный в течение последнего часа, автоматически попадает в верхние строчки новостного рейтинга. Этот вариант вполне подходит для обычного поиска информации, но не совсем удачен с учетом специфики контента. Речь идет о том, что информация от наиболее известных новостных изданий, например от BBC или CNN, зачастую оказывается далеко не в верхних строчках результатов поиска, уступая данным от малоизвестных СМИ. Для исправления ситуации в Google разработали специальную базу данных, которая формируется за счет постоянного мониторинга количества новостей от источников по всему миру, средней длины новостного материала, количества авторских материалов и цитат официальных органов. Также учитывается число сотрудников редакции каждого ресурса, количество переходов на сайты и даже количество стран, население которых имеет доступ к тому или иному ресурсу. На основании всех этих данных система проводит рейтингование уже с учетом авторитетности издания.

В Google News используются наработки специалистов из других подразделений компании. В частности, с прошлого года пользователям предлагается самостоятельно создавать тематические категории, размещая соответствующие блоки на главной странице в произвольном порядке. А в начале этого года к новостному сервису начали применять активно продвигаемую Google концепцию персонализации поиска. Теперь зарегистрированные пользователи, заходя на сайт, видят на главной странице заголовки новостей, которые предположительно должны их заинтересовать в большей степени, чем любые другие. При фильтрации новостных потоков под конкретного посетителя система ориентируется на запросы, сделанные пользователем ранее, а также на ссылки, по которым он переходил.

Постепенно ресурсы перестали довольствоваться статическими картинками, и информация все чаще стала сопровождаться видеосюжетами. Изначально таковыми снабжали главные новости, но в скором будущем соответствующее мультимедийное сопровождение должны получить и менее востребованные тексты. Таким образом, ресурсы окончательно превратятся из интернет-аналогов газет в альтернативу телевизионным новостным выпускам, причем с более богатыми возможностями. За рубежом в этом направлении активно работает Yahoo!. Компания наладила регулярные трансляции новостных видеороликов от CNN и ABC News еще в сентябре прошлого года.

В Рунете повышенным вниманием к совершенствованию новостного сервиса отличается «Яндекс». Поступающие в «Яндекс.Новости» с соответствующих ресурсов данные автоматически обрабатываются и систематизируются по специально разработанному алгоритму (подробнее ознакомиться с принципами ранжирования можно по адресу: company.yandex.ru/articles/smi-mirror.html). Продемонстрируем возможности сервиса на конкретном примере. Так, для сбора информации о взрыве на Черкизовском рынке в Москве 21 августа 2006 года был обработан 1451 источник. Найдено 323 текстовых упоминания об инциденте, 63 фотографии, видеоролик и четыре аудиозаписи. В русскоязычных блогах получено 18 комментариев по поводу происшествия. К описанию прилагается карта с места событий, а также соответствующая справка «Яндекс.Новости в лицах».

 

«Яндекс.Новости»

«Яндекс.Новости»

Рейтинг наиболее популярных персон в СМИ составляется автоматически на основе проанализированных публикаций. Для извлечения имен из основного текста используется технология компании «Интегрум». С апреля текущего года «Яндекс» расширил функциональность проекта, добавив так называемые пресс-портреты. Страница такого портрета содержит основную информацию о человеке, его послужной список, цитаты из высказываний третьих лиц, а также фрагменты документов (в архиве содержится список новостей и публикаций с 2000 года), из которых извлекались данные. Поиск людей можно осуществлять по фамилии или по названию организации. Сейчас в базе данных находится более миллиона пресс-портретов, 30 тыс. из которых ежедневно обновляются.

Утилитарная география

Картографические сервисы в поисковиках нельзя назвать новым явлением. Соответствующие проекты имеются практически у любого более или менее крупного портала. В то же время функциональность и реализация картографических служб существенно различаются. Главной тенденцией последних лет является, разумеется, использование спутниковых фотографий. Данной темой Google и Microsoft заинтересовались практически одновременно. Однако готовый сервис первым появился в апреле 2005 года у Google. Корпорация упростила себе задачу, заранее прикупив компанию Keyhole, занимавшуюся разработкой цифровых карт.

Изначально спутниковые иллюстрации были довеском к уже существующему Google Maps. Если раньше, введя название города или точный адрес в строке поиска, пользователи получали только карту местности, то теперь им предлагалось заодно осмотреть ландшафты. Изображения можно было вращать, масштабировать и совмещать с картой дорог. Возможность совмещения карты и спутниковых фотографий позднее была внедрена в соответствующих проектах Yahoo! и Microsoft, а потому просто обречена стать стандартом де-факто для прочих картографических сервисов в ближайшем будущем. Эта же тройка поисковиков диктует моду в сфере утилитарного применения возможностей географического поиска. В частности, современный сервис данного типа должен осуществлять поиск в выбранном регионе таких объектов, как гостиницы, рестораны, кинотеатры, магазины, а также адреса компаний.

 

Google Maps

Google Maps

В конце прошлого года началось бета-тестирование сервиса Google Transit Trip Planner для планирования поездок на общественном транспорте. От пользователя требуется указать начальную и конечную точки маршрута (допускаются точные адреса, пересечения улиц, населенные пункты), а также ввести время отправления и прибытия. Система рассчитает маршрут с учетом расписания движения транспорта, после чего выведет результаты на карту и покажет разницу между ценой всех билетов и расходами на соответствующую автопоездку. Пока новый сервис может быть полезен только жителям американского штата Орегон, но в дальнейшем планируется расширение зоны покрытия до всей территории США и даже, возможно, выход за пределы страны.

 

Google Transit Trip Planner

Google Transit Trip Planner

В ноябре прошлого года также был обновлен сервис Yahoo! Maps. Теперь, просматривая карту той или иной местности, пользователь может получить информацию о ближайшей розничной сети (вплоть до отзывов покупателей). Появилась возможность прокладывать маршрут с использованием трех и более точек. Третьим существенным дополнением к сервису стала опция Live Traffic, позволяющая в реальном времени получать информацию о пробках, дорожных работах и т.п.

Пока картографические возможности Google Maps и Yahoo! Maps рассчитаны в первую очередь на автомобилистов. Все больше городских карт снабжаются названиями улиц, домов и указателями направления автодвижения. Так, после очередного обновления Google Maps в апреле текущего года подробные данные можно получить по большей части о крупных европейских городах. Кроме того, база сервиса наконец пополнилась детальным представлением Москвы, правда указатели местоположения кинотеатров, магазинов и пр. отсутствуют. Но наверняка скорому появлению данной информации будет способствовать новая функция Google, реализованная в августе этого года. Если раньше Google Maps играл преимущественно маркетинговую роль, привлекая пользователей на портал, то теперь он превратился в полноценный рекламный инструмент. При этом речь идет не просто о банальных проплаченных отметках, как в случае с бумажными городскими атласами. Введя запрос по названию какого-либо магазина, пользователь получает вместе с информацией о его местонахождении специальный купон, который можно распечатать и, предъявив при оплате товара в искомом месте, получить скидку. Жаль только, что пока этот сервис доступен лишь американским пользователям.

Как видно, западные поисковые порталы не планируют в краткосрочной перспективе брать Россию в разработку. Это дает шанс заявить о себе отечественным доткомам. Правда, пока данным направлением более или менее активно занимается только «Яндекс». У Rambler тоже есть картографический проект (nakarte.rambler.ru), однако его функциональность не впечатляет. Одно время сервис привлекал возможностью отмечать на городских картах пользовательские точки с описанием, но вскоре аналогичная возможность появилась и у конкурента.

 

«Яндекс.Карты»

«Яндекс.Карты»

В то же время служба «Яндекс.Карты» пополняется новыми возможностями с завидной регулярностью. Существенные улучшения были произведены в декабре прошлого года, когда был запущен сервис поиска по местности «Яндекс.Адреса», который сразу же глубоко интегрировали с картографическим проектом. Пользователи получили возможность искать магазины, гостиницы, предприятия, госструктуры и достопримечательности во всех регионах России, с которыми работает «Яндекс». Естественно, графическая информация о местоположении доступна только для тех городов, чьи карты имеются в базе «Яндекс.Карты», то есть для Москвы, Санкт-Петербурга, Екатеринбурга, Казани, Нижнего Новгорода, Орла, Ростова-на-Дону, Рязани и Тулы. Пока сервис не позволяет прокладывать маршруты, но с учетом активности развития проекта можно предположить, что эта возможность вскоре будет реализована. В конце мая текущего года в «Яндекс.Картах» появилась карта автомобильных пробок для Москвы и ближнего Подмосковья, обновляемая каждые четыре минуты. Исходные данные поступают от столичной ГИБДД, автоматических детекторов транспорта, собственного подразделения компании и call-центра для автолюбителей.

 

Пробки на «Яндексе»

Пробки на «Яндексе»

В конце июня прошлого года Google запустил не имеющий точных аналогов географический проект, который стал популярен как среди специалистов, так и среди обычных пользователей. Речь идет о Google Earth — трехмерной модели Земли, разработанной на базе спутниковых фотографий высокого разрешения из базы все той же Keyhole. Для комфортной работы с сервисом необходим широкополосный канал со скоростью не менее 128 Кбит/с. Если раньше доткомы с опаской запускали массовые службы, требующие быстрого Интернета, то к лету 2005-го стало очевидно, что аудитория широкополосных сетей стала достаточно многочисленной.

Первоначально при создании модели земного шара использовались фотографии двух- и трехлетней давности, а в большом разрешении были представлены только крупнейшие города мира. Однако сервис непрерывно обновляется, и сегодня его возможности уже вызывают серьезную тревогу у спецслужб ряда стран, регулярно требующих от Google снизить разрешение снимков, на которых размещены те или иные стратегические объекты. Сервис требует установки на компьютер небольшого интерфейсного модуля. Существует как бесплатная версия, в которой доступны все базовые функции, так и две модификации с расширенными возможностями. В частности, за отдельную плату можно получить возможность видеозаписи движения по планете и поддержку GPS.

В последней, четвертой по счету версии Google Earth, выпущенной в июне текущего года, появилась поддержка Linux, а сторонним web-разработчикам был сделан подарок в виде обновленного API. Стало возможным размещать на страницах снимки из Google Earth. Главное же новшество — модуль, позволяющий получать трехмерные модели городов, был реализован благодаря приобретению компанией Google фирмы @Last Software, известной основном своим софтом для трехмерного моделирования SketchUp. Ранее компания создала платный модуль к Google Earth, позволяющий демонстрировать трехмерные модели. Несмотря на относительно высокую цену (495 долл.), программа пользовалась большим успехом у архитекторов. Теперь модуль включен в стандартный состав Google Earth 4.0 beta. Задуманный как развлекательный проект, Google Earth, все чаще используется в профессиональных целях. В частности, с помощью сервиса специалисты наблюдают движение льдов и вулканическую активность. Google Earth применялся при мониторинге распространения эпидемии птичьего гриппа.

 

Google Earth

Google Earth

Другие векторы

Хотя новостной и географический поиск являются наиболее популярными сервисами порталов (в последние годы также резко возросла востребованность в поиске видеоконтента, но об этом подробно рассказывается в статье «Онлайн-зрелища» в данном номерене), не считая стандартного поиска в Интернете, разумеется, компании, работающие в данной web-отрасли, попутно развивают ряд других направлений, актуальность которых для пользователей растет с каждым годом. Например, частные онлайн-дневники, поначалу игравшие весьма незначительную роль в информационном пространстве, постепенно стали сопоставимы с интернет-СМИ по значимости и влиянию на общественное мнение. Однако, несмотря на то, что бум блогов начался еще пару лет назад, многие поисковые системы, в том числе довольно крупные, по сей день не поддерживают соответствующую функцию поиска.

Да и Google, которая обычно отличается умением улавливать малейшие проявления потенциального спроса на тот или иной онлайн-сервис, запустила службу Google Blog Search только в сентябре прошлого года. Между тем дотком еще в 2003 году приобрел фирму Pyra с ее блог-хостингом Blogger. Интересно, что в «Яндексе» к бета-тестированию соответствующего сервиса приступили еще в декабре 2004 года, то есть раньше западных коллег. Правда, отечественная служба индексирует только те записи, которые экспортируются в RSS версий 0,9x, 1.0 и 2.0. Google поддерживает еще и формат Atom.

Западные же пользователи, заинтересованные в блогах, используют для поиска специализированные сервисы, например на Blogger или Technorati (www.technorati.com). Для последнего, кстати, в июле текущего года был обновлен интерфейс и произведены изменения в ядре для ускорения обработки запросов. В ближайшем будущем ожидается локализация сервиса, более быстрая индексация, а также формирование подробной статистики по блогам. Кстати, данные от Technorati являются основным источником аналитической информации об изменении размеров и качественного состава мировой блогосферы. Возвращаясь к обновлениям сервиса, можно отметить, что в Technorati появились три навигационные панели: Discover представляет собой тематический каталог блогов, Most Popular — это рейтинг, а с помощью Favourite пользователь может составить собственную подборку блогов, чтобы в дальнейшем искать информацию только в них.

«Яндекс» в марте текущего года также обновил свой сервис, сделав его не только поисковым инструментом, но и своеобразным индикатором общественного мнения Рунета. На главной странице blogs.yandex.ru разместились регулярно обновляемые рейтинги. Первый — «О чем пишут» — представляет собой результат обработки тэгов, то есть тематических меток записей. Другой рейтинг — «Чем интересуются» — состоит из наиболее частых запросов. Следующий — «Где пишут» — практически не изменяется со временем. Постоянный лидер — LiveJournal.com, за которым с большим отрывом следуют LiveInternet.ru и Diary.ru. Также на главной странице можно ознакомиться со списком самых читаемых блоггеров и самых обсуждаемых новостей.

С весны этого года также был улучшен собственно поиск: повысилась релевантность, стали находиться не только записи в блогах, но и другие RSS-потоки, появилась возможность смотреть полный текст записей прямо на «Яндексе» (сохраненная копия). В расширенном поиске добавилась возможность искать раздельно в блогах и форумах, по категориям, а также находить записи по упомянутым в них ссылкам.

Также неизменно растет интерес к «библиотечному» поиску. Первопроходцем в этой сфере традиционно выступила Google. При участии крупных издательств был создан сервис Google Print (ныне Google Book Search), ориентированный на поиск информации в книгах. Первоначально в базе данных службы находились исключительно американские тексты, затем были добавлены литературные фонды 14 стран, в которых английский язык является или основным, или одним из государственных. И наконец, с сентября прошлого года проект вышел на транснациональный уровень. Google приступила к сканированию запасников немецких, французских, испанских, итальянских и нидерландских издательств. С целью защиты авторских прав пользователям разрешают просматривать только около 20% всех страниц книги.

 

Google Book Search

Google Book Search

Стоит отметить, что балансирование на грани соблюдения копирайта — специфика подобных проектов, и Google уже не раз сталкивалась с юридическими трудностями и даже становилась участницей скандалов по этому поводу. Особенно сильно критиковался проект по сканированию изданий из библиотечных фондов США, в рамках которого книги сканировались и без предварительного согласования с издателями. В результате процесс пришлось на некоторое время приостановить, а к ноябрю 2005 года его возобновили, но с учетом претензий правообладателей. Теперь по запросам пользователей будут выводиться не страницы книг, а всего несколько предложений вокруг заданного ключевого слова.

Кроме того, компания Google уже около двух лет предоставляет услуги поиска научной информации в рамках своего сервиса Google Scholar. Служба дает возможность пользователям находить по ключевым словам необходимые статьи, рефераты, технические отчеты, документацию и т.д. В апреле текущего года корпорация обновила интерфейс Google Scholar.

В ноябре прошлого года о начале библиотечного проекта объявила и Microsoft. Компания сообщила о начале сканирования 100 тыс. книг из Британской библиотеки. Приняв во внимание сложности Google, Microsoft намеренно выбрала из архива, насчитывающего более 13 млн книг, только те, срок авторских прав на которые давно истек. Впрочем, об эксклюзивном контенте речь не идет. Британская библиотека разместила оцифрованные материалы и на своем сайте, поиск в архивах которого может быть осуществлен через Google.

 

 

В текущем году конкурирующие компании продолжили наращивание функциональности своих сервисов. В феврале Google объявила о начале размещения в Сети оцифрованных исторических манускриптов. В основе идеи лежит разработанная в Дублинском университете технология обработки цифрового видео с идентификацией значимых объектов, в том числе слов на страницах. Пробные испытания на рукописях Джорджа Вашингтона прошли успешно, и ученые поделились новинкой с Google. Корпорация профинансировала проект и привлекла к дальнейшим исследованиям два американских университета. При этом выяснился интересный факт: чем старше рукопись, тем проще дается ее распознавание. Так, с наименьшими трудозатратами были обработаны манускрипты ирландских монахов, написанные в IX веке.

В апреле Microsoft анонсировала сразу два новых сервиса. Первый — Windows Live Product — аналогичен по функциональности службе Froogle от Google и Yahoo Shopping и позволяет производить поиск товаров по магазинам. Второй же проект — Windows Live Academic — ближе к ранее безальтернативному Google Scholar. Сервис ищет статьи в научной прессе и академических изданиях, заодно сообщая пользователю адреса ближайших библиотек, в которых они хранятся. Windows Live Academic позволяет просматривать короткие выдержки из материалов, защищенных копирайтом, и полные версии, если ограничения отсутствуют или пользователь имеет оплаченную подписку для доступа к соответствующей онлайн-библиотеке. Русскоязычные тексты соответствующего содержания западные доткомы пока не индексируют, однако в Рунете довольно успешно развивается аналогичный проект Scholar.ru. Летом база данных ресурса уже насчитывала более 24 тыс. публикаций.

 

1

Windows Live Academic

Следующим важным аспектом для поисковых порталов остаются загружаемые приложения, так называемые тулбары, то есть инструментальные панели, встраиваемые в браузер, и софт для локального поиска на компьютере. Бум десктоп-поиска пришелся на 2004 год, когда соответствующие программы появились у Google, Yahoo!, MSN и даже Ask (тогда еще Ask Jeeves). С тех пор софт для локального поиска постоянно совершенствуется. Например, в Google Desktop к первоначальной функциональности постепенно добавились возможность поиска страниц в кэше Mozilla, Mozilla Firefox и Netscape, индексация почты в Mozilla Mail, Thunderbird и Netscape 7 Mail, а также нахождение файлов ряда мультимедийных форматов и PDF.

Росту популярности подобного ПО существенно способствует возможность интеграции плагинов от сторонних разработчиков. От корпорации требуется лишь предоставить необходимые средства и документацию. Пользу от внешних программистов первыми осознали в Google. Сначала успехи были скромными: за достаточно длительный период времени появилось всего три плагина для поиска файлов в форматах OpenOffice, StarOffice и CHM. Настоящий бум на сторонние разработки возник после запуска проекта Google Desktop Gadgets.

 

Google Desktop Gadgets

Гаджеты от Google

Множество интерактивных мини-приложений — от игр и медиаплееров до трансляций биржевых сводок и прогноза погоды — полностью изменили пользовательское отношение к Google Desktop. Уже готовые гаджеты можно скачать на desktop.google.com/plugins/sidebar/?hl=ru и добавить на рабочий стол. А можно создать и свой собственный. Конечно, если имеются навыки программирования в Visual Studio .NET, Java, Perl, Python или в любом другом языке, поддерживающем COM и XML.

 

В начало В начало

КомпьютерПресс 10'2006


Наш канал на Youtube

1999 1 2 3 4 5 6 7 8 9 10 11 12
2000 1 2 3 4 5 6 7 8 9 10 11 12
2001 1 2 3 4 5 6 7 8 9 10 11 12
2002 1 2 3 4 5 6 7 8 9 10 11 12
2003 1 2 3 4 5 6 7 8 9 10 11 12
2004 1 2 3 4 5 6 7 8 9 10 11 12
2005 1 2 3 4 5 6 7 8 9 10 11 12
2006 1 2 3 4 5 6 7 8 9 10 11 12
2007 1 2 3 4 5 6 7 8 9 10 11 12
2008 1 2 3 4 5 6 7 8 9 10 11 12
2009 1 2 3 4 5 6 7 8 9 10 11 12
2010 1 2 3 4 5 6 7 8 9 10 11 12
2011 1 2 3 4 5 6 7 8 9 10 11 12
2012 1 2 3 4 5 6 7 8 9 10 11 12
2013 1 2 3 4 5 6 7 8 9 10 11 12
Популярные статьи
КомпьютерПресс использует