Где и кем создаются новые технологии

Наталия Елманова

Мы уделяем внимание исследованиям более чем когда бы то ни было.
Мы создаем технологии, которые позволят компьютерам видеть,
слышать, говорить и обучаться,
так что люди смогут общаться с ними так же естественно,
как и с другими людьми.

Билл Гейтс, председатель правления и главный архитектор программного обеспечения Microsoft

Microsoft Research вчера и сегодня

   Microsoft Research и Windows XP

   Microsoft Research, Tablet PC и Microsoft .Net

Как рождаются технологии будущего

   Обучение компьютеров (Machine learning)

   Генерация и распознавание речи

   Новые средства коммуникаций и доступность пользователей

   Создание эффекта присутствия (Telepresence)

   Терабайтные компьютеры и проект TerraServer

Заключение

 

Данная статья посвящена деятельности Microsoft Research — научно-исследовательского подразделения Microsoft, основанного чуть более десяти лет назад и ныне являющегося одним из самых авторитетных в мире исследовательских центров в области создания программного обеспечения. Будучи, возможно, не таким заметным, как другие подразделения этой компании, оно, тем не менее, в течение этого десятилетия определяло многое в развитии информационных технологий, и вовсе не только технологий Microsoft.

В этой статье мы поговорим о том, что из разработок Microsoft Research используется в текущих версиях продуктов этой компании, а также о том, чем сейчас занимаются в этом подразделении — ведь результаты этой работы мы сможем увидеть воплощенными в готовых продуктах в течение ближайших лет.

Microsoft Research вчера и сегодня

Microsoft Research и Windows XP

В течение десяти лет Microsoft Research разрабатывает и совершенствует технологии, применяемые во всех продуктах Microsoft. Исследовательские проекты этого подразделения включают разработку новых способов взаимодействия пользователя с компьютерами, усовершенствование языков программирования и средств разработки, применение сложного математического аппарата для решения еще не решенных вычислительных задач, и цель этих проектов — повысить эффективность работы пользователей, разработчиков и предприятий.

Ниже перечислены некоторые технологии, появившиеся или полностью разработанные в Microsoft Research и включенные в новую операционную систему Microsoft — Windows XP.

  • Изменения, внесенные в Windows Media Player for Windows, в частности усовершенствование работы кодеков, улучшение качества звука и изображения, а также средства извлечения ключевых кадров, применяемые для быстрого просмотра видеоданных.
  • Изменения, внесенные в Windows Messenger, в частности средства подавления шума и эха при обработке звука, полученного с помощью микрофона, позволившие реализовать в видеоконференциях качественную обработку одновременного разговора нескольких участников, а также использовать для воспроизведения звука почти любую звуковую карту.
  • Технология ClearType, позволяющая осуществить отображение текста на мониторах с более высоким качеством за счет субпиксельного рендеринга.
  • Средства ввода двухбайтовых символов, позволяющие вводить иероглифы и легко переключаться на ввод английского текста (разработаны китайским подразделением Microsoft Research).
  • Search Companion, позволяющий облегчить поиск файлов, папок, людей, компьютеров внутри локальной сети и Интернета. Эта технология в настоящее время включает, в частности, возможность распознавания приложениями обычных фраз.
  • Криптографическая библиотека, содержащая алгоритмы, являющиеся основой протоколов, используемых для защиты данных, аутентификации, осуществления защищенных транзакций.
  • Средства оптимизации и повышения производительности, в частности средства сокращения времени загрузки Windows XP и снижения требований к ресурсам.
  • Инструментарий для разработки операционных систем, в частности инструменты для обнаружения дефектов создаваемых продуктов и повышения производительности труда разработчиков. Эти инструменты были использованы при разработке Windows XP.
  • Технологии, поддерживающие Internet Protocol version 6 (IPv6) и позволившие осуществить, например, применение Интернета в мобильных устройствах и решить проблемы автоматической конфигурации, расширяемости и безопасной передачи данных.

Иными словами, то, что уже стало нам привычно как пользователям, во многом есть результат работы Microsoft Research. Но наш рассказ об этом подразделении был бы неполным, если бы мы остановились только на готовых технологиях, являющихся составной частью уже выпущенных коммерческих продуктов. Более интересным, на наш взгляд, представляется то, что сейчас доступно в виде бета-версий и что мы увидим реализованным в готовых продуктах в 2002 году.

В начало В начало

Microsoft Research, Tablet PC и Microsoft .Net

Многие пользователи ожидают от компьютеров завтрашнего дня более удобного пользовательского интерфейса, позволяющего обращаться к ресурсам самого компьютера, локальной сети и Интернета, составлять расписания, просматривать и анализировать данные, отправлять сообщения друг другу с помощью более естественных методов общения, нежели печать текста. Согласно предсказаниям аналитиков Microsoft, большинство пользователей предпочитают взаимодействовать с компьютерами посредством речи, рукописного текста или нажатия на определенные места экрана. Помимо этого сегодня многие пользователи хотят иметь доступ к персональной и бизнес-информации из любой точки и с помощью любых устройств, в том числе карманных компьютеров и мобильных телефонов.

Отметим, что многие из перечисленных технологий, в частности беспроводной доступ в Интернет и поддержка распознавания рукописного текста и нарисованных от руки схем, уже реализованы в Windows XP и будут доступны пользователям TabletPC — полнофункциональных персональных компьютеров, позволяющих выполнять все приложения для этой операционной системы и поддерживающих ввод с помощью пера и чувствительного экрана (выпуск подобных устройств и соответствующей версии Windows XP ожидается летом этого года).

Одной из самых амбициозных глав в истории Microsoft является создание платформы Microsoft .NET, анонсированной летом 2000 года. Microsoft .NET — это платформа, которая не только позволяет создавать клиентские, серверные и сервисные решения мирового класса, но и дает возможность таким решениям работать вместе, а также с другими существующими решениями, сохраняя инвестиции в них. Она позволяет легко и эффективно решить проблемы интеграции различных решений, устройств и служб с помощью XML Web-сервисов. Многие составные части Microsoft .NET явились результатами разработок Microsoft Research в области сетевых технологий, языков программирования, средств разработки, управления данными, пользовательских интерфейсов, и многие из подобных проектов ведутся в настоящее время.

То, о чем говорилось выше, уже можно увидеть реализованным в виде готовых продуктов либо в виде предварительных версий, выпуск которых ожидается в ближайшее время. А теперь заглянем на несколько лет вперед...

В начало В начало

Как рождаются технологии будущего

По словам Ричарда Рашида, главы подразделения Microsoft Research, технологии XXI века предназначены для преодоления разнообразных барьеров: между людьми (средства коммуникаций), между компьютерами (высокоскоростные средства передачи данных), между людьми и компьютерами (новые средства пользовательского интерфейса, средства распознавания изображения и речи), между людьми и информацией (средства хранения и обработки данных, средства Data Mining), между домом, работой и другими местами пребывания людей (мобильные устройства и средства беспроводной связи) и др.

Что касается средств преодоления всех этих барьеров, то вполне очевидно, что приоритетными направлениями развития пользовательских интерфейсов являются распознавание рукописного текста, генерация и распознавание речи, «компьютерное зрение» (способность распознавания и анализа изображений), а также обработка и распознавание фраз на естественном языке. Остановимся на этом чуть более подробно.

В начало В начало

Обучение компьютеров (Machine learning)

Цель этого исследования — научить компьютеры понимать пользователей и поставленные ими задачи и наилучшим образом управлять доступными ресурсами для их решения. Работа в этом направлении ведется уже давно, и ее результаты успешно применяются в средствах проверки орфографии Microsoft Office. Отметим, что алгоритм распознавания фраз на естественном языке предполагает наличие огромной языковой базы знаний, генерируемой автоматически на основе словарей и содержащей не только слова, но и связи между ними. Сегодня к подобной базе знаний добавляются и энциклопедические статьи.

В настоящее время в Microsoft Research ведется работа по созданию приложений, «понимающих» заданные пользователями вопросы и находящих ответы на основе анализа индексов поисковых систем Интернета. На прошедшей в конце октября прошлого года в Лос-Анджелесе конференции Microsoft Professional Developers Conference (PDC) 2001 было продемонстрировано приложение, позволяющее ввести на английском языке вопрос типа «какого цвета трава?» или «где сейчас находится Бен Ладен?» и получить ответ типа «с вероятностью 30% — зеленая, с вероятностью 7% — красная» (либо «с вероятностью 40% — в Афганистане») и список ссылок на наиболее посещаемые Web-страницы, посвященные этой проблеме. Очевидно, в ближайшие несколько лет следует ожидать появления подобных возможностей в коммерческих продуктах.

В начало В начало

Генерация и распознавание речи

Цель этого исследования — разработка средств анализа, понимания и синтеза речи, позволяющих пользователям общаться с компьютером на естественном языке. Отметим, что средства распознавания английской речи уже входят в состав Windows XP, а над созданием средств синтеза речи, не отличимой от человеческой, в настоящее время ведется интенсивная работа. Похоже, уже недалек тот день, когда мы сможем посредством речи задавать компьютеру вопросы, подобные описанным в предыдущем разделе, и получать ответы на естественном языке, подобно героям недавно показанного по нашему телевидению телесериала «StarTrek»...

В начало В начало

Новые средства коммуникаций и доступность пользователей

Цель проектов в этой области — создание новых средств взаимодействия между пользователями, упрощающих их повседневную деятельность. Из проектов, близких к коммерческой реализации, можно отметить технологию Slideshow, позволяющую пользователям координировать действия между собой и быть в курсе важнейших событий.

«Слайды» в «слайд-шоу» представляют собой уведомления о различных событиях и состояниях различных процессов, например о том, что такой-то сотрудник находится в офисе, а такой-то — отсутствует, на приглашение на вечеринку в данный момент откликнулось пять человек, а в почтовом ящике появилось два новых сообщения.

Доступность коллег и подчиненных в любом месте и в любое время является вечной проблемой, отнюдь не полностью решенной с появлением и повсеместным распространением мобильной связи.

Одно из направлений исследований в этой области, близких к коммерческой реализации, — создание автоматических средств слежения за присутствием сотрудников в офисе (рабочее название этого средства — Seer, то есть предсказатель), предназначенных для определения, присутствует ли пользователь на рабочем месте и чем он занят — разговором по телефону, беседой с другим сотрудником и т.д.

Для распознавания поведения сотрудника в офисе используются данные анализа звука и изображения (прообраз «компьютерного зрения»), а также данные, получаемые из самых разнообразных источников, включая мобильные устройства, с помощью Notification Platform — набора специальных средств получения уведомлений от различных устройств и служб (архитектурные решения, положенные в основу нотификационного механизма, являются частью платформы Microsoft .Net).

Отметим, что данный проект включает и создание средств прогнозирования местонахождения пользователя в ближайшем будущем на основании имеющихся прежних данных о его расписании, продолжительности отсутствия, времени суток.

В начало В начало

Создание эффекта присутствия (Telepresence)

Цель этого исследования — создать у пользователей ощущение, что они присутствуют на каком-либо мероприятии, даже если физически они находятся в другом месте, с использованием средств цифровой обработки видеоизображений и звука, а также средств анимации.

Из проектов, близких к коммерческой реализации, можно отметить технологию I-Cam, упрощающую организацию виртуальных совещаний. На конференции Microsoft PDC-2001 была продемонстрирована разработанная в Microsoft Research камера кругового обзора, позволяющая следить одновременно за несколькими участниками, реагируя на их движения и речь.

Слежение осуществляется благодаря специально разработанному для этой цели программному обеспечению, реализующему правила, используемые профессиональными кино- и телеоператорами.

Как показали испытания этого устройства, в большинстве случаев зрители не смогли определить, когда камера управлялась оператором, а когда — работала автоматически. Отметим, что это устройство относится к классу недорогих — предполагается, что его стоимость составит порядка 300 долл.

В начало В начало

Терабайтные компьютеры и проект TerraServer

Согласно предсказаниям аналитиков, к 2004-2005 году персональные компьютеры смогут хранить терабайты информации. Реально это означает, что на своих компьютерах мы сможем хранить свои личные данные, накапливаемые в течение всей жизни: и личную переписку, и фотографии, и видеозаписи, и сведения о своем бизнесе. И в этом случае возникают новые технические проблемы — как администрировать такие огромные базы данных, как искать в них нужные сведения и как осуществлять такой поиск за приемлемое время. Именно поэтому в Microsoft Research сейчас ведется работа над проектами, посвященными созданию операционных систем и компонентов, позволяющих работать с большими объемами данных. Эти проекты включают разработку средств поиска данных и поиска закономерностей (Data Mining), а также средств управления данными, таких как средства автоматической настройки и самоадминистрирования.

Говоря о проектах, связанных с хранением и применением больших объемов данных, реализация которых ведется в настоящее время, следует отметить проект TerraServer. Цель этого проекта — создать всеобъемлющую базу данных, содержащую подробное изображение всей поверхности земного шара (данные аэрофотосъемки, снимки, сделанные с космических аппаратов, и пр.).

В настоящее время данные (пока неполные) об изображениях земного шара хранятся в SQL Server 2000 под управлением Windows 2000 Datacenter Server на кластере из четырех серверов Compaq ProLiant 8500; общий объем данных составляет 6 Тбайт.

Несмотря на то что указанные данные пока не отличаются полнотой (в настоящее время там представлены сведения, относящиеся в основном к США), этот сайт уже весьма популярен — его ежедневный трафик составляет 59 Гбайт. Отметим, что этот сервер в ближайшее время можно будет использовать и в качестве поставщика Web-сервисов (сейчас они доступны для бета-тестирования), что позволит использовать его функциональность в коммерческих Web-приложениях.

Мы рассмотрели некоторые из направлений исследований Microsoft Research. О многих других проектах данного подразделения можно узнать по адресу http://research. microsoft.com.

В начало В начало

Заключение

В настоящей статье мы обсудили деятельность Microsoft Research — подразделения Microsoft, отвечающего за разработку новых технологий. Многое из того, о чем здесь упоминалось, уже нашло свое отражение в продуктах Microsoft либо будет реализовано в ближайшем будущем. И вскоре мы получим возможность общаться с компьютерами с помощью речи, получать ответы на сложные вопросы, находить любые сведения, которые нам нужны, где бы мы ни находились, получать их в виде, удобном и естественном для восприятия, и общаться «живьем» с друзьями и коллегами, не покидая собственного дома или, наоборот, находясь на другом континенте.

КомпьютерПресс 1'2002

1999 1 2 3 4 5 6 7 8 9 10 11 12
2000 1 2 3 4 5 6 7 8 9 10 11 12
2001 1 2 3 4 5 6 7 8 9 10 11 12
2002 1 2 3 4 5 6 7 8 9 10 11 12
2003 1 2 3 4 5 6 7 8 9 10 11 12
2004 1 2 3 4 5 6 7 8 9 10 11 12
2005 1 2 3 4 5 6 7 8 9 10 11 12
2006 1 2 3 4 5 6 7 8 9 10 11 12
2007 1 2 3 4 5 6 7 8 9 10 11 12
2008 1 2 3 4 5 6 7 8 9 10 11 12
2009 1 2 3 4 5 6 7 8 9 10 11 12
2010 1 2 3 4 5 6 7 8 9 10 11 12
2011 1 2 3 4 5 6 7 8 9 10 11 12
2012 1 2 3 4 5 6 7 8 9 10 11 12
2013 1 2 3 4 5 6 7 8 9 10 11 12
Популярные статьи
КомпьютерПресс использует