Преодолевая языковые барьеры: руководство для домашнего пользователя

Александр Прохоров, Николай Прохоров

Переводчики и словари: конкуренты или коллеги?

Электронные словари на любой вкус и кошелек

   PROMT VER-Dict 2.0

   ABBYY Lingvo 11 «Шесть языков»

   Мультитран v. 3.42

   Контекст 7.0

   Visual Thesaurus

Программы-переводчики

   PROMT Почта

   PROMT Internet 7.0

 

Существует два типа программ, которые призваны облегчить людям общение на разных языках: системы машинного перевода (программы-переводчики) и электронные словари. В чем их преимущества и как правильно выбрать необходимую программу? Об этом и рассказывается в данной статье.

Переводчики и словари: конкуренты или коллеги?

О чем думает пользователь, когда сталкивается с необходимостью перевести е-mail или, например, web-страницу? О том, что ему нужен переводчик. При этом «переводчиком» многие пользователи называют любую компьютерную программу, которая способна хоть что-нибудь переводить, причем не важно — отдельные слова или текст целиком. Поэтому для начала попробуем разобраться в том, какие бывают компьютерные программы для перевода. Как мы уже упоминали, традиционно выделяется два класса программ: электронные словари и системы машинного перевода. Все, кто когда-либо пользовался обычным бумажным словарем, с легкостью освоят и электронный — принцип работы тот же. Преимуществами электронных словарей можно назвать оперативный доступ к переводу слова и возможность объединить в рамках одной программы-оболочки десятки специализированных словарей по различным темам.

При разработке электронного словаря создатели лицензируют контент бумажных словарей или набивают слова и переводы самостоятельно. Поэтому все электронные словари различаются преимущественно по трем параметрам: по объему слов и словосочетаний, качеству словарной базы и удобству интерфейса. Если первый параметр является количественным показателем и легко подсчитывается, то оценить словарь по второму параметру значительно сложнее. Здесь следует принимать во внимание, насколько актуальна словарная база, насколько полно словарь охватывает термины в определенной области (для специализированных словарей) и, наконец, предоставляется ли справочная грамматическая информация. Интерфейс у разных словарей также несколько различается, хотя в целом эти различия несущественны.

С технологической точки зрения электронный словарь сравнительно легко реализуем — основной объем работы заключается в набивке слов и словосочетаний. Возможно, этим и объясняется то, что на рынке представлено большое количество электронных словарей от разных производителей.

Многие словари содержат перевод не только отдельных слов, но и целых словосочетаний. Однако область применения электронного словаря можно обозначить совершенно четко — для справочных целей. Если при чтении текста нам встретилось слово на иностранном языке, мы традиционно обращаемся к словарю. Только теперь нам не нужно копаться в толстых бумажных словарях — перевод в считаные секунды будет найден в электронном словаре.

От электронных словарей перейдем к системам машинного перевода. Годом рождения компьютерных переводчиков можно считать 1954-й, когда фирма IBM в сотрудничестве с Джорджтаунским университетом продемонстрировала в действии первую систему машинного перевода. Она располагала очень скромными возможностями: словарь содержал всего 250 слов и для перевода текста использовалось шесть синтаксических правил. Начавшийся в 90-х годах прошлого века бурный рост компьютерных мощностей стимулировал развитие систем машинного перевода. Сегодня современные системы перевода, пройдя небывалый эволюционный путь, по праву могут быть отнесены к классу систем искусственного интеллекта, поскольку выполняют отдельные функции, свойственные человеческому разуму. Например, программы-переводчики конструируют текст на выходном языке на основе входного текста, руководствуясь правилами и алгоритмами, реализованными в системе.

Можно выделить два основных направления развития технологии машинного перевода: традиционная технология перевода, основанная на алгоритмах анализа и синтеза (rule-based machine translation), и статистический машинный перевод (statistical-based machine translation). При использовании традиционной технологии система перевода может быть схематически представлена как состоящая из двух модулей: из ядра перевода и из системного словаря. Ядро перевода, образно говоря, «думает» — анализирует текст и синтезирует выходной перевод, используя информацию из словаря.

Благодаря этому программа-переводчик может справиться с переводом любого текста при условии, что алгоритмы программы будут «уметь» работать со всеми типами грамматических конструкций, встречающихся в тексте, а словарь системы будет содержать необходимую лексику, причем с теми переводами, которые соответствуют тематике текста. Это означает, что программа будет соответствующим образом настроена на перевод данного текста.

Здесь также напрашивается аналогия с человеком-переводчиком. Как известно, большинство переводчиков имеют определенную специализацию, например технические тексты или финансовая документация. Более того, даже в рамках одной предметной области неизбежно возникает необходимость адаптации к стилю автора, к манере изложения. У человека подобная «настройка» происходит совершенно естественным образом. Для системы машинного перевода в этом случае требуется выполнить комплекс действий, для того чтобы адаптировать ее к текстам определенной тематики и даже к новому авторскому стилю. Таким образом, можно говорить о том, что системы машинного перевода решают проблему перевода на двух уровнях: быстрый перевод без настроек, когда требуется оперативно понять смысл текста, либо проведение настроек и получение на выходе качественного перевода, требующего редактирования не более 10-20% от объема документа.

К представителям традиционной технологии перевода можно отнести такие продукты, как PROMT (Россия), Systran (Франция), Linguatec (Германия) и ряд других.

Системы статистического машинного направления — сравнительно молодая отрасль в области машинного перевода. Основы этой технологии были заложены в начале 1990-х годов. В отличие от традиционной технологии перевода, статистический машинный перевод основан на «параллельных данных». Для функционирования программы требуется массив текстов на исходном языке и его переводов. Анализируя эти тексты на основе определенных правил, программа собирает перевод — как из кубиков. Например, сравниваются две простые фразы на арабском (написано латиницей) — rajl kabir и rajl tawil. Если компьютер «знает», что первая фраза означает «крупный человек», а вторая — «высокий человек», то программа делает вывод, что rajl означает «человек». Подобные простые фразы называются «N-граммы» и являются базовыми элементами статистического машинного перевода.

Несмотря на кажущуюся привлекательность и перспективность этой технологии, разработчики систем статистического перевода столкнулись с целым рядом объективных сложностей. Во-первых, для получения качественного перевода система должна располагать гигантской базой параллельных переводов, по объему эквивалентной тысячам и даже миллионам книг. Создание такой базы само по себе является сложнейшей задачей, требующей огромных ресурсов. Вторым ограничением является мощность компьютеров — для анализа такого колоссального объема текста ресурсов даже самых современных суперкомпьютеров может быть недостаточно.

Даже героическое преодоление этих сложностей не приводит к желаемому результату, а открывает разработчикам проблемы более высокого уровня. Например, для флективных языков, таких как русский, немецкий, арабский (в морфологии которых используются различные способы словоизменения), размер базы должен увеличиваться. Кроме того, система должна учитывать в базе данных различные варианты перевода одной и той же фразы в зависимости от семантических особенностей.

В результате, несмотря на большой интерес к системам статистического перевода и 15-летний опыт разработок, на рынке сегодня практически отсутствуют коммерческие продукты, основанные на этой технологии. В качестве примера можно назвать только разработки Google, но пока они представлены только для перевода с арабского на английский.

Электронные словари на любой вкус и кошелек

На нынешнем рынке электронных словарей представлено сразу несколько достойных продуктов. Почти все они имеют множество полезных функций и настроек, ведь каждый уважающий себя разработчик стремится создать собственный уникальный продукт, превосходящий по возможностям программы-конкуренты.

«Способности» сегодняшних электронных словарей весьма разнообразны, что обеспечивает свободу выбора домашних и корпоративных пользователей. Например, многие программы включают большое количество специализированных словарей по различным тематикам, что позволяет пользователю с легкостью переводить тексты, относящиеся к самым разным предметным областям.

В нашем обзоре рассматриваются пять словарей: ABBYY Lingvo 11 «Шесть языков», PROMT VER-Dict 2.0, «Мультитран v. 3.42», «Контекст 7.0» и толковый словарь Visual Thesaurus. Постараемся выяснить, каковы преимущества каждой из этих программ для домашних пользователей.

PROMT VER-Dict 2.0

Цена:10 долл.

Компания:ПРОМТ

Адрес сайта:www.ver-dict.ru

VER-Dict 2.0 включает более 7 млн. слов и словосочетаний в 120 тематических словарях. В состав продукта входят английские, французские, немецкие, испанские и итальянские словари.

Продукт поставляется в двух вариантах: версия для домашних пользователей комплектуется тремя лицензиями, а корпоративная версия содержит девять лицензий.

VER-Dict позволяет переводить слова не только в интерфейсе программы, но и из любого Windows-приложения. Для этого пользователь должен скопировать слово в буфер обмена (например, используя горячие клавиши Ctrl+C), а затем запустить функцию перевода буфера обмена (рис. 1).

 

Ver-Dict 2.0 выдает все варианты перевода в одном окне

Рис. 1. Ver-Dict 2.0 выдает все варианты перевода в одном окне

Словарь можно также использовать для проверки правописания слов, изучать их грамматику (возможность просмотра полной грамматической и морфологической информации), а также узнать, какие выражения являются разговорными и не употребляются во время деловой беседы. Помимо этого пользователю доступны 120 тематических словарей, при помощи которых можно найти правильный перевод терминов из самых разных областей знаний.

Важное преимущество программы — возможность самостоятельно создавать и редактировать собственные словари пользователя и, что очень удобно, обмениваться такими словарями с другими пользователями.

Отличительная особенность продукта — все слова и их переводы озвучены! Это стало возможно благодаря использованию в VER-Dict 2.0 технологии Microsoft Agent.

Электронный словарь PROMT VER-Dict 2.0 вполне подойдет для использования как дома, так и на работе. Достаточно простой и понятный интерфейс программы, большой набор специализированных словарей и доступная цена создают очень хорошее впечатление о продукте.

ABBYY Lingvo 11 «Шесть языков»

Цена:1140 руб.

Компания:ABBYY

Адрес сайта:www.Lingvo.ru

Версия ABBYY Lingvo 11 «Шесть языков» предлагает перевод с английского, немецкого, французского, итальянского и испанского языков на русский и обратно. Словарный запас словаря впечатляет — 5,5 млн. словарных статей. В состав продукта входит 101 словарь, специализированные и толковые словари, а также словари по общей тематике.

В программе также есть полезный плагин-помощник для тех, кто изучает языки самостоятельно, — Lingvo Tutor. В состав этого приложения входит целый ряд учебных тем, а также предусмотрена возможность составления расписания занятий.

Объективно Lingvo является сегодня одним из самых известных продуктов среди электронных словарей. Основная причина такой популярности — это, прежде всего, «солидный» возраст данного продукта (его разработка началась в 1989 году). В последние несколько лет обновленная версия словаря выходит ежегодно. Однако изменения касаются преимущественно интерфейса продукта: появляются новые опции (например, помощь в изучении языков), добавляются новые словари (рис. 2). К сожалению, контент словарей общей лексики остается практически неизменным. Как известно, любой язык постоянно развивается — появляются новые слова и выражения, а какие-то слова выходят из обихода. Поэтому остается пожелать разработчикам более оперативно обновлять контент продукта.

 

Lingvo открывает перевод в новом окне

Рис. 2. Lingvo открывает перевод в новом окне

Для удобства словарь можно также установить на смартфон/коммуникатор или на карманный компьютер.

Мультитран v. 3.42

Цена:160 долл.

Разработчик:переводчик Андрей Поминов

Адрес сайта:www.multitran.ru

Словарь «Мультитран» представляет собой программу, предназначенную для профессиональных переводчиков и содержащую на данный момент около 6 млн. терминов. «Мультитран v.3.42» осуществляет перевод слов с английского, немецкого, французского, испанского, итальянского и нидерландского языков на русский язык и обратно.

Если многие словари известных производителей страдают от отсутствия обновления словарной базы, то в «Мультитране» эта проблема решена оригинальным образом. Словари постоянно обновляются самими пользователями через онлайн-сервисwww.multitran.ru. При этом процедура настроена так, что позволяет отсылать термины на сайтwww.multitran.ru, а такжеполучать новые словарные статьи, добавленные другими людьми. Предусмотрены режимы автоматического или ручного скачивания новых терминов.

В то же время возможность самостоятельного пополнения словаря была воспринята пользователями неодобрительно. Причина — отсутствие единообразия и возникающий вследствие этого беспорядок. Тем не менее сегодня создатели словаря пока не отказались от такого способа расширения словарного запаса «Мультитрана». Постоянное пополнение лексического запаса словаря, безусловно, позволяет максимально полно представить лексику того или иного языка (рис. 3).

 

«Мультитран» выдает исчерпывающую информацию по каждому слову

Рис. 3. «Мультитран» выдает исчерпывающую информацию по каждому слову

Поиск слова осуществляется по его морфологическим характеристикам или по алфавиту. Если слово является составной частью фразы, то при необходимости перечень словосочетаний можно просмотреть, нажав кнопку «Список фраз». Вместе с тем, любую фразу можно разделить, если требуется получить перевод каждого слова.

Стоит отметить, что с помощью «Мультитрана» можно также осуществлять подстрочный перевод и отключать тематические словари при отсутствии необходимости их использования. «Мультитран v.3.42» можно вызывать из других программ нажатием Ctrl + Ins + Ins.

Словарь может стать незаменимым помощником для профессионального переводчика, в частности для фрилансера, работающего дома. Онлайн-сервис «Мультитран» также, безусловно, полезен для общения переводчиков, поскольку любой посетитель сайта может задать вопрос и получить консультацию по любому интересующему его вопросу.

Контекст 7.0

Цена:145 руб.

Компания:Информатик

Адрес сайта:www.informatic.ru

Для сравнения мы решили оценить возможности не только многоязычных словарей, но и электронного словаря с двумя направлениями перевода: англо-русским и русско-английским. Для примера был взят базовый комплект словаря «Контекст 7.0» российской компании «Информатик», вполне доступный по цене (145 руб.) любому домашнему пользователю.

Объем словаря — более 800 тыс. словарных статей. Функция перевода с помощью «Контекст 7.0» доступна из любого приложения Windows, причем переводить можно слова в любой форме. При вводе слова программа проверяет правильность его написания. Приложение можно вызывать нажатием клавиш Ctrl + C + C или самостоятельно настроить удобную пользователю комбинацию клавиш (рис. 4).

 

Интерфейс Контекста весьма лаконичен

Рис. 4. Интерфейс Контекста весьма лаконичен

Немаловажным преимуществом пакета является то, что пользователь может не только прослушать звучание слова, но и самостоятельно правильно прочитать его, корректно проставив ударение (благодаря опции транскрипции слов, которая имеется далеко не во всех словарях). Однако следует обратить внимание на то, что транскрипция указывается только при вводе английского слова. Если же требуется найти перевод для русскоязычных терминов, то рядом с найденными английскими словами и словосочетаниями транскрипция отсутствует, хотя логичнее было бы ее указывать.

Помимо этого по каждой словарной статье доступны комментарии и примеры употребления нужного слова в различном контексте. Словарь предлагает пользователю достаточно большое количество фраз-примеров с их переводом, что позволяет лучше понять значение искомого слова и при необходимости выбрать наиболее подходящее для конкретного случая словосочетание.

Для удобства пользователя предусмотрен поиск слов двумя способами: либо во всех представленных словарях, либо в отдельно взятом словаре. Для этого необходимо изменить параметры настройки словарей. Кроме того, предусмотрена функция создания и редактирования пользователем собственных словарей. Однако изначально новая словарная статья создается в максимально упрощенном варианте (графы «Слово», «Перевод» и «Толкование») и непонятно, каким образом нужно добавлять другие дополнительные пояснения к словарной статье.

Программа укомплектована тремя специализированными словарями по таким темам, как «Коммерция», «Компьютеры» и «Техника», а кроме того, содержит словарь общей лексики и справочник по английской грамматике.

В целом этот словарь вполне подходит для работы дома (например, для изучения английского языка). Дополнительное обучение не требуется; сразу же после установки словаря можно приступать к работе. Кроме того, приятно оформленный интерфейс также располагает пользователя к работе с этим приложением.

До настоящего момента мы анализировали диапазон возможностей электронных словарей, осуществляющих перевод словарных статей. Однако не стоит обходить стороной компьютерные разработки толковых словарей, один из которых мы отыскали на сайте американской компании Thinkmap. Это словарь Visual Thesaurus, который, несомненно, представляет интерес для многих пользователей и может быть полезен, например, профессиональным переводчикам для повышения уровня владения английским языком, а также тем, кто изучает его самостоятельно.

Visual Thesaurus

Цена:десктоп-версия — 39,95 долл., онлайн-версия — 19,95 долл. в год

Компания:Thinkmap, Inc., США

Адрес сайта:www.visualthesaurus.com

Это визуальный электронный толковый словарь, поясняющий значения англоязычных слов и словосочетаний. Сервис не только отображает толкования слов, но и рисует ассоциативный граф слова — своеобразную карту, где в центре находится само определяемое слово, а к нему лучиками привязаны слова, возникающие по ассоциации. Например, для слова success (успех) у системы возникают ассоциации со словами winner (победитель), prosperity (процветание), attainment (достижение цели) и т.д. Это позволяет использовать данный словарь в учебных целях и более четко понимать значения иностранных слов. Любое слово также озвучено и даже предлагается на выбор произношение с британским или американским акцентом (рис. 5).

 

Ассоциативный граф — удобное средство изучения языка

Рис. 5. Ассоциативный граф — удобное средство изучения языка

Тезаурус реализован в двух версиях: desktop и online. Для того чтобы пользоваться онлайн-версией словаря, необходим постоянный доступ в Интернет (соблюдение этого условия не требуется при покупке настольной версии продукта). В то же время пользователь Интернет-словаря получает доступ к так называемой интернациональной версии словаря. С ее помощью можно открывать словарные статьи на датском, французском, немецком, итальянском и испанском языках и просматривать их значения на английском языке.

Особо следует отметить опцию «Интерактивный тур по продукту» (Interactive Product Tour). При выборе этой услуги на сайте словаря появляется окно, где пошагово демонстрируются все возможности системы с иллюстрацией функций на конкретных примерах. Кроме того, «путеводитель» расставляет акценты на те полезные опции программы, которые пользователь может сразу не заметить, но обязательно должен знать. Знакомство с этими пояснениями позволит в дальнейшем более уверенно работать с программой, а в случае, если запомнить все возможности словаря с первого раза не удалось, можно «путешествовать по продукту» снова и снова.

После завершения тура по продукту программа предлагает запустить trial-версию словаря, чтобы испытать ее возможности. Пользователя сразу предупреждают, что он имеет право на ограниченное количество запросов. В действительности число запросов исчерпывается вводом всего одного слова — уже после запроса по следующей словарной статье появляется сообщение о том, что количество ввода и поиска слов, предложенное этой версией, исчерпано, и сервис предлагает приобрести программу.

Программы-переводчики

В предыдущих номерах журнала мы уже обозревали существующие сегодня на рынке системы машинного перевода (см., например, «Соревнование электронных переводчиков: кто сильнее?», КомпьютерПресс № 12’2005). Лидером нашего тестирования тогда стала система перевода PROMT Professional 7.0 российской компании ПРОМТ. Однако этот продукт ориентирован на бизнес-пользователей и предлагает много функций, которые домашнему пользователю попросту не нужны (например, пакетный перевод файлов или перевод XML-документов). Здесь надо отметить, что PROMT Professional 7.0 (стоимость 300 долл.) — далеко не самый продвинутый продукт в линейке PROMT 7.0. Для профессиональных переводчиков компания предлагает систему PROMT Expert 7.0 стоимостью 600 долл. В политике формирования цены на продукты у компании ПРОМТ прослеживается четкая аналогия с производителями профессионального инструмента: дрель для домашних нужд стоит в несколько раз дешевле, чем профессиональная. Аналогичным образом, дороже всего стоят профессиональные системы перевода, ориентированные на профессиональных переводчиков и офисных работников.

Для домашнего пользователя компания ПРОМТ предлагает отдельную линейку продуктов. Рассмотрим эти продукты более подробно.

PROMT Почта

Цена:990 руб. (англо-русско-английский)

Адрес сайта:www.e-promt.ru

Это новый продукт, который выпущен компанией ПРОМТ в июле 2006 года. У продукта говорящее название — ключевым элементом является здесь плагин для почтового клиента Microsoft Outlook. Система встраивает в Outlook специальную панель с кнопками, которые обеспечивают доступ к функциям перевода (рис. 6). Переводить можно не только входящую, но и исходящую корреспонденцию. Для тех, кто подписан на рассылки новостей с западных сайтов, безусловно полезна будет функция автоматического перевода писем, приходящих с определенного адреса. Программа позволяет создавать правила для автоматизации перевода подобных писем. В таком правиле указываются направления перевода и список подключаемых словарей, а также задается папка, в которую система будет помещать переведенные письма.

 

Переводчик позволяет переводить письма по щелчку мыши

Рис. 6. Переводчик позволяет переводить письма по щелчку мыши

Однако надо отметить, что многие домашние пользователи пользуются различными системами web-почты. Для них в продукте предусмотрен модуль перевода буфера обмена. Достаточно скопировать текст в окне Internet Explorer или FireFox и активизировать переводчик буфера обмена. Для экономии времени можно даже установить режим автоматического перевода содержания буфера обмена. Эта функция позволяет также переводить из любого другого приложения Windows.

Не менее полезная функция этого продукта — перевод сообщений ICQ. «Аська» настолько популярна у пользователей Рунета, что нет необходимости представлять этот Интернет-пейджер. С помощью «PROMT Почта» можно мгновенно переводить сообщения с одного языка на другой. Выбор направления перевода и запуск самого процесса вызываются комбинацией горячих клавиш, которые можно настроить. Текст перевода замещает исходный текст в окне ICQ или отображается в отдельном окне. Поддерживаются версии ICQ PRO 2003 и ICQ 5 (рис. 7).

 

Общайтесь со всем миром без языковых барьеров: теперь переводчик есть и в «аське»

Рис. 7. Общайтесь со всем миром без языковых барьеров: теперь переводчик есть и в «аське»

PROMT Internet 7.0

Сайт:www.e-promt.ru

Цена:990 руб. (англо-русско-английский)

1400 руб. (Гигант, 9 направлений перевода)

Назначение этого продукта очевидно из его названия — это Интернет-переводчик. Доля Рунета в масштабах мирового Интернета пока сравнительно мала, поэтому многие пользователи обращаются за новостями, обзорами и другой свежей информацией к западным сайтам. Однако это привилегия тех, кто знает иностранные языки. PROMT Internet 7.0 открывает доступ к зарубежным сайтам для всех желающих. Система встраивается в браузер Microsoft Internet Explorer в виде плагина. Пользователь может обращаться к переводчику посредством кнопочной панели или через контекстное меню. Можно переводить web-страницы целиком или только выделенные предложения и параграфы. Особенно приятно, что программа полностью сохраняет оригинальное форматирование. Переводится все текстовое содержимое web-страницы, включая гиперссылки и текстовые заменители картинок (это актуально для тех, у кого отключен режим отображения графических объектов).

 

Перевод web-страницы: текст переведен, а форматирование полностью сохранилось

Рис. 8. Перевод web-страницы: текст переведен, а форматирование полностью сохранилось

Как показывает опыт, в большинстве случаев система выдает не только быстрый (это больше зависит от скорости соединения с провайдером), но и вполне понятный результат перевода. Тем не менее разработчики рекомендуют использовать ряд настроек, чтобы полученный перевод не вызывал улыбку, например резервировать имена собственные или подключать специализированные словари в соответствии с тематикой сайта.

Программа также помогает проводить поиск в зарубежном Интернете. С помощью специальной функции «Поиск в web» можно автоматически перевести запрос с русского языка на иностранный, а затем отправить на выбранный поисковый сайт.

 

В начало В начало

КомпьютерПресс 8'2006

1999 1 2 3 4 5 6 7 8 9 10 11 12
2000 1 2 3 4 5 6 7 8 9 10 11 12
2001 1 2 3 4 5 6 7 8 9 10 11 12
2002 1 2 3 4 5 6 7 8 9 10 11 12
2003 1 2 3 4 5 6 7 8 9 10 11 12
2004 1 2 3 4 5 6 7 8 9 10 11 12
2005 1 2 3 4 5 6 7 8 9 10 11 12
2006 1 2 3 4 5 6 7 8 9 10 11 12
2007 1 2 3 4 5 6 7 8 9 10 11 12
2008 1 2 3 4 5 6 7 8 9 10 11 12
2009 1 2 3 4 5 6 7 8 9 10 11 12
2010 1 2 3 4 5 6 7 8 9 10 11 12
2011 1 2 3 4 5 6 7 8 9 10 11 12
2012 1 2 3 4 5 6 7 8 9 10 11 12
2013 1 2 3 4 5 6 7 8 9 10 11 12
Популярные статьи
КомпьютерПресс использует