Компьютерные словари и переводчики
Домашний переводчик «Друзья Goo-Ru»
Большой электронный словарь VER-Dict
Серия переводчиков X-Translator Platinum
Развитие Интернета привело к небывалому росту интереса к машинному переводу, поскольку никогда прежде машинный перевод не был необходим столь широкому кругу пользователей. Доступность материалов перестала сдерживаться географическими рамками: вызвать на экран документ с японского или китайского сайта сегодня так же легко, как и с русского. Однако для большинства пользователей без машинного переводчика невозможно даже понять, о чем идет речь в этом документе.
адачи машинного перевода только на первый взгляд кажутся поддающимися простой формализации. Очевидно, что замена слов в предложении на слова перевода не слишком приближает к цели. Системы машинного перевода постоянно развиваются, и на их совершенствование уходят огромные деньги: только за 15 лет (1978-1993) в США на исследования в области машинного перевода (МП) истрачено 20 млн., а в Европе — 70 млн. долл.
Отношение к машинному переводу в обществе неоднозначно. Человек-переводчик часто мыслит в категориях соревнования с компьютером-переводчиком вместо того, чтобы искать в нем помощника. Сегодня стало очевидно, что перевод, выполненный человеком, еще не может быть подвергнут формализации при существующем уровне развития техники, поэтому решение задачи оптимизации перевода лежит в области интеграции возможностей человека и компьютера.
В 1990 году Ларри Чаилдс, специалист по машинному переводу, предложил следующую классификацию МП-систем:
• FAMT (Fully-automated machine translation) — полностью автоматизированный машинный перевод;
• HAMT (Human-assisted machine translation) — машинный перевод при участии человека;
• MAHT (Machine-assisted human translation) — перевод, осуществляемый человеком с использованием компьютера.
В последнее время на смену прежней концепции, связанной с эйфорией от первых результатов, — «качественный машинный перевод», пришла новая — «качественный черновой машинный перевод», что подразумевает интеграцию машинного и человеческого интеллекта и контроль со стороны человека. Таким образом, современное понимание сути МП — это «не МП против переводчиков», а «МП против отсутствия переводов», при всё возрастающей потребности в последних.
Роль машинного перевода особенно велика при анализе Web-ресурсов. Во многих случаях даже не очень качественный перевод может послужить основой при принятии решения во время сортировки Web-ресурсов с целью отбора страниц для более качественного перевода. Принять подобное решение при поиске в многоязычной Web-среде без наличия программ переводчиков очень сложно, и в этих случаях системы МП подтверждают свою безусловную необходимость.
Даже если вы хорошо знаете язык, с которого переводите, и не пользуетесь системами машинного перевода, то обойтись без компьютерного словаря вам вряд ли удастся. Возможности современных ПК по быстрому поиску и хранению огромных словарных баз данных позволяют на порядок ускорить поиск незнакомых слов по сравнению с использованием обычных словарей.
Рассматривая тему компьютерных словарей переводчиков, следует отметить, что отечественными программистами и лингвистами созданы продукты мирового уровня, известные не только в России, но и за рубежом.
Переводчики и словари ПРОМТ
омпания ПРОМТ лидер в разработке систем автоматического перевода предлагает широкий спектр продуктов для разных языковых пар.
Прежде всего, следует сказать, что сервисы PROMT доступны в онлайне по адресу www.translate.ru, где можно бесплатно (не учитывая оплату Интернет-доступа) получить доступ к онлайновым переводчикам и словарям.
Для тех, кого не устраивает Интернет-версия услуг, компания ПРОМТ предлагает широкий набор автономных продуктов, который может удовлетворить потребности разных категорий пользователей. Дать описание всех версий в рамках одной статьи не представляется возможным, однако, учитывая, что в основе всех продуктов ПРОМТ лежит единое переводческое ядро (система анализа входного текста и синтеза связного перевода на выходе), а также реализованы общие принципы автоматизации перевода, мы дадим читателям общие сведения о продуктовой линейке компании и об основных принципах работы с продуктами на примере программы PROMT XT Office. Полную информацию обо всех продуктах ПРОМТ можно найти на сайте компании по адресу: www.promt.ru.
Цены на продукты ПРОМТ:
• PROMT Internet XT Premium. Английский, немецкий, французский, итальянский, испанский, русский языки, полный пакет — 49 долл.
• PROMT XT Standard. Немецкий и русский языки, полный пакет — 99 долл.
• PROMT XT Standard. Французский и русский языки, полный пакет — 99 долл.
• PROMT XT Standard. Английский и русский языки, полный пакет — 99 долл.
• ПРОМТ «Коллекции специализированных словарей. Тяжелая промышленность». Полный пакет —180 долл.
• PROMT XT Standard. Английский, русский, немецкий, французский, русский языки, полный пакет — 149 долл.
• PROMT XT Office. Итальянский и русский языки, полный пакет — 300 долл.
• PROMT XT Office. Английский и русский языки, полный пакет — 300 долл.
• PROMT XT Office Гигант. Английский, немецкий, французский, русский языки, полный пакет — 450 долл.
PROMT XT Office
PROMT XT Office это профессиональное решение, которое позволяет осуществлять перевод текстовых документов и электронной почты, а также онлайн-перевод Web-сайтов с сохранением форматирования.
Базовой программой пакета является лингвистический редактор PROMT, который позволяет переводить документы, проводить настройку на тематику документа и предоставляет широкие возможности редактирования текста. Программа обеспечивает быстрый перевод (1-2 стр./с), поддерживая практически все текстовые форматы (Word 6.0/97/2000/XP, RTF, HTML, TXT). Отдельно хотелось бы отметить перевод PDF-документов с помощью PROMT XT Office: в версии PROMT XT Office возможен перевод документов в формате PDF. Программа встраивает функции перевода в приложения Word, Excel, FrontPage, PowerPoint и Outlook. Поддерживаются версии Microsoft Office 2000/XP, 2003.
Переводчик можно использовать в двух режимах: без настроек для оперативного чернового перевода (с помощью базового словаря), а также с использованием дополнительной настройки (с подключением тематических словарей) с целью получения более качественного перевода.
ПРОМТ предлагает более 100 специализированных словарей для более точного перевода, однако даже большое количество таких словарей не может заменить пользовательского словаря. PROMT XT Office использует программу «Редактор словарей», позволяющую просматривать содержание пользовательских словарей и редактировать их.
Уникальной технологией, реализованной в PROMT XT Office, является использование механизма ассоциированной памяти (АП). Дело в том, что многие документы содержат часто встречающиеся одинаковые обороты и даже фрагменты текста, которые логично переводить единожды и впоследствии использовать готовый перевод. В базе переводов АП сохраняются сегменты оригинального и переведенного текстов, которые используются впоследствии при необходимости перевода аналогичного фрагмента текста. Это обеспечивает возможности обучения системы и сохранения результатов работы пользователя для последующего применения.
Полезной функцией является способность программы выключать из процесса перевода (резервировать) имена собственные с возможностью их транслитерации. Так, если вы переводите текст, в котором речь идет о часах фирмы «Слава», то вам необходим перевод в виде «Slava», а не «Glory» и т.п.
Еще один способ настройки заключается в выборе лингвистических алгоритмов. Для каждого направления перевода существует свой список алгоритмов, которые может настроить пользователь. Например, для англо-русского направления перевода можно выбрать, как будет переводиться местоимение «you» — «Вы», «вы» или «ты».
Настройки системы перевода можно сохранить в шаблоне тематики, чтобы в дальнейшем использовать его для перевода других документов.
Тематика документа включает упорядоченные списки подключенных словарей, зарезервированных слов и дополнительных настроек. Тематика — это совокупность пользовательских настроек исходно поставляемых шаблонов. Например, вы переводите текст и вводите ряд настроек: подключаете специализированные словари, расставляете их в нужном порядке, создаете и подключаете собственные словари, создаете список зарезервированных слов и т.д., а затем все проведенные настройки (которые вы подключали или изменяли) можно сохранить для дальнейшего использования. В следующий раз при переводе текстов по данной теме вы сможете использовать уже готовые настройки, подключив соответствующую тематику. На основании одного шаблона можно создать любое количество тематик, наследующих все компоненты шаблона. Тематики могут модифицироваться в процессе работы и в конечном счете существенно отличаться от породившего их шаблона.
В системе PROMT XT Office используется автоматическое и полуавтоматическое определение шаблона тематики. По умолчанию включен режим автоматического выбора шаблона тематики, при котором проводится сравнение текста документа со специальными выборками из словарной базы специализированных словарей и выбирается подходящий шаблон для перевода. Полуавтоматический режим дает пользователю возможность самостоятельно создавать и редактировать список ключевых слов.
Средство встраивания сценариев в программу PROMT предоставляет пользователям возможность подключать к процессу перевода макросы для анализа и модификации исходного текста до перевода, а также для переведенного текста. Макросы могут быть написаны на любом из скриптовых языков, поддерживаемых операционной системой. Вместе с системой PROMT XT Office устанавливается несколько примеров макросов, с помощью которых можно автоматизировать такие операции, как выделение искомого слова по всему тексту, обработка разреженного текста перед переводом, резервирование слов, начинающихся с заглавной буквы, и т.д. На основе этих примеров и специального файла справки с описанием объектной модели лингвистического редактора пользователь может создавать собственные макросы для выполнения специфических задач. С целью облегчения доступа к функциям перевода PROMT XT Office встраивает эти функции во все приложения MS Office 2000/XP/2003. После инсталляции PROMT XT Office в текстовом редакторе MS Word появляются дополнительная панель инструментов и пункт в верхнем меню, позволяющие обращаться к функциям перевода и настраивать систему перевода, не покидая окна редактора. Благодаря этому пользователь получает возможность работать с текстами и сразу же их переводить. Можно поместить перевод в новый документ или заменить исходный текст. Программа также позволяет осуществлять автоматический перевод электронной почты в Microsoft Outlook. PROMT XT Office обеспечивает перевод при работе в Интернете: онлайн-перевод Web-сайтов с сохранением форматирования производит перевод запросов для поисковых систем и отправку на указанный сервер и ряд других функций.
Домашний переводчик «Друзья Goo-Ru»
Не обошла вниманием компания ПРОМТ и аудиторию младшего возраста, которым адресован домашний переводчик «Друзья Goo-Ru» (9 долл.) — уникальный обучающий и развлекательный продукт для детей. В основе этой программы лежит мощное переводческое ядро, а также реализована технология «Виртуальные друзья», которая помогает школьникам превратить процессы изучения языков и подготовки домашних заданий в увлекательную игру.
Программа выполняет целый ряд полезных функций:
• помогает ребенку выполнять домашние задания по английскому и немецкому языкам;
• в веселой и непринужденной форме позволяет закрепить полученные знания с помощью упражнений и экзаменов;
• развлекает и занимает ребенка с помощью забавных советов, интересных викторин и веселых игр;
• позволяет общаться со всем миром, предоставляя возможности автоматического перевода текстов и писем с английского и немецкого языков на русский и обратно.
Отдельно стоит отметить возможность обновления программы: на сайте «Друзей Goo-Ru» (goo-ru.promt.ru) регулярно появляются новые упражнения («Глагол», «Прилагательное», «Существительное») и викторины («Музыка», «История», «География»).
Большой электронный словарь VER-Dict
VER-Dict представляет собой собрание словарей, объединенных в одной программной оболочке. Помимо объемного словаря общей лексики, в VER-Dict включены все специализированные словари, разработанные компанией ПРОМТ. Англо-русско-английский VER-Dict содержит более 1 млн. 250 тыс. слов и словосочетаний в 88 словарях, а VER-Dict Гигант — более 2 млн. 200 тыс. слов и словосочетаний в 110 словарях. В состав VER-Dict Гигант входят словари для перевода с английского, немецкого, французского на русский язык и обратно.
Отличительной особенностью VER-Dict является предоставление обширной морфологической и лексико-грамматической информации о каждом слове. Например, если пользователь подзабыл спряжение английских глаголов, то в режиме «Словоизменение» VER-Dict покажет все необходимые формы. Вся информация четко систематизирована, поэтому VER-Dict будет полезен и тем, кто изучает иностранные языки.
Пользователи Microsoft Word 97/2000/XP/2003 получают прекрасную возможность иметь «под рукой» мощный словарь — VER-Dict встраивается в популярный текстовый редактор и доступен посредством правой кнопки мыши. С помощью контекстного меню можно посмотреть переводы любого слова или его изменения.
Цены: англо-русско-английский словарь — 4 долл., многоязычный словарь (английский, немецкий, французский) — 6 долл.
Серия переводчиков X-Translator Platinum
Переводчик X-Тranslator Platinum является совместным продуктом компании ПРОМТ и ИДДК (www.iddk.ru). В основе продукта лежит переводческое ядро от ПРОМТ, а всеми вопросами тиражирования и распространения занимается компания ИДДК.
В рамках данного проекта реализовано несколько переводчиков:
• X-Translator Platinum. Переводчик. Англо-русский — 180 руб.;
• X-Translator Platinum. Переводчик. Испанско-русский — 180 руб.;
• X-Translator Platinum. Переводчик. Итальянско-русский — 180 руб.;
• X-Translator Platinum. Переводчик. Немецко-русский, русско-немецкий — 180 руб.;
• X-Translator Platinum. Переводчик. Французско-русский, русско-французский — 180 руб.;
• Коллекция словарей для X-Translator Gold и Platinum. Английский, немецкий, французский — 330 руб.
Наиболее популярной программой является X-Translator Platinum. Этот переводчик имеет значительный словарный запас (англо-русский — 85 тыс. слов, русско-английский — 130 тыс. слов). Окно программы разделено на две части: в верхней вводится или копируется из других приложений текст, а в нижней появляется его перевод. При этом программа позволяет менять направление перевода, копировать результат в буфер обмена, создавать, подключать и отключать пользовательские словари, добавлять туда новые слова и словосочетания, а также указывать слова, оставляемые без перевода. После установки переводчик работает без компакт-диска.
Все переводчики построены по тому же принципу и отличаются следующими характеристиками:
• Microsoft Internet Explorer plug-in — перевод Web-страниц:
• синхронный перевод;
• перевод и сохранение файлов различных форматов;
• сворачивание X-Translator Platinum в пиктограмму;
• функция перехвата ввода с клавиатуры;
• режим «поверх всех окон»;
• перевод буфера обмена;
• режим накопления текста при переводе буфера обмена;
• чтение текстов вслух;
• работа с пользовательскими словарями;
• возможность подключения коллекции словарей для X-Translator Platinum.
Следует отметить, что X-Translator Platinum является продолжением предыдущих совместных проектов компаний ПРОМТ и ИДДК — переводчиков X-Translator и X-Translator Gold (словари серии Gold также можно найти в продаже по цене 150 руб.).
Platinum-версия переводчика отличается от предыдущих версий следующими новшествами:
• добавлено два специализированных словаря: «Коммерция» и «Интернет», которые обеспечивают более высокое качество перевода специализированных текстов;
• появилась возможность подключения коллекции специализированных словарей, которая представляет собой отдельный продукт для переводчиков версий Gold и Platinum;
• реализована поддержка голосовых технологий — программа не только переводит, но и воспроизводит иностранные и русские тексты вслух;
• возможен перехват ввода с клавиатуры — в этом режиме при наборе текста в любом приложении Windows данный текст синхронно появляется в окне X-Translator Platinum и может быть немедленно переведен;
• при включении нового режима «поверх всех окон» окно X-Translator Platinum остается видимым для пользователя независимо от того, в каком приложении он работает;
• при включенном режиме накопления текста при переводе буфера обмена новый текст из буфера обмена добавляется к уже имеющемуся исходному тексту, то есть происходит накопление текста из буфера обмена и осуществляется перевод всего накопленного текста; при выключенном же режиме новый текст из буфера обмена замещает уже имеющийся исходный текст и осуществляется перевод только вновь полученного текста.
Pragma
Pragma это разработка украинской компании Trident Software (www.trident.com.ua). Прежде программа была известна как Language Master, а затем сменила наименование на Pragma. Последняя (3-я) версия программы поддерживает русский, украинский, английский и немецкий языки. Словари, входящие в базу переводчика Pragma 3.0, содержат около 1 млн. слов и выражений, которые охватывают около 100 тематик. Имеется и словарь специальных терминов (50 тематических областей), включающий около 0,5 млн. слов.
Pragma 3.0 работает со всеми популярными офисными пакетами (Microsoft Office, StarOffice, Lotus Notes), а также с почтовыми клиентами (Outlook Express, MS Outlook, Netscape, Eudora) и браузерами (Internet Explorer, Netscape, Mozilla).
Лицензия: shareware от 60 до 170 долл. Цены на Pragma:
• Pragma Base 3.0 60 долл.
• Pragma Internet 3.0 90 долл.
• Pragma Office 3.0 100 долл.
• Pragma Expert 3.0 170 долл.
• Pragma Ukrainian Language 30 долл.
• Pragma German Language 20 долл.
• Pragma Extended Dictionary — 20 долл.
• Pragma Expert 3.0 Special 60 долл.
• Pragma Expert 3.0 Special
(три языка) 80 долл.
Retrans Vista
etrans Vista (www.retrans.ru) является развитием системы перевода Retrans, права на которую принадлежат ВИНИТИ. В 2001 году после доработки продукт был зарегистрирован под названием Retrans Vista, которым владеет компания «Виста Текнолоджис».
Программа Retrans Vista это автоматизированная система перевода текстов с русского языка на английский и с английского на русский. Основные словари системы содержат терминологию и фразеологические единицы по естественным и техническим областям науки, по экономике, политике и бизнесу. Объем русско-английского и англо-русского политематических машинных словарей более 3 млн. 300 тыс. словарных статей. Пользователям доступны политематический словарь (3,5 млн. словарных статей) и пять дополнительных словарей: «Общий», «Автоматика», «Бизнес», «Биология», «Машиностроение».
Retrans Vista предоставляет интерактивный режим перевода, при котором пользователь может выбрать из предлагаемых вариантов перевода слов и словосочетаний собственный вариант перевода, зарезервировать слово, которое не нужно переводить, объединить слова в словосочетание или предложение. Интерактивный режим представлен в двух формах — табличной и текстовой.
Словарь пользователя позволяет сохранять результаты перевода и использовать их в дальнейшей работе, что существенно облегчает труд переводчика и обеспечивает единообразие стиля и терминологии.
Перевод в Интернете дает возможность быстро понять смысл содержания страницы на английском языке, при этом формат страницы сохраняется.
Функция быстрого автоматического перевода обеспечивает скорость до 7200 слов в минуту.
В системе Retrans Vista реализована концепция фразеологического машинного перевода, основанная на переводе целостных понятий, выражаемых словами, словосочетаниями или предложениями. Поэтому система в первую очередь находит эквиваленты для максимально длинных фраз и словосочетаний, а если это не удается, переводит входящие в их состав более короткие словосочетания и отдельные слова.
Ориентировочная цена 125 руб.
ABBYY Lingvo
омпания ABBYY (www.abbyy.com), более известная как разработчик OCR-cистем, выпускает также самый популярный сегодня в России словарь ABBYY Lingvo.
ABBYY Lingvo имеет три версии:
• ABBYY Lingvo 9.0. Англо-русский словарь для PC и Pocket PC, который содержит около 1 млн. 400 тыс. словарных статей в 22 словарях общей, разговорной и тематической лексики, русско-английский разговорник, лингвострановедческий словарь Великобритании и новый словарь разговорной лексики;
• ABBYY Lingvo 9.0. Многоязычный электронный словарь для PC и Pocket PC, включающий более 3 млн. 500 тыс. словарных статей в 49 словарях (более 7 млн. 400 тыс. переводов) на пяти европейских языках (английский, немецкий, французский, испанский, итальянский), а также пять новых разговорников, содержащих по 500 наиболее употребительных фраз;
• ABBYY Lingvo 9.0. Популярный многоязычная версия стоимостью 100 руб., которая содержит самую необходимую лексику на пяти языках (английском, немецком, французском, итальянском и испанском). Всего более 370 тыс. словарных статей.
Основные достоинства англо-русской и многоязычной версии:
• самые полные словари, актуальная лексика;
• всесторонняя тематика, включающая такие тематические специализированные словари, как медицинский и компьютерный, а также справочник по грамматике английского языка;
• подробный перевод, многочисленные примеры словоупотребления;
• перевод слова из любой формы с учетом морфологии);
• полнотекстовый поиск;
• говорящий словарь 25 тыс. самых наиболее употребительных слов озвучены дикторами из Великобритании и Германии;
• свыше 100 дополнительных бесплатных словарей на сайте www.LingvoDA.ru;
• инструменты для создания собственных пользовательских словарей.
ABBYY Lingvo
Рекомендованная цена англо-русского словаря ABBYY Lingvo 9.0 — 450 руб., многоязычного словаря ABBYY Lingvo 9.0 — 850 руб. (обычное издание) и 950 руб. (подарочное издание). Получить более подробную информацию о продуктах и приобрести их можно на сайтах www.abbyy.ru и www.lingvo.ru.
С примером сравнительного тестирования переводчиков Retrans Vista, X-Тranslator Gold и онлайновой службой www.translate.ru можно ознакомиться на нашем CD-ROM.