Соревнование электронных переводчиков: кто сильнее?

Александр Прохоров, Николай Прохоров

Участники соревнования

   PROMT Professional 7.0 (разработчик — ПРОМТ, Россия)

   Pragma 4.0 (разработчик — Trident, Украина)

   Systran 5.0 (разработчик — Systran, Франция)

   Англо-русский переводчик SKIIN 2.0 (разработчик — SKIIN, Россия)

Результаты

 

Еще несколько десятилетий назад никто не верил в будущее электронных систем перевода. Считалось, что, используя труд машины, люди попусту теряют время, поскольку стилистически корректно перевести текст и стать достойным конкурентом переводчику-человеку машина все равно не сможет.

Меняются времена — изменяются потребности людей. Сегодня информационные потоки между организациями так велики, а число новых отраслей промышленности, описываемых специфическими терминами, настолько возросло, что без программ-переводчиков трудно, а подчас и невозможно представить себе работу крупной компании.

Безусловно, и сегодня немало тех, кто выражает недовольство качеством машинного перевода, однако следует отдать должное разработчикам систем машинного перевода: стремясь усовершенствовать возможности своих программ и, конечно же, обогнать конкурентов, они постоянно предлагают новые версии электронных толмачей.

Проверим возможности нынешних систем машинного перевода, устроив для них соревнование. Программы должны будут перевести два текста: трудовой договор о найме охранника и инструкцию об управлении автомобилем в случае заноса. Многие компании часто сталкиваются с необходимостью перевода юридических документов и текстов, относящихся к различным отраслям промышленности. Кроме того, сотрудникам зачастую некогда проходить специальное обучение до того, как начать пользоваться программой-переводчиком. Учитывая эти факторы, успехи автоматических переводчиков будут оцениваться в том числе по критерию доступности и простоты работы с ними для новичков.

В состязании принимают участие программа-переводчик российской компании ПРОМТ, продукт французской компании Systran, Pragma от украинской Trident, а также программа-переводчик SKIIN. Для тестирования было выбрано англо-русское направление перевода как наиболее популярное и востребованное у русскоязычных пользователей.

Участники соревнования

PROMT Professional 7.0 (разработчик — ПРОМТ, Россия)

Одно из основных достоинств этой программы, сразу бросающееся в глаза, — ее богатый интерфейс. Работая с переводчиком, пользователь может подключать большое количество дополнительных настроек, а затем сохранять их в виде шаблонов для последующего использования. Кроме того, PROMT встраивается в основные офисные приложения и умеет распознавать графические файлы с помощью интегрированной OCR-системы.

В текстах, на которых тестировался данный переводчик, практически не осталось нераспознанных слов, а все непереведенные слова оказались названиями и адресами. Кстати, программа позволяет занести все подобные слова в список «Зарезервированных слов» и тогда при переводе они останутся без изменений. Слова, не требующие перевода, можно либо транслитерировать, либо сохранить язык оригинала. В случае если программа предлагает сразу несколько вариантов перевода слова, его основное значение выделяется подчеркиванием, а варианты приводятся в скобках.

Одним из важных преимуществ данной программы является функция подключения тематических словарей. Это, конечно, не нововведение, однако на практике далеко не у всех тестируемых программ подключение словарей влияет на качество перевода. Пользоваться словарями ПРОМТ оказалось удобнее, чем тематическими словарными базами других программ, а качество переведенного текста после подключения словарей значительно изменялось в лучшую сторону. Например, словосочетание «court costs» только PROMT перевел как «судебные издержки» (в юридической терминологии существует именно такое определение судебных расходов). Systran предложил вариант «судебные расходы» (также приемлемый вариант, но не точный), а Pragma выдумала «королевский» перевод — «придворные затраты». После подключения Юридического словаря PROMT 7.0 грамотно перевел фразу «This Agreement may be terminated» как «Договор может быть расторгнут» (до применения словаря фраза звучала довольно нелепо: «Соглашение может быть закончено»).

При работе с текстами одинаковой тематической направленности пользователь может сохранить все настройки, заданные им при переводе, в виде шаблонов тематик. Это удобно в том случае, если, например, сотруднику компании приходится переводить документы на одну и ту же тему или по нескольким периодически повторяющимся темам.

 

PROMT Professional 7.0 (разработчик — ПРОМТ, Россия)

Следует также отметить, что в седьмом поколении системы PROMT функционирует так называемая многоразмерная архитектура словарей. Это означает, что в программе существуют два варианта перевода — активный и неактивный. Активный участвует в процессе перевода, а неактивные работают в режиме просмотра для выбора наиболее подходящего по смыслу варианта. В случае необходимости неактивные варианты можно сделать активными. Таким образом, ограничение на количество вариантов перевода для каждого слова отсутствует — достаточно выбрать, какие варианты перевода будут активными для данного текста.

Несмотря на разнообразие функций, которые программа предоставляет пользователю, PROMT не лишена некоторых недостатков. Первая сложность состоит в том, что весь спектр возможностей и многочисленных опций скрывается за интерфейсом системы, освоить работу с которым невозможно без обращения к руководству пользователя. В противном случае многие опции программы так и останутся неизвестными пользователю.

Были в переведенном тексте и некоторые неточности. Например, системе не удалось грамотно перевести один из пунктов трудового договора: «No modification or amendments shall be made to this contract unless in writing and signed by all parties», несмотря на отсутствие в нем сложных грамматических конструкций. Сделанный PROMT перевод этого предложения выглядит так: «Никакая модификация или поправки не должны быть сделаны к этому контракту, если в письменной форме и не подписался всеми сторонами (партиями)».

Pragma 4.0 (разработчик — Trident, Украина)

Компания Trident, украинский конкурент ПРОМТ, позиционирует свой продукт как вспомогательное приложение, которое не является самостоятельной программой, а интегрируется практически в любое компьютерное приложение. Действительно, сразу после инсталляции программы дополнительное меню Pragma появилось справа на информационной панели Word, а также в программах Outlook, Internet Explorer, Wordpad и даже в Блокноте.

Кроме того, последняя версия Pragma содержит почти сотню тематических словарей. Выбрать необходимую для перевода тематику можно в выпадающем диалоговом окне сразу после нажатия опции «Перевод». Пользователь может также создавать собственные словари. Для работы со словарями разработана специальная утилита — «Корректор». В комплект Pragma также входит специальное приложение для быстрого перевода — Pragma Fast Translation, но во время работы с ним нельзя вводить текст или изменять его.

Хотя алгоритм работы с программой довольно прост, иногда возникали кое-какие сложности. Например, в руководстве пользователя Pragma написано, что программа выделяет зеленым цветом слова, имеющие несколько вариантов перевода, а красным цветом — незнакомые слова. Однако при переводе трудового договора выделенными оказались только слова с альтернативными вариантами перевода.

С точки зрения качества перевода было выявлено несколько неточностей. Во-первых, понятие «занос автомобиля» было переведено как «тормозная колодка». Конечно, этот термин тоже относится к автомобильной тематике, однако использование его в данном тексте совершенно неуместно, а других вариантов перевода программа не предложила.

 

Pragma 4.0 (разработчик — Trident, Украина)

Удивительно, но при переводе трудового договора после подключения тематического словаря «Право» в тексте не изменилось ни одно слово! Слово «parties» Pragma перевела как «партии» (в юриспруденции этот термин означает «стороны»), в то время как остальные программы справились с переводом этого слова.

Вместе с тем Pragma, единственная из тестировавшихся программ, после подключения тематического словаря смогла правильно перевести словосочетание «rear-wheel» — «задние колеса». В первом случае Pragma предложила вариант «тыльные колеса».

По непонятным причинам в разных офисных приложениях Pragma предлагает различные дополнительные функции перевода. Например, пользуясь Pragma в Microsoft Outlook, можно транслитерировать слова. А вот в программе Word можно устанавливать другие дополнительные настройки перевода, но функция транслитерации здесь отсутствует.

Pragma содержит меньше языковых направлений перевода, чем PROMT и Systran. В ее активе — английский, русский, немецкий, украинский и латышский языки.

Systran 5.0 (разработчик — Systran, Франция)

Французский переводчик Systran работает как из приложений Word, Excel, Outlook, Internet Explorer, PowerPoint, так и в качестве самостоятельной программы.

Следует отметить, что интерфейс Systran предоставляет пользователю множество возможностей для улучшения качества перевода. Однако при работе с ним возникли определенные трудности. Оказалось, что некоторые кнопки, расположенные на панели инструментов, не дублируются командами основного меню программы. Сложность работы заключается также в том, что программа сохраняет заданные настройки переведенного текста для всех вновь открываемых документов. В результате текст обычного электронного письма может содержать, например, термины из области авиации или автомобилестроения. Чтобы этого не произошло, необходимо отключить в новом документе тематические настройки предыдущего документа.

Недостаток Systran, который сразу бросается в глаза, — это создание программой собственных слов, состоящих из букв русского алфавита. Вместо того чтобы оставить слово непереведенным, система «придумывает» несуществующее слово или добавляет лишние буквы. Так, простое выражение «so that» было переведено как «ТАК, СТО», написано через запятую и заглавными буквами. А слово «первый» Systran почему-то пишет с буквой «а» на конце — «первыйа». Особенно «удачно» программа изобретает прилагательные — «ледистый», «штилевый». А переведенное слово «если» почему-то было написано большими латинскими буквами.

В переводе Systran намного чаще, чем у других программ-переводчиков, встречаются непереведенные слова (так, в текстах-заданиях непереведенными остались слова «paid», «following», «front-wheel» и др.). Слова, написанные заглавными буквами, программа не распознает и оставляет на языке оригинала. В некоторых предложениях не были учтены особенности грамматических конструкций русского языка и использован неверный порядок слов (например, предложение заканчивалось словами «направление, котор колеса смотрят на»), а также не были соблюдены времена глаголов («вы не будете управляли»).

 

Systran 5.0 (разработчик — Systran, Франция)

Программа укомплектована пятью большими словарями, каждый из которых, в свою очередь, содержит несколько тематических словарей. Однако подключение этих словарей не повлияло на качество переведенного текста.

В то же время нельзя не отметить явные плюсы этой программы. Пакет программ Systran Premium содержит дополнительные настройки, раскрывающиеся в виде закладок, которые позволяют повысить качество перевода. Кроме того, при переводе Systran осуществляет автоматическую проверку орфографии исходного текста, что позволяет переводить документы, содержащие ошибки в правописании. Система содержит специальную утилиту Systran Multi Translate Utility, которая осуществляет пакетный перевод файлов, а также переводчик, встраиваемый в Word. В пакет Systran 5.0 также входит специальная программа управления словарями (Systran Dictionary Manager). Безусловным плюсом программы является наличие большого количества языковых пар — Systran осуществляет перевод также с языков стран Восточной Азии (корейского, китайского, японского).

Англо-русский переводчик SKIIN 2.0 (разработчик — SKIIN, Россия)

Компании ПРОМТ, Trident и Systran являются бесспорными лидерами в разработке систем машинного перевода c иностранных языков на русский, однако в Интернете нам удалось найти еще одну программу, возможности которой нам также захотелось протестировать. Речь идет о российском переводчике SKIIN, который имеет единственное направление перевода — с английского на русский. По своим возможностям этой программе еще далеко до признанных лидеров. SKIIN осуществляет подстрочный перевод текста без учета синтаксических и морфологических особенностей языка.

 

Англо-русский переводчик SKIIN 2.0 (разработчик — SKIIN, Россия)

К достоинствам программы можно отнести простоту интерфейса и инструкцию по работе с переводчиком, выложенную на одноименном сайте. После перевода текста можно посмотреть статистику незнакомых и повторяющихся слов. В переведенном варианте текста полностью отсутствовали грамматические конструкции, программа ограничилась подставлением перевода каждого слова из словаря. Очевидным плюсом программы SKIIN является то, что любой желающий может бесплатно скачать ее из Интернета.

В начало В начало

Результаты

Программы сравнивались по критериям, приведенным в таблице (высший балл — 5).

Лидером соревнования оказалась российская система перевода PROMT, которая без труда справилась с переводом разных по тематике текстов, а качество ее перевода повысилось за счет подключения дополнительных настроек. В целом перевод PROMT можно назвать вполне профессиональным.

Второе место по качеству перевода получила украинская программа Pragma. К сожалению, функция подключения тематических словарей не всегда дает желаемый результат, в некоторых случаях перевод текста без словаря более корректен, чем после его подключения. Небольшой набор языковых направлений также можно отнести к минусам этой программы.

Несмотря на свою популярность и большой запас языковых направлений, французская система Systran справилась с англо-русским переводом текста хуже конкурентов. Разработчикам Systran необходимо в первую очередь работать над согласованием в процессе перевода грамматических конструкций английского и русского языков. Кроме того, программа оставляет большое количество слов непереведенными и часто предлагает варианты перевода, не существующие в русском языке, что говорит о необходимости пополнения ее словарного запаса и добавления в базы переводов специфических терминов из разных тематических областей.

 

Сравнение автоматизированных систем перевода

Сравнение автоматизированных систем перевода

Что касается переводчика SKIIN, то его возможности пока еще не столь широки, как у других участников этих соревнований. Эта программа не способна справиться с переводом больших объемов текста, поскольку после перевода требует ручной корректировки всех предложений для построения правильных грамматических конструкций. Кроме того, много времени придется потратить на поиск альтернативных вариантов перевода слов в случае, если предложенный программой перевод оказался неправильным.

Однако в целом электронные переводчики сегодня радуют своими новыми возможностями и дополнительными функциями, позволяющими пользователю, во-первых, без труда понять смысл текста, а во-вторых, значительно повысить качество перевода, например, специализированной информации. Сегодня с помощью систем автоматизированного перевода можно переводить совершенно разные тексты — от различных документов и электронных писем до контента web-страниц и распознавания графических файлов.

Примеры перевода, выполненные разными программами, можно найти на прилагаемом к журналу CD-ROM.

КомпьютерПресс 12'2005

Наш канал на Youtube

1999 1 2 3 4 5 6 7 8 9 10 11 12
2000 1 2 3 4 5 6 7 8 9 10 11 12
2001 1 2 3 4 5 6 7 8 9 10 11 12
2002 1 2 3 4 5 6 7 8 9 10 11 12
2003 1 2 3 4 5 6 7 8 9 10 11 12
2004 1 2 3 4 5 6 7 8 9 10 11 12
2005 1 2 3 4 5 6 7 8 9 10 11 12
2006 1 2 3 4 5 6 7 8 9 10 11 12
2007 1 2 3 4 5 6 7 8 9 10 11 12
2008 1 2 3 4 5 6 7 8 9 10 11 12
2009 1 2 3 4 5 6 7 8 9 10 11 12
2010 1 2 3 4 5 6 7 8 9 10 11 12
2011 1 2 3 4 5 6 7 8 9 10 11 12
2012 1 2 3 4 5 6 7 8 9 10 11 12
2013 1 2 3 4 5 6 7 8 9 10 11 12
Популярные статьи
КомпьютерПресс использует