Системы проверки орфографии

Егор Поваляев

Кому и зачем нужны системы проверки орфографии

Обзор продуктов

   ОРФО 2002

   Лингвистические средства «ОРФО»

   UniSpell

   РУТА

   Штрих 2.0

Резюме

 

Существует извечный философский вопрос о том, что важнее — форма или содержание. Сегодня он приобрел дополнительную актуальность применительно к текстовым документам. Многие люди годами общаются друг с другом при помощи почтовых сообщений и ICQ и при этом никогда не видятся. Зачастую впечатление о партнере по переписке во многом определяется содержанием и формой текстовых посланий. Как говорится, минимум личного обаяния, максимум голых фактов и конкретики.

Читая любой документ, мы невольно обращаем внимание на стиль изложения, легкость восприятия, содержательность и краткость повествования. Однако нередко мы сталкиваемся с опечатками и ошибками в документах. Они могут смазать все положительное впечатление об авторе, а порой и нанести серьезный урон бизнесу.

Общаясь на родном языке, мы практически всегда можем заметить, что в этом месте автор ошибся. Кроме того, мы обычно можем догадаться, что он имел в виду на самом деле. Гораздо сложнее дело обстоит в тех случаях, когда мы общаемся с иностранцами. Ошибившись в написании всего одного слова, можно значительно исказить смысл всего сообщения, и даже интуиция может не помочь получателю текста, поскольку язык общения для него не родной.

Для исправления набранного текста и были созданы программы проверки орфографии, синтаксиса, грамматических правил построения предложений, расстановки переносов и т.д. Первыми и наиболее активными пользователями подобных программ стали те, кто занимается созданием и редактированием текстов.

Впоследствии такие программные решения были встроены в популярные текстовые редакторы. Например, компания «Информатик» лицензировала свою технологию проверки правописания компании Microsoft для MS Office. Благодаря этому огромное число пользователей получили возможность автоматически исправлять тексты.

Программы грамматической проверки текстов постоянно совершенствуются и развиваются. Появляются новинки в виде отдельных продуктов, которые ориентированы на самый широкий круг пользователей. Но стоит ли покупать их или вполне достаточно встроенных в MS Office возможностей? Давайте разберемся.

Кому и зачем нужны системы проверки орфографии

Системы проверки орфографии нужны всем, кто редактирует текстовые документы с помощью компьютера. Однако большинство пользователей работают с продуктами семейства MS Office, где эта возможность уже реализована. Так нужно ли приобретать отдельный продукт и насколько сильно он будет отличаться по функциональным возможностям от встроенного в MS Office?

В стандартную версию MS Office обычно входят лингвистические средства для проверки нескольких языков, но не всех. Например, в английской версии — это английский, французский и испанский, в MS Office с русской локализацией — русский, украинский и английский. Системы проверки орфографии обычно поддерживают одновременную проверку правописания гораздо большего количества языков.

В продукты корпорации Microsoft с локализацией, отличной от русской, поддержка русского языка не входит. В некоторых иностранных фирмах в России, в соответствии с требованиями головного офиса, на компьютерах установлены нелокализованные версии текстовых процессоров, однако ведение части документации и переписка с российскими клиентами осуществляются на русском языке. Для таких документов может быть установлена система проверки орфографии.

Кроме того, большинство отдельных продуктов обладают рядом дополнительных опций, которые могут быть необходимы тем или иным специалистам, даже имеющим русские локализованные версии MS Office, а именно:

  • проверка орфографии в программах, где эта функция не реализована разработчиком. Это особенно актуально для профессиональных полиграфистов, использующих такие популярные программы верстки, как PageMaker, QuarkXPress и MS Excel;
  • дополнительные словари по предметным областям (техника, гуманитарные и точные науки, медицина, коммерция и др.);
  • постоянное пополнение словаря новой лексикой. В MS Office XP встроен словарь 2000 года, а в более ранние версии — словарь 1996 года;
  • проверка орфографии практически в любых окнах, в которых возможен ввод текста. Например, в почтовых и коммуникационных программах (в частности, в ICQ);
  • толковые словари русского языка. в случае сомнений в правильности выбора какого-либо слова можно обратиться к этому словарю, который обычно содержит сотни тысяч слов;
  • грамматический справочник русского языка, который содержит свод правил русской орфографии и пунктуации с примерами употребления;
  • поддержка удобного формата словарей пользователя. Новое слово не придется добавлять в словарь всякий раз, как оно встретится в другой форме, поскольку слова включаются в словарь сразу со всеми словоформами;
  • словари пользователя — общие для всех приложений, для которых установлена поддержка системы проверки орфографии. При работе с текстами в различных приложениях новые слова, занесенные в словарь в одном приложении, будут затем считаться правильными и в других;
  • поиск и замена русских слов во всех словоформах. даже в локализованной русской версии MS Word встроенные поиск и замена во всех формах реализованы только для английского языка;
  • автоматическое составление реферата. Полезная функция для тех, кто стремится создать хорошо структурированные тексты. Можно получить «выжимку» из своего текста заданного объема и составить список ключевых слов. В MS Word даже в локализованной русской версии встроенный автореферат реализован только для английского языка;
  • проверка орфографии для других языков: английского, испанского, немецкого, украинского и французского;
  • расстановка переносов в текстах с регулируемым уровнем качества. Можно выбирать «книжное» качество для обычных текстов или «газетное» при форматировании текста в узкие колонки.
В начало В начало

Обзор продуктов

На российском рынке присутствуют несколько производителей систем проверки орфографии.

В числе таких систем стоит отметить продукты «ОРФО» компании «Информатик», Unispell компании Textar, РУТА компании «Kиев», Пропись компании «АГАМА» и «Штрих 2.0» для Lotus Notes компании и Арсеналъ». Все они различаются набором функциональных возможностей. Какой из продуктов подойдет именно вам — об этом мы и постараемся рассказать.

В начало В начало

ОРФО 2002

«ОРФО 2002» — это популярный пакет, который проверяет правописание на шести языках: русском, английском, немецком, французском, испанском и украинском. Для всех языков есть удобное средство добавления новых слов со всеми их формами. Помимо продуктов фирмы Microsoft, «ОРФО» подключается к PageMaker, WordPerfect, WordPro и Quark XPress, причем везде используется один и тот же словарь пользователя. Если, например, вы готовите тексты в MS Word, а затем переносите их для верстки в PageMaker, то все новые слова, добавленные в словарь, автоматически перейдут в PageMaker.

Для пользователей, работающих в других приложениях (Notepad, Navigator, Eudora Light, Exchange и т.п.) или даже в своих собственных окнах, предусмотрены проверка по горячим клавишам с помощью «ОРФО Агент», а также мини-редактор Standalone Speller со встроенной проверкой орфографии набранного текста или содержимого ClipBoard.

Для некоторых языков вы можете заказать дополнительно специализированные словари по таким областям знаний, как бизнес, техника, медицина и т.п.

Русский грамматический модуль, по сравнению с MS Word, проверяет еще несколько трудных случаев, где часто встречаются ошибки.

В русский модуль «ОРФО» дополнительно входят: толковый словарь и грамматический справочник, составление реферата и списка ключевых слов, поиск и замена слов во всех формах, подробная справочная система, макрокоманда расстановки всех возможных переносов и др.

Технические требования к компьютеру для установки «ОРФО 2002»

В начало В начало

Лингвистические средства «ОРФО»

По умолчанию «ОРФО 2002» установит все лингвистические модули на все приложения, находящиеся в вашей системе и поддерживаемые «ОРФО» (рис. 1).

Модуль проверки орфографии поддерживает более 20 различных приложений. Кроме спеллера для русского языка существуют также модули «ОРФО» для украинского, английского, немецкого, французского, испанского языков. Готовятся версии для итальянского и португальского. Русский словарь «ОРФО» включает 220 тыс., английский — 120 тыс. основ. Для некоторых языков можно заказать дополнительные словари по бизнесу, медицине, технике, точным и гуманитарным наукам общим объемом более 200 тыс. основ.

Для некоторых языков можно заказать дополнительные словари по бизнесу, медицине, технике, точным и гуманитарным наукам.

«ОРФО 2002» полностью сохраняет формат и все функции диалогового окна проверки орфографии MS Word.

При проверке орфографии модуль:

  • предложит список возможных замен для каждого найденного ошибочного слова;
  • вставит в текст выбранный вариант;
  • позволит исправить выделенное слово вручную или ввести его как новое слово в пользовательские словари;
  • предоставит факультативные программные средства: выбор из уже существующих словарей или создание нового пользовательского словаря.

Автономный спеллер обеспечивает проверку орфографии в собственном мини-редакторе. Проверяется либо текст, набранный в этом самом редакторе, либо скопированный в буфер обмена (рис. 2).

Модуль «ОРФО Агент» дает возможность активизировать «ОРФО» при помощи горячих клавиш, чтобы подключить модуль проверки орфографии к тем приложениям, в которых подобная лингвистическая функция не предусмотрена и которые имеют редактируемые окна известных «ОРФО» типов (например, Notepad, WordPad, Write, некоторые программы электронной почты, ICQ и т.п. — рис. 3).

Макрокоманда для полной расстановки переносов расставляет переносы во всех словах текущего документа MS Word (рис. 4). Полезна для последующего экспорта документа в другие приложения.

В данном окне пользователь может выбрать язык, качество переносов — «книжное» или «газетное» для русского и украинского языков, а также изменить символ, который будет обозначать мягкий перенос.

По умолчанию «ОРФО 2002» устанавливает книжное качество переносов и использует символ мягкого переноса MS Word, код «31».

Модуль проверки грамматики и стиля осуществляет проверку правильности расстановки запятых, согласования окончаний слов, употребления слов в различных контекстах и т.п., опираясь на большую базу грамматических данных.

Грамматический и стилистический корректор «ОРФО» знает более 40 групп правил и проверяет текст с точки зрения трех основных стилей письма — строгого, делового и обычного. В ходе проверки он дает объяснения, а по окончании проверки приводит статистические данные: количество слов, уровень сложности текста и т.п.

Модуль расстановки переносов расставляет переносы в тексте документа в соответствии с правилами расстановки переносов в русском или украинском языке. Модуль можно настроить на книжный или газетный стиль для форматирования в узкие колонки.

Модуль «Синонимы» предоставляет доступ к более чем 30 тыс. русских синонимов, антонимов и родственных слов. Синонимы ставятся сразу в нужной форме.

Словарь синонимов «ОРФО 2002» располагает двумя уникальными возможностями:

  • распознает русские слова независимо от их формы в тексте;
  • для любого слова предлагает синонимы и антонимы в той же форме, что и исходное слово.

Толковый словарь предлагает развернутые толкования русских слов и выражений. Данный модуль может быть либо встроен в MS Word, либо использоваться как автономная программа (рис. 5).

Модуль составления автореферата автоматически составит список ключевых слов текущего документа на русском языке и выберет наиболее информативные фразы с этими словами в зависимости от заданного пользователем объема.

Модуль поиска и замены слов во всех формах позволяет находить и заменять в тексте любое русское слово во всех его формах. Данный модуль подключается к MS Word.

Справочник по русскому языку представляет собой хорошо подготовленный «путеводитель» по правилам русской грамматики. Данный модуль может быть встроен в MS Word или использоваться как автономная программа (рис. 6). Вызывается он также из окна пояснений при грамматической проверке.

«ОРФО 2002» предлагает уникальную возможность добавления новых слов во всех формах (рис. 7). Эта функция подключается по умолчанию во время установки.

Новые слова добавляются в словарь пользователя «ОРФО», а не в пользовательский словарь вашего приложения. Этот словарь содержит сопутствующую грамматическую информацию, которая используется как при проверке орфографии, так и при грамматической и стилистической проверке. Поэтому пользовательский словарь «ОРФО» имеет более сложную структуру, чем обычный пользовательский словарь приложения.

Помимо функции ввода новых слов в словарь «ОРФО» позволяет выбирать, создавать и редактировать пользовательские словари, трансформировать их в текстовый формат и сливать несколько словарей пользователя в один.

В начало В начало

UniSpell

UniSpell — это система лингвистической поддержки русского языка для ряда популярных программ для Macintosh (Microsoft Office 98 и предыдущие версии, QuarkXPress 3.3-4.0, Adobe PageMaker & Illustrator, ClarisWorks & FileMaker Pro) и Windows 95/NT (QuarkXPress 3.3-4.0, Adobe PageMaker & Illustrator, Word — рис. 8).

Система UniSpell предлагает множество возможностей, связанных со спецификой русского языка:

  • встроенная проверка орфографии по словарю, включающему 120 000 основ, и предложение вариантов исправления опечаток, в том числе нескольких опечаток в одном слове;
  • варианты исправления опечаток сортируются так, что наиболее вероятный вариант показывается первым;
  • возможность занесения новых слов в пользовательские словари вместе со всеми их косвенными формами. При этом в большинстве случаев набор форм слова правильно строится по аналогии с существующими словами, так что все формы заносятся в словарь нажатием всего одной кнопки, что очень удобно. Эта технология впервые была коммерчески реализована именно в UniSpell. В случае необходимости есть возможность скорректировать формы слова, задав другой образец;
  • морфологически грамотная расстановка невидимых переносов;
  • словарь исключений, позволяющий пользователю самостоятельно указать разрешенные позиции переноса для русских слов. Этот словарь, подобно обычным пользовательским словарям, используется при работе со всеми программами, которые поддерживает UniSpell. Пользовательские словари UniSpell могут быть использованы без изменений на Macintosh и Windows;
  • проверка типографской корректности пунктуации;
  • возможность подбора синонимов из словаря перефразировок.

Технические требования к компьютеру для установки UniSpell

В начало В начало

РУТА

РУТА — это группа лингвистических программ, которые предназначены для проверки украинской и русской орфографии, расстановки переносов, выбора синонимов и близких по значению слов, а также для усовершенствования грамматики и стилистики украинских и русских текстов.

Используя систему проверки правописания РУТА, пользователь также имеет возможность:

  • автоматически найти и исправить ошибки в словах;
  • проконтролировать согласование слов в предложении, правильность расстановки знаков препинания и стилистику текста;
  • расставить переносы в словах при форматировании текста;
  • воспользоваться словарем синонимов и близких по значению слов (тезаурусом);
  • решить проблемы, которые возникают при переносе текстов, созданных в среде DOS в среду Windows.

Справочная система РУТА предоставляет средства грамматического, пунктуационного и стилистического улучшения текстов. В РУТА встроены 55 правил украинской грамматики. Пользователь может выбирать разные стили проверки документов (стили отличаются наборами используемых правил из упомянутых 55).

РУТА — единственная в Украине система, имеющая уникальный словарь, при помощи которого можно проверять правописание более чем 6 млн. словоформ украинского языка. Кроме того, программа оснащена словарем синонимов украинского языка (тезаурус) объемом более 30 тыс. слов.

Последняя версия программы РУТА 4.0 встраивается в Microsoft Word 2000, 97, 7.0, Excel 2000, 97, 7.0, Outlook 2000, 97, Access 2000, 97, 7.0, PowerPoint 2000, 97, 7.0, Works 4.0, Publisher 2000, FrontPage 2000, Adobe PageMaker 6.0 и 6.5.

Технические требования к компьютеру для установки РУТА

В начало В начало

Штрих 2.0

Для проверки орфографии текстов в документах Lotus Notes в компании «Арсеналъ» была создана программа «Штрих 2.0». Она работает с Lotus Notes 5.0 на компьютерах с операционной системой Windows 95/98/2000 или NT.

«Штрих 2.0» встраивается непосредственно в стандартную систему проверки орфографии Lotus Notes, существенно расширяя ее возможности (рис. 9).

Отличительные особенности «Штрих 2.0»:

  • проверка орфографии смешанных русско-английских текстов — осуществляется строго по правилам орфографии русского и английского языков;
  • наличие русского и английского словарей большого объема;
  • базовый русский словарь насчитывает около 120 тыс. словарных статей, базовый английский — около 60 тыс. В комплект поставки входят также дополнительные словари: русский словарь «Адреса» и английский словарь Geography;
  • работа одновременно с несколькими словарями, которые дополнительно подключаются самим пользователем;
  • сохранение индивидуальных настроек проверки орфографии для различных баз данных Lotus Notes — для каждой базы данных документов Lotus Notes предусмотрена возможность использования своего режима проверки орфографии с подключением тех или иных пользовательских словарей;
  • пополнение и редактирование пользовательских словарей. В процессе проверки при обнаружении неизвестного слова пользователь может занести его в пользовательский словарь. Кроме того, пользователь имеет возможность самостоятельно создать и отредактировать словарь до проверки орфографии;
  • автоматическая генерация словоформ с возможностью последующего редактирования;
  • проверка составных слов, которые состоят из двух и более слов, соединенных дефисами и другими символами;
  • предупреждение о соседстве одинаковых слов, что при компьютерной обработке текстов является частым явлением.

Перечисленные свойства не только существенно сокращают временные затраты на проверку документа, но и позволяют достичь более высокого качества проверки орфографии.

Технические требования к компьютеру для установки Штрих 2.0

В начало В начало

Резюме

Среди рассмотренных систем проверки программа «ОРФО» имеет максимальные функциональные возможности и предоставляет высокое качество стилистических, грамматических и орфографических проверок. В пользу этой системы говорит и то, что именно ее выбрала компания Microsoft для встраивания в MS Office.

Когда же целесообразно использовать специализированные программы проверки правописания? Если вы журналист, корректор или другой специалист профессионально занимающийся издательским бизнесом, то вам следует обратить внимание на одну из подобных программ. Кроме того, подобные программы будут полезны людям, которые занимаются информационным наполнением Интернет-сайтов.

Рядовые пользователи, которые лишь изредка сталкиваются с задачами редактирования нескольких страниц текста, вполне могут удовлетвориться возможностями, встроенными в MS Office.

Надеемся, что наш рассказ поможет вам эффективно построить свою работу, подобрав оптимальный вариант системы для проверки грамматики, орфографии и синтаксиса.

КомпьютерПресс 1'2002