КАРТА САЙТА
  ПОИСК
полнотекстовый поиск
ФОРУМ ВИДЕО
ИГРЫ: НОВЫЕ    0-9 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z А-В Г-З И-М Н-П Р-Я

В ХОЗЯЙСТВЕ ПРИГОДИТСЯПАНЕЛЬ ИНСТРУМЕНТОВ

Автор материала:
Дмитрий Трубицин
Опубликовано в журнале
«Лучшие компьютерные игры»
№10 (83) октябрь 2008
вид для печати

Машинные переводчики русского текста

Нет ничего такого, что нельзя было бы извратить плохим пересказом.

Теренций Публий

Чтобы перевести экзотическое иностранное слово, сегодня уже не обязательно сдувать пыль с толстенных многотомных словарей. Достаточно набрать его на клавиатуре, и вы разом получите сонм сведений о нем. Именно за счет удобства использования электронные словари побеждают свои бумажные аналоги. Однако суть их остается прежней. Принципиальный же шаг вперед был сделан в 40-х годах XX века, когда родилась на свет первая система машинного перевода. Много воды утекло с тех пор, но сравнялись ли за это время автоматические переводчики с человеком? Отнюдь нет. И все же им можно найти применение.

Однако вот беда — ныне люди склонны занимать по отношению к машинным переводчикам две полярных, однако равно порочных позиции. Одни преувеличивают их достоинства и говорят о скором крахе всех агентств коммерческого перевода. Другие клеймят позором за частые нелепости и удивляются, почему эта тупиковая ветвь научной мысли еще не отмерла. И те, и другие ошибаются, ожидая от программы чудес. Мы же в этом обзоре постараемся объективно перечислить плюсы и минусы машинных переводчиков как в целом, так и отдельно взятых. Ведь при здравом подходе они становятся хорошим подспорьем в преодолении языковых барьеров, с которыми ежедневно сталкиваются многие компьютерные пользователи.

Не перевелись еще переводчики на Руси

Русский русского завсегда поймет...
...но как быть с остальными?

Чего точно не стоит ждать от любой из приведенных в нашем обзоре программ, так это художественного перевода. Устойчивые идиоматические выражения, сложное построение предложений — самое слабое место прямого компьютерного ума. Ему подавай технические или канцелярские тексты, где все стройно, чинно и гладко. Будь у каждого слова в языке всего одно значение, машинным переводчикам жилось бы куда легче.

Но благодаря программам-переводчикам можно быстро перевести несколько абзацев, а то и страниц текста, чтобы уловить его общий смысл. Не нужно платить переводчику или полчаса сидеть со словарем. Достаточно нажать кнопку и секунду подождать. Однако на приятное расслабляющее чтение рассчитывать не приходится. Придется пораскинуть мозгами, чтобы разгадать помыслы электронного толмача. Порой кажется, что язык перевода — нечто среднее между эсперанто и тарабарщиной: понятно сразу все и всем, но ничего и никому.

Язык для инопланетян

C попыток придумать универсальный язык для людей и началась история «искусственных наречий». Освобожденный от непереводимых идиом, состоящий из логически классифицируемых понятий и правил, в которых нет исключений, такой язык стал бы основой международного общения.

Во вселенной Dungeons and Dragons эта проблема решена давно. Практически каждый обитатель этого мира, будь то эльф или тролль, владеет общим языком Common, который распространили люди. А что же нам делать в реальности?

Первым проектом всеобщего языка был универсалглот, опубликованный в 1868 году французом Жаном Пирро. После него на звание международного языка претендовал волапюк, созданный в 1880 году немецким языковедом и священником Иоганном Шлейером. Этот язык вызвал большой резонанс в обществе.

«Где любовь, там и Бог» Л.Н. Толстого на эсперанто, изданное в 1912 году.

Но вот появляется эсперанто — единственный искусственный язык, получивший широкое распространение. Он создан варшавским окулистом Людвигом Заменгофом в 1887 году, спустя всего девятнадцать лет после появления универсалглота. Что интересно, первый учебник эсперанто был опубликован именно на русском языке.

О распространенности языка сегодня можно судить лишь косвенно — например, по Википедии на эсперанто (eo.wikipedia.org). К середине 2008 года она содержала более ста тысяч статей и занимала по этому показателю двадцатое место, значительно превосходя такие языки, как венгерский, корейский или иврит.

Кроме этих трех, из искусственных языков наиболее известны идо и новиаль — потомки эсперанто, а также бейсик-инглиш, интерлингва, латино-сине-флексионе, логлан, окциденталь и словио. Но, так или иначе, их основой были живые европейские языки.

И только один язык был специально разработан для общения с внеземным разумом. Он носит название линкос (от лат. linqua cosmica — «космический язык»). Дело происходило в те годы, когда человечество было взволновано запуском первого спутника и перспективой приема сигналов внеземных цивилизаций. Ганс Фройденталь, профессор математики из голландского университета, решил создать язык, понятный для существ, не имеющих с нами ничего общего, кроме разума.

Линкос прост, логичен и однозначен, он не содержит исключений из правил или синонимов. Но, самое главное, этот язык свободен от фонетического звучания. Слова этого языка никогда не будут произнесены. Их можно закодировать любым способом — например, в двоичной системе счисления — и передавать в космос по радио или световыми сигналами.

Фройденталь разработал уроки линкоса, которыми должно начинаться первое послание. Оно содержит базовые понятия логики и математики. Каждый «словознак» передается особым импульсом. Урок начинается рядом натуральных чисел, которые передаются последовательностью импульсов, словно тоновый набор в вашем телефоне. Затем вводятся знаки чисел и понятие равенства. После этого демонстрируются арифметические операции «больше», «меньше», «верно», «неверно», «возрастает», «убывает» и т. д. Таким образом, наши братья по разуму проходят курс математики и овладевают понятиями человеческой логики.

Насколько этот язык успешен, неизвестно. Кто знает, возможно, именно из линкоса родится будущий общегалактический язык...

Легко обнаружить одну закономерность: чем примитивней первоисточник, тем точнее будет машинный перевод. Так что, если вы сами сочиняете текст, который хотите впоследствии перевести, придерживайтесь трех правил:

  • Пишите просто, без пословиц, поговорок и двусмысленностей;

  • Пишите четко, без громоздких конструкций, причастных и деепричастных оборотов и всяческих свойственных русскому языку мудрствований;

  • Придерживайтесь коротких предложений с прямым порядком слов. И наконец, пишите правильно, программа и без того еще наделает ошибок.

Основное отличие разных программ в нашей подборке — качество перевода. Но лучше один раз его увидеть, чем сто раз о нем услышать. Мы приглашаем вас поэкспериментировать с предложенными программами, а сами дадим их краткие характеристики.

Cognitive Troll

Лицензия:
свободное пользование через интернет
Адрес в сети:
Языки интерфейса:
русский, английский
Языки перевода:
русский, английский

Самое главное в этом переводчике — им предельно просто пользоваться. Окошко для текста и кнопка «Перевести» — вот и все, с чем вам предстоит иметь дело. Да еще нужно выбрать, что будет держать в руках симпатичный тролль — сердце или книгу.

При том, что программа явно не берется тягаться с именитыми коллегами, с переводом некоторых фраз она справляется куда лучше своих конкуренток. Кроме того, к основному результату программа прилагает дополнительные варианты и уточняет написание слова, если не может найти к нему подходящего перевода. В целом, мило, легко в обращении и местами на удивление эффективно.

Рейтинг ЛКИ: 75%

Babel Fish

Лицензия:
свободное пользование через интернет
Адрес в сети:
Языки интерфейса:
английский
Языки перевода:
тринадцать, включая два варианта китайского и японский
Возможен перевод целых сайтов

Одна из первых систем машинного перевода в интернете, «Вавилонская рыба», названа так в честь сорта рыбы из книги Дугласа Адамса «Автостопом по галактике». Стоит воткнуть такую рыбешку себе в ухо — и сразу начинаешь понимать любой язык.

Оправдывает ли программа свое название? Качество перевода объективно уступает возможностям чудо-рыбки. Многие слова так и остаются непереведенными — от греха подальше. Хотя порой лучше так, чем вводить пользователя в заблуждение. Уровень у программы достойный, особенно когда речь идет о латинской группе языков, хотя в последние годы она все же сдает позиции.

Во всех машинных переводчиках важно не только количество поддерживаемых языков, но и связки между ними. Если программа позволяет перевести текст с китайского на английский и с испанского на английский, это еще не значит, что она переведет китайскую фразу на испанский. Хотя Babel Fish переводит более чем с десяти языков, к сожалению, русский здесь связан только с английским. Поэтому, чтобы перевести текст на какой-либо третий язык, нужно минимум два последовательных перевода — что может быть чревато «испорченным телефоном».

Пользователи Internet Explorer и Mozilla Firefox могут бесплатно скачать и установить для своего браузера панель быстрого доступа к переводу через Babel Fish.

Рейтинг ЛКИ: 80%
Сколько миль до Вавилона?

Любопытную возможность предоставляет сайт tashian.com/multibabel. Здесь можно быстро, легко и наглядно получить ответ на вопрос: что будет, если перевести фразу с одного языка на другой, а потом назад, и так пять раз на основе машинного переводчика Babel Fish?

Результат предсказуемо плачевен. Помните игру «испорченный телефон»? Так и здесь. С каждым шагом что-то в тексте теряется, что-то, вовсе в него не заложенное, возникает. Вывод: старайтесь не прогонять один и тот же текст через серию переводов. Каждый следующий подход уменьшает ваши шансы хоть частично понять первоначальный смысл.

И не стоит думать, что такие проблемы возникают только у пользователей машинных переводчиков. В книге Эдуарда Вартаньяна «Путешествие в слово» описано, как два десятка профессионалов последовательно, начиная с русского текста и через двадцать языков мира, переводили одно предложение из повести Гоголя «Повесть о том, как поссорились Иван Иванович с Иваном Никифоровичем».

Предложение было такое: «Она сплетничала и ела вареные бураки по утрам и отлично хорошо ругалась — и при всех этих разнообразных занятиях лицо ее ни па минуту не изменяло своего выражения, что обыкновенно могут показывать одни только женщины». Пройдя через жернова высококачественного литературного перевода, предложение усохло и совершенно исказилось. Вот каким оно стало: «Выпив компот, она выбросила из хижины старье, а он радостно забил в тамтам». А ведь каждый переводчик старался перевести точно и красиво.

Так что возрождение времен, когда падение Вавилонской башни еще не отделило людей друг от друга стенами языков, нам пока не грозит ни с помощью техники, ни без нее. Остается лишь радоваться многообразию земных наречий. С одним общим языком было бы куда скучней, хотя и проще.

Pragma он-лайн

Лицензия:
свободное пользование через интернет
Адрес в сети:
Языки интерфейса:
русский, украинский, английский
Языки перевода:
русский, английский, латышский, немецкий, украинский, французский, польский

Творение украинской фирмы, Pragma активно продвигается в среду передовых машинных переводчиков. Программа основана на перспективных идеях автоматической обработки текста, в частности на системе «специальных переводов».

Чтобы получить более качественный перевод узкоспециализированного текста, можно выставить один из пяти режимов перевода: «бизнес», «информатика», «техника», «закон» или «спорт». Тогда спорные места в тексте программа будет интерпретировать в пользу заданной тематики, что повышает шанс адекватного перевода.

Отметим, что лучше всего программа переводит связку русский-украинский, и дело не только в близости этих двух языков. Другие «козырные» языки — польский и латышский. С прочими дело обстоит чуть хуже, но ненамного.

Рейтинг ЛКИ: 80%

Instant Messenger Translator 3.0

Лицензия:
свободно распространяемая
Адрес в сети:
Языки интерфейса:
английский
Языки перевода:
русский (с транслитерацией), английский, немецкий, французский, испанский, португальский, итальянский

IM Translator работает на основе тех же принципов, что и PROMT, но у него узкая специализация. Он предназначен для автоматизации перевода текстовых сообщений с одного языка на другой в таких программах, как ICQ, AIM, MSN и Yahoo Messenger. Теперь достаточно выделить в окне чата непонятное вам словосочетание, и через мгновение перед вами предстанет его перевод. Собственные сообщения можно переводить перед отправкой с той же легкостью, всего двумя нажатиями горячей клавиши.

Интерфейс программы интуитивно понятен. Плохо только, что глаза все время мозолит навязчивая реклама. Но и это поправимо: есть компактный режим, в котором работать предельно удобно, а рекламы нет.

Рейтинг ЛКИ: 85%

Google Translation

Лицензия:
свободное пользование через интернет
Адрес в сети:
Языки интерфейса:
английский
Языки перевода:
двадцать три, включая арабский и хинди
Возможен перевод целых сайтов

В 2005-м году продукт компании Google победил на многих международных конкурсах машинных переводчиков. По скорости работы, удобству пользования и функциональности Google Translation — главный соперник PROMT. Но, заметно обходя отечественную разработку по количеству и экзотичности доступных для перевода языков, он все же немного уступает в качестве. Порой, если нужно перевести, скажем, с хинди на русский, выбирать не приходится. Но если альтернатива есть — впору задуматься.

Закономерно, что детище передовой поисковой системы умеет делать поиск с переводом. Суть такова: вы вводите слово на языке, который знаете, и указываете программе язык поиска. Она переводит слово, ищет сайты, где таковое присутствует, а потом выводит вам ссылки на них, причем сразу перегоняет их на язык первоначального запроса.

Также особо стоит упомянуть дополнительный инструментарий Google Translate. С его помощью пользователь сервиса может добавить на свой сайт модуль автоматического транслирования страниц с одного языка на другой, а также настроить в браузере мгновенный перевод слов с английского при наведении на них курсора.

Рейтинг ЛКИ: 85%
История вопроса

Концепции автоматизированных вычислительных устройств и машинного перевода родились почти одновременно. Еще в XIX веке Чарльз Беббидж обещал правительству Великобритании, что создаст для них вычислительную машину, способную переводить разговорную речь. Воз и ныне там.

Дождутся ли обещанного Беббиджем хотя бы его дальние потомки? Кто знает...

Другие изобретатели тоже пытались создать механические переводящие устройства еще до наступления компьютерной эры. Например, Петр Троянский в середине 1930-х годов получил в СССР патент, предложив не только автоматический двуязычный словарь, но и схему кодирования межъязыковых грамматических ролей, основанную на языке эсперанто. Тем не менее сейчас принято считать, что принципы современного машинного перевода были изложены только в 1947 году в письме директора естественнонаучного отделения Рокфеллеровского фонда Уоррена Уивера к Норберту Винеру. Уивер писал: «У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Все, что мне нужно, — это взломать код, чтобы извлечь информацию, заключенную в тексте».

За этим письмом последовала активная дискуссия среди специалистов, а через пять лет с громким успехом состоялся Джорджтаунский эксперимент. Была представлена очень ограниченная в своих возможностях программа. Она имела словарь в 250 единиц и шесть грамматических правил и осуществляла перевод с русского языка на английский. Казалось, что создание систем качественного автоматического перевода вполне достижимо в пределах нескольких лет.

После этого эксперимента возможности компьютерного перевода рассматривались в самом радужном свете, а будущее переводчиков-профессионалов, наоборот, представлялось очень и очень мрачным. Однако уже в 1966 году консультативный комитет по автоматической обработке языка при Национальной академии наук США ALPAC представил крайне пессимистический отчет о перспективах машинного перевода, после чего почти все работы в этой области были свернуты и практически заморожены до самого конца 1970-х годов, причем не только в США, но и в СССР и большинстве стран Европы. Только падение «железного занавеса», развитие международной коммерции и сети Интернет дали новый мощный толчок, подкрепленный финансовыми вливаниями, для исследований в этой сфере.

С середины 90-х годов перевод веб-страниц «на лету» постепенно становится одной из приоритетных задач всех систем машинного перевода. При этом, конечно, никто всерьез не рассматривает «чисто машинный перевод» как окончательный. Основные работы сейчас ведутся в сферах, которые принято обозначать аббревиатурами MAHT (Machine-Aided Human Translation, человеческий перевод с привлечением машин) и HAMT (Human-Aided Machine Translation, машинный перевод с участием человека).

SKIIN 3.42

Лицензия:
свободно распространяемая
Адрес в сети:
Языки интерфейса:
русский
Языки перевода:
только с английского на русский

В словаре этой программы около 45000 слов и словосочетаний — не слишком много. В работе переводчик предельно прост и, кроме непосредственно перевода, позволяет разве что сразу сохранить обработанный текст в формате RTF да посмотреть нехитрую статистику частоты употребления слов.

SKIIN уступает всем рассмотренным нами переводчикам в качестве, но среди бесплатных программ, работающих без подключения к интернету, выбирать не приходится. Если перебои в сети случатся некстати, такой запасной вариант может выручить.

Рейтинг ЛКИ: 70%

Наш выбор

PROMT

Лицензия:
свободное пользование через интернет
Адрес в сети:
Языки интерфейса:
русский, английский, немецкий, французский, испанский, португальский
Языки перевода:
русский, английский, немецкий, французский, испанский, португальский, итальянский
Возможен перевод целых сайтов

Первая версия данной программы увидела свет в 1998-м году, а последнее крупное обновление произошло буквально за пару дней до написания данной статьи. Сегодня PROMT — признанный мировой лидер по качеству перевода.

Думается, даже почти не владеющие английским языком читатели могут понять смысл следующего маленького диалога: «How do you do?» — «All right». Из всех программ нашей подборки лишь PROMT перевел его так: «Как дела?» — «Хорошо». У остальных получается нечто вроде: «Как вы делаете?» — «Все право». И это при самых простых настройках. А если перед вами сложный текст, стоит выбрать соответствующую ему тематику, чтобы программа подстроилась и порадовала вас своими результатами.

Чем еще примечателен PROMT? Он работает в простом и расширенном режимах. В расширенном режиме вы получаете доступ к панели инструментов для проверки орфографии, транслитерации непереведенных слов, набору текста с виртуальной клавиатуры и обращению к словарям. Результат перевода можно отправить по электронной почте или распечатать. Важно, что все языки здесь в связке с русским, а потому нет надобности в нескольких переводах одного текста. Как и Babel Fish, PROMT можно встроить в браузер.

Рейтинг ЛКИ: 90%

Translate.net 0.1.3154

Лицензия:
свободно распространяемая
Адрес в сети:
Языки интерфейса:
двенадцать, включая русский и украинский

Перед нами инструмент для одновременной работы с несколькими интернет-переводчиками. Вы задаете исходный язык, тему текста и язык перевода, а Translate.net сам обращается к переводчикам, словарям и даже Википедии и выводит на экран сводку результатов.

С помощью Translate.net можно наглядно сравнить качество нескольких машинных переводчиков и выбрать наиболее подходящий для вашего текста. А можно вручную сопоставить переводы и соорудить на их основе собственный, вбирающий все лучшее.

В программе нет ничего лишнего. Слева вверху экрана расположены варианты перевода, внизу — исходный текст. Справа вверху — список сервисов: задействованных, отключенных пользователем и тех, которыми по каким-либо причинам не удалось воспользоваться. Дополнительные настройки среди прочего позволяют выделять красным цветом непереведенные слова и менять размер и вид шрифта. Все изменения можно сохранить в отдельном профиле.

Текущая версия поддерживает около пятнадцати сервисов, включая наиболее популярные из перечисленных нами в данной статье. В следующих версиях количество обещает еще возрасти. Уже сейчас Translate.net — весьма удобная платформа для использования машинных переводчиков.

Рейтинг ЛКИ: 90%

Lingoes 2.4.5

Лицензия:
свободно распространяемая
Адрес в сети:
Языки интерфейса:
девятнадцать, включая русский

Еще одна программа для работы с внешними сервисами. Подключаемых сервисов и настроек у Lingoes больше, чем у Translate.net, но она ориентирована на работу со словарями, а не машинными переводчиками. В частности, она позволяет получить перевод любого заинтересовавшего вас слова в браузере или текстовом документе простым нажатием Ctrl и правой кнопки мыши.

Lingoes предоставляет быстрый доступ к множеству интернет-переводчиков. В дополнение к базовому комплекту можно загрузить дополнительные словари. Но пользоваться можно лишь одним переводчиком или словарем единовременно, поэтому сравнить уровень их работы затруднительно. И все же это лучше, чем целый день путешествовать по разношерстным сайтам.

А тем, кому перевода текста мало, Lingoes предлагает сопоставить валюты разных стран, всевозможные меры и временные пояса. Или дает возможность полюбоваться на таблицу Менделеева и получить исчерпывающую информацию о любом из ее элементов и подсчитать молярную массу какого-нибудь соединения здесь же, на встроенном калькуляторе.

Рейтинг ЛКИ: 85%

И тут коза закричала нечеловеческим голосом

За чтением некоторых творений машинных переводчиков можно весело провести вечер. Частенько они выдают такие фразочки, что нарочно не придумаешь. Зато уж если программа чудит, то чудит последовательно, и наметанным взглядом можно по ходу чтения сразу вносить в текст привычные коррективы. Пожалуй, в использовании переводчиков нужно соблюдать здоровую меру. Чрезмерно частое чтение обработанных машинными переводчиками текстов может плохо сказаться на восприятии и собственном стиле пользователя.

Что же до перспектив автоматического перевода... Конечно, живого профессионала никакая программа не заменит. Во всяком случае, в обозримом будущем. Но качество переводов потихоньку растет, на рынке потребность в подобных программах все выше, а спрос, как известно, рождает предложение. Конкуренция уже сейчас высока и только усиливается. Как знать, возможно, однажды искусственный разум сумеет преподнести какому-нибудь японцу «Преступление и наказание» так, чтобы тот по достоинству оценил гений Достоевского и скромного переводчика его произведения.

Статьи появляются на сайте не ранее, чем через 2 месяца после публикации в журнале.
ЧИТАТЕЛЬСКИЙ
РЕЙТИНГ
МАТЕРИАЛА
7.9
проголосовало человек: 41
1 2 3 4 5 6 7 8 9 10
вверх
Rambler's Top100 Рейтинг@Mail.ru Яндекс цитирования