Истоки ТМ-инструментов

Тема 2. Системы памяти переводов (Translation Memory): концепция и реализации

 

1. Истоки ТМ-инструментов

2. Состав системы ТМ

3. Идеология ТМ-инструментариев

4. Общий принцип ТМ

5. Обзор основных программ класса Translation Memory:

- ТРАДОС 3.0

- SDLX 3.0

- DejaVu

- Star Transit

- ABBYY Aligner

6. Преимущества и недостатки ТМ

7. Память переводов и вспомогательные программы для перевода

 

Общеизвестно, что наше время характеризуется глобальной интеграцией всех стран мира. Это ведёт к увеличению необходимости перевода языковых потоков в режиме реального времени. Более того, в современном мире перевод всё больше уходит от исключительно творческого характера и дополнительно приобретает характер ремесла и даже индустрии. В первую очередь это относится к переводу технических и юридических (и частично научных) текстов. Назовём этот тип перевода «промышленным». Как любой индустрии, промышленному переводу необходимы адекватные инструменты.

Истоки ТМ-инструментов

Рассматривая проблемы систем МП, нельзя не упомянуть имя японского ученого Макото Нагао из университета Киото, руководителя японской национальной программы по машинному переводу. В 1982 г. в одной из своих статей он предложил новую концепцию машинного перевода, которая была основана на утверждении, что тексты должны переводиться по аналогии с текстами, ранее переведенными вручную. Для этого целенаправленно формируется большой массив билингв (исходных текстов и их переводов), который вводится в мощный компьютер с большим объемом памяти. В процессе перевода новых текстов специальная поисковая система выбирает аналоги фрагментов этих текстов из массива билингв. Макото Нагао назвал свой подход к техническому переводу с английского на русский язык „Example based translation“ (перевод, основанный на примерах). Идея Макото Нагао была использована некоторыми разработчиками систем МП, но наибольшее распространение она получила в связи с развитием новейшей технологии перевода – систем класса Translation Memory (память переводов), которые в последнее время чаще называют ТМ-инструментами.

 

На Западе технология TM и созданный на ее базе инструментарий переводчика – Translation Memory Tools (TMT) – хорошо известны и широко применяются. Особенностью такой технологии является механизация переводческой деятельности, а не ее автоматизация в том виде, каком ее видели создатели технологии MT. Причем это более скромное, на первый взгляд, решение принесло практической пользы неизмеримо больше, чем глобальный замысел «электронных переводчиков».

 

Отличие от электронных словарей и других инструментов переводчика заключается в том, что типичная программа класса ТМ основана на нейронных сетях, которые способны в определенной степени моделировать работу человеческого мозга при обработке данных. Эти сети способны обучаться и анализировать сложные наборы данных, которые сложно обрабатывать с помощью линейных алгоритмов.

 

В этих программах используются размытый алгоритм, позволяющий отыскивать слова не только в их словарных формах, но и в других формах, например, в другом падеже. Кроме того, они могут находить словосочетания в другом порядке слов. Самоорганизующаяся искусственная нейронная сеть способна находить закономерности и определять взаимосвязи между ними. Программа сравнивает тот фрагмент, над которым вы сейчас работаете, с содержимым базы данных, и предоставляет эту информацию на дисплей. Она может установить, что данный фрагмент похож на аналогичный фрагмент, имеющийся в памяти системы, например, на 99%, на 74%, или даже на 20%.