ПоставщикамБлог

Машинный перевод

Машинный перевод

Машинный перевод – это автоматический перевод с одного естественного языка на другой с помощью компьютерных программ. Обычно его, вместе с компьютерным переводом, относят к категории электронного перевода. Машинный перевод является подразделом компьютерной лингвистики, который исследует использование программного обеспечения для перевода текста или речи с одного языка на другой.

Классификация систем машинного перевода возможна по нескольким критериям: степень участия переводчика-человека; тип перевода – общий или специализированный; используемая системная архитектура. Программы автоматизированного перевода полностью обрабатываю тексты без какого-либо вмешательства операторов. 

В зависимости от системной архитектуры, виды машинного перевода можно условно разделить на корпусный и основанный на правилах. А при разработке систем машинного перевода использовались два подхода: прямой и косвенный.

Системы машинного перевода, созданные до начала 1980-х годов, использовали преимущественно прямой подход. Такие системы работают с парами языков, используя статьи двуязычных словарей и морфологического анализа. Они переводят исходный текст слово в слово, без подробного анализа синтаксических структур вводимого текста и корреляции значений, после чего в тексте перевода делаются некоторые элементарные поправки в соответствии с морфологическими и синтаксическими правилами целевого языка.

В 1980-х годах  косвенный подход, имеющий более сложную архитектуру, стал доминирующим методом машинного перевода. Устройства, в которых использован этот подход, анализируют синтаксическую структуру текста, обычно создавая абстрактное (промежуточное) представление о значении оригинала и создавая на его основе текст на целевом языке. В таких устройствах применяются программы машинного перевода, которые идентифицируют структуру слова (морфологию) и предложения (синтаксис) и решают проблемы омонимии (семантики).

Для удобства работы с переводами, переводчики-фрилансеры и компании используют CAT tool, или CAT программу, которая отлично подходит для организации переводческой работы в офисах компаний. Это по сути комплексное решение по автоматизации переводов, система компьютерного перевода, которая имеет набор полезных функций и удобно для использования.

CAT tool (Computer-assisted translation tool) – это современное комплексное решение для переводчиков и компаний, которые занимаются профессиональными переводами. Основная задача CAT инструмента – сократить время на перевод документа за счет машинного перевода, подставления готовых частей перевода из памяти переводов, автоматического перевода согласно глоссариям, автоматической проверки качества перевода и других инструментов автоматизации перевода.

Системы компьютерного перевода так же позволяют использовать проверку правописания, грамматики, управлять терминами, использовать специфические словари, использовать базы данных терминов, индексаторы текста, совершать слияние перевода и исходного текста, управлять проектами, памятью переводов, и автоматизировать переводческий труд.

Наиболее популярные продукты категории Машинный перевод Все продукты категории

PROMT TRANSLATION SERVER
6
11
PROMT
10
14

F.A.Q. Машинный перевод

Как работает машинный перевод?

Это зависит от типа двигателя машинного перевода. Существует несколько разных видов программного обеспечения MT, которые работают по-разному. Мы представим правила, статистические и нейронные.

Основанный на правилах машинный перевод (RBMT) является прародителем программного обеспечения MT. Он основан на наборах грамматических и синтаксических правил и фразеологии языка. RBMT связывает структуру исходного сегмента с целевым сегментом, создавая результат на основе анализа правил исходного и целевого языков. Правила разрабатываются лингвистами, и пользователи могут добавлять терминологию, чтобы переопределить MT и улучшить качество перевода.

Статистический машинный перевод (SMT) начался в эпоху больших данных и использует большое количество существующих переведенных текстов и статистических моделей и алгоритмов для генерации переводов. Эта система в значительной степени зависит от доступных многоязычных корпусов, и в среднем требуется два миллиона слов, чтобы обучить движок для конкретной области, что может потребовать много времени и ресурсов. При использовании доменных данных SMT может производить переводы хорошего качества, особенно в технической, медицинской и финансовой областях.

Нейронный машинный перевод (NMT) - это новый подход, основанный на глубоких нейронных сетях. В NMT используется множество сетевых архитектур, но обычно сеть можно разделить на два компонента: кодер, который считывает входное предложение и генерирует представление, подходящее для перевода, и декодер, который генерирует фактический перевод. Слова и даже целые предложения представлены как векторы действительных чисел в NMT. По сравнению с предыдущим поколением МТ, NMT генерирует результаты, которые имеют тенденцию быть более плавными и грамматически точными. В целом, NMT является важным шагом в качестве МП.

Когда следует использовать машинный перевод?

При переводе творческого или литературного контента MT не подходит. Хорошее правило - чем сложнее ваш контент, тем менее он подходит для MT. Для больших объемов контента, особенно если он имеет короткий срок выполнения, MT очень эффективен. Если точность не важна, MT может произвести подходящие переводы за небольшую  стоимость. Отзывы клиентов, мониторинг новостей, внутренние документы и описания продуктов - все это хорошие кандидаты для МТ. Использование комбинации MT с постредактором-переводчиком-человеком открывает двери для более широкого спектра подходящего контента.

Какой движок MT лучше использовать?

 Общедоступные движки предназначены для того, чтобы иметь возможность переводить большинство типов контента, однако с помощью пользовательских движков MT данные обучения могут быть адаптированы к конкретному домену или типу контента.

В конечном итоге, выбор движка MT - это процесс. Вам нужно выбрать тип контента, который вы хотите перевести, пересмотреть политики безопасности и конфиденциальности, выполнить тесты на образцах текста, выбрать постредакторы. И, если вы используете систему управления переводами (TMS), убедитесь, что она способна поддерживать выбранный вами движок MT.

Материалы