Машинный перевод на основе правил

Машинный перевод на основе правил (RBMT от англ. rule-based machine translation) — обозначение технологий машинного перевода на основе лингвистической информации об исходном и переводящем языках. Такая информация извлекается, как правило, из словарей (как лингвистических, так и переводных), описаний грамматики языков, и структурируется в виде машиночитаемых правил, охватывающих основные семантические, морфологические и синтаксические закономерности каждого языка. На основе таких правил исходный текст последовательно, по предложениям преобразуется в текст перевода.

Системы машинного перевода на основе правил делятся на три группы:

Типичная система машинного перевода на основе правил может включать следующие компоненты:

  • лингвистические базы данных: двуязычные словари, справочники имён собственных и правила транслитерации, морфологические таблицы;
  • модуль перевода: грамматические правила, алгоритмы перевода.

Исторически использование систем правил в машинном переводе предшествовало применению корпусных методов, в связи с чем такой подход также называют классическим. Преимущества классических систем — синтаксическая и морфологическая точность, стабильность и предсказуемость результата, возможность настройки на предметную область; недостатки — трудоёмкость и длительность разработки, необходимость поддерживать и актуализировать лингвистические базы данных; «машинный акцент» при переводе. По мере развития технологий машинного перевода получил получил распространение гибридный подход, сочетающий как методы на основе правил, так и корпусные технологии (в том числе статистический перевод и перевод на основе примеров).

Примечания

[править | править код]
  1. Koehn, Philipp. Statistical Machine Translation. — Cambridge : Cambridge University Press, 2010. — P. 15. — ISBN 9780521874151. Архивная копия от 21 апреля 2022 на Wayback Machine
  2. Nirenburg, Sergei (1989). "Knowledge-Based Machine Translation". Machine Trandation 4 (1989), 5 - 24. 4 (1). Kluwer Academic Publishers: 5—24. JSTOR 40008396.

Литература

[править | править код]