
570
Библиотечные технологии в телеобучении
Для перевода объемных текстов с большим количеством повторов
применяется третья технология, использующая концепцию «Translation
Memory». Работа подобной системы основана на использовании баз соот-
ветствий смысловых единиц на разных языках. Перед началом работы с
такой системой нужно создать эту базу соответствий или воспользоваться
готовой. Как правило, для каждой задачи создается своя собственная база
соответствий. В результате предложения или их части, отсутствующие в
базе, не будут обрабатываться вообще, но зато те, что есть, будут перево-
диться всегда правильно. Именно по этой причине применение технологии
баз соответствий оправдано лишь для объемных текстов с многочислен-
ными повторами. Программы, опирающиеся на концепцию «Translation
Memory», оказываются полезным подспорьем для офис-менеджеров, тех-
нических работников и руководителей всех уровней, имеющих дело с ана-
лизом различных руководств, документации, служебной переписки, в ко-
торых употребляются стандартные тексты.
Многообещающим можно назвать подход в технологии машинно-
го перевода, основанный на выявлении и анализе глубинных смысловых
структур текста и их связи с теми словами, которыми выражается смысл.
Этот подход, имеющий общее с «interlingua-технологией», можно назвать
семантическим походом
1
. Не останавливаясь на малозначительных раз-
личиях в разных трактовках, принцип семантического подхода можно
описать следующим образом. Сначала для каждого предложения перево-
димого текста автоматически выявляются основные смысловые атрибуты
– фигурирующие в тексте ситуации и сущности, в них вовлеченные (так
называемые предикаты). Затем нужно определить, какие семантические
отношения определены в предложении между предикатами. Это означает,
что смысл предложения выражается графом, в узлах которого стоят слова
или единицы, равные по объему словам. Например, числительные, кото-
рые в русском языке выражаются многословной конструкцией, сливаются
в один узел. Или, например, связка «есть», которая в русском языке иног-
да опускается («она студентка»), должна быть восстановлена в отдельный
узел. Такая смысловая структура предложения позволяет абстрагировать-
ся от малоинформативных элементов формально-синтаксической струк-
1
Сокирко А.Н. Будущее машинного перевода // Компьютерра. 2003. № 21. С.43–47.
Калинин М.В. Система смыслового машинного перевода PEREVEDI.RU // Труды между-
народного семинара по компьютерной лингвистике «Диалог». 2003. http://www.dialog-
21.ru/Archive/2003/Kalinin.htm.