• формат pdf
  • размер 4,78 МБ
  • добавлен 07 сентября 2013 г.
Сухотин Б.В. Выделение морфем в текстах без пробелов между словами
М.: Наука, 1984. — 97 с.
Книга содержит описание оптимизационных алгоритмов, предназначенных для выделения морфем в тексте на произвольном языке с фонематической орфографией без пробелов между словами, а также описание экспериментов по анализу русского текста объемом в 10 тыс. букв с помощью этих алгоритмов, в описание экспериментов входят частотный словарь цепочек неограниченной длины, списки морфем, покрытия текста морфемными границами и краткое описание программы для ЭВМ.
Краткое содержание:
Введение.
Принципы построения формальных определений лингвистических явлений.
Неопределенность и оптимизация.
К стратегии формального описания лингвистических явлений.
Развитие исследований по проблеме выделения морфем в текстах на произвольном языке.
Эксперименты по выделению морфем в тексте без пробелов между словами с применением оптимизационных алгоритмов.
Множество допустимых решений.
Единицы, подлежащие оценке.
Качество морфемы.
Частотный словарь.
Оптимизационная процедура.
Модификация оценок.
Модификация значений устойчивости в четвертом алгоритме.
Результаты экспериментов.
Фрагмент текста, обработанного первым алгоритмом.
Список морфем, полученный в результате работы второго алгоритма.
Фрагмент текста, обработанного вторым алгоритмом.
Список морфем, полученный в результате работы третьего алгоритма.
Фрагмент текста, обработанного третьим алгоритмом.
Список морфем, полученный в результате работы четвертого алгоритма.
Текст, обработанный четвертым алгоритмом.
Оценка результатов.
Пути улучшения алгоритмов морфологического анализа.
Описание программы, составленной по алгоритму морфологического анализа.
Представление текстов и словаря.
Список морфем, подвергающихся одновременной обработке.
Некоторые процедуры.
Сведения об обмене с внешней памятью.
Общая схема программы.
Вычисление устойчивостей (обработка словаря).
Схема вычисления устойчивостей (вариант).
Схема вычисления устойчивостей (вариант 2).
Обработка текста.
Заключение.