Параллельный алгоритм вычисления семантической близости для больших коллекций документов

Искусственный интеллект

Информатика и вычислительная техника

degree

формат pdf
размер 434,55 КБ

Параллельный алгоритм вычисления семантической близости для больших коллекций документов

Михов О.В.
- М.: Факультет Вычислительной математики и кибернетики МГУ, 2011. – 32 с.

В данной работе рассмотрена задача вычисления семантической близости в сетях документов как подзадача задачи о решении лексической многозначности. Разработан и реализован параллельный алгоритм вычисления семантической близости в сетях документов, а также проведен ряд испытаний оценки производительности.

Содержание:
Актуальность проблемы, области применения.
Информационный поиск.
Машинный перевод.
Контент-анализ.
Обработка текстов.
Основная терминология.
Обзор работ в данной области.
Семантическая близость.
Википедия.
Выводы к главе.
Постановка задачи.
Обзор существующих решений.
Локальные методы.
Глобальные методы.
Исследование и построение решения задачи.
Исследование методов.
Локальные методы.
Парадигма «MapReduce».
Модуль распределенной файловой системы.
Модуль «MapReduce».
Описание практической части.
Использованный инструментарий.
Схема работы.
Шаблон «пары».
Шаблон «полосы».
Схема работы.
Шаг «Map1».
Шаг «Map2».
Шаг «Reduce».
Анализ представленного алгоритма.
Оценка производительности.
Конфигурация.
Анализ полученных результатов.

Похожие разделы