degree
  • формат pdf
  • размер 713,77 КБ
  • добавлен 17 октября 2012 г.
Исследование и разработка методов автоматического извлечения ключевых фраз из научных статей
Лексиков Н.А.
- М.: Факультет Вычислительной математики и кибернетики МГУ, 2012. – 37 с.
Содержание:
Извлечение ключевых фраз.
Оценка информативности.
Оценка эффективности.
Постановка задачи.
Обзор существующих решений рассматриваемой задачи или ее модификаций.
Фреймворк Sztergak.
Предварительная обработка статей.
Расширенный набор признаков.
Результаты и выводы.
Система Humb.
Общие принципы.
Выбор кандидатов ключевых фраз.
Тренировочный корпус.
Набор признаков.
Модель машинного обучения.
Пост-ранжирование.
Результаты.
Система Wingnus.
Предварительная обработка.
Определение кандидатов ключевых фраз.
Выбор кандидатов ключевых фраз.
Система KP-Miner.
Выделение кандидатов ключевых фраз.
Подсчет весов кандидатов.
Окончательная обработка кандидатов.
Исследование и построение решения задачи.
Предварительная обработка корпуса научных статей.
Предварительная обработка словаря терминов.
Отбор терминов встречающихся в статье из словаря.
Расчет весов информативности для отобранных терминов.
Ранжирование результатов и отбор терминов.
Описание практической части.
Обоснование выбранного инструментария.
Архитектура.
Схема работы.
Характеристики функционирования.
Эффективность.
Производительность.