Презентация
  • формат pdf
  • размер 2,94 МБ
  • добавлен 16 октября 2012 г.
Введение в обработку текстов. Лекция 2. Регулярные выражения и конечные автоматы
Турдаков Д.Ю.
- М.: Институт системного программирования РАН; Факультет Вычислительной математики и кибернетики МГУ, 2012. – 35 слайдов.
Математический спецкурс для 3-5 курсов.
Спецкурс предназначен для студентов 3-5 курсов, желающих получить знания и практические навыки в области обработки текстовой информации. Курс знакомит слушателей с основными проблемами компьютерной обработки текстов и современными подходами к их решению. Рассматриваются как фундаментальные понятия и идеи, так и современные исследования в данной области. Особое внимание уделяется применению методов машинного обучения, которые активно развиваются в настоящее время и показывают лучшие результаты.
Актуальность обработки текстовой информации на естественном языке связана с ростом количества документов, доступных для автоматической обработки, потребностью в их анализе и наличием вычислительных ресурсов. Слушатели получат базовые знания в области обработки текстов на естественном языке, понимание проблем, возникающих при разработке систем текстового анализа, и подходов к их решению.
Содержание:
Формальные языки.
Пример формального языка.
Регулярные выражения.
Мотивация.
Практические примеры.
Конечные автоматы (КА).
Использование КА для распознавания языка.
Представление автоматов.
Формальное определение.
Алгоритм распознавания для детерминированного КА.
Недетерминированные КА (НКА).
Распознавание для НКА.
ДКА и НКА.
Регулярные языки и связь регулярных выражений и конечных автоматов.
Регулярные языки.
Регулярные языки и регулярные выражения.
Построение автомата для регулярных выражений.
Задания для тренировки.