Презентация
  • формат pdf
  • размер 926,81 КБ
  • добавлен 21 декабря 2012 г.
Deductor. Аналитическая платформа. Методы очистки и обогащения персональных данных
BaseGroup Labs. – 21 слайд.
(Автор не указан).
Описываемый функционал входит в состав программного комплекса «Deductor», разработанного компанией «BaseGroup Labs».
Содержание:
Проблема.
Решение.
Стандартизация: понятие.
Стандартизация: парсинг.
Стандартизация: словари.
Стандартизация: регулярные выражения.
Очистка данных: понятие.
Очистка: частотный анализ.
Очистка: контрольные числа.
Очистка: схожесть строк.
Очистка: дедубликация.
Очистка: другие методы.
Обогащение: понятие.
Обогащение: интеграция с источниками.
Обогащение: анализ связей.
Обогащение: поиск близких объектов.
Обогащение: другие методы.
Резюме.
Результат.