21
2.  С  использованием  литературных  источников,  перечисленных  в  конце 
настоящих  методических  указаний,  составить  краткое  описание 
алгоритмов решения задач: 
2.1.  подготовка  данных  для  автоматизированного  анализа 
(алгоритмы  очистки  данных,  объединения  и 
трансформации,  понижения  порядка,  нахождения 
«выбросов» (Outlier Detection)); 
2.2.  классификации  и  регрессии (1R-алгоритм,  Naive Bayes, 
алгоритмы построения деревьев решений: TDIDT, ID3, C4.5); 
2.3.  поиска ассоциативных правил
 (алгоритм Apriori); 
2.4.  кластеризации (агломеративные  и  дивизимные  алгоритмы, 
алгоритм k-means, BIRCH-алгоритм, CLIQUE-алгоритм 
кластеризации данных с высокой размерностью). 
2.5.  Text Mining (алгоритмы  определения  новизны  текста (Novelty 
Mining),  алгоритмы  определения  событий  и  тенденций (Event, 
Trend Detection) ). 
 
СОДЕРЖАНИЕ ОТЧЕТА 
 
Краткие  теоретические  сведения  по  теме работы,  необходимые  для ее 
выполнения,  включая  определение  терминов  и  описание  используемых 
понятий. 
 
СПИСОК
 ЛИТЕРАТУРЫ 
 
1.  Bramer M. Principles of Data Mining / M. Bramer. – London: Springer-
Verlag London Limited, 2007. – 342 p. 
2.  Chakrabarti S. Data Mining: Know it All / S. Chakrabarti et al. – Burlington: 
Morgan Kaufmann Publishers by Elsevier Inc., 2009. – 477 p. 
3.  Han J. Data Mining: Concepts and Techniques / J. Han, M. Kamber. – San 
Francisco: Elsevier Inc., 2006. – 772 p. 
4.  Maimon O. Data Mining And Knowledge Discovery Handbook / O. 
Maimon, L. Rokach. – New York: Springer Science+Business Media, Inc., 
2005. – 1378 p. 
5.  Michael W. Berry Text Mining : Applications and Theory / M. Berry, J. 
Kogan. – Cornwall: John Wiley & Sons, Ltd, 2010. – 223 p.