Slides
Introduzione
Data Warehouses
Classificazione con alberi di decisione (e metodi di valutazione); altri metodi (a regole, Bayesiani, K-nn e ensemble)
Clustering
Pattern frequenti
Esercizio di ottimizzazione del numero di calcoli di distanza tra punti
Libri e Articoli
Introduction to Data Mining Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Addison Wesley, 2006.
Data Mining - Concepts and Techniques Jiawei Han, Micheline Kamber, Morgan Kaufmann, II edizione, 2006.
On the Computation of Multidimensional Aggregates by S. Agarwal, R. Agrawal, P.M. Deshpande, A. Gupta, J.F. Naughton, R. Ramakrishnan, S. Sarawagi
Calendario delle lezioni |
Martedì 5 febbraio | sala seminari | ore 14-16:30 |
Giovedì 7 febbraio | sala seminari | ore 14-16:30 |
Lunedì 11 febbraio | sala seminari | ore 14-16:30 |
Venerdì 15 febbraio | sala seminari | ore 14-16:30 |
Lunedì 18 febbraio | sala seminari | ore 14-16:30 |
Venerdì 22 febbraio | sala seminari | ore 14-16:30 |
Martedì 26 febbraio | sala seminari | ore 14-16:30 |
Giovedì 28 febbraio | sala seminari | ore 14-16:30 |
Articoli da confrontare per il rapporto finale d'esame:
Leo Breiman: Random Forests, in Machine Learning, 45(1), 2002. Paper (PDF)
Johannes Gehrke, Raghu Ramakrishnan, Venkatesh Ganti: RainForest - A Framework for Fast Decision Tree Construction of Large Datasets, in Proc. VLDB 1998: 416-427. Paper (PDF)
Ultima versione: 30 Gennaio 2008
|