CORSO DI DOTTORATO (XXIII CICLO) SU
DATA MINING

  


Slides

  • Introduzione
  • Data Warehouses
  • Classificazione con alberi di decisione (e metodi di valutazione); altri metodi (a regole, Bayesiani, K-nn e ensemble)
  • Clustering
  • Pattern frequenti

  • Esercizio di ottimizzazione del numero di calcoli di distanza tra punti

  • Libri e Articoli

  • Introduction to Data Mining Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Addison Wesley, 2006.
  • Data Mining - Concepts and Techniques Jiawei Han, Micheline Kamber, Morgan Kaufmann, II edizione, 2006.
  • On the Computation of Multidimensional Aggregates by S. Agarwal, R. Agrawal, P.M. Deshpande, A. Gupta, J.F. Naughton, R. Ramakrishnan, S. Sarawagi


  • Calendario delle lezioni
    Martedì 5 febbraiosala seminariore 14-16:30
    Giovedì 7 febbraiosala seminariore 14-16:30
    Lunedì 11 febbraiosala seminariore 14-16:30
    Venerdì 15 febbraiosala seminariore 14-16:30
    Lunedì 18 febbraiosala seminariore 14-16:30
    Venerdì 22 febbraiosala seminariore 14-16:30
    Martedì 26 febbraiosala seminariore 14-16:30
    Giovedì 28 febbraiosala seminariore 14-16:30


    Articoli da confrontare per il rapporto finale d'esame:

  • Leo Breiman: Random Forests, in Machine Learning, 45(1), 2002. Paper (PDF)
  • Johannes Gehrke, Raghu Ramakrishnan, Venkatesh Ganti: RainForest - A Framework for Fast Decision Tree Construction of Large Datasets, in Proc. VLDB 1998: 416-427. Paper (PDF)

  • Ultima versione: 30 Gennaio 2008