ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΕΠΙΣΤΗΜΗ ΔΕΔΟΜΕΝΩΝ & ΜΗΧΑΝΙΚΗ ΜΑΘΗΣΗ»
ΔΙΑΤΜΗΜΑΤΙΚΟ ΠΡΟΓΡΑΜΜΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΣΠΟΥΔΩΝ «ΜΑΘΗΜΑΤΙΚΗ ΠΡΟΤΥΠΟΠΟΙΗΣΗ ΣΕ ΣΥΓΧΡΟΝΕΣ ΤΕΧΝΟΛΟΓΙΕΣ & ΤΗ ΧΡΗΜΑΤΟΟΙΚΟΝΟΜΙΚΗ»
«ΣΤΟΧΑΣΤΙΚΕΣ ΔΙΕΡΓΑΣΙΕΣ & ΒΕΛΤΙΣΤΟΠΟΙΗΣΗ ΣΤΗ ΜΗΧΑΝΙΚΗ ΜΑΘΗΣΗ»
Εαρινό Εξάμηνο 2024: Αίθουσα 002, Τρίτη 8:45 – 10:30 και εργαστηριακή άσκηση 10:30 – 11:30 (Έναρξη Τρίτη 20/2/2024)
Διδάσκων: Ομότιμος Καθηγητής Βασίλης Μάγκλαρης
Υποστήριξη: ΕΕΔΙΠ Μαίρη Γραμματικού, Δρ. Νίκος Κωστόπουλος, Υπ. Δρ. Δημήτρης Πανταζάτος
Course Outline in English is available here
Περιγραφή:
Επισκόπηση Αλγορίθμων Βελτιστοποίησης στη Μηχανική Μάθηση: Σχέση Μηχανικής Μάθησης (ML) και Τεχνητής Νοημοσύνης (AI). Επιβλεπόμενη, μη επιβλεπόμενη, ενισχυτική μάθηση. Διακριτικά (Discriminative) & Παραγωγικά (Generative) Μοντέλα, το ChatGPT (Chat Generative Pre-trained Transformer). Σύνολα δεδομένων Training, Validation & Testing Datasets. Linear & Logistic Regression
Νευρωνικά Δίκτυα, κανόνας του Hebb. Προσδιορισμός παραμέτρων με επιβλεπόμενη μάθηση, Rosemblatt’s Perceptron, Back-Propagation Algorithm
Μη Επιβλεπόμενη Μάθηση: K -Means Clustering, Ανάλυση Κυρίων Συνιστωσών (Principal Components Analysis – PCA), Self-Organizing Maps (SOM), Autoencoders
Βασικές Έννοιες Στατιστικής Μηχανικής στη Μηχανική Μάθηση: Αλυσίδες Markov, ταξινόμηση καταστάσεων, πιθανότητες μετάβασης, εξισώσεις Chapman – Kolmogorov, επαναληπτικότητα – παροδικότητα, αναλλοίωτες κατανομές, ασυμπτωτική συμπεριφορά
Μέθοδοι Monte Carlo προσομοίωσης αλυσίδων Markov, αλγόριθμος Metropolis – Hastings. Προσομοιωμένη Ανόπτηση (Simulated Annealing), δειγματοληψία Gibbs. Παραγωγικά Μοντέλα Μάθησης (Generative Models), Μηχανή Boltzmann, Restricted Boltzmann Machine (RBM), Δίκτυα Πεποίθησης Μεγάλου Βάθους (Deep Belief Nets – DBN)
Ενισχυτική Μάθηση και Δυναμικός Προγραμματισμός: Διαδικασίες Απόφασης Markov (Markov Decision Processes), κριτήριο βελτιστοποίησης Bellman (Bellman’s Optimality Criterion), αλγόριθμοι Δυναμικού Προγραμματισμού (Value & Policy Iteration algorithms). Προσεγγιστικές μέθοδοι δυναμικού προγραμματισμού, Temporal Difference (TD) & Q-Learning
Ενισχυτική Μάθηση για Δρομολόγηση στο Internet: Αλγόριθμος Bellman – Ford, Border Gateway Protocols (BGP)
Αλγόριθμοι Πυρήνα και Διαχωρισιμότητα Προτύπων: Θεώρημα του Cover, εφαρμογές σε Radial-Basis Function (RBF) Networks, Υβριδική Μάθηση, Support Vector Machines (SVM)
Μη-παραμετρικοί Ταξινομητές, ταξινόμηση σύμφωνα με γνωστές κλάσεις K γειτονικών στοιχείων μάθησης, K -Nearest Neighbors (KNN)
Στατιστική αξιολόγηση δυαδικής ταξινόμησης, Confusion Matrix, Receiver Operating Characteristics (ROC) & Area Under the Curve (AUC), Παραμετρική Πιθανοτική Ταξινόμηση – κανόνας Bayes, προσεγγιστικές μέθοδοι, αλγόριθμος Naïve Bayes
Δένδρα Αποφάσεων (Decision Trees): Αλγόριθμοι διαμόρφωσης CART (Classification And Regression Trees), Gini Index, Random Forests, αλγόριθμοι Bagging (Bootstrap & aggregating)
Αναδρομικά Νευρωνικά Δίκτυα (Recurrent Neural Nets – RNN): Μοντέλα Συσχετισμένης Μνήμης (Associative Memory ή Content Addressable Memory – CAM), δίκτυα Hopfield, RNNs & ακολουθιακά μοντέλα δεδομένων (time/character series, speech processing), δίκτυα Long-Short Term Memory (LSTM)
Επεξηγησιμότητα Τεχνητής Νοημοσύνης – eXplainable AI (XAI): Ορισμοί, Intrinsic & Model-Agnostic XAI Methods, PI (Permutation Feature Importance), SHAP (Shapley Additive exPlanations), LIME (Local Interpretable Model Agnostic Explanation)
Εργαστηριακές Ασκήσεις:
Στην Αίθουσα 2 της ΣΗΜΜΥ με χρήση εργαλείων – βιβλιοθηκών Python.
Προτεινόμενη Βιβλιογραφία:
- Simon Haykin, “Neural Networks and Learning Machines”, 3rd Edition, Pearson Education, 2009
- Simon Haykin, “Νευρωνικά Δίκτυα και Μηχανική Μάθηση”, 3η Έκδοση, Παπασωτηρίου, 2010
- Bernhard Mehlig, “Machine learning with neural networks”, Cambridge Univ. Press, 2021 https://arxiv.org/pdf/1901.05639.pdf
- Μιχάλης Λουλάκης, “Στοχαστικές Διαδικασίες”, ΣΕΑΒ, 2015
- Βασίλης Μάγκλαρης, “Σημειώσεις Μαθήματος Συστήματα Αναμονής”, ΣΗΜΜΥ – ΕΜΠ, 2018 http://www.netmode.ntua.gr/courses/undergraduate/queues/documents/Queuing_Systems_2018.pdf
- Kevin P. Murphy, “Machine Learning: A Probabilistic Perspective”, MIT Press, 2012
- Ian Goodfellow, Yoshua Bengio and Aaron Courville, “Deep Learning”, MIT Press, 2016 https://www.deeplearningbook.org/
- Daniel Jurafsky and James H. Martin, “Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition”, 3rd Edition draft, 2018
- Andrew Ng, “CS229 Lecture Notes“, Stanford University, Fall 2018 https://see.stanford.edu/materials/aimlcs229/cs229-notes1.pdf
- James Gareth, Daniela Witten, Trevor Hastie and Robert Tibshirani, “An Introduction to Statistical Learning with Applications in R“, 2nd Edition, Springer, 2021 https://hastie.su.domains/ISLR2/ISLRv2_website.pdf
- Richard Sutton and Andrew Barto, “Reinforcement Learning: An Introduction“, 2nd Edition, MIT Press, 2018
- Dimitri P. Bertsekas and John Tsitsiklis, “Neuro-Dynamic Programming”, Athena Scientific, Belmont MA, 1996
- Christopher Bishop, “Pattern Recognition and Machine Learning”, Springer 2006
- Tom Mitchell, “Machine Learning”, McGraw Hill, 1997 http://www.cs.cmu.edu/~tom/mlbook.html
- Charu C. Aggarwal, “Outlier Analysis”, Springer 2013 https://link.springer.com/chapter/10.1007/978-1-4614-6396-2_1
- Christoph Molnar, “Interpretable Machine Learning”, 2nd Edition, Munich, 2022 https://christophm.github.io/interpretable-ml-book/
- Leonida Gianfagna and Antonio Di Cecco, “Explainable AI with Python”, Springer 2021 https://link.springer.com/book/10.1007/978-3-030-68640-6
- Robert Hogg, Joseph McKean and Allen Craig, “Introduction to Mathematical Statistics“, 8th Edition, Pearson Education, 2020
- Frank Kelly, “Reversibility and Stochastic Networks“, Wiley, 1979 http://www.statslab.cam.ac.uk/~frank/BOOKS/book/whole.pdf
- Sheldon Ross, “Applied Probability Models with Optimization Applications“, Dover, 1992