Advanced Machine Learning and Computer Vision
ab 2. Semester
>>> Aufgrund eines Forschungssemesters wird die Vorlesung im WS22/23 nur digital in Form von Vorlesungsvideos angeboten <<<
Inhalte
Die Vorlesung gibt einen vertieften Einblick in alle Aspekte des maschinellen Lernens und des maschinellen Sehens. Die erlernten Konzepte werden in den Übungen anhand von erfolgreichen Beispielen aus der Praxis ausprobiert, geübt, analyisiert undbewertet. Die Inhalte der Vorlesung umfassen: Support Vector Machines, Grundbausteine von tiefen Neuronalen Netzen (Layerstrukturen, Normalisierung, Attention-Mechanismen), sowie aktuelle Referenzarchitekturen und -system für Bild-, Text-, Videoverarbeitung und deren Kombination mit weiteren Sensorsignalen.
Die Inhalte der Vorlesung sind unter anderem:
- ML-Tools: Support Vector Machines, Bipartite Graph Matching, Distance Transforms
- Aktuelle Standardarchitekturen des Deep Learnings (ResNe(X)t, MobileNet, HRNet, ConvNeXt)
- Embedding Learning, (Visual) Word Embeddings
- Generative Adversarial Networks, Cycle GANs
- Attention Mechanismen und Transformer Networks
- Semantische Segmentierung in Bildern
- 2D Human Pose Estimation
- Human Pose Estimation with parametric 3D mesh models
Hinweis: Diese Veranstaltung baut auf der Vorlesung INF-0316 „ Machine Learning and Computer Vision“ bzw. INF-0092 „ Multimedia II: Machine Learning and Computer Vision“ auf. Der erfolgreiche Abschluss eines dieser Module ist deshalb zwingende Teilnahmevoraussetzung.
Übungen
Es erscheint jede zweite Woche ein Übungsblatt zu den behandelten Vorlesungsinhalten. Darin werden die Konzepte der Vorlesung vorrangig in praktischen Beispielen umgesetzt. Zu den Übungsterminen wird jeweils abwechseln Hilfestellung zur Bearbeitung gegeben bzw. das vorige Übungsblatt besprochen. Der genaue Ablauf des Übungsbetriebs wird zu Beginn der Vorlesungszeit bekannt gegeben.
Literatur
Die relevante Literatur wird jedes Semester neu festgelegt.
Ein hilfreiches Standardwerk zum Thema Deep Learning:
- Ian Goodfellow, Yoshua Bengio, Aaron Courville. Deep Learning. MIT Press, 2016, ISBN-13: 978-0262035613 ( PDF)