Maschinelles Lernen und Maschinelles Sehen
Neuigkeiten
Paper auf der European Conference on Computer Vision (ECCV) 2024 akzeptiert (Oral)
Das Paper "A Fair Ranking and New Model for Panoptic Scene Graph Generation" von Julian Lorenz, Alexander Pest, Daniel Kienzle, Katja Ludwig und Rainer Lienhart wurde für die ECCV 2024 als Oral Paper akzeptiert.
In der Veröffentlichung werden signifikante Fehler in der bisher verbreiteten Evaluierung von Panoptic Scene Graphs aufgezeigt. Die Autoren präsentieren eine Lösung für dieses Problem und werten existierende Veröffentlichungen auf den neuen Erkenntnissen aus.
Abschließend stellen die Autoren eine verbesserte neue Modellarchitektur für Panoptic Scene Graph Generation vor.
Weitere Informationen sind unter https://lorjul.github.io/fair-psgg/ zu finden.
Paper auf der International Conference on Multimedia Information Processing and Retrieval (MIPR) 2024 akzeptiert
Das Paper mit dem Titel "Segformer++: Efficient Token-Merging Strategies for High-Resolution Semantic Segmentation" von Daniel Kienzle, Marco Kantonis, Robin Schön und Rainer Lienhart wurde auf der IEEE International Conference on Multimedia Information Processing and Retrieval (MIPR) 2024 akzeptiert. Das Paper beschreibt eine neue Methode, um die Effizienz von Transformermodellen zu steigern. Die beschriebenen Methoden ermöglichen den Einsatz von rechenintensiven Transformermodellen für hochauflösender Bilder.
Weitere Informationen zu diesem Paper sind unter
Paper für den Workshop eLVM@CVPR 2024 akzeptiert
Ein Paper mit dem Titel „Adapting the Segment Anything Model During Usage in Novel Situations“ von Robin Schön, Julian Lorenz, Katja Ludwig und Rainer Lienhart wurde auf dem Workshop für „Efficient Large Vision Models (eLVM)“ akzeptiert. Dieser Workshop findet im Rahmen der CVPR 2024 in Seattle statt. Das Paper stellt eine Methode vor, um das Segment Anything Model (SAM) ohne Zuhilfenahme von zusätzlichen Trainingsdaten zur Testzeit anzupassen. Anstelle dessen werden Information, welche während der Verwendung des Systems anfallen, zur Generierung von Pseudolabels verwendet.
Kontakt
Anschrift
Prof. Dr. Rainer Lienhart
Lehrstuhl für Maschinelles Lernen und Maschinelles Sehen
Institut für Informatik
Universität Augsburg
Universitätsstr. 6a
D -
89159 AugsburgGermany
Telefon
+49 (821) 598-5703
rainer.lienhart @informatik.uni- augsburg.de