Christian Herdtweck |
| Adresse: | Spemannstr. 38 72076 Tübingen |
| Raum Nummer: | 105 |
| Tel.: | 07071 601 602 |
| Fax: | 07071 601 616 |
| E-Mail: | christian.herdtweck |
In meiner Doktorarbeit geht es um Computer Vision (Maschinensehen: Computern das Sehen beibringen). Genauer gesagt interessiere ich mich für die Prozesse, die aus einfachen Merkmalen aus den ersten visuellen Verarbeitungsebenen (wie zum Beispiel optischer Fluss, Kanten, Linien oder Intensitätsänderungen) andere, semantisch sinnvollere Repräsentationen erzeugen, die dann von spezifischeren visuellen Prozessen genutzt werden können um weiter zu verstehen was es ist, das man da sieht. Ich habe drei Prozesse auf dieser mittleren Verarbeitungsebene studiert:
Gist (betreut von Christian Wallraven)
Die meisten Computer Vision-Systeme konzentrieren sich auf auf eine bestimmte Aufgabe wie Objekterkennung oder Szenenklassifizierung. Es gibt jedoch Hinweise darauf, dass sich im menschliche Gehirn schon nach ein paar Hundert Millisekunden eine Repräsentation des visuellen Stimulus geformt hat, das zumindest Ahnungen von wichtigen Objekten, Szenentyp, Geometrie und Ansichtswinkel beinhaltet. Diese sogenannte Gist ist, was ich versuche im Computer nachzubilden, indem ich die Ergebnisse bereits existierende Algorithmen kombiniere um eine konsistente Darstellung der Szene zu erhalten.
Horizont (betreut von Christian Wallraven)
Diese Gist nachzubilden ist jedoch nicht so einfach, denn es ist schwer diese frühen visuellen Prozesse zu identifizieren und herauszufinden, wie sie interagieren. Ich habe mich daher zunächst auf eine einfachere Aufgabe konzentriert: den Horizont in einem Bild zu finden, was dasselbe wie eine Schätzung der Kameraneigung zum Zeitpunkt der Aufnahme ist. Wir Menschen können diese Aufgabe ganz leicht innerhalb von 150 Millisekunden lösen und nutzen das Ergebnis vielleicht dazu, uns in der dargestellten Szene zu orientieren und die grobe Bildstruktur einzuschätzen.
Eigenbewegung (betreut von Cristóbal Curio)
Im Alltag sind wir selten mit komplett neuen Stimuli konfrontiert, denn was wir in einem Augenblick sehen ist normalerweise sehr ähnlich zu dem, was wir kurz vorher gesehen haben. Änderungen werden meist dadurch hervorgerufen, dass sich Objekte im Sichtfeld oder wir selbst uns bewegen. In diesem Projekt versuche ich, von optischem Fluss (also Bewegung im Bild) auf die Bewegung des Betrachters zu schliessen. Dafür zerlege ich den optischen Fluss in Objektbewegung, eine Kombination aus Basis-Flussfeldern und Rauschen und kominiere diese Schätzungen auf probabilistische Weise mit semantischem Wissen über die Szene.
Weiterführende Information: Computer Vision and Scene Analysis
Bildsuche mit Semantischer Komposition mit David Engel und Björn Browatzki
David Engel hatte die Idee, dass semantische Bildinformation, die durch manuelle und automatische Beschriftung zusehends besser verfügbar ist, genutzt werden kann um Suche in Bildern zu verbessern. Wir haben ein System vorgestellt, das Bilder basieren auf ihrer semantischen Komposition, also der Anordnung von semantischen Klassen, findet.
Weiterführende Information: Adaptive HMI
Ich wurde bei diesen Projekten auch von Prof. Schilling (Universität Tübingen) betreut.
(momentan nur auf Englisch. Bitte wählen Sie in der hellgrünen Leiste rechts oben "English")
Ich habe an der Universität Karlsruhe (TH) Mathematik studiert und bin seit Dezember 2007 Doktorand hier am Institut