Options
2003
Diploma Thesis
Titel
Automatische Lokalisierung von Gesichtern in digitalen Videoströmen
Abstract
In der vorliegenden Diplomarbeit wurde ein Verfahren entwickelt, das annähernd frontal abgebildete Gesichter in digital aufgezeichneten, farbigen Videodaten lokalisiert. Die gelieferten Informationen über die Position und Größe der vorkommenden Gesichter können zur Klassifikation der Aufzeichnung in verschiedene Genres verwendet werden oder als Grundlage für weitere Verarbeitungsschritte dienen, wie zum Beispiel dem Erkennen der gezeigten Personen mittels biometrischer Verfahren. Das als Eingabe verwendete Videomaterial unterliegt keinerlei Einschränkungen bezüglich Aufnahmebedingungen oder -umgebung. Daher wurde die Entwicklung eines besonders robusten Lokalisationsverfahrens angestrebt, das mit der zu erwartenden hohen Variabilität der Eingabedaten gut umgehen kann. Die anfallende große Datenmenge bei Videos führt zusätzlich zur Forderung einer möglichst kurzen Laufzeit des Verfahrens. Um beide Ziele zu erreichen, wird als Basis zum Erkennen von Gesichtsmustern das als sehr robust angesehene Mustererkennungsverfahren der Support Vector Machine (SVM) verwendet. Die inakzeptable Geschwindigkeit der normalen SVM bei der Bildanalyse wird durch Einsatz einer schnell auswertbaren angenäherten SVM und einer iterativen Verbesserungsstrategie der Näherung stark erhöht, ohne auffällige Auswirkungen auf die Genauigkeit der Gesichtslokalisation zu haben. Eine weitere Beschleunigung des Verfahrens wird durch Analyse der Farbinformation des Videos erzielt; die ebenfalls enthaltenen Bewegungsinformation wird zum Ausschluss von Fehldetektionen und damit zur Erhöhung der Erkennungsgenauigkeit verwendet. Durch die Kombination eines robusten Basisverfahrens mit Komponenten zur Geschwindigkeitssteigerung konnte ein Gesichtslokalisationsverfahren entwickelt werden, das Gesichter in einem weiten Bereich von unterschiedlichen (Frontal-)Posen, Beleuchtungen, Farbverfälschungen und Qualitätsschwankungen finden kann, und dabei dennoch eine Bearbeitungsgeschwindigkeit von mehreren Videoframes pro Sekunde aufweist.
ThesisNote
Darmstadt, TU, Dipl.-Arb., 2003
Verlagsort
Darmstadt