Fraunhofer-Gesellschaft

Publica

Hier finden Sie wissenschaftliche Publikationen aus den Fraunhofer-Instituten.

Automatische Lokalisierung von Gesichtern in digitalen Videoströmen

 
: Braun, T.
: Cavet, R.

Darmstadt, 2003, 105 pp.
Darmstadt, TU, Dipl.-Arb., 2003
German
Thesis
Fraunhofer IGD ()
content-based image retrieval; face detection; content based video retrieval

Abstract
In der vorliegenden Diplomarbeit wurde ein Verfahren entwickelt, das annähernd frontal abgebildete Gesichter in digital aufgezeichneten, farbigen Videodaten lokalisiert. Die gelieferten Informationen über die Position und Größe der vorkommenden Gesichter können zur Klassifikation der Aufzeichnung in verschiedene Genres verwendet werden oder als Grundlage für weitere Verarbeitungsschritte dienen, wie zum Beispiel dem Erkennen der gezeigten Personen mittels biometrischer Verfahren.
Das als Eingabe verwendete Videomaterial unterliegt keinerlei Einschränkungen bezüglich Aufnahmebedingungen oder -umgebung. Daher wurde die Entwicklung eines besonders robusten Lokalisationsverfahrens angestrebt, das mit der zu erwartenden hohen Variabilität der Eingabedaten gut umgehen kann. Die anfallende große Datenmenge bei Videos führt zusätzlich zur Forderung einer möglichst kurzen Laufzeit des Verfahrens. Um beide Ziele zu erreichen, wird als Basis zum Erkennen von Gesichtsmustern das als sehr robust angesehene Mustererkennungsverfahren der Support Vector Machine (SVM) verwendet. Die inakzeptable Geschwindigkeit der normalen SVM bei der Bildanalyse wird durch Einsatz einer schnell auswertbaren angenäherten SVM und einer iterativen Verbesserungsstrategie der Näherung stark erhöht, ohne auffällige Auswirkungen auf die Genauigkeit der Gesichtslokalisation zu haben. Eine weitere Beschleunigung des Verfahrens wird durch Analyse der Farbinformation des Videos erzielt; die ebenfalls enthaltenen Bewegungsinformation wird zum Ausschluss von Fehldetektionen und damit zur Erhöhung der Erkennungsgenauigkeit verwendet.
Durch die Kombination eines robusten Basisverfahrens mit Komponenten zur Geschwindigkeitssteigerung konnte ein Gesichtslokalisationsverfahren entwickelt werden, das Gesichter in einem weiten Bereich von unterschiedlichen (Frontal-)Posen, Beleuchtungen, Farbverfälschungen und Qualitätsschwankungen finden kann, und dabei dennoch eine Bearbeitungsgeschwindigkeit von mehreren Videoframes pro Sekunde aufweist.

: http://publica.fraunhofer.de/documents/N-19707.html