Fraunhofer-Gesellschaft

Publica

Hier finden Sie wissenschaftliche Publikationen aus den Fraunhofer-Instituten.

Evaluierung von verschiedenen Verfahren zur automatischen Bestimmung der Kopforientierung von Personen

 
: Eckeren, Katharina van
: Tausch, Reimar

Darmstadt, 2011, 86 S.
Darmstadt, Hochschule, Bachelor Thesis, 2011
Deutsch
Bachelor Thesis
Fraunhofer IGD ()
pose estimation; image classification; evaluation; Business Field: Visual decision support; Research Area: Confluence of graphics and vision

Abstract
In dieser Arbeit wird ein klassifikator-basierter Ansatz vorgestellt und evaluiert. Er ermöglicht es, mit den Daten einer monokularen Kamera die Kopfpose von Personen, die als Indikator der Blickrichtung und Aufmerksamkeit verwendet werden kann, diskret zu bestimmen. Der Raum aller Kopfposen, der aus den Kopfbewegungen von links nach rechts (Zeilen) und von oben nach unten (Spalten) besteht, wird mittels eines Rasters diskret in Klassen unterteilt. Der verwendete Klassifikator ist eine lineare Support Vector Machine. Als Deskriptoren werden verkleinerte Vorschaubilder in Farbe, Graustufen und Gradienten, sowie die Histogram of oriented gradients (HOG) evaluiert. Sie wurden für jede Klasseneinteilung getestet und ihre Ergebnisse ausgewertet.
Es wurden drei verschiedene Poseneinteilungen vorgenommen: Fünf (1 x 5), neun (3 x 3) und 15 (3 x 5)Klassen. Im ersten Durchlauf wurde der Klassifikator für fünf (1 x 5) mögliche Kopfposen getestet. Anschließend wurde die Anzahl der möglichen Kopfposen auf neun (3 x 3) erhöht. Und zuletzt wurde eine Kopfposenanzahl von 15 (3 x 5) Posen getestet.
Zur Evaluierung wurde die Pointing '04 Bilderdatenbank verwendet, wobei in einem Vorbereitungsschritt basierend auf Template Matching der relevante Kopfbereich aus den Bildern extrahiert wurde. Mit Hilfe der Evaluierung wird gezeigt werden, dass der HOG-Deskriptor mit Abstand die besten Ergebnisse erzielt, um erfolgreich die Kopfpose einer Person zu bestimmen. Bei einer Einteilung in f unf Kopfposen wurde die beste Klassifizierungsrate von 80,6% durch den HOG-Deskriptor erreicht. Wie zu erwarten, sinkt die Klassfikationsgenauigkeit bei steigender Kopfposenanzahl ab. Mit einer erhöhten Anzahl an Kopfposen erbrachte der HOG-Deskriptor, bei neun Klassen mit einer Genauigkeit von 72,7% und bei 15 Klassen mit einer Genauigkeit von 66,0%, das beste Resultat.

: http://publica.fraunhofer.de/dokumente/N-229302.html