Options
1997
Doctoral Thesis
Titel
Verfolgung von Personen in monokularen Bildfolgen
Abstract
Die Fähigkeit, menschliche Aktivitäten durch Bildauswertung zu erkennen, ist eine Schlüsseleigenschaft beim Entwurf von Maschinen, die mühelos und intelligent mit Menschen interagieren sollen. Dazu müssen begriffliche Beschreibungen der Bewegungen von Personen erstellt werden. Die vorliegende Arbeit befaßt sich mit der Extraktion quantitativer geometrischer Beschreibungen der Bewegungen von Personen und leistet somit einen natürlichen Zwischenschritt auf dem Weg zu begrifflichen Beschreibungen. Die Extraktion der geometrischen Beschreibungen erfolgt modellbasiert mit Hilfe eines dreidimensionalen Personenmodells, dessen Kinematik durch einen homogenen Transformationsbaum beschrieben ist und dessen Körperteile durch gerade elliptische Kegelstümpfe modelliert sind. Das Personenmodell besitzt die Gelenke Hals, Schultern, Ellenbogen, Handgelenke, Wirbelsäule, Hüfte, Knie und Fußgelenke, denen die Körperteile Kopf, Hals, Rumpf, Oberarme, Unterarme, Hände, Oberschenkel, Unterschenkel und Füß e angeheftet sind. Neben den Freiheitsgraden des Personenmodells, die den Gelenken entsprechen, existieren weitere Freiheitsgrade, die die Lage der Person relativ zur Kamera beschreiben. Abhängig von der speziellen Anwendung sowie von der Art der Bildfolgen können durch das vorgestellte Verfahren die Werte unterschiedlich vieler Gelenkfreiheitsgrade und Lagefreiheitsgrade aus den Bildfolgen bestimmt werden. Das vorgestellte Verfahren liefert somit quantitative geometrische Beschreibungen der Bewegungen von Personen in Form von zeitlichen Verläufen der Werte von Gelenk- und Lagefreiheitsgraden Die Bestimmung der Freiheitsgradwerte wird als Schätzaufgabe verstanden, die im Rahmen der Kaimanfilter-Theorie gelöst wird. Dazu wird das Personenmodell um ein einfaches Bewegungsmodell erweitert, das von einer konstanten Änderungsrate aller Freiheitsgrade ausgeht und der Prädiktion von Zuständen dient. Im Aktualisierungsschritt des Kalmanfilters wird sowohl Kanteninformation als auch Flächeninfo rmation genutzt. Dabei sorgt Kanteninformation für eine genaue Lokalisierung und Flächeninformation für eine stabile Verfolgung. Die Schätzung erfolgt durch ein iteriertes erweitertes Kalmanfilter, bei dem im Aktualisierungsschritt nicht-Iineare Quadratsummenfunktionen zu minimieren sind. Dazu werden verschiedene numerische Verfahren vorgestellt und diskutiert. Im experimentellen Teil der Arbeit wird die Leistungsfähigkeit des vorgestellten Verfahrens dokumentiert. Insbesondere wird gezeigt, daß mit ihm Gehbewegungen mit bis zu 13 Freiheitsgraden verfolgt werden können. Ein weiteres Experiment zeigt, daß mit dem Verfahren auch die Gesten einer stehenden Person erfaßt werden können.
ThesisNote
Zugl.: Karlsruhe, Univ., Diss., 1997
Language
German