Fraunhofer-Gesellschaft

Publica

Hier finden Sie wissenschaftliche Publikationen aus den Fraunhofer-Instituten.

Rekonstruktion von 3D-Linienmodellen aus Bildsequenzen

 
: Moll, K.M.
: Wuest, H.

Darmstadt, 2006, 104 S.
Darmstadt, TU, Dipl.-Arb., 2006
Deutsch
Diplomarbeit
Fraunhofer IGD ()
3D reconstruction; reconstruction; computer vision; Trifocal Tensor

Abstract
In dieser Diplomarbeit wird das Problem der Rekonstruktion von 3D-Linienmodellen aus Videodaten behandelt. 3D-Rekonstruktion ist ein interessantes Forschungsgebiet, das seit den 1970er Jahren große Beachtung findet.
Ziel dieser Diplomarbeit war es dabei, ein System zur vollautomatischen Generierung von Linienmodellen zu erstellen, welche später zum markerlosen Tracking verwendet werden können. Die automatische Generierung hat dabei den Vorteil, daß dieselben Verfahren zur Kantenerkennung zum Einsatz kommen wie später beim Tracking.
Weiterhin wurde ein Verfahren zum inkrementellen Update der bestehenden Rekonstruktion aus weiteren Videodaten entwickelt und evaluiert. Die Ergebnisse haben gezeigt, daß das Problem generell lösbar ist, aber auch, daß es noch viel Verbesserungsbedarf hinsichtlich Geschwindigkeit und Stabilität gibt.
Es existieren verschiedene Ansätze zur 3D-Rekonstruktion, die bedeutendsten davon sind Faktorisierungsansätze -- meist gefolgt von Bündelblockausgleich (bundle adjustment) -- und Verfahren über die Fundamentalmatrix (two-view, Punktfeatures) beziehungsweise den Trifokaltensor (three-view, Linienfeatures).
In der Diplomarbeit wird aus mehreren Gründen das Verfahren über den Trifokaltensor gewählt. Der Algorithmus wurde unter Zuhilfenahme der VisionLib-Bibliothek implementiert, die in der Abteilung A4 des Fraunhofer IGD entwickelt wird.
Die Implementierung wurde mit Hilfe von synthetischen und realen Daten evaluiert. Die Ergebnisse waren vielversprechend, es gelangen gute Rekonstruktionen auf Basis von realen Videodaten. Allerdings zeigte sich auch, daß es noch Probleme hinsichtlich Stabilität und Geschwindigkeit gibt.

 

This thesis deals with the problem of reconstructing 3d line models from monocular video sequences. 3d reconstruction is an interesting topic which has been studied extensively since the 1970s.
The thesis aims to implement a fully automatic approach to generating line models, which can then be employed for markerless tracking.
The automatic generation seems promising, as features are extracted in exactly the same way as later on, during tracking. A method to allow incremental updates, using further video frames was explored and evaluated. The results showed that the problem is feasible, but also that there is still much room for improvements regarding stability and speed.
There are several approaches to 3d reconstruction, most notably factorization methods---commonly followed by bundle adjustment---and methods involving the fundamental matrix (two-view, point features) or the trifocal tensor (three-view, line features).
Here, we choose the trifocal tensor reconstruction for various reasons. The reconstruction algorithm has been implemented using the VisionLib framework provided by the department IGD A4. The performance has been measured using both synthetic and real test data.
Results were good concerning the general feasibility and correctness of the implementation---3d models have been extracted from real video data---but they also demonstrated weaknesses regarding stability and speed.

: http://publica.fraunhofer.de/dokumente/N-44058.html