Visuelle Aufmerksamkeitsmechanismen auf bimodalen Laserdaten

Frintrop, S.; Rome, E.; Nüchter, A.; Surmann, H.

2003

Conference Paper

Abstract

Aufmerksamkeit hilft Menschen dabei, relevante Punkte der Umgebung mit den Augen zu fixieren, um wesentliche Informationen aus der Menge an Sinneseindrücken herauszufiltern. Obwohl menschliche Aufmerksamkeit durch verschiedene Sinnesorgane beeinflußt wird, simulieren bestehende Aufmerksamkeitsmodelle gewöhnlich nur visuelle Aufmerksamkeit und deren Implementierungen nutzen meist nur Kameradaten. Im Gegensatz dazu wenden wir Aufmerksamkeitsmechanismen auf bimodale Daten eines 3D-Laserscanners an, der auf einem autonomen mobilen Roboter montiert ist. Der 3D-Laserscanner deckt eine große Bildfläche ab und liefert mit einem einzigen Scan sowohl Tiefen- als auch Intensitätswerte. Diese Daten wurden als Bilder dargestellt, so dass ein Scan-Durchgang ein Tiefen- und ein Intensitätsbild der Umgebung erzeugt. Auf diese Bilder wurde das Aufmerksamkeitsmodell von Itti et al. angewendet. Der Vorteil dieses Ansatzes ist die zusätzliche Tiefeninformation, die bei rein Kamera-gesteuerten Modellen nur durch den aufwändigen Einsatz von Stereo-Bilddatenverarbeitung zu gewinnen ist. Dadurch können Objekte mit gewissem Abstand zu ihrem Hintergrund leicht detektiert werden. In unseren Experimenten wurde der Ansatz sowohl innerhalb von Gebäuden als auch im Freien getestet, so dass die Szenen von Büroumgebungen bis zu Straßenverkehrsszenen reichen. Die Ergebnisse belegen die Eignung des 3D-Laserscanners zur Detektion auffälliger Bereiche: 86% der zuerst fokussierten Bereiche zeigen ein Objekt von potenziellem Interesse. Vorteilhaft ist dabei die Multimodalität des Scanners, da Intensitäts- und Tiefeninformation verschiedene Arten von Auffälligkeit detektieren und sich so gegenseitig ergänzen können. In Zukunft sollen diese Ergebnisse genutzt werden, um Robotern bei diversen Aufgaben behilflich zu sein, zum Beispiel bei der Manipulation von Objekten, der Hindernisvermeidung oder der Selbst-Lokalisierung anhand von Landmarken.

Author(s)

Frintrop, S.

Rome, E.

Nüchter, A.

Surmann, H.

Mainwork

Beiträge zur 6. Tübinger Wahrnehmungskonferenz (TWK 2003)

Conference

Tübinger Wahrnehmungskonferenz (TWK) 2003

Options

Visuelle Aufmerksamkeitsmechanismen auf bimodalen Laserdaten