Fraunhofer-Gesellschaft

Publica

Hier finden Sie wissenschaftliche Publikationen aus den Fraunhofer-Instituten.

Efficient similarity search in large video databases

 
: Steinbrecher, T.
: Cavet, R.

Darmstadt, 2005, 64 S.
Darmstadt, TU, Dipl.-Arb., 2005
Englisch
Diplomarbeit
Fraunhofer IGD ()
search process; video analysis; feature representation; clustering

Abstract
Today, the main source of income for most TV stations are paid advertisements. In Germany alone, billions of Euros are spent each year on TV ads. Substantial commercial interest lies in the question how exactly this money is being spent - i.e., which ad clips played on which channel, at which time. TV stations do not disclose this data to the public; therefore it has to be gathered by content-based retrieval, from recorded TV broadcasts. In order to cope with the large amounts of data involved (a single TV station generates about 30GB of MPEG2 data per day), highly efficient methods for video similarity search must be available. In the context of this diploma thesis, a fast video detection system that relies on feature-based frame similarity calculations was developed. The system is robust to temporal/spatial modifications in the source video, as well as missing frames - to the extent that decoding only the I-frames of the analyzed stream will suffice for good detection results. Different image features were compared and evaluated. For speed and scalability improvement, an index-based search that relies on clusters in feature space was implemented. The video detector does not aim for perfect accuracy in the sense that the results are free of false positives. Instead, its purpose is to find candidates for detection as quickly as possible, in order to reduce the search domain for downstream processing stages, which use slower, but more accurate methods.

 

Die Haupteinnahmequelle der meisten Fernsehkanäle sind heutzutage bezahlte Werbeclips. Allein in Deutschland werden jedes Jahr Milliarden Euro für Fernsehwerbung ausgegeben. Beachtliches kommerzielles Interesse liegt in der Frage, wie genau dieses Geld eingesetzt wurd - d.h., welche Werbeclips laufen auf welchen Kanälen, zu welcher Zeit? Die TV-Sender machen diese Daten jedoch nicht öffentlich zugänglich; daher können sie nur durch inhaltsbasierte Erkennung gewonnen werden. Um mit den dabei auftretenden enormen Datenmengen umzugehen (die Aufnahme eines einzelnen Fernsehsenders generiert etwa 30GB MPEG2-Daten pro Tag), müssen effiziente Methoden zur Video-Ähnlichkeitssuche verfügbar sein. Während dieser Diplomarbeit wurde ein schnelles Videosuchsystem entwickelt, das auf Feature-basierten Ähnlichkeitsvergleichen von Einzelbildern fußt. Das System ist robust gegenüber zeitlichen/räumlichen Änderungen im Quellvideo sowie fehlenden Frames - in dem Maße, daß es reicht, lediglich die I-Frames des zu analysierenden Videostroms zu decodieren. Verschiedene Bildfeatures wurden evaluiert und verglichen. Um Geschwindigkeit und Skalierbarkeit zu verbessern, wurde eine Index-basierte Suche, die Cluster im Feature-Raum verwendet, implementiert. Der Videodetektor zielt nicht auf perfekte Genauigkeit in dem Sinne, daß die Ergebnisse frei von falschen Positiven ist. Stattdessen ist das Ziel, möglichst schnell Kandidaten für Videoerkennungen zu finden, um den Suchraum für nachgeschaltete Verarbeitungsstufen - die genauer, aber langsamer sind - einzuschränken.

: http://publica.fraunhofer.de/dokumente/N-33495.html