Fraunhofer-Gesellschaft

Publica

Hier finden Sie wissenschaftliche Publikationen aus den Fraunhofer-Instituten.

Merkmalsbasierte Erkennung von Videosequenzen in einem kontinuierlichen Datenstrom einer digitalen Videoquelle

 
: Huber, M.
: Volmer, S.

Darmstadt, 2000
Darmstadt, TU, Dipl.-Arb., 2000
German
Thesis
Fraunhofer IGD ()
Digital Library; Video; content-based image retrieval

Abstract
In der Welt des Fernsehens sind Einschaltquoten das wichtigste Instrument zur Bewertung der Qualität eines Fernsehprogramms.
Im Konkurrenzkampf der anbietenden Fernsehsender ist daher die Analyse des Zuschauerverhaltens bezüglich der Ab- und Zuwanderung während eines laufenden Programmes von sehr hohem Interesse, insbesondere mit Blick auf die häufigen Unterbrechungen durch Werbeblöcke. Um den Einfluß der Werbeblöcke aller Programme auf das Zuschauerverhalten analysieren zu können, muß festgehalten werden, wann auf welchem Kanal welcher Werbespot zu welchem Zeitpunkt gelaufen ist.
Im Rahmen dieser Arbeit wurde ein System zur automatischen Echtzeiterkennung von Videosequenzen in einem digitalen Videodatenstrom entwickelt. Die Funktionaltität des Systems basiert auf den Prinzipien inhaltsorientierter Suchverfahren in Bilddatenbanken. Aus Einzelbildern bekannter Sequenzen werden visuelle Merkmale extrahiert und gemeinsam mit Informationen über die zugehörigen Werbespots in einer Datenbasis verwaltet. Beim Erkennungsvorgang werden dann periodisch für das jeweils aktuelle Videobild des Datenstroms Merkmale extrahiert und diese mit Techniken der merkmalsbasierten Bildsuche mit den gespeicherten Merkmalen der Datenbasis in Echtzeit verglichen. Bei erfolgreicher Identifikation eines bekannten Werbespots wird das Ergebnis sekundengenau protokolliert. Für die Realisierung des Systems wurden verschiedene Vergleichs- beziehungsweise Bewertungsmethoden entworfen, die ein einzelnes Merkmal oder eine Folge von Merkmalen mit Merkmalen aus einer Datenbasis vergleichen und daraufhin eine der bekannten Werbespots als erkannt auswählen oder das Vergleichsmerkmal bzw. die Vergleichsmerkmale einer unbekannten Sequenz zuordnen. Die Methoden wurden implementiert, in das Erkennungssystem integriert und bezüglich ihrer Erkennungszuverlässigkeit, Echtzeitfähigkeit und des Einflusses verschiedener Systemparameter untersucht. Die für diesen Zweck definierten Testszenarien basierten auf dem Erkennen unterschiedlicher Werbespots in laufenden Fernsehsendungen beziehungsweise Werbeblöcken. In einer Referenzversuchsreihe, bei der die aus Testvideodatenströmen extrahierten Merkmale aufgezeichnet und nachträglich über die verschiedenen Methoden analysiert wurden, konnten Erkennungszuverlässigkeiten von nahezu 100 % erreicht werden. Über Datenbasen mit begrenzter Größe und den gezielten Einsatz von Heuristiken bezüglich der zu erkennenden Videosequenzen beim merkmalsbasierten Ähnlichkeitsvergleich konnten auch unter Echtzeitbedingungen vielversprechende Ergebnisse erzielt werden.

 

In the world of television the audience ratings are the most important instrument to evaluate the quality of a television program. The analysis of the behavior of the viewers during the running program is of great interest in the competition of broadcasting stations, particularly with regard to the frequent commercial breaks. In the focus of interest is the influence of television commercials on the behavior of the viewers. For that the channel and the broadcast time of the commercials must be analyzed.
In this thesis a system for automatic real-time recognition of video sequences has been developed. The functionality of the system is based upon the fundamentals of content-based image retrieval. Visual features are extracted from the single frames of known sequences and are stored in a database along with additional information about the corresponding commercials. During the process of recognition features are extracted from the current frame of the digital video stream and are compared in real-time with the stored features in the database in terms of similarity. Upon a successful identification of a known commercial, the result is logged with a precision of at least one second. For the implementation of the system, different methods for analysis and evaluation of the video stream were designed that compare single or a set of features with those stored in the database and therefore select one of the known commercials as the recognized one or attach the query feature respectively the query features to an unknown sequence. These methods were implemented, integrated in the recognition system and examined with regards to their recognition reliability, real-time ability and the influence of different system parameters. For that purpose test scenarios was defined, which are based upon the recognition of different television commercials in the running program or in a block of commercials. Tests were conducted in order to analyze the recognition quality and reliability. As a result, a recognition rate of almost 100 % was achievable for tests without real-time constraints. Encouraging results were achieved under real-time conditions with databases of limited size with the use of appropriate heuristics.

: http://publica.fraunhofer.de/documents/N-1715.html