Fraunhofer-Gesellschaft

Publica

Hier finden Sie wissenschaftliche Publikationen aus den Fraunhofer-Instituten.

Vergleich von Bildklassifikationsalgorithmen für chemische Strukturformeln

 
: Frings, N.

:
Volltext urn:nbn:de:0011-n-780174 (6.6 MByte PDF)
MD5 Fingerprint: 5a430abb5b1b05ef446d95609c858b9f
Erstellt am: 27.8.2008


Remagen, 2008, 81 S.
Koblenz, FH, Bachelor Thesis, 2008
Deutsch
Bachelor Thesis, Elektronische Publikation
Fraunhofer SCAI ()

Abstract
In dieser Arbeit wurde detailliert die computerbasierte Klassifikation von Bildern untersucht. Anhand einer konkreten Fallstudie, der Klassifikation von Bildern als chemische Strukturformel oder nicht-chemische Strukturformel, wurde ein Klassifikationssystem entwickelt und optimiert. Dabei wurden die zentralen Stationen zur Entwicklung eines Klassifikationssystems behandelt. Es wurde ein Trainingsdatensatz so zusammengestellt, dass die beinhalteten Bilder möglichst repräsentativ für die gewünschten zu klassifizierenden Klassen sind. Bei der Auswahl der Bildeigenschaften wurde zum einen auf gängige Bildeigenschaften zur¨uckgegriffen (allgemeine Bildeigenschaften). Des weiteren wurden die im Bild gefundene Winkel, Linien, Richtungen und Zusammenhangskomponenten über statistische Maßzahlen beschrieben und als Bildeigenschaften genutzt. Damit wurde das Vorwissen über das konkrete Problem in Maßzahlen efasst. In der Evaluation wurde gezeigt, dass diese, auf das Problem zugeschnittenen Bildeigenschaften deutlich mehr Aussagekraft f¨ur das gegebene Problem haben als die allgemeinen Bildeigenschaften. In einer Studie wurden insgesamt 6 Klassifikationsalgorithmen miteinander verglichen und mit Methoden zur Optimierung auf ihr maximales Potenzial hin untersucht. Mit dem besten, durch Kreuzvalidierung erzielten, Ergebnis konnten dabei 97% aller Bilder korrekt klassifiziert werden. Für eine fallspezifische Optimierung des Klassifikationssystems wurden auch anwendungsfallspezifische Qualitätskriterien mit berücksichtigt. Das ist zum einen das pragmatische Kriterium der Rechenzeit und zum andern die unterschiedliche Gewichtung der verschiedenen möglichen Fehler einer Klassifikationsentscheidung. Durch eine Evaluation auf einem unabhängigen Datensatz wurde gezeigt, dass das Klassifikationssystem mit Bildern einer ausreichenden Qualität hervorragend funktioniert.

: http://publica.fraunhofer.de/dokumente/N-78017.html