Fraunhofer-Gesellschaft

Publica

Hier finden Sie wissenschaftliche Publikationen aus den Fraunhofer-Instituten.

Visuell-Interaktive Exploration von Text Clustering Ergebnissen

 
: Staab, Michael Markus
: Kuijper, Arjan; Ruppert, Tobias

Darmstadt, 2016, 62 S.
Darmstadt, TU, Master Thesis, 2016
Deutsch
Master Thesis
Fraunhofer IGD ()
Visual analytics; information visualization; cluster analysis; text analysis; text mining

Abstract
Digital vorliegende Texte gewinnen immer mehr an Bedeutung und sind gleichzeitig in ihrer Vielzahl und Komplexität für einen Leser nur schwer zu durchschauen. Clustering-Verfahren können hier hilfreich sein: Sie unterstützen den Anwender dabei, Text auf Basis des enthaltenen Inhalts zu gruppieren. Allerdings bestehen dabei viele Abhängigkeiten, die zu potenziell sehr diversen Ergebnissen führen, wobei es immer vom konkreten Einzelfall abhängt, welches Ergebnis als "das beste" anzusehen ist. Deswegen ist es sowohl sinnvoll, mehrere Clusterings mit unterschiedlichen Parametern durchzuführen und zu vergleichen, als auch, den Benutzer aktiv in den Analyseprozess miteinzubeziehen. Ziel dieser Arbeit war es, ein Textclustering-System zu entwickeln, das in der Lage ist, Clusterings mit direkter Interaktion des Benutzers zu erstellen, zu analysieren und zu vergleichen. Hierfür wurde sowohl eine neuartige Version der Featureselektion implementiert als auch sehr viel Wert auf die Visualisierung der einzelnen Prozessabläufe gelegt. Eine anschließende Auswertung kam zu dem Ergebnis, dass die Featureselektion gut funktioniert und die Nützlichkeit des Systems gegeben ist. Für die Zukunft bietet es sich an, die Verfahren im System noch zu erweitern und dem Benutzer die Möglichkeit zu geben, selbst weitere Qualitätsmetriken und Verfahren einzupflegen.

: http://publica.fraunhofer.de/dokumente/N-417351.html