Options
2023
Master Thesis
Title
Clustering and Alignment of Dataflows
Other Title
Clustering und Ausrichtung von Datenflüssen
Abstract
Die Auswertung von Datenflüssen ist für das Verständnis komplexer Zusammenhänge und das Treffen von fundierten Entscheidungen von zentraler Bedeutung. Gegenwärtige Ansätze zur Visualisierung von Datenflüssen im Bereich der Schwachstellenanalyse von Android Applikationen stellen diese nicht als separate Elemente dar, sondern visualisieren die Datenflüsse konsolidiert in Form von Flussdiagrammen oder hierarchischen Diagrammvarianten, welche einen Überblick über alle Schwachstellen geben sollen. Für ein besseres Verständnis einzelner Schwachstellen und als Entscheidungshilfe für das weitere Vorgehen bei der Behebung ist dies jedoch nicht ausreichend. Im Rahmen dieser Arbeit wurde die bestehende Anwendung DataFlows um ein Clustering- und Alignmentverfahren erweitert. Dazu wurden in einem umfangreichen Experiment verschiedene Distanzmetriken in Kombination mit Clusteringalgorithmen miteinander verglichen und die Ergebnisse präsentiert, sowie eine neuartige, domänenspezifische Distanzmetrik vorgestellt. In einer qualitativen Benutzerstudie mit acht Teilnehmern wurde die bestehende Version der Anwendung mit der erweiterten Version verglichen. Rückmeldungen der Teilnehmer und Ergebnisse aus den System Usability Scale-Fragebogen legen nahe, dass die erweiterte Version eine bessere Vergleichbarkeit der Datenflüsse bietet und eine einfachere Mustererkennung ermöglicht. Die Teilnehmer identifizierten auch potenzielle Schwachstellen und Verbesserungsmöglichkeiten. Daraus ergeben sich Ansatzpunkte für weitere Optimierungsmöglichkeiten und zukünftige Entwicklungen.
;
The evaluation of dataflows is vital for understanding complex interrelationships and decision making. Current approaches to visualising data flows in the area of Android application vulnerability analysis do not present them as separate items, but rather visualise them in a consolidated manner in the form of flowcharts or hierarchical diagrams, which are intended to provide an overview of all vulnerabilities. However, this is not sufficient for a better understanding of individual vulnerabilities and as a decision-making aid for further remediation. In the context of this work, the existing application DataFlows was extended with a clustering and alignment technique. For this purpose, different distance metrics in combination with clustering algorithms were compared in an extensive experiment and the results presented, as well as a novel, domain-specific distance metric. A qualitative user study with eight participants compared the existing version of the application with the extended version. The participants’ feedback and the results of the System Usability Scale questionnaires suggest that the enhanced version provides better comparability of dataflows and enables easier pattern recognition. Participants also identified potential weaknesses and areas for improvement. This provides a basis for further optimisation and future refinements.
Thesis Note
Darmstadt, TU, Master Thesis, 2023
Language
English