Options
2024
Bachelor Thesis
Title
MMFlow - a Metro Map Visualization for Data Flow Analysis
Other Title
MMFlow - eine Metro Map Visualisierung für die Datenflussanalyse
Abstract
Data flows can be found everywhere, e.g. software security, transport networks, or in tracing of network trafic. Especially the analysis and optimization of data flows are in focus of many companies. In the case of software security, data flows are often used to identify vulnerabilities of data leaks in the used or self developed applications. In times of increasing digitalization, many vital processes depend on reliable and secure digital communication. The rising number of devices, soft & Firmware versions that need to be maintained, create a need for fast and reliable vulnerability identification. In order to minimize labor and the need for highly skilled security experts many organizations use vulnerability scanners. These scanners return up to 100 data flows per scanned application and in most cases include false positives. These scan results have to be verified by hand by checking if each flow element is reachable. This is a very labor-intensive and tedious process. Currently, security analysts, which perform data flow verification, scroll through the resulting JSON files or use visualization where it is difficult to decide which flows might seem relevant. As a result, a less eficient verification order could be used and similar flow elements are not verified together. Additionally, it can be dificult to keep track of verified flow elements in a concise manner and share results during the verification process. In order to support this process we researched the area of Metro Map visualization for data flow analysis and verification. Standard metro map approaches do not handle data flow cycles well; Therefore, the area of metro map layout algorithms was researched and our findings were implemented, to evaluate our suggested layout algorithm. In this thesis, each development step of MMFlow, the input data characteristics, user tasks and system requirements in this domain are illustrated. In the end,two promising layout variations of the selected and adapted layout algorithm, which can handle data flows that inherit multiple cycles were created. This layout algorithm is an adaptation of a storyline approach combined with metro map characteristics. It creates an overview of all data flows including their source and sink and facilitates similarity perceptions between all visually displayed attributes as well as their code base hierarchy. Furthermore, they can select and mark an individual flow element to visually keep track of their verification progress. This thesis is especially interesting for security analysts and software developer who search for great visual support in their data flow analysis/verification, or want to create their visualization of data flows. Visualization researchers will get further insight into the benefits and drawbacks of metro map visualizations. These researches may find new ways to adapt the suggested layout algorithms for other domains, which would benefit from hierarchy-preserving flow or sequence visualizations.
;
Datenflüsse sind in allen Bereichen des Lebens wiederzufinden, sei es im öffentliche Nahverkehr, in virtuellen Netzwerken oder in der Softwareanalyse. Insbesondere die Analyse und Optimierung von Datenflüssen stehen im Fokus vieler Unternehmen. In der Softwaresicherheit werden Datenflüsse häufig genutzt, um Schwachstellen oder andere Datenlecks in den verwendeten oder selbst entwickelten Anwendungen zu identifizieren. In Zeiten der fortschreitenden Digitalisierung hängen viele lebenswichtige Prozesse in unserer Gesellschaft von einer zuverlässigen und sicheren digitalen Kommunikation ab. Diese immer weiter steigende Anzahl von Hard-, Soft- und Firmware Versionen, die gewartet werden müssen, machen eine schnelle und zuverlässige Identifizierung von Sicherheitslücken unerlässlich. Um den Arbeitsaufwand und den Bedarf an hoch qualifizierten Sicherheitsexperten zu minimieren, werden in vielen Unternehmen Schwachstellen-Scanner eingesetzt. Diese Scanner liefern mitunter bis zu 100 Datenflüsse pro gescannter Anwendung und können einige Fehlalarme enthalten. Im Anschluss müssen die Ergebnisse manuell verifiziert werden, indem die Erreichbarkeit jedes Datenflusselements überprüft wird. Die manuelle Verifikation ist ein sehr zeitaufwändiger und umständlicher Prozess. Aktuell durchsuchen Sicherheitsexperten die Scannerergebnisse entweder im Textformat oder verwenden Visualisierungen, bei denen es schwierig zu entscheiden ist, welche Datenflüsse besonders relevant sind. Eine ungünstige Überprüfungsreihenfolge kann zusätzlich dazu führen, dass Datenflüsse mit ähnlichen Elementen nicht gleichzeitig oder direkt hintereinander bearbeitet werden. Zusätzlich ist es schwierig, den Überblick über verifizierte Datenflüsse zu behalten und vorläufige Ergebnisse des Überprüfungsprozesses mit Anderen zu teilen. Um diesen Prozess besser zu unterstützen, haben wir Metro-Map-Visualisierungen für die Datenflüssanalyse und -überprüfung genauer untersucht. Die aktuell oft genutzten Metro Map Algorithmen können nur schlecht mit azyklischen Daten umgehen, weshalb mehrere Metro-Map-Layout-Algorithmen untersucht wurden. Im Anschluss wurden die ausgewählten Algorithmen weiterentwickelt und implementiert, um diese zu testen. In dieser Arbeit werden die Entwicklung der Software “MMFlow” sowie die Eigenschaften der Eingabedaten, Benutzeraufgaben und Systemanforderungen der Datenflüssanalyse dargestellt. Schlussendlich wurden zwei vielversprechende Layout-Varianten desselben Metro-Map Ansatzes entwickelt, welche Datenflüsse mit mehreren Zyklen verarbeiten können. Diese Layoutalgorithmen sind Adaptionen eines Storyline-Ansatzes in Kombination mit typischen Merkmalen einer Metro Map. Die hier dargestellten Adaptionen schaffen einen Überblick über alle Datenflüsse einschließlich ihrer Quellen und Senken und ermöglicht Ähnlichkeitswahrnehmungen zwischen allen visuell dargestellten Attributen sowie deren Quellcode-Hierarchie. Darüber hinaus können die Benutzer alle Quellen und Senken leicht finden und die zugehörigen Flüsse vergleichen. Nutzer können einzelne Datenflüsselemente auswählen und markieren, um ihren Verifikationsfortschritt visuell zu dokumentieren.
Thesis Note
Darmstadt, TU, Bachelor Thesis, 2024