Options
2022
Bachelor Thesis
Title
Identification of Interesting Areas and Provisioning of Guidance in Scatter Plots
Abstract
Der Umgang mit großen Datenmengen ist heutzutage ein ständiger Begleiter in vielen Bereichen. Bei großen Datenmengen kann es sehr schwierig sein an Informationen zu gelangen. Mit dieser Arbeit möchte ich mit einem Programm Nutzer Hilfe für das Verstehen eines Datensatzes geben. Zuerst kann ein unbekannter Datensatz sehr unübersichtlich wirken. Das Programm hilft hierbei essentielle Informationen zu vermittlen. Es werden Zusammenhänge verschiedener Attribute aufgezeigt, Unterschiede zwischen Daten verdeutlicht und es wird auf erstrebenswerte Regionen verwiesen. Der Datensatz ist eine Tabelle mit einer Menge von Objekten. Die Objekte können aus vielen Attributen bestehen. Das Programm soll die Tabelle in einem Streudiagramm visualisieren. Die Punkte im Streudiagramm sind jedoch Objekte mit 2 Attributen (x und y Koordinaten). Durch Dimensionsreduktion bekommen die Objekte die x und y Koordinaten. Als Erweiterung zum Streudiagramm kann der Nutzer dem Programm eine Suchanfrage stellen. Als Ergebnis wird ein Standort im Streudiagramm angezeigt. Ähnlich wie in einer Karte soll dem Nutzer Wegweiser gegeben werden, die vom Standort auf nicht sichtbare Regionen zeigen. Diese Wegweiser werden als Pfeile in das Streudiagramm eingefügt. Dem Nutzer stehen Verteilungsdiagramme zur Verfügung, um Bereiche, Queries oder Datenpunkte miteinander vergleichen zu können.
;
Dealing with large amounts of data is a constant companion in many areas these days. With large amounts of data, it can be very difficult to access information. With this work I would like to use a program to help users to understand a data set. At first, an unknown data set can seem very confusing. The program helps to convey essential information. Connections between various attributes are shown, differences between data are clarified and regions worth striving for are referred to. The data set is a table with a set of objects. The objects can consist of many attributes. The program should visualize the table in a scatter diagram. However, the points in the scatterplot are objects with 2 attributes (x and y coordinates). The objects get the x and y coordinates by dimension reduction. As an extension to the scatter diagram, the user can submit a search query to the program. As a result, a location is displayed in the scatter plot. Similar to a map, the user should be given signposts that point to regions that are not visible from the location. These signposts are inserted into the scatterplot as arrows. Distribution diagrams are available to the user in order to be able to compare areas, queries or data points with one another.
Thesis Note
Darmstadt, TU, Bachelor Thesis, 2022