CC BYKuijper, ArjanLücke-Tieke, HendrikRothenbacher, ErikErikRothenbacher2022-07-112022-07-112022https://publica.fraunhofer.de/handle/publica/418772https://doi.org/10.24406/publica-14210.24406/publica-142Das Ziel dieser Arbeit ist es, einige implizite und explizite Ähnlichkeitsmaße zwischen Tabellen zu finden und zu vergleichen. Um die Ansätze vergleichen zu können, wird ein in der Tabellenforschung neuartiger Datensatz entwickelt. Weil alle vorherigen Arbeiten zu Tabellen eigene Datensätze verwendeten, die nicht durch eine einzelne Person nachgebaut werden können, gibt es drei Bedingungen an den neuen Datensatz. Er muss der in dieser Arbeit verwendeten Ähnlichkeitsdefinition folgen, er muss durch eine Person erstellbar sein und selbst fachfremde Personen müssen die Gültigkeit des Datensatzes nachvollziehen können. Damit ist eine Basis geschaffen, auf der Ähnlichkeitsmaße für Tabellen verglichen und analysiert werden können. So kann man herausfinden, welche Maße am besten funktionieren und unter welchen Bedingungen sie Probleme haben.deLead Topic: Digitized WorkResearch Line: Human computer interaction (HCI)Research Line: Machine Learning (ML)Similarity functionsSimilarity measuresSimilarity metricsSimilarity searchPerformance evaluationEvaluation von Tabellenfeatures und ihr Einfluss auf die Güte von Tabellenähnlichkeitsmaßenbachelor thesis