Under CopyrightHerney, P.P.Herney2022-03-0722.4.20082007https://publica.fraunhofer.de/handle/publica/27754010.24406/publica-fhg-277540Die inkrementelle Speicherung und Archivierung von großen Datenbeständen gehört heute zum alltäglichen Geschäftsprozess bei vielen Firmen und Institutionen. Die großen Datensammlungen können sich nur als gewinnbringend erweisen, wenn gesuchte Informationen zügig und einfach wiederzugewinnen sind. Viele Datenbestände haben einen ungenutzten räumlichen Bezug, der auch in einem Recherchesystem entscheidende Hilfe zur Auffindung von Datensätzen leisten könnte. Diese Arbeit unternimmt den Versuch eine Schnittstelle zu entwerfen, die, jenseits einer textuellen Suche à la Google, die Suche und Exploration großer Datenbestände mit visueller Unterstützung ermöglichen soll. Die Attribute werden als Kriterien betrachtet und können eingeschränkt werden. Die graphische Darstellung von Verteilungen der Datensätze nach Kriterien und die Visualisierung auf einer Karte kann es dem Nutzer ermöglichen, sich einen besseren Überblick über die Datengrundlage seiner Suche zu verschaffen. Das Verständnis der Datengrundlage ermöglicht dem Nutzer eine effizientere Suche. Ziel der vorliegenden Arbeit ist die Erstellung eines Prototyps zur Exploration eines Beispieldatensatzes der Deutschen Presse-Agentur. Die Suche wird anhand der Kriterien Kategorie, Zeit und Raum durchgeführt. Trotz der großen Zahl von Datensätzen sollen Anfragen zu den Verteilungen im Sekundenbereich beantwortet werden können. Die Implementierung basiert auf OLAP-Technologie und erweitert das Geoinformationssystem CommonGIS. Das Protokoll XML for Analysis wird eingesetzt, um standardisiert einen OLAP-Datenbankserver anzusprechen und die geographische Datengrundlage im GIS mit Kennzahlen anzureichern. Die Arbeit stellt einerseits den Anwendungsbereich des Ansatzes vor und untersucht andererseits, welche Möglichkeiten und Einschränkungen sich für den Einsatz von OLAPTechnologie zum Information Retrieval ergeben.In many companies and institutions everyday business process includes incrementally storing and filing great datasets. These large collections of data can only be used to greatest advantage, if information can be retrieved both easily and quickly. A large fraction of the datasets implies an unused spatial context, which could be used to support searching the data bases. This paper suggests an interface beyond text retrieval like Google to allow searching and exploring datasets with visual aid. The attributes are viewed as criteria, which can be constrained. The graphical representation of the distribution of the records per criterion and the visualization on a map may allow the user to get a better overview of the data base of his search. Understanding the data allows the user to search more efficiently. This paper includes the discussion of a prototype to exemplify the exploration of a dataset from the "Deutsche Presse-Agentur". The search uses the criteria of category, time and space. Despite of the large number of records such queries are to be processed within seconds.The implementation is based on OLAP technology and extends the geographic information system CommonGIS. The protocol XML for Analysis allows standardized communication with an OLAP database server. Measures enrich the geographic data in the GIS. The paper evaluates the scope of productive usage for the proposed search technique and investigates the possibilities and limitations of the OLAP technology for information retrieval.Selbstständigkeitserklärung S.III Kurzfassung S.IV Abstract S.V Danksagung S.VI Inhaltsverzeichnis S.VII-VIII Auszüge S.IX Wichtige Abkürzungen S.IX 1 . Einleitung S.1-5 - 1.1. Einführung eines Szenarios: Ticker-Meldungen der dpa S.1 - 1.2. Anwendungsbereich S.1-2 - 1.3. Abstraktion des Anwendungsbereichs S.2 - 1.4. Motivation S.3-4 - 1.5. Ziel der Arbeit S.4 - 1.6 . Überblick S.4-5 2 . Grundlagen S.6-11 - 2.1. Multikriteriell, multidimensional und multivariat S.6 - 2.2. Information Retrieval S.6-8 - 2.3. Business Intelligence S.9 - 2.4. Spatial Business Intelligence S.9-11 3 . Anforderungen S.12-17 - 3.1. Ableitung der Anforderungen S.12 - 3.2. Vorüberlegungen S.12 - 3.3. Systematisierung von Anfragen S.12-15 - 3.4. Welche Anfragen sollen unterstützt werden und wie? S.15 - 3.5. Effizienz S.15-16 - 3.6. Abgrenzung zu bestehenden Systemen S.16 - 3.7. Anforderungen an die Funktionalität S.16-17 4. Technologievorstellung und Evaluierung S.18-26 - 4.1 . Technologieentscheidungen S.18 - 4.2. Einsatz von OLAP im Hinblick auf die Softwareentwicklung S.18-22 - 4.2.1. Konzept eines multidimensionalen Datenwürfels S.19 - 4.2.2. Was ist OLAP und wozu wird es eingesetzt? S.19-20 - 4.2.3. Begrifflichkeiten im OLAP-Umfeld S.20-22 - 4.3. XMLA S.22-26 - 4.3.1 . Discover S.22-23 - 4.3.2 . Execute S.23 - 4.3.3 . MDX S.23-26 - 4.4. Systemarchitektur S.26 5. Umsetzung der Softwareentwicklung S.27-36 - 5.1. CommonGIS S.27-29 - 5.2. Das Plugin-System von CommonGIS S.29-31 - 5.3. OLAP-Plugin S.31-36 - 5.3.1 . Initialisierung S.31 - 5.3.2. Dimensionsmodell in Software S.31-32 - 5.3.3 . Filter S.32-33 - 5.3.4 . Warteschlange S.33-34 - 5.3.5. Oberfläche zur multikriteriellen Suche S.34-35 - 5.3.6. Visualisierung S.35-36 6. Datenintegration und Anwendung S.37-48 - 6.1. Datengrundlage S.37-38 - 6.1.1. Meldungen der Deutschen Presse-Agentur S.37-38 - 6.1.2. Geographische Daten S.38 - 6.2. Datenaufbereitung S.38-43 - 6.2.1. Entwurf des Datenmodells S.38 - 6.2.2. ETL-Vorgehensweise S.38-39 - 6.2.3. Import der dpa-Meldungen S.39 - 6.2.4. Import der geographischen Daten und Erstellung der räumlichen Hierarchie S.39-40 - 6.2.5. Verknüpfung der Meldungsorte mit der räumlichen Information S.40 - 6.2.6. Thematische Kategorisierung der Meldungen S.40-43 - 6.2.7. Erstellung des OLAP-Würfels S.43 - 6.3. Exploration der Beispieldaten S.44-48 7. Ergebnisse und Ausblick S.49-54 - 7.1 . Ergebnisse S.49 - 7.2 . Verbesserungsmöglichkeiten S.49-54 - 7.2.1 . Architektur S.49 - 7.2.2. Oberfläche des OLAP-Plugins S.50 - 7.2.3. Abfrage der Meldungen S.51-52 - 7.2.4. CommonGIS Integration S.52-53 - 7.2.5. OLAP S.53-54 - 7.3 . Fazit S.54 Anhang S.55-56 Literaturverzeichnis S.57-60deinformation retrievalmultikriterielle SucheOLAPGIS005006629Kartenbasierte Benutzerschnittstelle zur effizienten Explorationmaster thesis