Zseby, T.T.Zseby2022-03-072022-03-072005https://publica.fraunhofer.de/handle/publica/27653310.14279/depositonce-1269Subject of this work is the investigation and assessment of statistical sampling methods for non-intrusive measurements in IP networks. Sampling methods here are used as a method to cope with growing requirements on measurement functions and post processing, caused by increasing data rates in Internet traffic. The goal is to provide recommendations for the use of sampling schemes and parameter settings and to allow an assessment of the estimation accuracy with the information available under real conditions. Two target applications are selected, for which the need for a reduction of the measurement effort is crucial, usage based accounting and the validation of quality guarantees in service level agreements (SLAs). A general taxonomy is developed for definition and differentiation of packet selection methods for measurements in IP networks. Based on this taxonomy and an assessment of related work in this area the most promising sampling methods are selected for an in-depth investigation. The selected methods are investigated by theoretical modeling and empirical tests with real traffic traces. They are compared with respect to their technical applicability to IP measurements, achievable estimation accuracy and expected resource consumption. A special focus is set on the investigation of stratified sampling methods. For these, classical statistics promise an accuracy gain without additional costs, if intelligent grouping of data can be applied by utilization of a-priori information. The incorporation of practical aspects from a real router vendor perspective was possible by a close cooperation with Cisco Systems, which funded parts of this work.Inhalt diese Arbeit ist die Untersuchung und Beurteilung von Stichprobenverfahren für den Einsatz bei passiven Messungen in IP Netzen. Stichprobenverfahren werden hier eingesetzt um die wachsenden Anforderungen an Messfunktionen und Nachbearbeitung zu bewältigen, die durch die steigenden Datenraten im Internet verursacht werden. Ziel ist es Empfehlungen für den Einsatz von Stichprobenverfahren und Parametereinstellungen zu erstellen und eine Beurteilung der Schätzgenauigkeit mit unter realen Bedingungen verfügbaren Informationen zu ermöglichen. Zwei Ziel-Anwendungen werden ausgewählt, für die eine Beschränkung des Messaufwands von essentieller Bedeutung ist, nutzungsbasierte Abrechnung und die Validierung von vertraglich vereinbarten Dienstgüten. Zunächst wird eine Taxonomie für die Definition und Unterscheidung von Paketselektionsverfahren für Messungen in IP Netzen entwickelt. Basierend auf dieser Taxonomie und einer Bewertung verwandter Arbeiten auf dem Gebiet werden die aussichtsreichsten Stichprobenverfahren für eine genauere Betrachtung ausgewählt. Die ausgewählten Verfahren werden mit theoretischer Modelbildung und praktischen Experimenten mit realen Verkehrsdaten untersucht. Die Verfahren werden anhand technischer Anwendbarkeit, erzielbarer Schätzgenauigkeit und erwartetem Ressourcenverbrauch verglichen. Ein Schwerpunkt wird auf die Untersuchung von geschichteten Selektionsverfahren gesetzt. Hier verspricht die klassische Statistik einen Genauigkeitsgewinn ohne Zusatzkosten, falls eine intelligente Gruppierung der Daten durch Verwendung von a-priori Informationen möglich ist. Die Berücksichtigung praktischer Aspekte aus Sicht eines realen Router-Herstellers war möglich durch eine enge Zusammenarbeit mit Cisco Systems, die einen Teil dieser Arbeit finanziert haben.en004Statistical sampling for non intrusive measurements in IP networksEinsatz von Stichprobenverfahren für passive Messungen in IP-Netzendoctoral thesis