• English
  • Deutsch
  • Log In
    Password Login
    Research Outputs
    Fundings & Projects
    Researchers
    Institutes
    Statistics
Repository logo
Fraunhofer-Gesellschaft
  1. Home
  2. Fraunhofer-Gesellschaft
  3. Abschlussarbeit
  4. Representation of Discovered Frequent Information in Compressed Log Files
 
  • Details
  • Full
Options
2022
Bachelor Thesis
Title

Representation of Discovered Frequent Information in Compressed Log Files

Abstract
Log files are usually compressed due to their large file size before being stored. In that process, a compression algorithm would identify frequent patterns in the file to remove redundant information. However, these patterns are usually immediately discarded once the compression process is finished, even though valuable information can be obtained from these patterns. This thesis presents how frequent pattern data can be simultaneously collected during the file compression process to spare computational resources and then be visualized using a web-application dashboard. The application of the implemented pattern recognition method in this thesis could not only identify patterns within log files with an arbitrary format but could also work on any text file including text corpora.

; 

Protokolldateien werden in der Regel aufgrund ihrer großen Dateigröße komprimiert, bevor sie gespeichert werden. Dabei erkennt ein Komprimierungsalgorithmus frequent entdeckten Muster in der Datei, um redundante Informationen zu entfernen. Diese Muster werden jedoch in der Regel sofort verworfen, sobald der Komprimierungsprozess abgeschlossen ist, obwohl sich aus diesen Mustern wertvolle Informationen gewinnen lassen. In dieser Arbeit wird vorgestellt, wie Daten über frequent entdeckten Muster gleichzeitig während des Dateikomprimierungsprozesses gesammelt werden können, um Rechenressourcen zu schonen, und dann über eine Webanwendung Dashboard visualisiert werden können. Die in dieser Arbeit implementierte Mustererkennungsmethode kann nicht nur Muster in Protokolldateien mit beliebigem Format erkennen, sondern auch auf beliebige Textdateien einschließlich Textkorpora angewendet werden.
Thesis Note
Darmstadt, TU, Bachelor Thesis, 2022
Author(s)
Joewono, Jonathan Geraldi
Fraunhofer-Institut für Graphische Datenverarbeitung IGD  
Advisor(s)
Kuijper, Arjan  orcid-logo
Fraunhofer-Institut für Graphische Datenverarbeitung IGD  
Cherepanov, Igor
Fraunhofer-Institut für Graphische Datenverarbeitung IGD  
Language
English
Fraunhofer-Institut für Graphische Datenverarbeitung IGD  
Keyword(s)
  • Lead Topic: Digitized Work

  • Lead Topic: Visual Computing as a Service

  • Research Line: Human computer interaction (HCI)

  • Data mining

  • Human-centered user interfaces

  • Pattern recognition

  • Cookie settings
  • Imprint
  • Privacy policy
  • Api
  • Contact
© 2024