• English
  • Deutsch
  • Log In
    Password Login
    Research Outputs
    Fundings & Projects
    Researchers
    Institutes
    Statistics
Repository logo
Fraunhofer-Gesellschaft
  1. Home
  2. Fraunhofer-Gesellschaft
  3. Konferenzschrift
  4. Selbstüberwachtes Vortraining zur Verbesserung automatischer Audioklassifikationsalgorithmen
 
  • Details
  • Full
Options
March 19, 2024
Conference Paper
Title

Selbstüberwachtes Vortraining zur Verbesserung automatischer Audioklassifikationsalgorithmen

Abstract
Tiefe neuronale Netze bilden derzeit den Stand der Technik in der automatischen Klassifikation von Audiosignalen. Im Normalfall benötigen sie jedoch eine große Menge an annotierten Daten, um neue Daten robust zu klassifizieren . In vielen Anwendungsfällen stehen diese Datenmengen jedoch nicht zur Verfügung, so dass alternative Trainingsstrategien benötigt werden. Das selbstüberwachte Vortraining von neuronalen Netzen hat sowohl in der Bild- als auch in der Textverarbeitung zu einer deutlichen Verbesserung der Erkennungsleistungen geführt. Hierbei werden i. d. R. mithilfe von künstlichen Aufgabenstellungen Annotationen erzeugt, die sich aus den Daten ableiten lassen und zum Vortraining der neuronalen Netze geeignet sind. Für diesen Ansatz können beliebige Datensätze verwendet werden, da im Gegensatz zum überwachten Lernen keine Datenannotationen benötigt werden. In dieser Arbeit evaluieren wir verschiedene Ansätze des selbstüberwachten Lernens für Audioklassifikation in den Bereichen Musik, Alltagsklänge sowie industrielle Geräusche und untersuchen insbesondere den Einfluss der Zusammenstellung der Trainingsdaten auf die erreichbare Erkennungsleistung. Das beste Ergebnis wurde mit dem Contrastive Learning-Ansatz auf dem umfassenden AudioSet-Datensatz als Trainingsgrundlage erzielt. Hierbei wurden die Ergebnisse im Vergleich zu neuronalen Netzen mit Zufallsgewichten als Startpunkt auf allen Datensätzen übertroffen, was das große Potenzial von selbstüberwachtem Lernen auch für Audioklassifikation bestätigt.
Author(s)
Grollmisch, Sascha  
Fraunhofer-Institut für Digitale Medientechnologie IDMT  
Abeßer, Jakob  
Fraunhofer-Institut für Digitale Medientechnologie IDMT  
Bös, Joachim  
Fraunhofer-Institut für Digitale Medientechnologie IDMT  
Mainwork
"Fortschritte der Akustik - DAGA 2024". Tagungsband - Proceedings  
Conference
Jahrestagung für Akustik 2024  
Language
German
Fraunhofer-Institut für Digitale Medientechnologie IDMT  
Keyword(s)
  • Analyse Industriegeräusche

  • Environmental Sound Analysis

  • Cookie settings
  • Imprint
  • Privacy policy
  • Api
  • Contact
© 2024