Options
2024
Journal Article
Title
Improving the performance of artificial neural networks trained on synthetic data in gas spectroscopy - a study on two sensing approaches
Title Supplement
Approaches to overcome data scarcity when utilizing artificial neural networks in quantitative gas analysis
Other Title
Verbesserung der Performance von mit künstlich erzeugten Daten trainierten künstlichen neuronalen Netzen für die Gasspektroskopie - eine Studie an zwei Sensoransätzen
Abstract
Artificial neural networks (ANNs) are used in quantitative infrared gas spectroscopy to predict concentrations on multi-component absorption spectra. Training of ANNs requires vast amounts of labelled training data which may be elaborate and time consuming to obtain. Additional data can be gained by the utilization of synthetically generated spectra, but at the cost of systematic deviations to measured data. Here, we present two approaches to train ANNs with a combination of comparatively small, measured data sets and synthetically generated data. For the first approach a neural network is trained hybridly with synthetically generated infrared absorption spectra of mixtures of N2O and CO and measured zero-gas spectra, taken with a mid-infrared dual comb spectrometer. This improves the mean absolute error (MAE) of the network predictions from 0.46 to 0.01 ppmV and 0.24 to 0.01 ppmV for the concentration predictions of N2O and CO respectively for zero-gas measurements which was previously observed for training with purely synthetic data. At the same time a similar performance on spectra from gas mixtures of 0-100 ppmV N2O and 0 to 60 ppmV CO was achieved. For the second approach an ANN pre-trained on synthetic infrared spectra of mixtures of acetone and ethanol is retrained on a small dataset consisting of 26 spectra taken with a mid-infrared photoacoustic spectrometer. In this case the MAE for the concentration predictions of ethanol and acetone are improved by 45 % and 20 % in comparison to purely synthetic training. This shows the capability of using synthetically generated data to train ANNs in combination with small amounts of measured data to further improve neural networks for gas sensing and the transferability between different sensing approaches.
;
Künstliche neuronale Netze werden in der quantitativen Infrarot-Gasspektroskopie eingesetzt, um Gaskonzentrationen in Multi-Komponenten-Absorptionsspektren vorherzusagen. Das Training von künstlichen neuronalen Netzen benötigt große Mengen an Trainingsdaten, was mit einem hohen Arbeits- und Zeitaufwand verbunden ist. Zusätzliche Trainingsdaten können durch synthetisch generierte Spektren gewonnen werden, sind jedoch mit systematischen Abweichungen zu tatsächlich gemessenen Daten verbunden. In dieser Arbeit werden zwei Ansätze präsentiert, um künstliche neuronale Netze mit einer Kombination aus vergleichsweise kleinen, gemessenen Datensätzen und synthetisch erzeugten Daten zu trainieren. Für den ersten Ansatz wird das neuronale Netz hybrid mit synthetisch erzeugten Infrarot-Absorptionsspektren von Mischungen aus N2O und CO und gemessenen Null-Gas-Spektren trainiert, welche mit einem Doppel-Kamm-Spektrometer im Mittelinfraroten aufgenommen wurden. Dieses Vorgehen verbessert den mittleren, absoluten Fehler der Netzvorhersagen von 0,46 auf 0,01 ppmV und 0,24 auf 0,01 ppmV für N2O bzw. für CO für Null-Gas-Messungen, im Vergleich zu den Vorhersagen des neuronalen Netzes, welches nur mit synthetisch erzeugten Daten trainiert wurde. Gleichzeitig zeigte das hybrid trainierte Netz eine gleichbleibende Performance für Konzentrationsvorhersagen für Spektren aus Gasmischungen von 0 bis 100 ppmV N2O und 0 bis 60 ppmV CO. Für den zweiten Ansatz wird ein neuronales Netz, welches bereits mit synthetischen erzeugten Infrarotspektren von Mischungen aus Aceton und Ethanol trainiert wurde, erneut auf einem kleinen gemessenen Datensatz bestehend aus 26 Spektren trainiert, welche mit einem photoakustischen Spektrometer im mittleren Infrarot aufgenommen wurden. In diesem Fall hat sich der mittlere absolute Fehler der Konzentrationsvorhersage für Ethanol und Aceton um 45 % bzw. 20 % im Vergleich zu einem rein synthetischen Training verbessert. Das zeigt das Potential synthetisch erzeugte Daten für das Training von künstlichen neuronalen Netzen in Kombination mit kleinen gemessenen Datensätzen zu nutzen, um neuronale Netze für den Einsatz im Bereich der Gassensorik zu verbessern und gleichzeitig die Übertragbarkeit der Methodik auf verschiedene Messansätze.
Author(s)