Now showing 1 - 10 of 2537
  • Publication
    Incorporating Query Recommendation for Improving In-Car Conversational Search
    ( 2024-03-23)
    Rony, Md. Rashad Al Hasan
    ;
    ;
    Khan, Abbas Goher
    ;
    Friedl, Ken E.
    ;
    Sudhi, Viju
    ;
    Süß, Christian
    Retrieval-augmented generation has become an effective mechanism for conversational systems in domain-specific settings. Retrieval of a wrong document due to the lack of context from the user utterance may lead to wrong answer generation. Such an issue may reduce the user engagement and thereby the system reliability. In this paper, we propose a context-guided follow-up question recommendation to internally improve the document retrieval in an iterative approach for developing an in-car conversational system. Specifically, a user utterance is first reformulated, given the context of the conversation to facilitate improved understanding to the retriever. In the cases, where the documents retrieved by the retriever are not relevant enough for answering the user utterance, we employ a large language model (LLM) to generate question recommendation which is then utilized to perform a refined retrieval. An empirical evaluation confirms the effectiveness of our proposed approaches in in-car conversations, achieving 48% and 22% improvement in the retrieval and system generated responses, respectively, against baseline approaches.
  • Publication
    Deep Dynamic Language Models
    This thesis investigates the domain of deep dynamic language models, focusing on the integration of temporal dynamics to enhance language modeling and its application in various tasks, such as text generation, recommendation systems, and predicting post popularity. Temporal content change, i.e., trends and themes that change with time featured in document collections such as academic journals, news articles and social media, make the traditional static language models (LMs) not an optimal solution. In order to address this limitation, several approaches to develop dynamic LMs are proposed and explored in this thesis. Initially, the impact of incorporating temporal information is explored, specifically in the context of modeling online communities. For the analysis of temporal content change in Yelp - a crowd-sourced review platform - an instantaneous language model is proposed. This model combines a temporal point process (TPP) for modeling review creation times and a LM to capture textual aspects. Empirical evaluations demonstrate that this model significantly improves the performance of LMs in terms of both language modeling and prediction of review creation time. Building upon the success of the instantaneous LM, the research in this thesis is extended to more application oriented task, such as recommender systems. Recognizing that user preferences and item reviews change over time, the proposed model here leverages users’ reviews to enhance rating predictions. By developing time-interval aware representations, the proposed model outperforms several state-of-the-art recommender systems models in real-world datasets. Additionally, the integration of dynamic topic models into LMs is explored. First, the problem of skewed topic distributions in topic modeling is addressed, which can cause models to learn more general topics present in the majority of documents, rather than rare topics present in only a few documents. A neural dynamic focused topic model is proposed as a solution, which decouples topic activities from topic proportions in documents using sequences of Bernoulli random variables. Experimental evaluations show that this model outperforms state-of-the-art topic models in generalization tasks, while employing a comparable number of parameters and converging two times faster. Furthermore, the performance of large pre-trained language models (LPLMs) in dynamic environments is explored. The empirical analysis on Reddit datasets reveals significant performance drops when predicting the popularity of future posts due to temporal distribution shifts in data. To mitigate this issue, a model is proposed that combines neural variational dynamic topic models and attention mechanisms to infer temporal LM representations. The proposed model exhibit improved performance while utilizing only a fraction of the parameters of LPLMs, and providing interpretable representations that offer insights into real-world events. In summary, this thesis emphasizes the significance of incorporating temporal dynamics into LMs and explores their application in various tasks.
  • Publication
    Wie Agenten und Foundation-Modelle bei der Versorgung Schwerverletzter helfen
    ( 2024-03)
    Meyer, Mareen
    ;
    ; ;
    Defosse, Jérôme
    ;
    Hensen, Sandra
    ;
    Iser, Henri
    ;
    Salge, Torsten Oliver
    ;
    Stead, Susan
    ;
    Tjardes, Thorsten
    ;
    Waloßek, Nina
    Künstliche Intelligenz im Schockraum: Wie kann sie das medizinische Team entlasten und unterstützen, um die Behandlung für die Patient*innen sicherer und besser zu machen? Und welche Anwendungen eignen sich hierfür besonders? Hier kommt die Entwicklung neuer KI-Modelle ins Spiel. Insbesondere sogenannte Foundation-Modelle und Large-Language-Modelle (LLMs) ermöglichen die Umsetzung einer Vielzahl von neuen Use Cases im Krankenhaus. Diese umfassen die gesamte Kette klinischer Prozesse bis hin zu Extremsituationen, wie der Schwerverletzten-Versorgung im Schockraum. Besonders relevant ist, dass LLMs ein omnipräsentes Problem von Data Science in der Medizin lösen könnten: Sie können auch mit wenigen Trainingsdaten auf Use Cases adaptiert werden und liefern durch ihr tiefes Sprachverständnis fundiertere Ergebnisse, als es bisher möglich war. Eine besonders spannende Entwicklung stellen LLM-Agenten dar, die eine Umgebung analysieren und daraufhin eigenständig Aktionen, wie z. B. die Bedienung von Systemen über Schnittstellen, durchführen können. In diesem Whitepaper veranschaulichen wir den Nutzen von LLMs und Agenten anhand von zwei Einsatzmöglichkeiten im Schockraum, die im Rahmen des Projekts TraumAInterfaces umgesetzt wurden.
  • Publication
    Superkraft Sprachmodell?
    ( 2024-03)
    Dinnessen, Felix
    ;
    Bringmann, Björn
    ;
    Dang, David
    ;
    ;
    Halscheidt, Sandra
    Die deutsche Verwaltungslandschaft steht angesichts der notwendigen Digitalisierung und Automatisierung von bisher manuellen Prozessen vor einer grundlegenden Transformation. Der Anstieg an Anträgen für Wohngeld, BAföG oder Einbürgerungsverfahren setzt Behörden zusätzlich unter Druck. Der entstehende Rückstau trägt zu einem sinkenden Vertrauen in die Leistungsfähigkeit der öffentlichen Verwaltung bei. Gleichzeitig muss sie die rückläufigen Mitarbeitendenzahlen infolge des demografischen Wandels kompensieren. Generative Künstliche Intelligenz (GenAI) und insbesondere große Sprachmodelle (Large Language Models, LLMs) spielen hier eine wichtige Rolle, um die Mitarbeitenden zukünftig in ihren Aufgaben zu unterstützen, zu entlasten und hierdurch Freiräume zu schaffen, um sich verstärkt der direkten Interaktion mit Bürgerinnen und Bürgern zu widmen. In diesem Briefing präsentieren Fraunhofer IAIS und Deloitte drei Anwendungsbeispiele großer Sprachmodelle, von welchen die öffentliche Verwaltung schon heute profitieren kann. Bei der Betrachtung zu etablierender Rahmenbedingungen muss zwischen den behördeninternen Voraussetzungen und der staatlichen Infrastruktur unterschieden werden. Diese Publikation betrachtet die Voraussetzungen auf individueller Ebene der Behörden.
  • Publication
    Vertrauenswürdige KI-Anwendungen mit Foundation-Modellen entwickeln
    ( 2024-01-22) ;
    Schmidt, Sebastian
    ;
    Müller, Felix Benjamin
    ;
    Görge, Rebekka
    ;
    ; ; ; ;
    Die weltweit erste, umfassende Regulierung von Künstlicher Intelligenz ist die europäische KI-Verordnung (AI Act), die zum Zeitpunkt der Veröffentlichung des Whitepapers kurz vor der formellen Verabschiedung steht und eine KI-Konformitätsbewertung von Hochrisikosystemen fordert. Vor diesem Hintergrund zeigt das Whitepaper auf, wie die Vertrauenswürdigkeit einer mit Foundation-Modellen entwickelten KI-Anwendung bewertet und sichergestellt werden kann. Dafür wird die Vorgehensweise, wie sie im »KI-Prüfkatalog zur Gestaltung vertrauenswürdiger Künstlicher Intelligenz« des Fraunhofer IAIS entwickelt worden ist, in den Kontext von Foundation-Modellen übertragen. Dabei wird besonders berücksichtigt, dass sich spezielle Risiken der Foundation-Modelle auf die KI-Anwendung auswirken können und zusätzlich bei der Prüfung der Vertrauenswürdigkeit beachtet werden müssen.
  • Publication
    On the effects of biased quantum random numbers on the initialization of artificial neural networks
    Recent advances in practical quantum computing have led to a variety of cloud-based quantum computing platforms that allow researchers to evaluate their algorithms on noisy intermediate-scale quantum devices. A common property of quantum computers is that they can exhibit instances of true randomness as opposed to pseudo-randomness obtained from classical systems. Investigating the effects of such true quantum randomness in the context of machine learning is appealing, and recent results vaguely suggest that benefits can indeed be achieved from the use of quantum random numbers. To shed some more light on this topic, we empirically study the effects of hardware-biased quantum random numbers on the initialization of artificial neural network weights in numerical experiments. We find no statistically significant difference in comparison with unbiased quantum random numbers as well as biased and unbiased random numbers from a classical pseudo-random number generator. The quantum random numbers for our experiments are obtained from real quantum hardware.
  • Publication
    AITA: AI trustworthiness assessment. AAAI spring symposium 2023
    ( 2024-01-03)
    Braunschweig, Bertrand
    ;
    Buijsman, Stefan
    ;
    Chamroukhi, Faïcel
    ;
    Heintz, Fredrik
    ;
    Khomh, Foutse
    ;
    Mattioli, Juliette
    ;
  • Publication
    Short-term predictor for COVID-19 severity from a longitudinal multi-omics study for practical application in intensive care units
    ( 2024) ;
    Hahnefeld, Lisa
    ;
    Kloka, Jan Andreas
    ;
    ;
    Nürenberg-Goloub, Elena
    ;
    Zinn, Sebastian
    ;
    Vehrenschild, Maria
    ;
    Zacharowski, Kai
    ;
    Lindau, Simone
    ;
    Ulrich, Evelyn
    ;
    ; ;
    Schwäble, Joachim
    ;
    Gurke, Robert
    ;
    Dorochow, Erika
    ;
    Bennett, Alexandre
    ;
    Dauth, Stephanie
    ;
    Campe, Julia
    ;
    Knape, Tilo
    ;
    Laux, Volker
    ;
    Kannt, Aimo
    ;
    Köhm, Michaela
    ;
    ;
    Resch, Eduard
    ;
    Behrens, Frank
    Background: The COVID-19 pandemic challenged the management of technical and human resources in intensive care units (ICU) across the world. Several long-term predictors for COVID-19 disease progression have been discovered. However, predictors to support short-term planning of resources and medication that can be translated to future pandemics are still missing. A workflow was established to identify a predictor for short-term COVID-19 disease progression in the acute phase of intensive care patients to support clinical decision-making. Methods: Thirty-two patients with SARS-CoV-2 infection were recruited on admission to the ICU and clinical data collected. During their hospitalization, plasma samples were acquired from each patient on multiple occasions, excepting one patient for which only one time point was possible, and the proteome (Inflammation, Immune Response and Organ Damage panels from Olink® Target 96), metabolome and lipidome (flow injection analysis and liquid chromatography-mass spectrometry) analyzed for each sample. Patient visits were grouped according to changes in disease severity based on their respiratory and organ function, and evaluated using a combination of statistical analysis and machine learning. The resulting short-term predictor from this multi-omics approach was compared to the human assessment of disease progression. Furthermore, the potential markers were compared to the baseline levels of 50 healthy subjects with no known SARS-CoV-2 or other viral infections. Results: A total of 124 clinical parameters, 271 proteins and 782 unique metabolites and lipids were assessed. The dimensionality of the dataset was reduced, selecting 47 from the 1177 parameters available following down-selection, to build the machine learning model. Subsequently, two proteins (C-C motif chemokine 7 (CCL7) and carbonic anhydrase 14 (CA14)) and one lipid (hexosylceramide 18:2; O2/20:0) were linked to disease progression in the studied SARS-CoV-2 infections. Thus, a predictor delivering the prognosis of an upcoming worsening of the patient's condition up to five days in advance with a reasonable accuracy (79 % three days prior to event, 84 % four to five days prior to event) was found. Interestingly, the predictor's performance was complementary to the clinicians' capabilities to foresee a worsening of a patient. Conclusion: This study presents a workflow to identify omics-based biomarkers to support clinical decision-making and resource management in the ICU. This was successfully applied to develop a short-term predictor for aggravation of COVID-19 symptoms. The applied methods can be adapted for future small cohort studies.
  • Publication
    Einsatz von KI-basierten Anwendungen durch Krankenhauspersonal: Aufgabenprofile und Qualifizierungsbedarfe
    ( 2024) ;
    Albiez, Daniela
    ;
    Bures, Dominik Martin
    ;
    Hosters, Bernadette
    ;
    Jovy-Klein, Florian
    ;
    Nickel, Kilian
    ;
    Reibel, Thomas
    ;
    Schramm, Johanna
    ;
    ;
    Antons, David
    ;
    Diehl, Anke
    Künstliche Intelligenz (KI) hat für Krankenhäuser wesentlich an Bedeutung gewonnen. Um die umfangreichen Potenziale der Technologie tatsächlich nutzen zu können, sind Anpassungen bei Aufgabenprofilen sowie zielgerichtete Qualifizierungsmaßnahmen für das Krankenhauspersonal heute und in Zukunft unabdingbar. Davon sind sowohl medizinische als auch nichtmedizinische Prozesse entlang der gesamten Wertschöpfungskette im Krankenhaus betroffen. Ziel der Arbeit ist es, einen Überblick über die notwendigen Fähigkeiten im Umgang mit intelligenten Technologien im klinischen Kontext zu geben und Maßnahmen zur Qualifizierung von Mitarbeiter*innen vorzustellen. Im Rahmen des Projekts "SmartHospital.NRW" wurden im Jahr 2022 eine Literaturrecherche sowie Interviews und Workshops mit Expert*innen durchgeführt. KI-Technologien und Anwendungsfelder wurden identifiziert. Zentrale Ergebnisse umfassen veränderte und neue Aufgabenprofile, identifizierte Synergien und Abhängigkeiten zwischen den einzelnen Aufgabenprofilen sowie die Notwendigkeit eines umfassenden interdisziplinären und interprofessionellen Austauschs beim Einsatz von KI-basierten Anwendungen im Krankenhaus. Unser Beitrag zeigt, dass Krankenhäuser frühzeitig Kompetenzen im Bereich Digital Health Literacy in der Belegschaft fördern und gleichzeitig technikaffines Personal anwerben müssen. Interprofessionelle Austauschformate sowie ein begleitendes Changemanagement sind essenziell für die Nutzung von KI im Krankenhaus.
  • Publication
    Deep reinforcement learning in service of air traffic controllers to resolve tactical conflicts
    ( 2024)
    Papadopoulos, George
    ;
    Bastas, Alevizos
    ;
    Vouros, George A.
    ;
    Crook, Ian
    ;
    Andrienko, Natalia
    ;
    Gennady Andrienko
    ;
    Cordero, Jose Manuel
    Dense and complex air traffic requires higher levels of automation than those exhibited by tactical conflict detection and resolution (CD&R) tools that air traffic controllers (ATCOs) use today: AI tools can act on their own initiative, increasing the capacity of ATCOs to control higher volumes of traffic. However, given that the air traffic control (ATC) domain is safety critical, requires AI systems to which ATCOs are comfortable to relinquishing control, guaranteeing operational integrity and automation adoption. Two major factors towards this goal are quality of solutions and operational transparency. ResoLver, the system that this article presents, addresses these challenges using an enhanced graph convolutional reinforcement learning method operating in a multiagent setting where each agent – representing a flight – performs a CD&R task, jointly with other agents. We show that ResoLver can provide high-quality solutions with respect to stakeholders interests (air traffic controllers and airspace users), addressing also operational transparency issues, which have been validated by ATCOs in simulated real-world settings.