Hoppe, ThomasThomasHoppe2025-06-122025-06-122024-12-24https://publica.fraunhofer.de/handle/publica/488566Die Erfindung betrifft ein Verfahren zum Trainieren eines Word-Embedding-Verfahrens (105), umfassend folgende Schritte- einer Generierung mindestens eines Trainingstextdatensatzes (10), welcher eine Vielzahl von Listen (11, 11-1 bis 11-4) umfasst,wobei die Generierung des mindestens einen Trainingstextdatensatzes (10) auf Basis von mindestens einem strukturierten Textdatensatz (20) erfolgt,wobei jeder der mindestens einen strukturierten Textdatensätze (20) mindestens eine hierarchische Datenstruktur (21, 21-1, 21-2) basierend auf einem gerichteten, azyklischen Graphen auf einer Menge von Knoten (30-1 bis 30-7) aufweist,wobei jedem Knoten der Menge von Knoten (30-1 bis 30-7) jeweils ein oder mehrere Textelemente (40-1 bis 40-7) zugeordnet sind, und wobei jedes Textelement insbesondere ein Wort und/oder einen Term umfasst, dadurch gekennzeichnet, dassjede Liste der Vielzahl von Listen (11, 11-1 bis 11-4) jeweils auf Basis eines längsten Pfades eines der gerichteten, azyklischen Graphen eines der mindestens einen strukturierten Textdatensätze (20) gebildet wird, wobei die jeweilige Liste für jeden Knoten des zugehörigen längsten Pfades einen Eintrag enthält, wobei jeder Eintrag der jeweiligen Liste mindestens ein Textelement umfasst, welches demjenigen Knoten zugeordnet ist, auf dem der jeweilige Eintrag basiert, und- der mindestens eine Trainingstextdatensatz (10) zum Trainieren eines Word-Embedding-Verfahrens (105) verwendet wird, welches jedem Textelement einer Untermenge der Menge der Textelemente, welche die Einträge der Vielzahl von Listen (11, 11-1 bis 11-4) umfasst, jeweils eine Repräsentation, insbesondere einen reellwertigen Vektor, zuweist. Die Erfindung betrifft auch eine Vorrichtung.deVerfahren und Vorrichtung zum Trainieren eines Word-Embedding VerfahrenspatentDE102023116650 A1DE202310116650