Fraunhofer-Gesellschaft

Publica

Hier finden Sie wissenschaftliche Publikationen aus den Fraunhofer-Instituten.

Automatisches, computerbasiertes Ähnlichkeitsberechnungssystem zur Quantifizierung der Ähnlichkeit von Textausdrücken

AUTOMATIC, COMPUTER-BASED SIMILARITY CALCULATION SYSTEM FOR QUANTIFYING THE SIMILARITY OF TEXT EXPRESSIONS
 
: Chen, L.; Thiel, U.; Frankhauser, P.; Kamps, T.

:
Frontpage ()

DE 102005051617 A: 20051027
WO 2007048607 A3: 20070621
Deutsch
Patent, Elektronische Publikation
Fraunhofer IGD ()

Abstract
Die vorliegende Erfindung bezieht sich auf eine Vorrichtung und ein Verfahren zur automatischen, computerbasierten Ähnlichkeitsgewichtung von Textausdrücken. Das erfindungsgemässe System bzw. Verfahren weist eine Dokumenten-Datenbankeinheit (1), eine Kandidatenausdruck-Speichereinheit (2), eine Ähnlichkeitsgewichtswert-Berechnungseinheit (3) auf und ist dadurch gekennzeichnet, dass die Ähnlichkeitsgewichtswerte agw (t1, t2) für die einzelnen Paare von Ausdrücken auf Basis eines Ähnlichkeitsmasses occ con(t1, t2) berechenbar sind, welches sowohl die Gesamthäufigkeit des gemeinsamen Vorkommens bei der beiden Ausdrücke eines Ausdruckspaares innerhalb ein und derselben Textsegmente in einer Menge von mehreren Textsegmenten, als auch die Gesamtzahl unterschiedlicher Kontextausdrücke in dieser Menge von Textsegmenten berücksichtigt.

 

A device and a method for automatic, computer-based similarity weighting of text expressions. The system and method contemplate a document data bank unit, a candidate expression memory unit and a similarity weight value calculation unit. The similarity weight values agw(t1, t2) can be calculated for the individual pairs of expressions on the basis of a similarity measure occ con(t1, t2) which takes into account both the total frequency of the common occurrence of the two expressions of one pair of expressions within one text segment in a quantity of several text segments, and the total number of different context expressions in the quantity of text segments.

: http://publica.fraunhofer.de/dokumente/N-201672.html