Options
Patent
Title
Automatisches, computerbasiertes Ähnlichkeitsberechnungssystem zur Quantifizierung der Ähnlichkeit von Textausdrücken
Other Title
AUTOMATIC, COMPUTER-BASED SIMILARITY CALCULATION SYSTEM FOR QUANTIFYING THE SIMILARITY OF TEXT EXPRESSIONS
Abstract
Die vorliegende Erfindung bezieht sich auf eine Vorrichtung und ein Verfahren zur automatischen, computerbasierten Ähnlichkeitsgewichtung von Textausdrücken. Das erfindungsgemässe System bzw. Verfahren weist eine Dokumenten-Datenbankeinheit (1), eine Kandidatenausdruck-Speichereinheit (2), eine Ähnlichkeitsgewichtswert-Berechnungseinheit (3) auf und ist dadurch gekennzeichnet, dass die Ähnlichkeitsgewichtswerte agw (t1, t2) für die einzelnen Paare von Ausdrücken auf Basis eines Ähnlichkeitsmasses occ_con(t1, t2) berechenbar sind, welches sowohl die Gesamthäufigkeit des gemeinsamen Vorkommens bei der beiden Ausdrücke eines Ausdruckspaares innerhalb ein und derselben Textsegmente in einer Menge von mehreren Textsegmenten, als auch die Gesamtzahl unterschiedlicher Kontextausdrücke in dieser Menge von Textsegmenten berücksichtigt.
;
A device and a method for automatic, computer-based similarity weighting of text expressions. The system and method contemplate a document data bank unit, a candidate expression memory unit and a similarity weight value calculation unit. The similarity weight values agw(t1, t2) can be calculated for the individual pairs of expressions on the basis of a similarity measure occ_con(t1, t2) which takes into account both the total frequency of the common occurrence of the two expressions of one pair of expressions within one text segment in a quantity of several text segments, and the total number of different context expressions in the quantity of text segments.
Inventor(s)
Chen, L.
Thiel, U.
Frankhauser, P.
Kamps, T.
Patent Number
102005051617
Publication Date
2007
Language
German