Options
2012
Conference Paper
Titel
Domänenübergreifende profilbasierte Autorschafts-Attribution
Abstract
Wir präsentieren in dieser Arbeit einen profilbasierten Ansatz für die automatische Autorschafts-Attribution von anonymen Texten, die aus unterschiedlichen Domänen stammen. Die Autorschafts-Attribution ist dabei eine forensisch linguistische Anwendung, die primär das Schutzziel Authentizität gewährleistet und gleichzeitig das Schutzziel Anonymität aufhebt. Als Ausgangssprache für unsere Untersuchung betrachten wir ausschließlich deutschsprachige Texte. Der Grund dafür ist, dass die meiste Forschungsarbeit auf dem Gebiet der Autorschafts-Attribution im englischsprachigen Raum angesiedelt ist und bisher kaum wissenschaftliche Beiträge für die deutsche Sprache existieren. Unser Ansatz stellt ein zweistufiges Verfahren dar, welches in der ersten Stufe zunächst weniger relevante Autoren aus ein er festgelegten Trainingsmenge filtert, um anschließend in der zweiten Stufe die Attribution auf die verbliebene Menge durchzuführen. Wir zeigen in unseren Experimenten, dass der Ansatz eine erfolgreiche automatische Attribution über unterschiedliche Domänen hinweg ermöglichen kann. Dabei testen wir mehrere Parametrisierungen, um eine bestmögliche Performanz zu erzielen.
Konferenz