Formale Modelle für natürliche Sprachen

Sommersemester 2013



Lehrbeauftragte: Dr. Bianca Truthe
Wochenstunden: 4+0+0
Zuhörerkreis: IF, DKE
Voraussetzungen: Grundvorlesung zur Theoretischen Informatik
Prüfung bzw. Scheinerwerb: jeweils durch eine mündliche Prüfung von 20 - 30 Minuten

Inhalt:

Die automatische Verarbeitung natürlichsprachiger Texte gewinnt ständig an Bedeutung, z.B. im Zusammenhang mit Informationsextraktion aus Texten, Erstellung wohldefinierter Texte wie Protokolle u.ä., Übersetzungen usw. Dabei spielt insbesondere die automatische Analyse und Synthese von Sätzen eine wichtige Rolle. In der Vorlesung wird gezeigt, dass die üblichen Modelle für formale Sprachen (wie sie aus der Grundvorlesung zur Theoretischen Informatik bekannt sind) für die Behandlung natürlicher Sprachen nur bedingt brauchbar sind und es werden einige Typen formaler Sprachen behandelt, die für die Verarbeitung natürlicher Sprachen besser geeignet sind. Es werden vier Klassen schwach kontext-abhängiger Sprachfamilien angegeben, die die meisten Phänomene natürlicher Sprachen beschreiben können, aber trotzdem eine einfache Struktur und gute Eigenschaften hinsichtlich automatischen Parsens besitzen. Darüber hinaus werden kontextuale Grammatiken und Automaten mit Neustart behandelt, die insbesondere zur Analyse von Einfügungen in Sätzen geeignet sind. Für die Modellierung von Dialogen wird ein Modell auf der Basis von Grammatiksystemen angegeben.

Weitere empfohlene Literatur:

Rozenberg, Salomaa:
Handbook of Formal Languages I-III.
Springer-Verlag, Berlin, 1997
Hopcroft, Ullman:
Introduction to Automata Theory, Languages, and Computation.
Addison-Wesley, 1979
Paun:
Marcus Contextual Grammars.
Kluwer, 1997
Partee et al:
Mathematical Methods in Linguistics.
Kluwer, 1997