HyperAI

Computerlinguistik

Die Computerlinguistik ist eine Disziplin, die mathematische Modelle zur Analyse und Verarbeitung natürlicher Sprachen verwendet und Programme auf Computern einsetzt, um den Analyse- und Verarbeitungsprozess durchzuführen. Dadurch wird das Ziel erreicht, mithilfe von Maschinen einen Teil oder die gesamten Sprachfähigkeiten einer Person zu simulieren.

Grundlegende Inhalte

Die Computerlinguistik kann je nach Art und Komplexität ihrer Arbeit in die folgenden drei Kategorien unterteilt werden:

  1. Automatische Anordnung: Dies ist die Stärke von Computern und zugleich der ausgereifteste Teil der Computerlinguistik. Statistik, Klassifizierung und Sortierung verschiedener Sprachmaterialien; Bearbeitung verschiedener Vokabulare, Indizes und Wörterbücher; Aufbau von Korpora, Terminologiedatenbanken etc.
  2. Automatische Analyse: Hierbei handelt es sich um eine komplexere automatische Sprachverarbeitung. Dieses automatische Analysesystem arbeitet auf Basis spezifischer, vorab im Computer gespeicherter Sprachinformationen mit dem Ziel, vorgegebene Schlussfolgerungen zu gewinnen.
  3. Automatische Recherche: Hierbei handelt es sich um eine komplexere automatische Verarbeitung von Sprache. Dieses automatische Forschungssystem basiert auf im Computer gespeicherten allgemeinen Sprachinformationen und zieht seine eigenen Schlussfolgerungen anhand von Statistiken, Vergleichen, Analogien und anderen Mitteln.

Anwendung

Der Kern der Computerlinguistik ist das automatische Verstehen und Generieren von Sprache. Ersteres identifiziert die syntaktische Struktur eines Satzes anhand der Wortsymbolfolge auf der Oberfläche des Satzes, bestimmt die semantische Beziehung zwischen Komponenten und findet schließlich die Bedeutung des Satzes heraus; Letzteres wählt Wörter auf der Grundlage der auszudrückenden Bedeutung aus, konstruiert die semantischen und syntaktischen Strukturen zwischen Komponenten auf der Grundlage der semantischen Beziehung zwischen Wörtern und erstellt schließlich Sätze, die der Grammatik und Logik entsprechen.

Die Computerlinguistik gliedert sich in zwei Ebenen: wissenschaftliche Forschung und technologische Forschung. Der Zweck wissenschaftlicher Forschung besteht darin, die inhärenten Gesetze der Sprache zu entdecken, rechnergestützte Methoden zum Sprachverständnis und zur Sprachgenerierung zu erforschen und grundlegende Ressourcen für die Verarbeitung sprachlicher Informationen aufzubauen. Die technologische Forschung orientiert sich an Anwendungszielen und konzipiert und entwickelt praxistaugliche Systeme zur Sprachinformationsverarbeitung auf Grundlage der tatsächlichen Bedürfnisse der Gesellschaft.