Using Computers in Linguistics. A Practical Guide

Lawler, John/ Dry, Helen Aristar (eds.)

London, New York: Routledge 1998

Dieses Buch soll als Leitfaden linguistischer Computerarbeit im weitesten Sinne dienen. In acht Kapiteln werden Grundbegriffe computergestützter Arbeit geklärt, verschiedene fachspezifische Probleme im Umgang mit Computern angeschnitten und mögliche Folgen der neuen technischen Mittel und Medien erläutert.

Das Buch bringt es insgesamt auf knapp 300 Seiten und kann dementsprechend auf viele Themenfelder nur sehr grob eingehen. Die Einleitung des Buches nimmt wichtige Resultate vorweg und zeichnet den Weg der einzelnen Kapitel vor. Sie unterstreicht den Nutzen des Buches als Nachschlagewerk, nicht nur als Einführung.

Das erste Kapitel stellt die Frage nach der Natur linguistischer Daten und der daraus entstehenden Anforderungen an den Computer. Festgestellt wird, dass die Darstellungs- und Bearbeitungsmöglichkeiten einer Vielzahl von einander widerstrebenden Charakteristika gerecht werden müssen, z.B. der linearen Struktur eines Textes und der hierarchisch zergliederten Struktur dazu angelegter Daten aus Gebieten wie Morphologie, Syntax usw. Das zweite Kapitel soll als Einführung in das Internet mit den verschiedenen speziellen Netzwerken, von Gopher über das Telnet bis zum Usenet dienen. Auffällig ist hier die stiefmütterliche Behandlung moderner Applikationen. Die Schilderung der Grundsätze erfolgt zwar nachvollziehbar und ohne Übermengen an technischem Kauderwelsch, geht allerdings immer vom Betriebssystem Unix aus und findet für andere Umgebungen nur knappe Worte. Das dritte Kapitel widmet sich dem spezielleren Thema linguistischer Lernsoftware. Der Autor des Kapitels, selbst Entwickler zweier Lernprogramme, führt auf sehr plastische Weise in die Entwicklung und Verwendung der Software ein. Viele Beispiele aus seiner Erfahrung machen seine Ausführungen sehr gut nachvollziehbar. Das vierte Kapitel führt in die Erstellung und Pflege von Textdatenbanken ein, während das fünfte auf Möglichkeiten der Arbeit mit diesen Datenbanken in Unix-Systemen eingeht. Bemerkenswert ist, dass der Autor die Mühe unternimmt, Begriffe der Computersprache durch den Vergleich mit linguistischen Kategorien anschaulich zu machen. Kapitel 6 gibt Antworten auf die Frage, welcher Computer und welche Software sinnvolle Anschaffungen darstellen. Die Autoren machen allerdings nicht den Fehler, pauschalisierte Empfehlungen zu geben, sondern sie nennen entscheidungsrelevante Kriterien.

Die letzten beiden Kapitel fallen aus diesem Rahmen der Einführungen und Überblicke heraus. Sie befassen sich mit den Gebieten des Natural Language Processing oder der Computational Linguistics. Das siebte Kapitel wagt die Behauptung, dass alle technischen Mittel vorhanden seien, um eine ganze Reihe von kommerziellen Anwendungen der computergestützten Sprachbearbeitung herzustellen. Dazu zählen neben Grammatikprüfprogrammen Anwendungen, die Gebrauchstexte mit hoher Fehlerfreiheit übersetzen, das Programmieren in normaler Sprache ermöglichen oder inhaltliche Fragen zu gespeicherten Texten beantworten können. Der Autor nennt Kriterien, die für eine derartige Nutzung erfüllt werden müssen. Im achten Kapitel wird ein fortgeschrittener Ansatz der linguistischen Arbeit mit Computern vorgestellt: Corpus-Based Linguistics, ein Ansatz, der mit großen Datenmengen und vornehmlich statistischer Textarbeit gute Resultate erzielen konnte. Diese werden hier vorgestellt, mit einer besonderen Betonung auf den offensichtlichen Defiziten dieser Arbeitsmethode. Eine Kernthese der Autoren dieses Kapitels ist, dass mit einfachen Mitteln eine große Menge an Analyse sprachlicher Daten geleistet werden kann, während die Ausdehnung dieser Erkenntnisse um immer kleinere Schritte rapide wachsenden Aufwand erfordert (vgl. S. 231).

Dieses Buch erfüllt sicher einen großen Nutzen für Linguisten oder linguistisch Interessierte, die über die Möglichkeiten computergestützter Arbeit informiert werden wollen; aber auch beim Willen zu selbständiger Arbeit kann dieses Buch als Nachschlagewerk sicher wertvolle Dienste erweisen. Mir hat es als Ausblick auf praktische wissenschaftliche Arbeit gedient; besonders die durchweg verständliche Sprache hat mich erleichtert. Enttäuschend fand ich allein das zweite Kapitel, in dem meines Erachtens auch im Jahr 1998 schon die technischen Entwicklungen andere Schwerpunkte gefordert hätten als Softwaretipps für textbasiert arbeitende Unix-Anwender. Spätestens hier erfüllen aber die online unter  http://www.routledge.com/linguistics/using-comp.html zu sämtlichen Kapiteln verfügbaren Ergänzungen, Anhänge und Links wertvolle Dienste.

 

Rezension aus dem Essener Grundkurs Sprachwissenschaft.
Rezensiert von Jan Bojaryn. Jahr: 2000

Zurück