GerManC: A historical corpus of German 1650-1800

Autor:
Durrell, Martin & Ensslin, Astrid & Bennett, Paul
Aufsatztitel:
GerManC: A historical corpus of German 1650-1800

Jahrgang:
31
Heft:
01/02 (2007)
Seiten:
71-80
Abstract:
Abstract English
This paper gives an account of the GerManC corpus currently being compiled at theUniversity of Manchester (UK). The first pilot project for this representative historical corpus of German for the years 16 50-1800 is now complete and comprises some 100,000 words from newspapers. The corpus has been fully annotated according to TEI guidelines, and programs have been developed to tag and lemmatize it. As an illustration of the potential of the corpus as a resource for research into the history and standardization of German, short accounts are given of the developments of the variants for beide ‘both’, the gender forms for zwei ‘two’, and the weak adjective declension.

Abstract Deutsch
Dieser Artikel bietet einen kurzen Überblick des GerManC Korpus, das gegenwärtig an der Universität Manchester (Großbritannien) zusammengestellt wird. Der erste Teil dieses repräsentativen historischen Korpus der deutschen Sprache in den Jahren 1650-1800 is jetzt fertig und umfasst etwa 100 000 Wörter aus Zeitungstexten. Das Korpus ist nach den Richtlinien der TEI vollständig annotiert worden, und Programme wurden entwickelt, mit denen das Korpus getaggt und lemmatisiert werden kann. Das Potential des Korpus für die Erforschung der deutschen Sprache und ihrer Standardisierung in dieser Epoche wird durch drei kurze Beispiele aufgezeigt, und zwar zur Geschichte der Varianten für beide, zu den Genusformen des Zahlworts zwei, und zur Entwicklung der schwachen Adjektivflexion.

Zurück