Korpora geschriebener Sprache

American National Corpus (ANC)

Autor/Herausgeber: Ide, Nancy
Veröffentlicht durch: American National Corpus Project
Publikationsdatum: 2002-
Zuletzt bearbeitet: 17.08.2014
Korpus zum American English, das im online frei verfügbaren 'Open American National Corpus (OANC)' momentan etwa 15 Millionen Wörter aus den unterschiedlichsten Textsorten sowie aus Transkripten der gesprochenen Sprache seit 1990 umfasst.

An annotated corpus for the analysis of VP ellipsis

Autor/Herausgeber: Bos, Johan/Spenader, Jennifer K.
Veröffentlicht durch: Faculteit der Letteren = Faculty of Arts/Rijksuniversiteit Groningen = University of Groningen
Publikationsdatum: 20.10.2011
Zuletzt bearbeitet: 13.12.2016
Johan Bos und Jennifer Spenader haben das Wall Street Journal Corpus (WSJ), das mit der Penn Treebank veröffentlicht wird, im Hinblick auf Verbphrasenellipsen (Verb Phrase Ellipsis, VPE) untersucht und daraus ein annotiertes Korpus erstellt.

An annotated corpus of argumentative microtexts

Autor/Herausgeber: Peldszus, Andreas/Stede, Manfred
Veröffentlicht durch: GitHub, Inc., San Francisco, CA
Publikationsdatum:
Zuletzt bearbeitet: 06.08.2015
Korpus mit 112 argumentativen deutschen Mikrotexten sowie professionellen Übersetzungen ins Englische.

Archives of Popular Swahili

Autor/Herausgeber: de Rooij, Vicent A.
Veröffentlicht durch: Universiteit van Amsterdam, University of Amsterdam/Department of Sociology and Anthropology
Publikationsdatum:
Zuletzt bearbeitet: 26.07.2016
Textsammlung des Projekts "Language and Popular Culture in Africa" am Department of Sociology and Anthropology der Universiteit van Amsterdam zur Bantusprache Swahili.

ARTFL Project: Multilingual Bibles

Autor/Herausgeber: Olsen, Mark
Veröffentlicht durch: University of Chicago, IL
Publikationsdatum:
Zuletzt bearbeitet: 02.10.2018
Hier finden sich parallele Übersetzungen der Bibel ins Lateinische, Deutsche (Lutherdeutsch), Englische und Französische. Die Texte sind frei verfügbar und können somit zur multilingualen Korpusrecherche bzw. zur Erstellung multilingualer Textkorp