Parallelkorpus zum Niederländischen und Deutschen
Wir stellen hier eine Version des Europarl-Korpus zur Verfügung. Aus dem 'source release' haben wir ein Korpus für das Sprachenpaar Deutsch-Niederländisch generiert und es mit einem Webinterface versehen.
Europarl Korpus
Suchen im Europarl Korpus (release v6, 02/2011)
Das Europarl Parallelkorpus ist aus den 'Proceedings' des Europäischen Parlaments extrahiert worden. Es enthält ca. 50 Mill. Wörter pro Sprache. Das Korpus wurde zusammengestellt von Cameron Shaw Fordyce (CELCT), Josh Schroeder und Philipp Koehn (beide University of Edinburgh).
Eine detaillierte Beschreibung des Korpus findet sich in diesem Artikel:
Europarl: A Parallel Corpus for Statistical Machine Translation, Philipp Koehn, MT Summit 2005, [ PDF ].
Mehr Informationen zum Europarl-Korpus finden Sie auf der Europarl Website. Hier steht das gesamte Korpus auch zum Download bereit.