Das PaGeS-Korpus, ein Parallelkorpus der deutschen und spanischen Gegenwartssprache
Abstract
Das Korpus-PaGeS ist ein zweisprachiges Parallelkorpus, das aus einer Sammlung von spanischen und deutschen Texten der Gegenwartssprache besteht. Der Aufsatz beschreibt die einzelnen Arbeitsphasen in der Erstellung des Korpus. Die Beschreibung umfasst die manuelle Vorverarbeitung, die linguistische Aufbereitung und das automatische und manuelle Verfahren für die Alignierung der Texte. Es wird auf den Zugriff und die Visualisierung der Daten eingegangen und die verschiedenen Suchmöglichkeiten werden erläutert. Abschließend werden die geplanten nächsten Schritte skizziert.Downloads
##submission.format##
Lizenz
Um einen globalen Wissensaustausch zu fördern, gewährt die Zeitschrift für deutsche Philologie (RdFA) den Zugang ohne Beschränkungen, seit sie online veröffentlicht wird, deshalb ist sie eine Open Access- Zeitschrift. Die Complutense Universität ist im Besitz der publizierten Manuskripte dieser Zeitschrift und es ist rechtsverbindlich, bei jedem partiellen oder totalen Nachdruck diese bibliographische Referenz anzugeben. Die Artikel haben eine Lizenz Creative Commons (CC BY 4.0). Dieser Umstand muss auf diese Weise zitiert werden, wenn nötig. Informationen über die Version der Lizenz können jederzeit konsultiert werden.