Das RIDGES Korpus
Das RIDGES-Projekt (Register in Diachronic German Science) untersucht die Entstehung und Entwicklung der deutschen Wissenschaftssprache seit Ende des 15. Jahrhunderts bis ins 20. Jahrhundert. In der frühneuhochdeutschen Zeit entstehen immer mehr Texte mit wissenschaftlichem oder wissenschaftsnahem Inhalt, seit der Mitte des 15. Jahrhunderts auch in gedruckter Form. Dem wissenschaftlichen Register angemessene Textstrukturen und Terminologie mussten im Laufe der Zeit erst entwickelt und erprobt werden. Wissenschaftliche Texte haben sich über die Jahrhunderte natürlich verändert. Dabei sind die meisten Veränderungen quantitativ und nicht qualitativ (kategorial).
In unserem Projekt sollen wissenschaftliche Texte daher auf allen sprachlichen Ebenen (Syntax, Wortbildung, Lexik, Phraseologie, Textstruktur etc.) analysiert werden, um Entwicklungen und Tendenzen identifizieren und beschreiben zu können. In einem variationistischen Ansatz annotieren wir wissenschaftliche Texte mit korpuslinguistischen Methoden und nutzen quantitative Verfahren, um Veränderungen in den Merkmalen zu identifizieren. Dabei kommen verschiedene Formate zum Einsatz, zum Beispiel Excel und ANNIS.
Wichtig ist uns dabei die Mitwirkung unserer Studierenden, die im Rahmen ihres Studiums bei der Erstellung und der Annotation der Korpus-Ressourcen mit einbezogen werden. Die so entstandenen Ressourcen werden in mehreren Formaten unter einer Creative Commons-Lizenz frei zur Verfügung gestellt.