Referenzen
Bollmann, Marcel; Petran, Florian & Stefanie Dipper (2011): Rule-Based Normalization of Historical Texts. In: Proceedingsof the RANLP Workshop on Language Technologies for Digital Humanities and Cultural Heritage, Hissar, Bulgaria, 34-42.
Dickinson, Markus & Detmar Meurers (2003): Detecting Errors in Part-of-Speech Annotation. In: Proceedings of the 11th Conference of the European Chapter of the Association for Computational Linguistics (EACL-03). Budapest, Hungary.
Druskat, Stephan & Gast, Volker & Krause, Thomas et al. (2016): corpus-tools.org: An Interoperable Generic Software Tool Set for Multi-layer Linguistic Corpora. Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016). http://www.lrec-conf.org/proceedings/lrec2016/summaries/918.html
Krause, Thomas & Amir Zeldes (2016). A new architecture for generic corpus query and visualization. Digital Scholarship in the Humanities, 31(1): 118–139. DOI: https://academic.oup.com/dsh/article/31/1/118/2605493
Krause, Thomas; Lüdeling, Anke; Odebrecht, Carolin & Amir Zeldes (2012): Multiple Tokenizations in a Diachronic Corpus. Exploring Ancient Languages through Corpora Conference (EALC), 14.-16.Juni 2012. Oslo, Norway.
Odebrecht, Carolin; Belz, Malte; Zeldes, Amir; Lüdeling, Anke; Krause, Thomas (2017): RIDGES Herbology: designing a diachronic multi-layer corpus. In: Lang Resources & Evaluation 51 (3), S. 695-725. DOI: https://link.springer.com/article/10.1007/s10579-016-9374-3
Reichmann, Oskar & Klaus-Peter Wegera (Hrsg.) (1993): Frühneuhochdeutsche Grammatik. Tübingen: Niemeyer Verlag.
Reul, Christian, Dennis Christ, Alexander Hartelt, Nico Balbach, Maximilian Wehner, Uwe Springmann, Christoph Wick, Christine Grundig, Andreas Büttner, and Frank Puppe (2019): OCR4all—An Open-Source Tool Providing a (Semi-)Automatic OCR Workflow for Historical Printings. Applied Sciences 9 (22), 4853. DOI: https://doi.org/10.3390/app9224853
Schmid, Helmut (1994): Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of International Conference on New Methods in Language Processing, Manchester, UK.
Empfohlene Literatur
Georges, Karl Ernst (2010) : Ausführliches deutsch-lateinisches Handwörterbuch. Unveränderter Nachdruck der achten verbesserten und vermehrten Auflage von Heinrich Georges. Darmstadt: WBG.
Hartweg Frederic & Klaus-Peter Wegera (2005): Frühneuhochdeutsch. Eine Einführung in die deutsche Sprache des Spätmittelalters und der frühen Neuzeit. 2., neu bearbeitete Auflage, Tübingen: Niemeyer Verlag.
Niermeyer, J.F. & C. van de Kieft (2002): Mediae Latinitatis Lexicon Minus. Überarbeitet von J.W.J. Burgers. Darmstadt: WBG.
OCR: http://www.cis.uni-muenchen.de/ocrworkshop/program.html
Adelung: http://woerterbuchnetz.de/Adelung/
Bibel: http://www.die-bibel.de/online-bibeln
Grimm: http://woerterbuchnetz.de/DWB/
Lexer: http://woerterbuchnetz.de/Lexer/