Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

Das RIDGES Korpus

Logo von RIDGES mit einem schwarz-weißen Wermut-Blatt und dem Schriftzug Ridges

Das RIDGES-Projekt (Register in Diachronic German Science) untersucht die Entstehung und Entwicklung der deutschen Wissenschaftssprache seit Ende des 15. Jahrhunderts bis ins 20. Jahrhundert. In der frühneuhochdeutschen Zeit entstehen immer mehr Texte mit wissenschaftlichem oder wissenschaftsnahem Inhalt, seit der Mitte des 15. Jahrhunderts auch in gedruckter Form. Dem wissenschaftlichen Register angemessene Textstrukturen und Terminologie mussten im Laufe der Zeit erst entwickelt und erprobt werden. Wissenschaftliche Texte haben sich über die Jahrhunderte natürlich verändert. Dabei sind die meisten Veränderungen quantitativ und nicht qualitativ (kategorial).

In unserem Projekt sollen wissenschaftliche Texte daher auf allen sprachlichen Ebenen (Syntax, Wortbildung, Lexik, Phraseologie, Textstruktur etc.) analysiert werden, um Entwicklungen und Tendenzen identifizieren und beschreiben zu können. In einem variationistischen Ansatz annotieren wir wissenschaftliche Texte mit korpuslinguistischen Methoden und nutzen quantitative Verfahren, um Veränderungen in den Merkmalen zu identifizieren. Dabei kommen verschiedene Formate zum Einsatz, zum Beispiel Excel und ANNIS.

Wichtig ist uns dabei die Mitwirkung unserer Studierenden, die im Rahmen ihres Studiums bei der Erstellung und der Annotation der Korpus-Ressourcen mit einbezogen werden. Die so entstandenen Ressourcen werden in mehreren Formaten unter einer Creative Commons-Lizenz frei zur Verfügung gestellt.

Transkription

Die Transkription von Faksimiles stellt für die korpuslinguistische Aufbereitung zumeist die grundlegende, diplomatische Ebene (dipl).

Die clean-Ebene enthält erste Normalisierungen hinsichtlich Sonderzeichen und grafischer Strukturierungen.

Die norm-Ebene stellt einen weiteren Normalisierungsschritt dar, indem hier die Tokenisierung, die Orthografie, Flexionsformen und Wortbildungen einheitlich dem nhd. Sprachstand angepasst werden.

Durch die Alignierung der einzelnen Ebenen können Annotationen und Suchanfragen, die auf Grundlage der norm-Ebene getätigt wurden, auf die dipl-Ebene zurückgeführt werden.

dipl-Transkription

Die grundlegende, diplomatische Ebene (dipl) beinhaltet die Transkription von Faksimilés und stellt den ersten Schritt für die korpuslinguistische Aufbereitung dar.

Diese Ebene soll sich grafisch hinsichtlich Orthografie, Getrennt- und Zusammenschreibung und Sonderzeichen möglichst nah am zugrunde liegenden Faksimile orientieren. Grundsätzlich wird so auch entgegen modernen Orthografieregeln segmentiert oder transkribiert. Sie wird entweder durch OCR (Optical Character Recognition) oder manuell erstellt und korrigiert.

In diesem Abschnitt finden sich folgende Informationen:

  1. OCR
  2. Manuelle Transkription
  3. Transkriptionsrichtlinien
  4. Automatische Tokenisierung

OCR

Als Grundlage für die dipl-Ebene dienen Faksimiles der Primärwerke. Um aus diesen maschinenlesbaren Text zu erhalten, wird OCR4all genutzt. Der Workflow besteht aus folgenden Schritten:

  • Preprocessing
  • Noise removal (optional)
  • Segmentation mit LAREX
  • Line Segmentation
  • Recognition
  • Ground Truth Production mit LAREX
  • Training (optional)

Weitere Details und Dokumentation: https://www.ocr4all.org/guide/user-guide/introduction

Der OCR-Output wird mit dem TreeTagger tokenisiert und die Tokenisierung manuell nachbearbeitet korrigiert.

Fußnoten und Marginalien müssen gemäß den Transkriptionsrichtlinien unter Umständen neu platziert werden (siehe Annotationsebene note).

Manuelle Transkription

Die manuelle Transkription wurde im txt-Format erstellt und in das xlsx-Format importiert. In der UTF-8-kodierten txt-Datei dienen die Leerzeichen als Tokentrenner.

Transkriptionsrichtlinien

  1. Transkribieren
    1. Allgemeine Richtlinien und Hinweise
    2. Lautzeichen
    3. Diakritika
    4. Satzzeichen
    5. Ligaturen
    6. Andere Schriftsysteme
    7. Liste von Zeichen
  2. Segmentieren
    1. Wort
    2. Zeilenumbrüche
    3. Abkürzungen
    4. Zahlen
    5. Satzzeichen
    6. Fußnoten
    7. Graphematik
  3. Textrepräsentation

Transkribieren

Allgemeine Richtlinien und Hinweise

  • Nicht mehr lesbare Zeichen oder Zeichenketten werden mit einem Unterstrich (_) markiert, unabhängig davon, wieviele Zeichen (in etwa) nicht mehr interpretiert werden können.
  • Handschriftliche Versalien, die offensichtlich zum Text gehören (KEINE Anmerkungen oder Kommentare von Lesern), werden mit annotiert.
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt die Versalie A im Wort ABsinthiumABſinthium

Lautzeichen

Die Zeichen für “I” und “J” sind in Fraktur-Texten grafisch häufig nicht voneinander unterscheidbar. Konvention in RIDGES ist daher, das Zeichen in der dipl als J darzustellen und erst in der norm-Ebene das Zeichen individuell nach moderner Orthografie zu interpretieren.

Faksimilédipl
Abbildung eines Buchausschnitts, zeigt das Wort 'Ist' mit großem I, das einem großen J gleichtJſt

Das ſ wird beibehalten.

Faksimilédipl
Leſer
  • “Ʒ” (bzw. “ʒ”) wird nicht von “Z” (bzw. “z”) unterschieden. Beide Varianten werden als Z (bzw. z) transkribiert.
  • Unabhängig vom Erscheinungsbild der Zeichen “x”, “y” und “z” (z.B. “y” mit Trema, verzierte Varianten) werden die Zeichen “x”, “y” bzw. “z” als x, y, bzw. z transkribiert. Für Beispiele siehe Abschnitt Zeichen.

Diakritika

Alle Akzente werden beibehalten.

Faksimilédipl
Abbildung eines Buchausschnitts, zeigt das Wort 'immané' mit Akzent auf dem 'e'immané
Abbildung eines Buchausschnitts, zeigt das Wort 'Quòd' mit Akzent auf dem 'o'Quòd
Abbildung eines Buchausschnitts, zeigt das Wort 'vitâ' mit Akzent auf dem 'a'vitâ

Superskribiertes “e” und “o” werden beibehalten.

Faksimilédipl
Abbildung eines Buchausschnitts, zeigt das Wort 'genaͤdiger' mit superkribiertem 'e' über dem 'a'genaͤdiger
Abbildung eines Buchausschnitts, zeigt das Wort 'zů' mit Diakritikum auf dem 'u'

Unabhängig vom Erscheinungsbild des Punktes beim “i” und “ü” (z.B. schräg) wird in der Transkription nicht unterschieden.

Faksimilédipl
Abbildung eines Buchausschnitts, zeigt das Wort 'die' mit schrägem Strich über dem 'i'die
Abbildung eines Buchausschnitts, zeigt das Wort 'fünff' mit Schrägen Strichen über dem 'u'fünff

Alle horizonalen Striche über einem Zeichen werden als Tilde ( ̃ ) transkribiert.
Eine Tilde repräsentiert in der Regel einen Nasalstrich:

Faksimilédipl
Abbildung eines Buchausschnitts, zeigt das Wort 'om̃ia' mit Nasalstrich über dem 'm'om̃ia
Abbildung eines Buchausschnitts, zeigt die Wörter 'sciẽtiã meã' mit Nasalstrichen über dem ersten 'e' und den beiden 'a'ssciẽtiã meã
Abbildung eines Buchausschnitts, zeigt das Wort 'eı̃' mit Nasalstrich über dem 'i'eı̃
Abbildung eines Buchausschnitts, zeigt das Wort 'samẽ' mit Nasalstrich über dem 'e'ſamẽ
Abbildung eines Buchausschnitts, zeigt das Wort 'eynẽ' mit Nasalstrich über dem 'e'eynẽ
Abbildung eines Buchausschnitts, zeigt das Wort 'nẽlich' mit Nasalstrich über dem 'enẽlich
Abbildung eines Buchausschnitts, zeigt das Wort 'him̃el' mit Nasalstrich über dem 'm'him̃el
Abbildung eines Buchausschnitts, zeigt das Wort 'iñ' mit Nasalstrich über dem 'n'

Das Dicit-Zeichen (Abkürzung für “er”) wird in der dipl-Ebene auf zwei unterschiedliche Arten repräsentiert:

FaksimilédiplBeschreibung
Abbildung eines Buchausschnitts, zeigt das Wort 'oder' mit Dicit-ZeichenDicit-Repräsentation mit ð
Abbildung eines Buchausschnitts, zeigt das Wort 'v̉tzerẽ'v̉tzerẽDicit-Repräsentation mit ̉
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt das Wort 'v̉tzerẽ'v̉tzerẽ
  • Folgendes Zeichen wird mit repräsentiert:
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt das Wort 'deꝰ'deꝰ

Satzzeichen

Das Zeichen für morphologische Worttrennung oder Zeilenumbruch kann im Faksimilé ⸗ mit dargestellt sein und wird beibehalten.

Faksimilédipl
Abbildung eines Buchausschnitts, zeigt ein '⸗'Dañ⸗reiſz

Halbgeviertstriche (en dash, “–”) und Geviertstriche (em dash, “—”) werden als einfache Bindestriche (-) transkribiert.

Das “modifizierende Pluszeichen” (˖) wird beibehalten.

Faksimilédipl
˖

Das Absatzzeichen () wird in der dipl-Ebene beibehalten.

Faksimilédipl

Anführungszeichen werden übernommen.

Ligaturen

  • Vokalische Ligaturen werden beibehalten (æ und Æ; Œ und œ).
Faksimilédipl
hæc
  • Die ct-Ligatur wird nicht beibehalten.
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt eine ct-Ligatur
Lactucis
  • Die Ligatur aus “v̈” und “v” wird aufgelöst: v̈v
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt das Wort 'hev̈vſchrecken' mit einer Ligatur aus 'v̈' und 'v'hev̈vſchrecken
  • “ß” wird in Frakturtexten mit dem langen “ſ” und “z” als ſz transkribiert, da hier eine Unterscheidung zwischen der Ligatur und den beiden Einzelzeichen häufig schwierig ist. In Antiqua-Texten wird die Ligatur beibehalten.
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt das Wort 'Uberfluſz' mit einer Ligatur aus 'ſ' und 'z'Uberfluſz
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt das griechische Wort 'ἄκανθος' mit einer Ligatur aus 'o' und 'ς'
[Ligatur aus o und ς]
ἄκανθος
  • Die lateinische Abkürzung für “etc.” wird als & und c. transkribiert (2 Token).
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt ein Zeichen für 'etc.'&
c.
[2 Token]
  • Das kaufmännische Und (&) wird beibehalten.
Faksimilédipl
&

Andere Schriftsysteme

Faksimilédipl
Abbildung eines Buchausschnitts, zeigt das griechische Wort 'ἄκανθος' mit einer Ligatur aus 'o' und 'ς'ἄκανθος

Typographische Besonderheiten

  • Oft werden die ersten Zeichen bzw. ersten Wörter (im Bsp. Von Weg⸗) einer neuen Seite bei einem Seitenumbruch in der vorhergehenden Seite in einem eigenen Absatz/in einer eigenen Zeile doppelt realisert (sog. Kustoden). Diese Zeichen bzw. das Wort wird nicht mit in das Transkript aufgenommen.

Segmentieren

  • Auch entgegen moderner Orthografieregeln wird analog zur Textgrundlage segmentiert.
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt das Wort 'Spannen⸗lang'Spannen⸗lang
zuſetzen

Wort

  • Zusammengeschriebene klitisierte Elemente werden zusammengeschrieben transkribiert.
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt das Wort 'ichs'ichs
  • Im Falle einer Worttrennung aufgrund von Zeilenumbrüchen, die keine overte, grafische Markierung wie “⸗” oder “-” beinhalten, werden formal die getrennten Elemente als jeweils ein Token in der dipl-Ebene repräsentiert.
Faksimilédipl
ge
nent
[2 Token]
  • Komposita, egal welcher Komplexität oder Bildungsweise, mit Gleichheitszeichen werden als ein Token realisiert.
Faksimilédipl
Artzney⸗Kunſt
[1 Token]

Zeilenumbrüche

  • Von Zeilenumbrüchen betroffene Elemente werden analog zur Primärquelle getrennt tokenisiert.
Faksimilédipl
allge⸗
meinen
[2 Token]
  • Von Zeilenumbrüchen betroffene Komposita werden analog zur Primärquelle getrennt tokenisiert, dabei bleibt die Kennzeichnung der morphologischen Worttrennung unberührt.
Faksimilédipl
Stab⸗
wurtz⸗Oel
[2 Token]

Abkürzungen

  • Abkürzungen werden analog zur Textgrundlage tokenisiert. Das heißt, auch Setzfehler oder Spatien, die nicht modernen Orthografieregeln entsprechen, werden realisiert.
Faksimilédipl
u.
ſ.
w.
[3 Token]
u
d.g.
[2 Token]

Zahlen

  • Punktsetzungen bei Ordinalzahlen werden mit der Ziffer als ein Token realisiert.
Faksimilédipl
I.
  • Die Faksimilia weisen oft Kardinalzahlen mit Interpunktion auf. Diese Punktsetzungen werden mit der jeweiligen Ziffer als Token realisiert. Ausnahmen bilden Zahlen, die mit einem satzbeenden Punkt auftreten. Hier wird wie gewohnt die Satzinterpunktion getrennt von der Kardinalzahl tokenisiert.
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt 'I. Loth'I.
Loth
[2 Token]
Abbildung eines Buchausschnitts, zeigt '.IX.'.IX.
[1 Token]
  • Zeichenketten wie “5 %”, “5-12”, “800’” werden auf der dipl und clean als ein Token und in der norm als mehrere Token betrachtet, wenn sie im Scan keine Spatien erkennbar sind. Sind Spatien erkennbar, werden sie auch als verschiedene Token realisiert.
  • Bruchangaben werden mit / beibehalten. Dabei wird getrennt segmentiert, um gemischte Brüche transparent zu halten.
Faksimilédipl
1
1/2
[Das sind 2 Token]

Satzzeichen

  • Satzinterpunktionszeichen wie Kommata, Punkte, Virgeln oder Semikola werden als jeweils eigenständige Token realisiert.
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt 'I. Loth'finden
.
[2 Token]
  • Höher dargestellte Punkte werden als normale Punkte repräsentiert, da nicht immer zweifelsfrei festgestellt werden kann, ob die Darstellung beabsichtigt ist oder nicht.
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt 'I. Loth'keychen
.
[2 Token]
  • Manchmal handelt es sich nicht um Zeichen, sondern Tintenabdrücke im Faksimilé. Diese werden nicht repräsentiert.
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt 'I. Loth'werden
.
[2 Token]

Fußnoten

  • Fußnotenreferenzierungen werden in dipl- und clean-Ebene als mehrere Token und in der norm-Ebene als ein Token realisiert.
Faksimilédipl
(
*
)
[3 Token]
*
*
)
[3 Token]

Graphematik

  • Text hinter (geschweiften) Klammern, wird nach dem umklammerten Textabschnitt eingefügt. 1
Faksimilédipl
Abbildung eines Buchausschnitts, zeigt Text hinter einer geschweiften KlammerWermuth
Wermuth
,
gemeiner
Wermuth
,
groſzer
ſ.
Wer⸗
muthbeifuſz
.

Textrepräsentation

  • Der Text der Marginalie wird immer am Anfang des jeweiligen Absatzes, in dem/neben dem sie realisiert ist aufgenommen, unabhängig davon, ob so mehrere Marginalien hintereinander oder/und auf der nachfolgenden Seite realisiert werden müssen. Sie unterbrechen somit den Fließtext.
  • Der Text der Fußnote wird immer am Ende des Absatzes, in dem sie eingepflegt ist aufgenommen, unabhängig davon, ob sich so die Fußnoten sammeln oder erst auf der nachfolgenden Seite realisiert werden müssten. Sie unterbrechen somit den Fließtext. Geht eine Fußnote über mehrere Seiten, wird sie zusammenhängend transkribiert.

Zeichen

FaksimilédiplBeschreibung
Abbildung eines Buchausschnitts, zeigt ein Zeichen, das ein 'x' istxDieses Zeichen ist ein x.
Abbildung eines Buchausschnitts, zeigt ein Zeichen, das ein 'y' istyDieses Zeichen ist ein y.
Abbildung eines Buchausschnitts, zeigt ein Zeichen, das ein 'z' istzDieses Zeichen ist ein z.
Abbildung eines Buchausschnitts, zeigt das '⊙'-SymbolDas Sonnensymbol wird beibehalten.
Abbildung eines Buchausschnitts, zeigt einen Senkrechtstrichdieſe
|
Senkrechtstriche werden mit | beibehalten.
Abbildung eines Buchausschnitts, zeigt ein 'Zwitter'-Symbol$Dieses Symbol wird als $ transkribiert. Es bedeutet wahrscheinlich “Zwitter” bzw. “zwitterig” (botanischer Fachbegriff).
Abbildung eines Buchausschnitts, zeigt das Tironische 'et'Dieses Zeichen wird als transkribiert. Es handelt sich hierbei um das Tironische “et”.
Abbildung eines Buchausschnitts, zeigt eine Ligatur aus 'v̈' und 'v'v̈vDies ist eine Ligatur aus “v̈” und “v”. Sie wird in der dipl-Ebene aufgelöst. Siehe Abschnitt Ligaturen.
Abbildung eines Buchausschnitts, zeigt ein Zeichen für 'etc.'&
c.
[2 Token]
Dies ist eine lateinische Abkürzung für “etc.” Sie wird als & und c. transkribiert (siehe Abschnitt Ligaturen).

Für Beispiele und Einzelfallentscheidungen siehe Übersicht.

Automatische Tokensierung

Die mit OCR erstellten Transkriptionen müssen noch tokenisiert werden, bevor sie nach Excel konvertiert werden müssen. Dafür nutzen wir das Bash-Script tokenize-ocr4all.sh im scripts Ordner und dem Tokenizer vom TreeTagger. Das Script wir in der Kommandozeile (unter Linux oder MacOS) aufgerufen und benötigt den Installationsordner vom TreeTagger und dem Ordner mit den Textdateien aus OCR4all (txt/RIDGES_Herbology/) als Argument.

./scripts/tokenize-ocr4all.sh TREETAGGER_ORDNER txt/RIDGES_Herbology/

Das Script ersetzt nach dem Ausführen alle Textdateien mit der Endung .txt mit Dateien im TreeTagger-Format und der Endung (.tt) im selben Ordner. Die Zeilen- und Seiteninformationen aus den Textdateien bleiben als lb bzw. pb Annotation erhalten.

Die Konvertierung der Dateien in txt/RIDGES_Herbology/ in das Excel-Format (im Ordner Excel/RIDGES_Herbology) erfolgt dann über eine Annatto-Workflowdatei.

annatto run tt2excel.toml

Dieser Schritt erstellt auch die automatische clean-Ebene.


  1. Zur Darstellung der geschweiften Klammer siehe Abschnitt figure.

clean-Normalisierung

Die clean-Ebene enthält erste vollautomatisch erstellte Normalisierungen hinsichtlich Sonderzeichen und graphischer Strukturierungen. Sie wird automatisch beim Konvertieren von TreeTagger nach Excel erstellt. Alternativ kann die clean-Ebene für die bestehenden Excel-Dateien neu erstellt werden, indem man die Annatto-Workflowdatei reclean.toml ausführt

annatto run reclean.toml

Über diesen Konvertierungs-Schritt werden u.a. Ligaturen, die nach moderner Rechtschreibung nicht mehr verwendet werden, normalisiert. Graphische Markierungen der einzelnen Texte wie Zeilenumbrüche werden aufgelöst und Sonderzeichen einiger Fonts wie Fraktur auf die heutigen Schriftsätze übertragen. Für die Token, die Vokale mit Tilden enthalten, werden alle möglichen Formen dieser Token in der clean angegeben. Die verschiedenen Formen werden durch | getrennt (zum Beispiel: auſzwēdig wird zu auszwemdig|auszwendig).
In der clean-Ebene werden außerdem Wörter, die durch einen Zeilenumbruch getrennt und mit einem Bindeelement versehen sind, zusammengezogen. Beginnt das zweite Wort mit einem Großbuchstaben, wird dieser in der clean-Ebene in Kleinschreibung realisiert. Ist der komplette zweite Bestandteil in Großbuchstaben geschrieben, bleibt dies so bestehen (Gelb-Sucht wird zu Gelbsucht; MON- <lb> TANUM wird zu MONTANUM).

Trunkierte Elemente, die am Zeilenende stehen, werden bisher nicht als solche erkannt und daher automatisch mit dem ersten Element der folgenden Zeile zusammengezogen (Speiſz⸗und Nahrungs⸗Saffts wird zu Speiszund (sic!) Nahrungssaffts).

Für eine komplette Auflistung aller Ersetzungen, die für die Erstellung der clean-Ebene gemacht wurden, siehe die Readme zum Skript.

Richtlinien für die clean-Normalisierung

  1. Normalisieren
    1. Allgemeine Richtlinien und Hinweise
    2. Lautzeichen
    3. Diakritika
    4. Satzzeichen
    5. Ligaturen
    6. Griechische Schrift
  2. Segmentieren
    1. Wort
    2. Zeilenumbrüche
    3. Abkürzungen
    4. Zahlen
    5. Satzzeichen
    6. Fußnoten

Normalisieren

Allgemeine Richtlinien und Hinweise

FaksimilédiplcleanBeschreibung
_unknownBei nicht lesbaren Zeichen oder Zeichenketten ist durch die fehlende Transkription ist eine Normalisierung nicht mehr möglich. Dies wird mit dem Platzhalter-Tag unknown angezeigt.
Abbildung eines Buchausschnitts, zeigt die Versalie A im Wort ABsinthiumABſinthiumABsinthiumHandschriftliche Versalien, die offensichtlich zum Text gehören (KEINE Anmerkungen oder Kommentare von Lesern), werden in der dipl mit annotiert und in der clean übernommen.

Lautzeichen

FaksimilédiplcleanBeschreibung
Abbildung eines Buchausschnitts, zeigt das Wort 'Ist' mit großem I, das einem großen J gleichtJſtJstDie Zeichen für ‘I’ und ‘J’ sind in Fraktur-Texten grafisch häufig nicht voneinander unterscheidbar. In der clean-Ebene wird J beibehalten.
LeſerLeserDas lange “ſ” wird durch ein reguläres s ersetzt.

Diakritika

FaksimilédiplcleanBeschreibung
Abbildung eines Buchausschnitts, zeigt das Wort 'immané' mit Akzent auf dem 'e'
Abbildung eines Buchausschnitts, zeigt das Wort 'Quòd' mit Akzent auf dem 'o'
Abbildung eines Buchausschnitts, zeigt das Wort 'vitâ' mit Akzent auf dem 'a'
immané
Quòd
vitâ
immané
Quòd
vitâ
Alle Akzente werden beibehalten.
Abbildung eines Buchausschnitts, zeigt das Wort 'zů' mit Diakritikum auf dem 'u'zuSuperskribiertes “o” wird in der clean-Ebene nicht mehr realisiert und durch den zugrundeliegenden Vokal ersetzt.
Abbildung eines Buchausschnitts, zeigt das Wort 'genaͤdiger' mit superkribiertem 'e' über dem 'a'genaͤdigergenädigerVokalgrapheme mit superskribiertem “e” werden in der clean-Ebene in Umlaute des modernen Deutschen umgewandelt.
Abbildung eines Buchausschnitts, zeigt das Wort 'oder' mit Dicit-Zeichen
Abbildung eines Buchausschnitts, zeigt das Wort 'v̉tzerẽ'

v̉tzerẽ
oder
vertzeren
Das Dicit-Zeichen (ð oder ̉ ) wird in der clean automatisch mit er ersetzt
Abbildung eines Buchausschnitts, zeigt das Wort 'deꝰ'deꝰdeusDas ꝰ-Zeichen wird in der clean-Ebene durch us ersetzt.

Tilden werden entsprechend ihrer Funktion als Nasalstriche aufgelöst.1 Achtung: In der clean-Ebene wird der Strich automatisch als Nasalstrich interpretiert und nicht immer korrekt zwischen “m” und “n” unterschieden:2

Faksimilédiplclean
Abbildung eines Buchausschnitts, zeigt das Wort 'om̃ia' mit Nasalstrich über dem 'm'om̃iaomnia
Abbildung eines Buchausschnitts, zeigt die Wörter 'sciẽtiã meã' mit Nasalstrichen über dem ersten 'e' und den beiden 'a'ssciẽtiã meãscientiam meam
Abbildung eines Buchausschnitts, zeigt das Wort 'eı̃' mit Nasalstrich über dem 'i'eı̃ein
Abbildung eines Buchausschnitts, zeigt das Wort 'samẽ' mit Nasalstrich über dem 'e'ſamẽsamen
Abbildung eines Buchausschnitts, zeigt das Wort 'eynẽ' mit Nasalstrich über dem 'e'eynẽeynem
Abbildung eines Buchausschnitts, zeigt das Wort 'nẽlich' mit Nasalstrich über dem 'enẽlichnemlich
Abbildung eines Buchausschnitts, zeigt das Wort 'him̃el' mit Nasalstrich über dem 'm'him̃elhimmel
Abbildung eines Buchausschnitts, zeigt das Wort 'iñ' mit Nasalstrich über dem 'n'inn

Satzzeichen

FaksimilédiplcleanBeschreibung
Abbildung eines Buchausschnitts, zeigt ein '⸗'Dañ⸗reiſzDann-reiszDie morphologische Trennung durch “⸗” bleibt erhalten, wird jedoch mit einem regulären Bindestrich (-) ersetzt. Komposita, die in der dipl-Ebene mit einem ⸗ realisiert werden, behalten dieses Zeichen bei, um die allgemeine Suche nach Komposita in dieser Ebene zu ermöglichen. Für Erläuterungen zur rein grafischen Trennung, wie Zeilenumbrüchen, siehe Abschnitt Segmentieren.
˖:In der clean wird das “modifizierende Pluszeichen” (˖) zu : normalisiert.
Das Absatzzeichen () wird in dipl-, clean- und norm-Ebene übernommen.

Ligaturen

FaksimilédiplcleanBeschreibung
hæchaecDie Ligaturen æ und Æ werden aufgelöst. Das gleiche gilt ebenfalls für Œ und œ.
Abbildung eines Buchausschnitts, zeigt das Wort 'Uberfluſz' mit einer Ligatur aus 'ſ' und 'z'UberfluſzUberfluszDie “ß”-, bzw. “ſz”-Ligatur wird analog zu dipl aufgelöst: sz.
Abbildung eines Buchausschnitts, zeigt ein Zeichen für 'etc.'&
c.
&
c.
Folgendes beteutet “etc.”. Es wird als & und c. transkribiert (2 Token).
&&Das kaufmännische Und (&) wird übernommen.

Andere Schriftsysteme

Faksimilédiplclean
Abbildung eines Buchausschnitts, zeigt das griechische Wort 'ἄκανθος' mit einer Ligatur aus 'o' und 'ς'ἄκανθοςἄκανθος

Segmentieren

diplclean
Spannen⸗langSpannen-lang
zuſetzenzusetzen

Wort

diplcleanBeschreibung
ichsichsKlitika werden als ein Token realisiert.
ge
nent
[2 Token]
ge
nent
[2 Token]
Die Worttrennung ohne grafische Markierung ist nicht in jedem Fall transparent. Grafische Normalisierungen werden nicht vorgenommen.
Artzney⸗Kunſt [1 Token]Artzney-Kunst [1 Token]Die morphologische Trennung von Komposita durch “⸗” bleibt erhalten, wird jedoch mit einem regulären - ersetzt.

Zeilenumbrüche

FaksimilédiplcleanBeschreibung
allge⸗
meinen
[2 Token]
allgemeinen
[1 Token]
Wörter, die von Zeilenumbrüchen betroffen sind, werden in der clean-Ebene ohne den (Doppel-) Bindestrich, der diesen anzeigt, sowie in einer Spanne zusammengefasst realisiert. Die grafische Worttrennung wird somit aufgehoben.
Stab⸗
wurtz⸗Oel
[2 Token]
Stabwurtz-Oel
[1 Token]
Wenn ein Kompositum, das durch Gleichheitszeichen grundsätzlich getrennt wird, von einem Zeilenumbruch betroffen ist, so wird dieses Gleichheitszeichen in der clean-Ebene entfernt, das andere Gleichheitszeichen für die morphologische Trennung wird analog zum Abschnitt Wort mit einem Minus ersetzt. Das Kompositum wird in einer Spanne zusammengefasst wiedergegeben.

Abkürzungen

Abkürzungen werden in der clean-Ebene analog zur dipl-Ebene tokenisiert.

diplclean
u.
ſ.
w.
[3 Token]
u.
s.
w.
[3 Token]
u
d.g.
[2 Token]
u
d.g.
[2 Token]

Zahlen

Bei Zahlen werden in der clean-Ebene alle Konventionen der dipl-Ebene übernommen.

Satzzeichen

Für Satzzeichen werden in der clean-Ebene alle für die dipl-Ebene beschriebenen Konventionen übernommen.

Fußnoten

Für Fußnoten werden in der clean-Ebene alle für die dipl-Ebene beschriebenen Konventionen übernommen.

  • Der Text der Marginalie wird immer am Anfang des jeweiligen Absatzes, in dem/neben dem sie realisiert ist, unabhängig davon, ob so mehrere Marginalien hintereinander oder/und auf der nachfolgenden Seite realisiert werden müssen, in die dipl-Ebene/Transkription aufgenommen.
  • Der Text der Fußnote wird immer am Ende des Absatzes, in dem sie eingepflegt ist, unabhängig davon, ob sich so die Fußnoten sammeln oder erst auf der nachfolgenden Seite realisiert werden müssten, in die dipl-Ebene/Transkription aufgenommen. Geht eine Fußnote über mehrere Seiten, wird sie zusammenhängend transkribiert.
  • Nicht mehr lesbare Zeichen oder Zeichenketten werden mit einem Unterstrich (_) markiert, unabhängig davon, wieviele Zeichen (in etwa) nicht mehr interpretiert werden können. Zusätzlich wird in einem späteren Schritt die Stelle auf der Annotationsebene “unclear” gekennzeichnet.
  • Halbgeviertstriche (en dash, “–”) und Geviertstriche (em dash, “—”) werden als einfache Bindestriche (-) transkribiert, da in älteren Drucken eine Unterscheidung oft schwierig ist.

  1. Nachweis für das Beispiel: Reichmann & Wegera 1993: 31.

  2. Gegebenenfalls in der norm ausgleichen.

norm-Normalisierung

Durch die einzelnen Normalisierungsschritte und der daraus resultierenden multiplen Segmentierung ist es möglich, die uneinheitliche Orthografie in einzelnen Texten sowie im diachronen Verlauf zu vereinheitlichen und dennoch die spezifischen Besonderheiten des jeweiligen Textes/der jeweiligen Sprachstufe im Korpus abzubilden. Weiterhin können automatische Tagging- und Parsing-Tools, die in vielen Fällen auf modernem Deutsch trainiert sind, auf der norm-Ebene angewandt werden.

Die norm-Ebene beinhaltet normalisierte Annotationen der clean-Token. Die Normalisierung erfolgt hinsichtlich Tokenisierung, Graphematik, Phonologie und Morphologie.

Normalisierungsideal ist die gegenwartssprachliche deutsche Norm (standarddt.), die durch das Duden-Wörterbuch und die Duden-Grammatik repräsentiert wird.

Nicht normalisiert werden Morphosyntax, Syntax, Lexik und Pragmatik.

Normalisierungsrichtlinien

Normalisierungsrichtlinien

Allgemeine Richtlinien und Hinweise

FaksimilédiplcleannormBeschreibung
_unknownunknownBei nicht lesbaren Zeichen oder Zeichenketten ist durch die fehlende Transkription ist eine Normalisierung nicht mehr möglich. Dies wird in der clean-Ebene mit dem Platzhalter-Tag unknown angezeigt und in der norm-Ebene übernommen.
Abbildung eines Buchausschnitts, zeigt die Versalie A im Wort ABsinthiumABſinthiumABsinthiumABsinthiumHandschriftliche Versalien, die offensichtlich zum Text gehören (KEINE Anmerkungen oder Kommentare von Lesern), werden in der dipl mit annotiert und in der clean und norm übernommen.

Beachte!

Bei der weiteren Bearbeitung in Excel kann es nach Anwendung des Clean-Skripts zu ungewollten automatischen Formatierungen kommen, ÜBERPRÜFEN!!!
1/2 wurde durch Excel zu 01.Februar. Das normalisierte falsch wurde durch Excel zum logischen Operator FALSCH.

Als Grundlage für die moderne Orthografie gilt die aktuelle Ausgabe des Dudens.

Tokenisierung

  • Die Annotation auf der norm-Ebene repräsentiert die standarddt. lexikalischen Einheiten:
    diplnorm
    Rinder ZungeRinderzunge
  • Wortsegmentierung und Großschreibung, die nicht den modernen Orthografieregeln entsprechen, werden angeglichen.
    Faksimilédiplcleannorm
    Abbildung eines Buchausschnitts, zeigt das Wort 'Spannen⸗lang'Spannen⸗langSpannen-langspannenlang

Wort

  • Klitika werden in der norm-Ebene aufgelöst. Dazu wird die Tokenisierung verändert, indem aus einem Token zwei Token gemacht werden.

    Faksimilédiplcleannorm
    Abbildung eines Buchausschnitts, zeigt das Wort 'ichs'ichsichsich
    es
    [2 Token]
  • Getrennt- und Zusammenschreibung wird nach modernen Orthografieregeln angepasst. Dazu wird die Tokenisierung verändert, indem aus einem Token in der dipl-Ebene (oder clean) zwei Token in der norm-Ebene gemacht werden!

    Faksimilédiplcleannorm
    zuſetzenzusetzenzu
    setzen
    [2 Token]
  • Zusammenschreibungen von Lexemen unterschiedlichen Wortarten werden in der norm-Ebene aufgelöst (2 Token).

diplcleannormBeschreibung
obgenanntobgenanntoben genanntAdverb + Partizip
hiebevorhiebevorhier bevorAdverb + Adverb
  • Worttrennung aufgrund von Zeilenumbrüchen, die keine overte, grafische Markierung wie “⸗” oder “-” beinhalten, wird – wenn sie transparent ist – nach modernen Orthografieregeln normalisiert und die grafische Trennung aufgehoben.

    Faksimilédiplcleannorm
    ge
    nent
    ge
    nent
    genannt
  • Komposita werden analog zur modernen Orthografie zusammengeschrieben (Grundlage hierfür bildet die aktuelle Ausgabe des Dudens).

Faksimilédiplcleannorm
Artzney⸗KunſtArtzney-KunstArzneikunst
Abbildung eines Buchausschnitts, zeigt ein '⸗'Dañ⸗reiſzDann-reiszTannenreis

Zeilenumbrüche

  • Wörter, die von Zeilenumbrüchen betroffen sind, werden in der clean- und norm-Ebene ohne den (Doppel-) Bindestrich, der diesen anzeigt, realisiert und in einer Spanne zusammengefasst. Die grafische Worttrennung wird somit aufgehoben.

    Faksimilédiplcleannorm
    allge⸗
    meinen
    [2 Token]
    allgemeinen
    [1 Token]
    allgemeinen
    [1 Token]
  • Wenn Komposita von einem Zeilenumbruch betroffen sind, werden sie behandelt wie Komposita innerhalb einer Zeile und analog zur modernen Orthografie zusammengeschrieben (Siehe Duden).

    Faksimilédiplcleannorm
    Stab⸗
    wurtz⸗Oel
    [2 Token]
    Stabwurtz-Oel
    [1 Token]
    Stabwurzöl
    [1 Token]

Abkürzungen

  • Abkürzungen werden nach Dudenrichtlinien umgesetzt. Dies hat zur Folge, dass Abkürzungen unterschiedlich tokenisiert werden können (bspw. Abkürzungen als zwei oder mehr Tokens wie u. a. m. vs. solche, die als ein Token realisiert werden, wie usw.). vgl. dazu beide Beispiele. In Fällen, in denen keine Dudenrichtlinie zugeordnet werden kann, wird immer nach einem Punkt segmentiert.
    Faksimilédiplcleannorm
    u.
    ſ.
    w.
    [3 Token]
    u.
    s.
    w.
    [3 Token]
    usw.
    [1 Token]

Graphematik

Die historische graphematische Repräsentation wird an die aktuelle orthographische Norm angepasst.

diplnorm
kreutterKräuter

Lautzeichen

  • Die Zeichen für ‘I’ und ‘J’ sind in Fraktur-Texten grafisch nicht immer voneinander unterscheidbar. Konvention in RIDGES ist daher, das Zeichen in der dipl als J darzustellen und erst in der norm-Ebene das Zeichen individuell nach moderner Orthografie zu interpretieren und entsprechend anzupassen.
    Faksimilédiplcleannorm
    Abbildung eines Buchausschnitts, zeigt das Wort 'Ist' mit großem I, das einem großen J gleichtJſtJstIst
  • Der Digraph ij für Lateinisch “ii” wird in der norm zu ii normalisiert.
cleannorm
LapatijsLapatiis
  • Das lange “ſ” wird durch ein reguläres s ersetzt.
    diplcleannorm
    LeſerLeserLeser

Diakritika

  • Alle Akzente werden übernommen.

    diplcleannorm
    immanéimmanéimmané
    QuòdQuòdQuòd
    vitâvitâvitâ
  • Superskribiertes “o” wird in der clean- und norm-Ebene nicht mehr realisiert und durch den zugrundeliegenden Vokal ersetzt:

    Faksimilédiplcleannorm
    Abbildung eines Buchausschnitts, zeigt das Wort 'zů' mit Diakritikum auf dem 'u'zuzu
  • Umlaute mit superskribiertem “e” werden in der clean- und norm-Ebene wie moderne Umlaute des Deutschen realisiert.

    Faksimilédiplcleannorm
    Abbildung eines Buchausschnitts, zeigt das Wort 'genaͤdiger' mit superkribiertem 'e' über dem 'a'genaͤdigergenädigergnädiger
  • In der clean-Ebene aufgelöste Nasalstriche stellen nicht immer den korrekten zugrunde liegenden Nasal dar und sollten ggf. in der norm-Ebene korrigiert werden.

Faksimilédiplcleannorm
Abbildung eines Buchausschnitts, zeigt das Wort 'om̃ia' mit Nasalstrich über dem 'm'om̃iaomniaomnia
Abbildung eines Buchausschnitts, zeigt das Wort 'samẽ' mit Nasalstrich über dem 'e'ſamẽsamenSamen
Abbildung eines Buchausschnitts, zeigt das Wort 'eynẽ' mit Nasalstrich über dem 'e'eynẽeynemeinem
Abbildung eines Buchausschnitts, zeigt das Wort 'him̃el' mit Nasalstrich über dem 'm'him̃elhimmelHimmel
Abbildung eines Buchausschnitts, zeigt das Wort 'iñ' mit Nasalstrich über dem 'n'innin
  • Das Dicit-Zeichen wird in der clean- und norm-Ebene mit “der” ersetzt.

    Faksimilédiplcleannorm
    Abbildung eines Buchausschnitts, zeigt das Wort 'oder' mit Dicit-Zeichenoderoder
  • Das -Zeichen wird in der clean- und norm-Ebene durch us ersetzt.

    Faksimilédiplcleannorm
    Abbildung eines Buchausschnitts, zeigt das Wort 'deꝰ'deꝰdeusdeus
  • Dieses Zeichen wird durch er ersetzt.

    Faksimilédiplcleannorm
    Abbildung eines Buchausschnitts, zeigt das Wort 'v̉tzerẽ'v̉tzerẽvertzerenverzehren

Ligaturen

Ligaturen werden in der norm augelöst.

diplcleannorm
hæchaechaec
  • Nach modernen Orthografieregeln wird für “sz” das ß verwendet.
    Faksimilédiplcleannorm
    Abbildung eines Buchausschnitts, zeigt das Wort 'Uberfluſz' mit einer Ligatur aus 'ſ' und 'z'UberfluſzUberfluszÜberfluss
  • Das kaufmännische Und (&) wird in der norm-Ebene beibehalten.

    Faksimilédiplcleannorm
    &&&
  • Folgendes beteutet “etc.”. Es wird als “&” und “c.” transkribiert und in der norm-Ebene zu etc. normalisiert. .

diplcleannorm
&
c.
[2 Token]
&
c.
[2 Token]
etc.
[1 Token]

Satzzeichen

  • In der norm wird die clean-Normalisierung des “modifizierenden Pluszeichen” (˖) erhalten.

    diplcleannorm
    ˖::
  • Das Absatzzeichen () bleibt in der norm-Ebene erhalten.

    diplcleannorm

Zahlen

Bei Zahlen werden in der norm-Ebene alle Konventionen der dipl- und clean-Ebene übernommen.

Sonderzeichen

  • Intervenieren innerhalb eines Wortes Sonderzeichen, dann werden die Sonderzeichen in der norm-Ebene ignoriert und das unterbrochene Wort zusammengeschrieben.
    Faksimilédiplcleannorm
    Abbildung eines Buchausschnitts, zeigt 'Glo-'
    Abbildung eines Buchausschnitts, zeigt zwei Zeichen vor 'ver Graſſ.'
    Glo-


    ver
    Graſſ
    .
    [6 Token]
    Glo-✠

    ver
    Grass
    .
    [5 Token]
    Glover
    Grass
    .
    [3 Token]

Phonologie

Formen, die in phonologischer Hinsicht fnhd. oder dialektalen Lautstand aufweisen, werden in der norm den (standard-)nhd. Entsprechungen angepasst.

diplcleannormBeschreibung
HellenpeinHellenpeinHöllenpeinDialektale Entrundung (md.)
wänlinwänlinWännleinDiphthongierung
beedebeedebeideDialektale Monophthongierung
hänget
lehret
hänget
lehret
hängt
lehrt
Synkope

Morphologie

  • Fehlende oder abweichende Morpheme werden hinzugefügt oder durch im NHD grammatische Morpheme ersetzt:
diplcleannorm
wordenwordengeworden
das kal Hauptdas kal Hauptdas kahle Haupt
in die Nasenin die Nasenin die Nase
bei ſchweinem fleiſchbei schweinem fleischbei schweinenem Fleisch
  • Abweichungen der Flexionsklasse werden normalisiert:

    diplcleannormBeschreibung
    MannenMannenMännernÜbergang von der schwachen zur starken Flexion.
    bububauteÜbergang von der starken zur schwachen Flexion.
    gennentgennentgenanntEinführung des Rückumlauts.
    gebauengebauengebautÜbergang von der starken zur schwachen Flexion.
  • Es erfolgt keine Anpassung des Genus
    diplcleannorm
    das Milzdas Milzdas Milz

Wortbildung

  • Ausgestorbene oder nicht mehr gebräuchliche Wortbildungsmorpheme werden nach Möglichkeit durch entsprechende nhd. Bildungen ersetzt. (siehe Beispieltabelle am Schluss)
    diplcleannorm
    halben [Postposition]halbenhalber
    stachelechtstachelechtstachelig

Morphosyntax

  • Im standarddt. prinzipiell grammatische Morpheme werden nicht normalisiert, auch wenn sie morphosyntaktisch im Standarddt. durch ein anderes Morphem ersetzt werden müssten.
    diplcleannormBeschreibung
    [Heylt] die verſehrte Daͤrmelein[Heylt] die versehrte Därmelein[Heilt] die versehrte DärmleinKeine Anpassung der Adjektivflexion in der definiten Nominalphrase.
    (nicht: die versehrten Därmelein)

Syntax

  • Die Positionen der Konstituenten werden nicht normalisiert.
  • Aus standarddt. Sicht ungrammatische Elemente werden nicht entfernt.
  • Aus standarddt. Sicht fehlende Konstituenten (z.B. Artikel) werden nicht eingefügt.
  • Aus standarddt. Sicht ungrammatische Kongruenzabweichungen werden nicht normalisiert.
  • Aus standarddt. Sicht ungrammatische Kasusrektion wird nicht normalisiert.

Lexik

  • Aus standarddt. Sicht nicht mehr oder anders gebrauchte Lexeme werden nicht durch die standarddt. Entsprechung normalisiert. Ggf. orthografisch normalisieren.
diplcleannormBeschreibung
HornungHornungHornungOberdeutsches Wort für “Februar”.
  • Die Existenz eines standarddeutschen Lexems wird durch die Lemmatisierung im Duden definiert.
  • Die Existenz (und graphematische Repräsentation) ausgestorbener Lexeme wird durch die Lemmatisierung in Grimms Wörterbuch vorgegeben.
diplcleannorm
VergeſzVergeſzVergess

Pragmatik

  • Aus standarddt. Sicht ungewöhnlich realisierte kommunikative Funktionen (z.B. Anreden, Ehrbezeugungen, wörtliche Zitationskennzeichnungen) werden nicht normalisiert.



Transkription und Normalisierung: Übersicht

Nachfolgend werden die Richtlinien zur Transkription und Normalisierung im Einzelnen gegenübergestellt. Allgemein für jede Segmentierungsebene sowie Annotationsebene gilt, dass keine Leerzeilen oder Leerzeichen enthalten sein dürfen. Dazu wird für jeden Fall ein Beispiel gegeben, die konkrete Regel beschrieben und die weiteren Normalisierungsschritte gegenübergestellt (dipl – clean – norm). Die Richtlinien sind nach Schwerpunkten gruppiert:
(1) Zeichensetzung/Sonderzeichen
(2) Segmentierung/Tokenisierung
(3) Interpunktion.

  1. Transkribieren
    1. J/I
    2. Lautzeichen
    3. Diakritika
    4. Satzzeichen
    5. Sonstige Zeichen
    6. Ligaturen
    7. Griechische Schrift
    8. Typographische Besonderheiten
  2. Tokenisieren
    1. Wort
    2. Zeilenumbrüche
    3. Abkürzungen
    4. Zahlen
    5. Satzzeichen
    6. Fußnoten
  3. Normalisieren
    1. Phonologie
    2. Morphologie
    3. ij/ii
    4. Lexik
    5. Morphosyntax
    6. Wortbildung
    7. Adjektivflexion
    8. Graphematik

Sonderzeichen wie zum Beispiel das “ſ” werden mit Hilfe von Unicodes in der dipl-Ebene realisiert. Eine Liste der zu verwendenden Unicodes ist angefügt.

  1. Nachweis für das Beispiel: Reichmann & Wegera 1993: 31.

Fußnoten und Marginalien

Der Text der Marginalie wird immer am Anfang des jeweiligen Absatzes, in dem/neben dem sie realisiert ist, unabhängig davon, ob so mehrere Marginalien hintereinander oder/und auf der nachfolgenden Seite realisiert werden müssen, in die dipl-Ebene/Transkription aufgenommen.
Der Text der Fußnote wird immer am Ende des Absatzes, in dem sie eingepflegt ist, unabhängig davon, ob sich so die Fußnoten sammeln oder erst auf der nachfolgenden Seite realisiert werden müssten, in die dipl-Ebene/Transkription aufgenommen.


Zeichentabelle

Nr. dipl-Ebene clean-Ebene norm-Ebene
Transkript des Faksimiles. Wird automatisch durch ein Python-Skript (clean-skript.py) erstellt. Dieses ersetzt alle heute unüblichen Sonderzeichen durch heute verwendete Entsprechungen. Erfolgt manuell im .xlsx Format nach der modernen neuen Rechtschreibung.
Tipp: Kopieren Sie sich die clean-Ebene und verändern Sie dann die entsprechenden Stellen!
1.0 Nicht mehr lesbare Zeichen oder Zeichenketten werden mit einem Unterstrich markiert, unabhängig davon, wieviele Zeichen (in etwa) nicht mehr interpretiert werden können. Durch die fehlende Transkription ist eine Normalisierung nicht mehr möglich. Dies wird mit dem Platzhalter-Tag "unknown" angezeigt. Durch die fehlende Transkription ist eine Normalisierung nicht mehr möglich. Dies wird mit dem Platzhalter-Tag "unknown" angezeigt.
dipl clean norm
_ unknown unknown
Handschriftliche Versalien, die offensichtlich zum Text gehören (KEINE Anmerkungen oder Kommentare von Lesern), werden mit annotiert.

Abbildung eines Buchausschnitts, zeigt die Versalie A im Wort ABsinthium
dipl clean norm
ABſinthium ABsinthium ABsinthium
1.1 Die Zeichen für 'I' und 'J' sind in Fraktur-Texten grafisch in der Regel nicht voneinander unterscheidbar. Konvention in RIDGES ist daher, das Zeichen in der dipl als J darzustellen und erst in der norm-Ebene das Zeichen individuell nach moderner Orthografie zu interpretieren.

Abbildung eines Buchausschnitts, zeigt das Wort 'Ist' mit großem I, das einem großen J gleicht
Wie in der dipl-Ebene. Anpassung an moderne Orthografie.
dipl clean norm
Jſt Jst Ist
1.2 Das ſ wird übernommen. Das lange "ſ" wird durch ein reguläres s ersetzt.
dipl clean norm
Leſer Leser Leser
Abbildung eines Buchausschnitts, zeigt ein Zeichen, das ein 'x' ist
Dies ist ein x
dipl clean norm
x x x
Das Zeichen Ʒ (bzw. ʒ) wird in der dipl-Ebene nicht von Z (bzw. z) unterschieden. Beide Varianten werden als Z (bzw. z) transkribiert. Wie in der dipl-Ebene.
dipl clean norm
Abbildung eines Buchausschnitts, zeigt ein Zeichen, das ein 'z' ist
Dies ist ein z
z z
In manchen Drucken sieht das Zeichen y etwas anders aus; es wird aber als "normales" y transkribiert.
dipl clean norm
Abbildung eines Buchausschnitts, zeigt ein Zeichen, das ein 'y' ist
Dies ist ein y
y y
1.3 Alle Akzente werden übernommen. Alle Akzente werden übernommen. Alle Akzente werden übernommen.
dipl clean norm
Abbildung eines Buchausschnitts, zeigt das Wort 'immané' mit Akzent auf dem 'e'
immané
immané immané
Abbildung eines Buchausschnitts, zeigt das Wort 'Quòd' mit Akzent auf dem 'o'
Quòd
Quòd Quòd
Abbildung eines Buchausschnitts, zeigt das Wort 'vitâ' mit Akzent auf dem 'a'
vitâ
vitâ vitâ
Abbildung eines Buchausschnitts, zeigt das Wort 'zů' mit Diakritikum auf dem 'u'
Dieses Zeichen wirdübernommen.
Dieses diakritische Zeichen wird in der clean-Ebene nicht mehr realisiert und durch den zugrundeliegenden Vokal ersetzt.
dipl clean norm
zu zu
Abbildung eines Buchausschnitts, zeigt das Wort 'genaͤdiger' mit superkribiertem 'e' über dem 'a'
Umlaute mit superskribiertem "e" werden übernommen.
Umlaute mit superskribiertem "e" werden wie moderne Umlaute des Deutschen realisiert.
dipl clean norm
genaͤdiger genädiger gnädiger
Abbildung eines Buchausschnitts, zeigt das Wort 'die' mit schrägem Strich über dem 'i'
'í' mit schrägem Strich wird nicht vom 'i' mit Punkt unterschieden. Beide Varianten werden als i transkribiert.
dipl clean norm
die die die
Abbildung eines Buchausschnitts, zeigt das Wort 'fünff' mit Schrägen Strichen über dem 'u'
Das "ű" mit schrägen Strichen wird nicht nicht vom ü mit Punkten unterschieden. Beide Varianten werden als ü transkribiert.
dipl clean norm
fünff fünff fünf
Alle horizonalen Striche über einem Zeichen werden als Tilde ( ̃̃ ) interpretiert.
Eine Tilde kann stehen für:
ausgelassene Nasale, sog. Nasalstrich
Tilden werden entsprechend ihrer Funktion umgesetzt. Die kann u. a. aus Reichmann & Wegera (1993) entnommen werden.1
Achtung: In der clean-Ebene wird der Strich automatisch als Nasalstrich interpretiert. Gegebenenfalls in der norm ausgleichen.
Gegebenenfalls in der clean-Ebene eingefügte Nasale anders umsetzen.
dipl clean norm
Abbildung eines Buchausschnitts, zeigt das Wort 'om̃ia' mit Nasalstrich über dem 'm'
om̃ia
omnia omnia
Abbildung eines Buchausschnitts, zeigt die Wörter 'sciẽtiã meã' mit Nasalstrichen über dem ersten 'e' und den beiden 'a's
sciẽtiã meã
scientiam meam scientiam meam
Abbildung eines Buchausschnitts, zeigt das Wort 'eı̃' mit Nasalstrich über dem 'i'
eı̃
ein ein
Abbildung eines Buchausschnitts, zeigt das Wort 'samẽ' mit Nasalstrich über dem 'e'
samẽ
samen Samen
Abbildung eines Buchausschnitts, zeigt das Wort 'eynẽ' mit Nasalstrich über dem 'e'
einẽ
eynem einem
Abbildung eines Buchausschnitts, zeigt das Wort 'nẽlich' mit Nasalstrich über dem 'e'
nẽlich
nemlich nämlich
Verdopplung eines Buchstabens
dipl clean norm
Abbildung eines Buchausschnitts, zeigt das Wort 'him̃el' mit Nasalstrich über dem 'm'
him̃el
himmel Himmel
Abbildung eines Buchausschnitts, zeigt das Wort 'iñ' mit Nasalstrich über dem 'n'
inn in
Abbildung eines Buchausschnitts, zeigt das Wort 'oder' mit Dicit-Zeichen
Das Dicit-Zeichen (Abkürzung für "der") wird in der dipl-Ebene mit ð übernommen
Es wird in der clean automatisch mit "der" ersetzt In der norm auch.
dipl clean norm
oder oder
Abbildung eines Buchausschnitts, zeigt das Wort 'deꝰ'
Dieses Zeichen wird mit repräsentiert.
Ersetzung durch us Ersetzung durch us
dipl clean norm
deꝰ deus deus
Abbildung eines Buchausschnitts, zeigt das Wort 'v̉tzerẽ' Ersetzung durch er Ersetzung durch er
dipl clean norm
v̉tzerẽ vertzeren verzehren
1.4 Abbildung eines Buchausschnitts, zeigt ein '⸗'
Das Zeichen für morphologische Worttrennung (oder Zeilenumbruch) wird mit übernommen.
Die morphologische Trennung durch "⸗" bleibt erhalten, wird jedoch mit einem regulären - ersetzt. Komposita, die in der dipl-Ebene mit einem realisiert werden, behalten dieses Zeichen bei, um die allgemeine Suche nach Komposita in dieser Ebene zu ermöglichen. Für Erläuterungen zur rein grafischen Trennung, wie Zeilenumbrüchen, siehe Nummer 2.1. Gleichheitszeichen, die Kompositabildung anzeigen, werden durch Minuszeichen (-) ersetzt oder das Kompositum wird analog zur modernen Orthografie zusammengeschrieben (Grundlage hierfür ist der aktuelle Stand des Dudens).
dipl clean norm
Dañ⸗reiſz Dann-reisz Tannenreis
Halbgeviertstriche (en dash, "–") und Geviertstriche (em dash, "—") werden als einfache Bindestriche (-) transkribiert.
dipl clean norm
- - -
Das "modifizierende Pluszeichen" (˖) wird übernommen. In der clean wird das Zeichen zu : normalisiert. In der norm wird das Zeichen zu : normalisiert.
dipl clean norm
˖ : :
Das Absatzzeichen () wird in dipl-, clean- und norm-Ebene übernommen.
dipl clean norm
1.5 Bruchangaben werden mit / übernommen. Dabei wird getrennt segmentiert, um gemischte Brüche transparent zu halten. Bruchangaben werden mit / übernommen. Dabei wird getrennt segmentiert, um gemischte Brüche transparent zu halten. Bruchangaben werden mit / übernommen. Dabei wird getrennt segmentiert, um gemischte Brüche transparent zu halten.
dipl clean norm
1 1 1
1/2 1/2 1/2
Abbildung eines Buchausschnitts, zeigt das '⊙'-Symbol
Dieses Symbol wird übernommen.
Dieses Symbol wird übernommen. Dieses Symbol wird übernommen.
dipl clean norm
Abbildung eines Buchausschnitts, zeigt einen Senkrechtstrich
Senkrechtstriche werden mit | übernommen.
Senkrechtstriche werden übernommen. Senkrechtstriche werden übernommen.
dipl clean norm
dieſe diese diese
| | |
Abbildung eines Buchausschnitts, zeigt ein 'Zwitter'-Symbol
Dieses Symbol wird als $ transkribiert. Es bedeutet wahrscheinlich "Zwitter" bzw. "zwitterig".
Die als Platzhalter dienenden Dollarzeichen werden übernommen. Dollarzeichen werden übernommen. In der Ebene "comment" kann ergänzt werden, dass das Zeichen vermutlich "Zwitter" oder "zwitterig" bedeutet.
dipl clean norm
$ $ $
Abbildung eines Buchausschnitts, zeigt das Tironische 'et'
Dieses Zeichen wird als transkribiert. Es handelt sich hierbei um das Tironische "et".
dipl clean norm
et et
1.6 Die Ligaturen æ und Æ werden übernommen. Das gleiche gilt ebenfalls für Œ und œ Die Ligatur wird aufgelöst.
dipl clean norm
hæc haec haec
Abbildung eines Buchausschnitts, zeigt eine ct-Ligatur
Die ct-Ligatur wird nicht übernommen.
Die ct-Ligatur wird nicht übernommen. Die ct-Ligatur wird nicht übernommen.
dipl clean norm
Lactucis Lactucis Lactucis
Abbildung eines Buchausschnitts, zeigt eine Ligatur aus 'v̈' und 'v'
Dies ist eine Ligatur aus v̈ und v. Die Ligatur wird aufgelöst: v̈v
v̈v
dipl clean norm
Abbildung eines Buchausschnitts, zeigt das Wort 'hev̈vſchrecken' mit einer Ligatur aus 'v̈' und 'v'
hev̈vſchrecken
hev̈vschrecken Heuschrecken
Die ſz-Ligatur wird mit dem langen "ſ" und "z" übernommen: ſz Die Ligatur wird analog zu dipl aufgelöst: sz Nach modernen Orthografieregeln wird für "sz" das ß verwendet.
dipl clean norm
Abbildung eines Buchausschnitts, zeigt das Wort 'Uberfluſz' mit einer Ligatur aus 'ſ' und 'z'
Uberfluſz
Uberflusz Überfluss
Griechische Ligaturen werden nicht abgebildet, sondern bereits in der dipl aufgelöst:
Abbildung eines Buchausschnitts, zeigt das griechische Wort 'ἄκανθος' mit einer Ligatur aus 'o' und 'ς'
Ligatur aus o und ς

Als Hilfe: https://de.wikipedia.org/wiki/Griechisches_Alphabet#/media/File:Greek_alphabet_ligatures.jpg
dipl clean norm
ἄκανθος ἄκανθος ἄκανθος
Abbildung eines Buchausschnitts, zeigt ein Zeichen für 'etc.'
Dies beteutet "etc."
dipl clean norm
& & etc.
c. c.
Das kaufmännische Und (&) wird übernommen. Das kaufmännische Und (&) wird übernommen. Das kaufmännische Und (&) wird übernommen.
dipl clean norm
& & &
1.7 Sprachliches Material mit anderen Schriftsystemen (z.B. Griechisch) wird in clean und norm nicht geändert.
http://www.unicode.org/charts/PDF/U0370.pdf
sowie
http://www.unicode.org/charts/PDF/U0370.pdf
dipl clean norm
ἄκανθος ἄκανθος ἄκανθος
1.8 Oft werden die ersten Zeichen bzw. ersten Wörter (im Bsp. Von Weg⸗) einer neuen Seite bei einem Seitenumbruch in der vorhergehenden Seite in einem eigenen Absatz/in einer eigenen Zeile doppelt realisert (sog. Kustoden). Diese Zeichen bzw. das Wort wird nicht mit in das Transkript aufgenommen.
2 Abbildung eines Buchausschnitts, zeigt das Wort 'Spannen⸗lang'
Auch entgegen moderner Orthografieregeln wird analog zur Textgrundlage tokenisiert.
Wortbildung und Großschreibung, die nicht der modernen Orthografieregeln entsprechen, werden angeglichen.
dipl clean norm
Spannen⸗lang Spannen-lang spannenlang
2.1 Klitisierte Elemente können zusammengeschrieben (z.B. ichs, bedarfs, aufs) oder apostrophiert dargesetllt sein (z.B. ich's, bedarf's, auf's). Klitisiert werden schwach betonte Morpheme. Z.B.: Formen des Personalpronomens, unbestimmter oder bestimmter Artikel Klitika werden als ein Token realisiert. Klitika werden in dieser Ebene aufgelöst. Dazu wird die Tokenisierung verändert, indem aus einem Token in dipl (oder clean) zwei Token gemacht werden!.
dipl clean norm
Abbildung eines Buchausschnitts, zeigt das Wort 'ichs'
ichs
ichs ich
es
Auch entgegen moderner Orthografieregeln wird analog zur Textgrundlage tokenisiert. Getrennt- und Zusammenschreibung wird nach modernen Orthografieregeln angepasst. Dazu wird die Tokenisierung verändert, indem aus einem Token in der dipl-Ebene (oder clean) zwei Token in der norm-Ebene gemacht werden!
dipl clean norm
zuſetzen zusetzen zu
setzen
Im Falle einer Worttrennung aufgrund von Zeilenumbrüchen, die keine overte, grafische Markierung wie "⸗" oder "-" beinhalten, werden formal die getrennten Elemente als jeweils ein Token in der dipl-Ebene betrachtet. Auch entgegen moderner Orthografieregeln wird analog zur Textgrundlage tokenisiert. Die Worttrennung ohne grafische Markierung ist nicht in jedem Fall transparent. Grafische Normalisierungen werden nicht vorgenommen. Diese Art der Worttrennung, wenn sie transparent ist, wird nach modernen Orthografieregeln normalisiert und die grafische Trennung aufgehoben.
dipl clean norm
ge ge genannt
nent nent
Komposita, egal welcher Komplexität oder Bildungsweise, mit Gleichheitszeichen werden als ein Token realisiert. Die morphologische Trennung durch "⸗" bleibt erhalten, wird jedoch mit einem regulären "-" ersetzt. Gleichheitszeichen, die Kompositabildung anzeigen, werden durch Minuszeichen ersetzt oder das Kompositum wird analog zur modernen Orthografie zusammengeschrieben (Grundlage hierfür bildet die aktuelle Ausgabe des Dudens.).
dipl clean norm
Artzney⸗Kunſt Artzney-Kunst Arzneikunst
2.2 Von Zeilenumbrüchen betroffene Elemente werden analog zur Primärquelle getrennt tokenisiert. Das Trennungszeichen "⸗" wird übernommen. Wörter, die von Zeilenumbrüchen betroffen sind, werden in der clean-Ebene ohne den (Doppel-) Bindestrich, der diesen anzeigt, sowie in einer Spanne zusammengefasst realisiert. Die grafische Worttrennung wird somit aufgehoben.
dipl clean norm
allge⸗ allgemeinen allgemeinen
meinen
Von Zeilenumbrüchen betroffene Komposita werden analog zur Primärquelle getrennt tokenisiert, dabei bleibt die Kennzeichnung der morphologischen Worttrennung unberührt. Wenn ein Kompositum, das durch Gleichheitszeichen grundsätzlich getrennt wird, von einem Zeilenumbruch betroffen ist, so wird dieses Gleichheitszeichen in der clean-Ebene entfernt, das andere Gleichheitszeichen für die morphologische Trennung wird analog zu Nummer 1.1 mit einem Minus ersetzt. Das Kompositum wird in einer Spanne zusammengefasst wiedergegeben. Die Gleichheitszeichen, die Kompositabildung anzeigen, werden durch Minuszeichen ersetzt oder das Kompositum wird analog zur modernen Orthografie zusammengeschrieben (Grundlage hierfür bildet die aktuelle Ausgabe des Dudens.).
dipl clean norm
Stab⸗ Stabwurtz-Oel Stabwurzöl
wurtz⸗Oel
2.3 Abkürzungen werden analog zur Textgrundlage tokenisiert. Das heißt, auch Setzfehler oder Spatien, die nicht modernen Orthografieregeln entsprechen, werden realisiert. Abkürzungen werden nach Dudenrichtlinien umgesetzt. Dies hat zur Folge, dass Abkürzungen unterschiedlich tokenisiert werden können (bspw. Abkürzungen als zwei oder mehr Tokens wie u. a. m. vs. solche, die als ein Token realisiert werden, wie usw.). vgl. dazu beide Beispiele in 2.3. In Fällen, in denen keine Dudenrichtlinie zugeordnet werden kann, wird immer nach einem Punkt segmentiert.
dipl clean norm
u. u. usw.
ſ. s.
w. w.
Abkürzungen werden analog zur Textgrundlage tokenisiert. Das heißt, auch Setzfehler oder Spatien, die nicht modernen Orthografieregeln entsprechen, werden realisiert. Abkürzungen werden nach Dudenrichtlinien umgesetzt. Dies hat zur Folge, dass Abkürzungen unterschiedlich tokenisiert werden können (bspw. Abkürzungen als zwei oder mehr Tokens wie u. a. m. vs. solche, die als ein Token realisiert werden, wie usw.). vgl. dazu beide Beispiele in 2.3. In Fällen, in denen keine Dudenrichtlinie zugeordnet werden kann, wird immer nach einem Punkt segmentiert.
dipl clean norm
u u u.
d.
d.g. d.g. g.
2.4 Punktsetzungen bei Ordinalzahlen werden mit der Ziffer als ein Token realisiert. Nach modernen Orthografieregeln werden Ordinalzahlen mit Punkt realisiert.
dipl clean norm
I. I. I.
Die Faksimilia weisen oft Kardinalzahlen mit Interpunktion auf. Diese Punktsetzungen werden mit der jeweiligen Ziffer als Token realisiert. Ausnahmen bilden Zahlen, die mit einem satzbeenden Punkt auftreten. Hier wird wie gewohnt die Satzinterpunktion getrennt von der Kardinalzahl tokenisiert.
Abbildung eines Buchausschnitts, zeigt 'I. Loth'
Abbildung eines Buchausschnitts, zeigt '.IX.'
Um die Kardinalzahlen von Ordinalzahlen in der norm-Ebene getrennt betrachten zu können, wird die Interpunktion bei Kardinalzahlen weggelassen.
dipl clean norm
I. I. I.
Loth Loth Loth
.IX. .IX. IX
Zeichenketten wie "5 %", "5-12", "800'" werden auf der dipl und clean als ein Token und in der norm als mehrere Token betrachtet, wenn sie im Scan visuell zusammen stehen. Stehen sie visuell auseinander, werden sie auch als verschiedene Tokens realisiert. Norm: immer als mehrere Token
2.5 Abbildung eines Buchausschnitts, zeigt 'finden' mit Punkt dahinter
Satzinterpunktion wie Kommata, Punkte, Virgeln oder Semikola werden als jeweils eigenständige Token realisiert.
dipl clean norm
finden finden finden
. . .
Abbildung eines Buchausschnitts, zeigt das Wort 'keychen' mit höher gestelltem Punkt dahinter
Die Höhe von Punkten wird nicht beachtet. Da wir nicht immer zweifelsfrei feststellen können, wann ein Punkt "hoch" ist und wann "tief", transkribieren wir das alles als normale Punkte.
dipl clean norm
keychen keychen keuchen
. . .
Bildausschnitt aus einem Buch, zeigt das Wort 'werden' gefolgt von einem Punkt mit einem Zeichen drüber
Dieses Zeichen wird als Punkt transkribiert.
dipl clean norm
werden werden werden
. . .
2.6 Fußnotenreferenzierungen werden in dipl- und clean-Ebene als mehrere Token und in der norm-Ebene als ein Token realisiert. Norm: ein Token
dipl clean norm
( ( (*)
* *
) )
dipl clean norm
* * **)
* *
) )
3.1 Formen, die in phonologischer Hinsicht fnhd. oder dialektalen Lautstand aufweisen, werden in der norm den (standard-)nhd. Entsprechungen angepasst.
dipl clean norm
Hellenpein Hellenpein Höllenpein
wänlin wänlin Wännlein
Dialektale Formen
dipl clean norm
beede beede beide
Apokope / Synkope (hier: Synkope)
dipl clean norm
hänget hänget hängt
3.2 Fnhd. Flexionsformen werden durch die nhd. Entsprechungen ersetzt.
dipl clean norm
in die Nasen in die Nasen in die Nase
das kal Haupt das kal Haupt das kahle Haupt
Es erfolgt keine Anpassung des Genus
dipl clean norm
das Milz das Milz das Milz
Vom Nhd. abweichende starke oder schwache Verbalflexion bzw. Rückumlaut wird dem nhd. Stand angepasst
dipl clean norm
gennent gennent genannt
gebauen gebauen gebaut
Auseinanderschreibung
dipl clean norm
obgenannt obgenannt oben genannt
hiebevor hiebevor hier bevor
3.3 Die aus der niederfränkischen Schreibtradition stammende ij-Schreibung für Lateinisch "ii" wird in der norm zu ii normalisiert.
dipl clean norm
Lapatijs Lapatijs Lapatiis
3.4 Ausgestorbenes lexikalisches Material wird mit modernen Orthografieregeln übernommen, aber nicht lexikografisch übersetzt.
dipl clean norm
Vergeſz Vergeſz Vergess
3.5 Es erfolgt keine morphosyntaktische Anpassung (z.B. innerhalb der Nominalphrase)
dipl clean norm
(Es) Heylt die verſehrte Daͤrmelein (Es) Heylt die versehrte Därmelein (Es) Heilt die versehrte Därmlein
3.6 Ausgestorbene Wortbildungsmorpheme werden nach Möglichkeit durch entsprechende nhd. Bildungen ersetzt. (siehe Beispieltabelle am Schluss)
dipl clean norm
halben(Postposition) halben halber
(allenthalben ist ein Adverb und bleibt allenthalben)
stachelecht stachelecht stachelig
3.7 Flexionslose Adjektive, die im Neuhochdeutschen eine overte Flexion enthalten, werden in der norm flektiert, ohne dass der Kasus geändert wird.
dipl clean norm
das kal Haupt das kal Haupt das kahle Haupt
bei ſchweinem fleiſch bei schweinem fleisch bei schweinenem Fleisch
3.8 Intervenieren innerhalb eines Wortes Sonderzeichen, dann werden die Sonderzeichen in der norm-Ebene ignoriert und das unterbrochene Wort zusammengeschrieben.
dipl clean norm
Abbildung eines Buchausschnitts, zeigt 'Glo-<lb>
Abbildung eines Buchausschnitts, zeigt zwe Zeichen vor 'ver Graſſ.
Glo- Glo ✠ Glover
ver ver
Graſſ Grass Grass
. . .
Text hinter (geschweiften) Klammern, wird nach dem umklammerten Textabschnitt eingefügt.
dipl
Abbildung eines Buchausschnitts, zeigt Text hinter einer geschweiften Klammer
Wermuth Wermuth , gemeiner Wermuth , groſzer ſ. Wer⸗ muthbeifuſz.
Graphematisch wird grundsätzlich nach dem Duden normalisiert.
BeschreibungZeichenEingabe über die Tastatur
Schräger Dopppelbindestrich2E17
Langes kleines “s”ſ017F
Alt s
Tildẽ̃0303
Ligatur aeæ00E6
Ligatur AEÆ00C6
Ligatur oeœ0153
Ligatur OEŒ0152
Akut´dead key +
Gravis`shift+dead key+
Cedille kleinç00E7
Cedille großÇ00C7
Superskribiertes “e”ͤ0364
Kreiså030A
y mit Punktenÿ00FF
Absatzzeichen00B6
Abkürzung “der”ðAltGr+d
Häkchen über Zeichen0309
Zeichen für lat. “recipe”211E
Zeichen für lat. “libra”2114
Zeichen für lat. “uncia”2125
Zeichen für lat. “scrupel”2108
3 Kreise2234
Kreis mit Punkt “einjährig”2299
Latin Small Letter Rum RotundaA75D
Tironisches “et”204A

Tabelle SEQ Tabelle * ARABIC 2: Zeichentabelle


Tabelle: Normalisierungsbeispiele

clean norm
1 -icht/-echt/-acht/-lote -(l)ich/-(l)ig
ästicht ästig
knöpfflicht knöpfflich
haarecht haarig
holzecht holzig
schattecht schattig
langlecht länglich
laulecht laulig
weißlecht weißlich
rohtlecht rötlich
stachelecht stachelig
gelblote gelblich
2 deutlich erkennbare Ortsnamen werden als nhd. Form normalisiert
Franckfort Frankfurt
Muttetz Muttenz
3 -lich-Adverbien werden durch nhd. lich-lose Formen ersetzt
kräftiglich kräftig
wunderbarlich wunderbar
4 für- vor-
fürnehmlich vornehmlich
5 -für -vor
herfür hervor
6 on- / ohne entspricht dem Präfix un-
on- / ohne un-
7 -fnhd. etwan
etwan nhd. etwa (Adverb)
nhd. etwas (Pronomen)
8 -erin flektierte nhd. Form
in ein erhabnes Steinerin Grab gelegt steinernes
9 -en
endlichen endlich
sonsten sonst
selbsten selbst
10 -en
ob oben
beizeit beizeiten
11 (Nicht)Normaliserung von Kasus
mit Normalisierung: Man trinke des wassers mit Normalisierung von Kasus:
Man trinke das Wasser
Man trinke des wassers ohne Normalisierung von Kasus:
Man trinke des Wassers
12 Vom Nhd. abweichende starke oder schwache Verbalflexion bzw. Rückumlaut wird dem nhd. Stand angepasst
gennent genannt
gebauen gebaut
13 Auseinanderschreibung
obgenannt oben genannt
hiebevor hier bevor
14 ggf. ge-Präfix in Partizipien ergänzen
funden gefunden
kommen gekommen
worden geworden
15 Flexionsformen der Pronomina der, die, das an nhd. Formen anpassen
der derer
dero derer
des dessen
16 fnhd. wann/wenn nhd. wann (Interrogativpron)
nhd. wenn (Subjunktion)
wann

wenn es einen Nebensatz einleitet → keine V2 Stellung, sondern VLetzt (auch VLetzt mit Nachfeldbesetzung: wenn man Köl- und Haselbaum pflanzt zu Weinreben)
wenn
wann

wenn es einen Hauptsatz einleitet → V2 und übersetzbar it nhd. 'denn'
wann
wenn

wenn es einen Hauptsatz einleitet → V2 und übersetzbar it nhd. 'denn'
wann
wenn

wenn es einen Nebensatz einleitet → keine V2 Stellung, sondern VLetzt (auch VLetzt mit Nachfeldbesetzung: wenn man Köl- und Haselbaum pflanzt zu Weinreben)
wenn
17 -fnhd. söllen/wöllen sind dialektale Formen
söllen sollen
wöllen wollen
18 Eigennamen/Fremdwörter in Komposita werden getrennt geschrieben
St. Anthonius Feuer Sankt Anthonius Feuer
Cassia fistel Cassia Fistel
19 Abkürzung frequenter Wörter und Endungen
Abbildung eines Buchausschnitts, zeigt 'vñ' mit Nasalstrich über dem 'n'
unn (sic!)
und
Abbildung eines Buchausschnitts, zeigt 'vm̃' mit Nasalstrich über dem 'm'
umm (sic!)
um
Abbildung eines Buchausschnitts, zeigt 'darum̃' mit Nasalstrich über dem 'm'
darumm (sic!)
darum
Abbildung eines Buchausschnitts, zeigt 'complexiõ' mit Nasalstrich über dem 'o'
complexiom (sic!)
Komplexion
20 Einzelentscheidungen
benommen genommen
Beweisung Beweisung
brauch (= Gebrauch) Brauch
dannenher daher
dennocht dennoch
der selbe der selbe
derselbe derselbe
derowegen deswegen
entbeut entbietet
Epff Epff
fahen fangen
gel gel
gepreist gepriesen
gleichsfalls
gleichesfalls
gleichfalls
guldin golden
halb halber
harm Harn
harmen harnen
hauffecht häufig
leichtlich leicht
liebnusz Liebnis
Mannen Männern
mehrer teils
morgen (= morgens) morgens
namlichen nämlich
Nutz Nutzen
pestnachen Pastinaken
samlen sammeln
schlahen schlagen
sonders sonders
(wegen der) Viele Viele
vierecket viereckig
vor vorher
wehtum/wehtumb Wehtun
wofer wofern
wurz wurzel
yedickest gedihest (Lexer: 'oft')
yetliches jegliches
zeuchen ziehen
wa (als dialektale Form) wo
Vättern Väter
nießte neuste

In Verbindung mit Excel benutzte Tools

Excel-Makro

SearchAndMerge.bas: https://hu.berlin/search-and-merge
Das Makro SearchAndMerge.bas sucht in einem markierten Bereich nach leeren Zellen (kleiner gleich 300 leere Zellen nacheinander) und vereinigt diese mit der letzten Vorgängerzelle, die einen Wert enthält.

Python-Skript

clean-skript_V3.py: https://hu.berlin/clean-script-v3
Die neuen Texte ab Version 5 stellten neue Anforderungen an die <clean>-Ebene, neue Zeichenersetzungen wurden nötig sowie ein komplett neuer Umgang mit Nasalstrichen. Die vorigen Texte ließen Zeichenersetzungen der Nasalstriche zu den jeweiligen Nasalen durch Kontextbetrachtung zu, während die neuen Texte viele von diesen alten Regularitäten nicht mehr erfüllen. Deshalb wird ab der zweiten Version des clean-Skriptes anders mit solchen Nasalstrichen verfahren. Statt den Kontext zu betrachten und eine eindeutige Entscheidung zugunsten eines Nasals zu treffen, werden nun alle in Frage kommenden Zeichenersetzungen berücksichtigt und die möglichen Token werden durch | getrennt dargestellt.

Bei der weiteren Bearbeitung in Excel kann es nach Anwendung des Clean-Skripts zu ungewollten automatischen Formatierungen kommen, ÜBERPRÜFEN!!!
1/2 wurde durch Excel zu 01.Februar. Das normalisierte falsch wurde durch Excel zum logischen Operator FALSCH.

Annotation

Es gibt im RIDGES-Korpus aktuell manuelle und mit verschiedenen Tools automatisch erstellte Annotationen sowie Metadaten, die die Eigenschaften der Dateien beschreiben.

Zu linguistischen Annotationen werden Interpretationen der Token aus grammatischer Perspektive gezählt. Das RIDGES-Korpus enthält als linguistische Annotationen ein POS-Tagging für Wortarten, Lemmatisierung, die Markierung von fremdsprachlichem Material und die Kennzeichnung von Abkürzungen. Im Druck nicht leserliche und daher nicht weiter analysierbare Token werden auf der Ebene unclear annotiert.

Strukturelle Annotationen kodieren Informationen zum Layout und zur Textstruktur. Dazu zählen die Spaltenzugehörigkeit, Überschriften, Abbildungen und deren Platzierung, Schriftbild und Markup, Auszeichnungen von Fußnoten, Marginalien und Bildunterschriften, Zitaten und Zitatmarkierungen sowie Zugehörigkeit der Token zu Zeilen, Seiten und die Kennzeichnung von Seitenzahlen.

Inhaltliche Annotationen beinhalten nicht-sprachliche Informationen zu Token, Spannen und Dokumenten. Annotiert werden Personennamen, Titel, die Art der Referenz auf Autor:innen und Leser:innen. Inhaltliche Informationen zu Dokumenten werden in den Metadaten annotiert.

Darüberhinaus gibt es Annotationsebenen, die nur in älteren Versionen des Korpus vorhanden sind.

Für jede Version des Korpus und jeden darin enthaltenen Text ist aufgelistet, welche Annotationen vorhanden sind.

Manuelle Annotationen

Manuell annotiert werden sowohl linguistische als auch strukturelle und inhaltliche Annotationen. Die Annotationen werden hauptsächlich von Studierenden im Rahmen der RIDGES-Seminare unter wissenschaftlicher Betreuung erstellt.

Allgemeine Richtlinien

Groß- und Kleinschreibung der Werte beachten

Annotationsebenen


Linguistische Annotationen

lang

Kodiert die konkrete Sprache des Textes nach ISO Drei-Buchstaben-Code ISO 639-3 (z.B. lat).

Exponent

Annotationswert wird je dipl-Token zugewiesen.

Werte

AnnotationswertBeschreibung
deuDeutsch (Default-Wert)
latLatein
grcAltgriechisch
spaSpanisch
itaItalienisch
araArabisch
fraFranzösisch
polPolnisch
nldNiederländisch
engEnglisch
rusRussisch
gohAlthochdeutsch
danDänisch
hunUngarisch
egyÄgyptisch
czeTschechisch
sweSchwedisch
norNorwegisch
undefFür Abkürzungen, die nicht im Duden stehen
unknownFür unknown (Unterstrich (_) in ‘dipl’)

Richtlinien und Hinweise

  • Für Sprachen, die oben nicht gelistet sind, können die ISO-Codes dieser Seite entnommen werden.

  • (Satz)zeichen und Ziffern bleiben immer deu.

  • Zweifelsfälle, bei denen nicht zwischen Schreibvariante oder Fremdsprache unterschieden werden kann, werden im Kontext beurteilt (bspw. Capitel, Extract, October, Scribenten). deu wird annotiert, wenn das Wort in deutschem Kontext steht und lat, wenn das Wort in lateinischem Kontext steht. Namen bleiben deu (bspw. Brown, Plinius, Dioskurides, Loddike, Klusen, Lurk) - außer sie haben eine fremdsprachliche Flexionsendung. (bspw. lat für Plinii, Dioskuridi, Etmüllero).

  • Item/Jtem sind lat

  • deu vs. lat: Wenn keine Entscheidung getroffen werden kann, wird lat verwendet.
    lat vs. grc: Wenn keine Entscheidung getroffen werden kann, wird lat verwendet.

  • Wenn etwas, laut Autor:in, in mehreren Sprachen den gleichen Namen hat, wird die erstgenannte Sprache verwendet.


abbr

Kennzeichnung von Abkürzungen in ‘norm’.

Exponent

Annotationswert wird je norm-Token zugewiesen.

Werte

AnnotationswertBeschreibung
nokeine Abkürzung in ‘norm’ (Default-Wert)
yesAbkürzung in ‘norm’
unknownfür unknown in ‘norm’

Richtlinien und Hinweise

  • Aufzählungen, Mengenangaben (z.B. ij.) und Nummerierungen werden mit no annotiert (siehe Abb. unten).
    Abbildung eines Buchausschnitts, zeigt eine AufzählungAbbildung eines Buchausschnitts, zeigt eine Aufzählung
  • Im Zweifelsfall wird yes annotiert.



Strukturelle Annotation

Unter strukturellen Annotationen werden alle Annotationen zusammengefasst, die Aussagen über die grafische Strukturierung der Textgrundlage liefern. Dazu zählen Kennzeichnungen der Zeilen- und Seitenumbrüche, Seitenzahlen, unkenntliche/nicht lesbare Zeichen und Marginalien sowie Fußnoten. Strukturelle Annotationen werden auf Grundlage der diplomatischen Ebene vergeben (dipl-Ebene). So ist die Tokenisierung in der dipl-Ebene Vorlage für die weiteren, strukturellen Annotationen.

column

Auszeichnung einer ganzen Spalte

Exponent

Spannenannotation über mehrere dipl-Token

Werte

AnnotationswertBeschreibung
ldipl-Token, die zusammen in der linken Spalte stehen
rdipl-Token, die zusammen in der rechten Spalte stehen
cbei dreispaltigem Text: dipl-Token, die zusammen in der mittleren Spalte stehen (center)

unclear

Markierung, dass Zeichen eines Tokens oder ein Token bzw. ein Text nicht lesbar sind. In der dipl-Ebene werden nicht leserliche Zeichen oder Zeichenketten mit einem Unterstrich (_) gekennzeichnet. Es können aber auch im Fließtext Unterstriche vorkommen, die als _ transkribiert werden. Durch die zusätzliche Annotation unclear auf der gleichnamigen Ebene lässt sich unterscheiden, ob ein Unterstrich kennzeichnet, dass eine Textstelle nicht lesbar ist oder ob es sich um einen transkribierten Unterstrich aus dem Faksimilé handelt.
Desweiteren kann so nach nicht lesbaren Zeichen gesucht und gefiltert werden.

Exponent

Annotationswerte werden je dipl-Token zugewiesen

Werte

AnnotationswertBeschreibung
unclearNicht leserliche Zeichen oder Zeichenketten werden unabhängig von der Anzahl unleserlicher Zeichen, in der dipl-Ebene mit nur einem Unterstrich (_) gekennzeichnet (siehe Transkription und Normalisierung).
Wenn in der Transkription ein solcher Fall eintritt, so wird mit dem Tag unclear in der gleichnamigen unclear-Ebene dies allgemein angezeigt.

Auszeichnung einer Überschrift, wenn sich diese vom Fließtext absetzt.

Exponent

Spannenannotation über mehrere dipl-Token.

Werte

AnnotationswertBeschreibung
headAllgemeine Markierung einer Überschrift

Richtlinien und Hinweise

  • Es wird nicht zwischen Überschriften und Unterüberschriften unterschieden, da der Unterschied in historischen Texten nicht immer feststellbar ist. Alle Überschriften erhalten daher den gleichen Annotationswert head.
  • Zwei Überschriften werden jeweils in einer Spanne annotiert (siehe Abbildungen).
  • Fortlaufende Kapitelüberschriften werden dabei nicht transkribiert (siehe Abbildungen).
AnnotationScreenshot
Das ſechſzehende Capitel. wird als eine Spanne annotiert und Von Sawrampffer. als eine weitere Spanne.Abbildung eines Buchausschnitts, zeigt zwei Überschriften untereinander
Die beiden Beispiele zeigen fortlaufende Kapitelüberschriften, die auf mehreren Seiten erscheinen. Sie werden nicht transkribiert und müssen daher nicht ausgezeichnet werden.Abbildung eines Buchausschnitts, zeigt eine forlaufende Überschrift
Abbildung eines Buchausschnitts, zeigt eine forlaufende Überschrift

figure

Auszeichnung einer Grafik oder Tabelle, die im Text eingebettet ist.

Exponent

Spannenannotation über mehrere dipl-Token

Werte

AnnotationswertBeschreibung
figureAllgemeine Kennzeichnung einer Grafik im Text.
tableAllgemeine Kennzeichnung einer Tabelle im Text.

Richtlinien und Hinweise

  • Abbildungen
    • Grundsätzlich wird unterschieden zwischen Abbildungen mit und ohne Bildbeschriftung.
    • Besitzt eine Abbildung eine Beschriftung, werden alle dipl-Token der Bildbeschriftung in einer Spanne als figure annotiert. Beispiele finden sich in der Tabelle Abbildungen mit Beschriftung.
    • Besitzt eine Abbildung keine Beschriftung, werden Teile des Fließtextes als “Anker” zur Annotation in der figure-Ebene verwendet. Diese sind in der Tabelle Abbildungen ohne Beschriftung definiert.
  • Tabellen
    • Annotation als table in einer Spanne über den gesamten transkribierten Text der Tabelle. Die Annotation von Tabellen funktioniert analog zu der von Abbildungen.
Abbildungen mit Beschriftung
BeschreibungAnnotationScreenshot
Bild1 mit Bildbeschriftung auf einer ExtraseiteDie Bildbeschriftung wird wie der restliche Text auch transkribiert und normalisiert (dipl, clean, norm). In ‘note’ wird sie als caption annotiert und in ‘figure’ als figure. In ‘pb_n’ und in ‘figure_p’ wird die entsprechende Seitenzahl angegeben.
Sollte diese Extraseite einen Fließtext unterbrechen, d.h. nicht zwischen abgegrenzten Absätzen stehen, dann wird die Bildbeschriftung vor den entsprechenden Absatz gestellt und in ‘pb_n’ ignoriert. In ‘figure_p’ wird die Seitenzahl der Faksimiléseite, auf der die Abbildung sich befindet, eingetragen.
Bei dem hier aufgeführten Bildbeschriftungsbeispiel kann ein zweispaltiger Text angenommen werden (Wal- wurtz bekäme also in ‘column’ den Wert l und männ- lin den Wert r). Auch Zeilenumbrüche werden annotiert.
Abbildung eines Buchausschnitts, zeigt das Bild einer Planze mit Text links und rechts davon
Zwei Bilder2 mit Bildbeschriftung auf einer ExtraseiteDie Bildbeschriftung wird wie der restliche Text auch transkribiert und bekommt eine eigene Seitenzahl zugewiesen. In ‘note’ wird jede Beschriftung für sich als caption annotiert und in ‘figure’ als figure. Es gibt also zwei caption- und zwei figure-Annotationen. In ‘figure_p’ wird jeweils die entsprechende Seitenzahl angegeben.
Bei dem hier aufgeführten Beispiel kann ein zweispaltiger Text angenommen werden (Weiß Hornungsblüm bekäme also in ‘column’ den Wert l und Geel Hornungsblüm den Wert r).
Abbildung eines Buchausschnitts, zeigt Bilder von zwei Pflanzen nebeneinander, mit Bildbeschriftung unter dem jeweiligen Bild
Mehr als zwei Bilder3 mit Bildbeschriftung auf einer ExtraseiteBei mehreren Bildern wird von links nach rechts und von oben nach unten vorgegangen (links nach rechts geht vor). In diesem Beispiel werden die Figuren also in der folgenden Reihenfolge transkribiert und annotiert:
- oben links
- oben rechts
- unten links
- unten rechts
werden jeweils in ‘figure’ als figure annotiert und erhalten in ‘pb_n’ eine gemeinsame und in ‘figure_p’ jeweils eine Seitenzahl zugewiesen
Abbildung eines Buchausschnitts, zeigt Bilder von vier Pflanzen neben- und untereinander, mit Bildbeschriftung über dem jeweiligen Bild
Bild4 mit Marginalie als BildbeschriftungBezieht sich eine Marginalie offensichtlich auf eine Abbildung, die unter einem abgeschlossenen Absatz steht, wird diese Marginalie im Anschluss an den Absatz transkribiert und in ‘note’ als margin sowie in ‘figure’ als figure annotiert.Abbildung eines Buchausschnitts, zeigt ein Bild unter einem Fließtext, links neben dem Fließtext steht eine Marginalie
Zwei Bilder5 mit Beschriftung zwischen FließtextZuerst wird die Beschriftung des linken Bildes (oder des oberen, wenn übereinander), dann die des rechten Bildes vor dem entsprechenden Absatz transkribiert. Die Transkriptionsabschnitte werden in ‘note’ jeweils als caption und in ‘figure’ als figure annotiert. In ‘figure_p’ wird die originale Seitenzahl angegeben.
Bei dem konkreten Beispiel kann man außerdem eine Annotation von Spalten vornehmen.
Abbildung eines Buchausschnitts, zeigt Bilder von Pflanzen zwischen Fließtext

Abbildungen ohne Beschriftung

BeschreibungAnnotationScreenshot
Bild(er) allein auf SeiteDas letzte dipl-Token der vorangehenden sowie das erste dipl-Token der folgenden Seite werden als eine Abbildung annotiert. In ‘figure_p’ wird die Seitenzahl angegeben.
Sind auf einer Seite mehrere Abbildungen ohne Text werden diese als eine Abbildung annotiert.
Abbildung eines Buchausschnitts, zeigt Bilder von zwei Pflanzen nebeneinander, mit Bildbeschriftung unter dem jeweiligen Bild
Bilder neben einspaltigem TextAnnotation von dem ersten bis zum letzten dipl-Token des danebenstehenden Textabschnittes (wie bisher auch).Abbildung eines Buchausschnittes, zeigt Bilder neben einspaltigem Text
Bild über TextDas Bild wird in ‘figure’ für das erste dipl-Token des folgenden Textabschnittes annotiert (hier Haſzelwurtz).Abbildung eines Buchausschnitts, zeigt ein Bild über Text
Bild unter TextDas Bild wird in ‘figure’ für das letzte dipl-Token des vorangehenden Textabschnittes annotiert.
Bild zwischen TextDas Bild wird in ‘figure’ für das letzte dipl-Token des vorangehenden Textabschnittes und das erste dipl-Token des folgenden Textabschnittes annotiert (hier also für den Punkt hinter Kuchenſchell und Kuchenſchell im unteren Textabschnitt).Abbildung eines Buchausschnitts, zeigt ein Bild unter Text
Bild in zweispaltigem Textoben in einer Spalte: Annotation an dem ersten nachfolgenden dipl-TokenAbbildung eines Buchausschnittes, zeigt ein Bild über der linken Spalte eines zweispaltigen Textes
unten in einer Spalte: Annotation an dem letzten vorangehenden dipl-TokenAbbildung eines Buchausschnittes, zeigt ein Bild unter der linken Spalte eines zweispaltigen Textes
innerhalb einer Spalte: Annotation an dem letzten vorangehenden und ersten folgenden dipl-TokenAbbildung eines Buchausschnittes, zeigt ein Bild zwischen Text in der linken Spalte eines zweispaltigen Textes
Bild mittig zwischen zweispaltigem Text;
Lesefluss: links rechts, links rechts
Das Bild wird für das letzte dipl-Token in der rechten Spalte oben bis zum ersten dipl-Token in der linken Spalte unten annotiert.Abbildung eines Buchausschnittes, zeigt ein Bild mittig zwischen zweispaltigem Text
Bild mittig zwischen zweispaltigem Text;
Lesefluss: links, rechts
Das Bild wird für das letzte dipl-Token in der linken Spalte oben und das erste dipl-Token in der linken Spalte unten annotiert.Abbildung eines Buchausschnittes, zeigt ein Bild mittig zwischen zweispaltigem Text
Bild mittig über zweispaltigem Text / Bild unten in der linken SpalteDas obere Bild wird an dem ersten dipl-Token der linken Spalte annotiert, das untere Bild für die nebenstehenden dipl-Token.Abbildung eines Buchausschnittes, zeigt ein Bild mittig über zweispaltigem Text und ein Bild unten in der linken Spalte
Bild von Text umgebenDas Bild wird für den gesamten Text auf dieser Seite annotiert.T1 T2 T3
T 4 B T5
T6 T7 T8

figure_p

Angabe der Seite, auf der eine Abbildung im Faksimilé zu sehen ist.

Exponent

Spannenannotation über mehrere dipl-Token

Werte

AnnotationswertBeschreibung
numerischer WertSeitenzahl als lateinische oder römische Zahlenangabe

script

Weist jedem Token eine Schriftart zu.

Exponent

Spannenannotation für einzelne dipl-Token

Werte

AnnotationswertBeschreibung
romandipl-Token, das in Antiqua gedruckt ist.
blackletterdipl-Token, das in Fraktur gedruckt ist.
mixeddipl-Token, das in verschiedenen Schriftsätzen gedruckt ist.

Richtlinien und Hinweise

In manchen Texten kommt es vor, dass ein und dasselbe Token zum Teil in einem und zum Teil in einem anderen Font gedruckt wurde. Dies betrifft v.a. Wörter mit deutscher Flexionsendung und fremdsprachiger Wurzel. Für diese Token wurde innerhalb von “script” der Wert mixed annotiert.


hi_rend

Beschreibung der Darstellung des hervorgehobenen Bereichs, z. B. grafische Hervorhebungen, Farben etc.

Exponent

Spannenannotation über einzelne dipl-Token

Werte

AnnotationswertBeschreibung
italicsdipl-Token, das kursiv gedruckt ist.
bolddipl-Token, das fett gedruckt ist.
underlineddipl-Token, das unterstrichen gedruckt ist.
reddipl-Token, das rot gedruck ist.
iniCapdipl-Token, das mit einem zusätzlichen Großbuchstaben gedruckt ist.
letter-spacing:1emEin größerer Abstand zwischen Buchstaben, Sperrdruck.

note

Markiert Fußnoten, Marginalien und Bildbeschriftungen.

Exponent

Spannenannotation über mehrere dipl-Token.

Werte

AnnotationswertBeschreibung
noteIn einer Spannenannotation wird die gesamte Fußnote mit dem Wert note annotiert. Der Text der Fußnoten wird immer am Ende des Absatzes, in dem sie eingepflegt sind, in die dipl-Ebene/Transkription aufgenommen, unabhängig davon, ob sich so die Fußnoten sammeln oder erst auf der nachfolgenden Seite realisiert werden müssten.
marginIn einer Spannenannotation wird die gesamte Marginalie mit dem Wert margin annotiert. Der Text der Marginalien wird immer am Anfang des jeweiligen Absatzes, in dem/ neben dem sie realisiert sind, in die dipl-Ebene/Transkription aufgenommen, unabhängig davon, ob so mehrere Marginalien hintereinander oder/und auf der vorherigen Seite realisiert werden müssen.
captionIn einer Spannenannotation wird die gesamte Bildbeschriftung mit dem Wert caption annotiert. Der Text der Bildbeschriftungen wird immer am Anfang des jeweiligen Absatzes, in dem sie realisiert sind, in die dipl-Ebene/Transkription aufgenommen, unabhängig davon, ob so mehrere Bildbeschriftungen hintereinander oder/und auf der vorherigen Seite realisiert werden müssen.

quote

Ordnet Fließtext als Zitat oder Nicht-Zitat ein.

Exponent

Spannenannotation für einzelne dipl-Token

Werte

AnnotationswertBeschreibung
yesEin Zitat im Text.
noKein Zitat (Default-Wert).

quotemark

Markierung von Anführungszeichen (außerhalb des Fließtextes).

Exponent

Spannenannotation über mehrere dipl-Token

Werte

AnnotationswertBeschreibung
qmMarkierung pro Zeile mit Anführungszeichen

Richtlinien und Hinweise

Beispiel:
Abbildung eines Buchausschnitts, zeigt eine Anführungszeichen außerhalb eines Fließtextes
Abb.: Beschreibung der Gräser nebst ihren Abbildungen nach der Natur / Johann Christian Daniel Schrebers (Leipzig, 1769) Zentralbibliothek Zürich: https://www.e-rara.ch/zuz/content/pageview/16384579



Inhaltliche Annotation

Zu den inhaltlichen Annotationen zählen die Annotationen der genannten historischen Persönlichkeiten (persname), Autor:innen (author_ref), Leser:innen (reader_ref) und erwähnten Werken (title)

persname

Es wird die Identität der Personen annotiert, auf die ein:e Autor:in referiert.

Exponent

Spannenannotation über eine oder mehrere dipl-Token

Werte

AnnotationswertBeschreibung
ZeichenketteName einer Person

Richtlinien und Hinweise

  • Diese Ebene dient der eindeutigen und schnellen Verknüpfung der im Korpus auftretenden Namen mit den dazugehörigen historischen Personen.
  • Es wird der jeweilige Personenname im Nominativ angegeben. Eine Liste der vereinheitlichten Namen findet sich hier.
  • Ist eine Person nicht eindeutig identifizierbar wird der in der “norm” gegebene Wert im Nominativ Singular in die Ebene “persname” übertragen.
  • Die Schreibung der Namen richtet sich nach dieser Liste (diese enthält offizielle Abkürzungen und die entsprechende Ausschreibung vieler Botaniker:innen) und wenn dort nicht aufgeführt, nach ihrer Schreibung in der deutschsprachigen Wikipedia. Anstelle von Leerzeichen werden Unterstriche gesetzt.
  • Im Folgenden sind alle bisher in RIDGES vorkommenden eindeutigen Personennamen aufgeführt. Diese werden weiterhin so übernommen. Hinweis: Viele Autoren haben eine Art Künstlername und es gibt auch viele verschiedene Schreibweisen. In dieser Ebene muss darauf geachtet werden, dass ein und dieselbe Person immer mit dem gleichen Namen annotiert wird.

A Achilles, Adriaan_van_Royen, Aetios_von_Amida, Agrippa_von_Nettesheim, Aimé_Jacques_Alexandre_Bonpland, Albrecht_von_Haller, Alexander_von_Humboldt, Alexander_von_Tralleis, Alexander_Wilhelm_Martini, Alexandre_Henri_Gabriel_de_Cassini, al_Farabi, Almanzor, André_Michaux, Andreas_Cleyer, Anna_von_Böhmen_und_Ungarn, Antoine-Laurent_de_Jussieu, Antoine_Gouan, Anton_Rehmann, Antonio_Musa_Brassavola, Antonius_Musa, Apollonius, Apuleius, Archigenes, Aristomachos, Aristoteles, Arnald_von_Villanova, Artemis, Artemisia_II., Asa_Grey, Asklepiades_von_Bithynien, Attalos_I., August_Quirinus_Rivinus, Augustin_Pyramus_De_Candolle, Averroes, Avicenna, B Balthasar_Ehrhart, Bartholomaeus_Anglicus, Bartolomeo_Platina, C Caelius_Apicius, Carl_Heinrich_Schultz_Bipontinus, Carl_Peter_Thunberg, Carl_Sigismund_Kunth, Carl_von_Linné, Carrichter, Caspar_Bauhin, Caspar_Hoffmann, Charles_de_l’Écluse, Christian_Friedrich_Lessing, Christian_Gottlieb_Ludwig, Christoph_Wilhelm_Hufeland, Chrysippos_von_Soloi, Conrad_Gessner, Conrad_Roßbach, Constantinus, D David_Heinrich_Hoppe, Dieuches, Diodoros, Dirslaus_von_Schwenkfeld, Dominique_Villars, E Eberhard_Gmelin, Eduard_August_von_Regel, Erasistratos, Eucharius_Rösslin_der_Jüngere, F Fabio_Colonna, Ferdinand_Jacob_Heinrich_Sir_Müller, Filippo_Beroaldo, Flavius_Josephus, François_Fulgis_Chevallier, Franz_Xaver_von_Wulfen, Franziskus_Joel, Friedrich_II., Friedrich_III., G Galenos, Gaza, Genthios, Georg_Franz_Hoffmann, George_Bentham, Giovanni_da_Vigo, Gregor_Horst, Guglielmo_da_Varignana, Guillaume_Rondelet, Gustav_Karl_Wilhelm_Karsten, Guy_de_La_Brosse, H Heinrich_Bernhard_Rupp, Heinrich_Kramer, Heinrich_Petreus, Henri_Ernst_Baillon, Henry_Charles_Andrews, Herakleides_Pontikos, Herkules, Herman_Boerhaave, Hermann_Hager, Hermann_von_Neuenahr_der_Ältere, Hermolaus_Barbarus, Hesiod, Hieronymus_Bock, Hipólito_Ruiz_López, Hippokrates_von_Kos, Homer, Hugh_Algernon_Weddell, I Isaac_Newton, Isaac_Rand, Isaak_ben_Salomon_Israeli, Isidor_von_Sevilla, J Jacques_Barrelier, Jacques_Peschier, Jean-Baptiste_Miroudot_du_Bourg, Jean_Louis_Lassaigne, Jean_Ruel, Joachim_Camerarius, Jesus_von_Nazaret, Joachim_Camerarius_der_Jüngere, João_de_Loureiro, Johann_Bauhin, Johann_Esaias_Silberschlag, Johann_Georg_Volkamer, Johann_Gottlieb_Gleditsch, Johann_Heinrich_von_Heucher, Johann_Jacob_Dillen, Johann_Jacob_Reinhard, Johann_Jakob_Scheuchzer, Johann_Schröder, Johann_Sigismund_Elsholtz, Johann_Wonnecke_von_Kaub, Johannes_Andrä_von_Königgrätz, Johannes_Bodaeus_van_Stapel, Johannes_Jacobus_Manlius_de_Bosco, Johannes_Manardus, Johannes_Mesuë_der_Ältere, Johannes_Theodor_Schmalhausen, Johannes_von_Damaskus, John_Gerard, John_Hutton_Balfour, John_Kirk, John_Parkinson, José_Antonio_Pavón_y_Jiménez, Joseph_Pitton_de_Tournefort, Juan_José_Martínez_de_Lexarza, Juba_I., Justina, K Karl_August_von_Bergen, Karl_Gottfried_Hagen, Antimachos_von_Kolophon, König_Salomo, Königin_von_Halikarnassos, L Leonhart_Fuchs, Lorenz_Heister, Lucius_Iunius_Moderatus_Columella, Lysimachos, M Marcellus_Vergilius, Marquard_von_Hattstein, Maimonides, Marcellus_Empiricus, , Michael_Isigrin, Marcus_Porcius_Cato_der_Ältere, Marschall_von_Bieberstein, Marsilio_Ficino, Martin_Schmuck, Matteo_Syluatico, Matthaeus_Platearius, Mausolos_II, Maximilian_I., Michael_Ettmüller, Michael_Meyenburg, Michelangelo_Tilli, Mithridates, N Nathaniel_Wallich, Nero, Niccolò_Leoniceno, Nicolas_Lémery, Nicolaus_Joseph_Jacquin, Nikandros_aus_Kolophon, Nikolai_Stepanowitsch_Turtschaninow, O Oreibasios, Orpheus, Otto_Brunfels, Otto_Heinrich, P Pablo_de_La_Llave, Pandecta, Paulos_von_Aigina, Paulus, Paulus_der_Arzt, Paracelsus, Paulus_von_Aegineta, Paulus_von_Tarsus, Pedanios_Dioskurides, Pehr_Kalm, Philip_Miller, Pierre_Séguier , Pietro_Andrea_Mattioli, Platon, Plinius_der_Ältere, Pythagoras, R Raius, Ramon_Llull, Rhazes, Rembert_Dodoens, Robert_Brown, Robert_Morison, Rudolf_Goclenius, Rutilius_Taurus_Aemilianus_Palladius, S Samuel_Ledel, Sebastian_Kneipp, Serapion_von_Alexandria, Serenus, Simon_Pauli_der_Jüngere, Simon_Petrus, Simon_von_Genua, Sosimenes, Stanislaus_I.\_Leszczyński, Strabon, T Tabernaemontanus, Teukros_(König_von_Troas), Thales, Themison_von_Laodikeia, Theophilus_Protospatharius, Theophrastos_von_Eresos, Thomas_Nuttall, W Wilhelm_Daniel_Joseph_Koch, Wilhelm_Ernst_Scheffer, William_Henry_Harvey, William_Jackson_Hooker, William_Watson, X Xenokrates, Xenophon, Z Zenon


title

Es werden alle Werknamen annotiert, auf die ein Autor referiert.

Exponent

Spannenannotation über mehrere dipl-Token

Werte

AnnotationswertBeschreibung
ZeichenketteTitel eines Werkes

Richtlinien und Hinweise

Es wird der jeweilige Werkname im Nominativ angegeben. Dies gilt nicht für fremdsprachliches Material. Dieses wird aus dem Original übernommen.


author_ref

Zeichnet Referenzen auf Autor:innen, inklusive Selbstreferenzen aus.

Exponent

Spannenannotation über eine oder mehrere dipl-Token

Werte

AnnotationswertBeschreibung
pron1plSelbstreferenz des:der Autor(s):in (Autorenplural/Pluralis Auctoris), Referenz auf eine Gruppe von Autor:innen, zu denen sich der:die Autor:in zählt oder eine im didaktischen Kontext sozial inklusive Referenz auf den:die Autor:in und die Leser:innen6 mit der ersten Person Plural, z.B. “wir”, “unser”.
pron1sgSelbstreferenz des:der Autor(s):in mit der ersten Person Singular, z.B. “ich”, “mein”.
pron3sgReferenz auf eine:n Autor:in mit der dritten Person Singular, z.B. “er”.
pron2plReferenz auf mehrere Autor:innen mit der zweiten Person Plural, z.B. “ihnen”.
author 7Explizite Referenz auf eine:n benannte:n Autor:in, z.B. “Plinius”, “Dioscorides”, “ein Mönch” (wenn diese:r als Autor:in/Quelle zitiert wird)

reader_ref

Zeichnet Referenzen des:der Autor(s):in auf den:die Leser:in.

Exponent

Spannenannotation über eine oder mehrere dipl-Token

Werte

AnnotationswertBeschreibung
pron1plReferenz mit der ersten Person Plural6, also z.B. “wir”, “uns”, “unser”
pron2sgReferenz mit der zweiten Person Singular, z. B. “du”, “dein”
pron3sgReferenz mit der dritten Person Singular, z.B. “er”, “sie”
pron2plReferenz mit der zweiten Person Plural, z.B. “ihr”, “euer”
readerAdressierung an den Leser in nicht-pronominaler Form, z.B. “an den Leser”, “lieber Leser”
author 7Anrede eines anderen Autoren mit Namen, z.B. An den Groſzachtbahren vnd Hochgelehrten Herrn Johan Jacob Krafften

Richtlinien und Hinweise

Referenzen auf ein generisches “man” oder Imperative werden in dieser Annotationsebene nicht annotiert.


  1. Bild: Contrafayt Kreüterbuch / Otto Brunfels (Straßburg, 1532) Münchener DigitalisierungsZentrum http://mdz-nbn-resolving.de/urn:nbn:de:bvb:12-bsb00054201-5, Seite https://daten.digitale-sammlungen.de/bsb00054201/image_51

  2. Bild: Contrafayt Kreüterbuch / Otto Brunfels (Straßburg, 1532) Münchener DigitalisierungsZentrum http://mdz-nbn-resolving.de/urn:nbn:de:bvb:12-bsb00054201-5, Seite https://daten.digitale-sammlungen.de/bsb00054201/image_90

  3. Bild: Phythologia/ Johann Joachim Becher (Ulm, 1662). Google Books https://books.google.de/books?id=-FlcAAAAcAAJ&pg=PA414&dq=phythologia&hl=de&sa=X&ei=4PiSVf7lAaH5ywObwaHABw&ved=0CCEQ6AEwAA#v=onepage&q&f=false

  4. Alchymistische Practic / Andreas Libavius (Frankfurt, 1603). Münchener DigitalisierungsZentrum http://mdz-nbn-resolving.de/urn:nbn:de:bvb:12-bsb10872546-0. Seite https://reader.digitale-sammlungen.de/de/fs1/object/display/bsb10872546_00016.html

  5. Bild: Neuwkreuterbuch/ Jacobus Theodorus Tabernaemontanus (Frankfurt am Main, 1588). Collection Bnu en dépôt à l’Université de Strasbourg https://docnum.unistra.fr/digital/collection/coll13/id/7058

  6. Referiert wir auf die Gruppe bestehend aus Autor:in und Leser:innen, wird das Token auf ‘author_ref’ mit pron1pl ausgezeichnet, wenn eine sozial inklusive Funktion im didaktischen Kontext vorliegt. Eine Auszeichnung mit pron1pl auf der Ebene ‘reader_ref’ erfolgt dagegen bei einer nicht-didaktisierenden gleichgestellten Referenz. ↩2

  7. Der Wert author hat auf der Ebene ‘reader_ref’ einen anderen Exponenten und eine abweichende Bedeutung von der Ebene ‘author_ref’. ↩2

Automatische Annotationen

Automatisch annotiert werden sowohl linguistische als auch strukturelle Annotationen.

Die Annotationen werden über Skripte im scripts-Ordner automatisch erstellt.

  • tokenize-ocr4all.sh tokenisiert die PageXML-Daten aus OCR4all und fügt strukturelle Annotationen hinhzu
  • tag-all.sh fügt die Annotationen zu den linguistischen Eigenschaften hinzu.

Annotationsebenen


Annotationen zu linguistischen Eigenschaften


pos

Wortarten-Annotation (pos - part of speech) nach dem Stuttgart-Tübingen-Tagset (STTS)

Exponent

Spannenannotation je norm-Token

Werte

Tags nach dem STTS: https://www.ims.uni-stuttgart.de/forschung/ressourcen/lexika/germantagsets/


lemma

Zuordnung aller Wortformen zu abstraktem Lemma mit Lemmanamen mit dem Treetagger: http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/

Exponent

Spannenannotation je norm-Token

Werte

jeweiliges Lemma



Strukturelle Annotation

Unter strukturellen Annotationen werden alle Annotationen zusammengefasst, die Aussagen über die grafische Strukturierung der Textgrundlage liefern. Dazu zählen Kennzeichnungen der Zeilen- und Seitenumbrüche, Seitenzahlen, unkenntliche/nicht lesbare Zeichen und Marginalien sowie Fußnoten. Strukturelle Annotationen werden auf Grundlage der diplomatischen Ebene vergeben (dipl-Ebene). So ist die Tokenisierung in der dipl-Ebene Vorlage für die weiteren, strukturellen Annotationen.


lb

Markierung einer ganzen Zeile.

Wird automatisch beim Ausführen des Skripts scripts/tokenize-ocr4all.sh erstellt.

Exponent

Spannenannotation über mehrere dipl-Token

Werte

AnnotationswertBeschreibung
lbMarkierung pro ganzer Zeile

pb

Markierung einer ganzen Seite.

Wird automatisch beim Ausführen des Skripts scripts/tokenize-ocr4all.sh erstellt.

Exponent

Spannenannotation über mehrere dipl-Token

Werte

AnnotationswertBeschreibung
pbMarkierung pro ganzer Seite

pb_n

Markierung der Nummerierung einer Seite.

Wird automatisch beim Ausführen des Skripts scripts/tokenize-ocr4all.sh erstellt und vorausgefüllt. Dabei wird der Wert aus den OCR4all-Daten übernommen und startet typischerweise mit “0001”, “0002”, etc.

Daher muss der Wert manuell nachbearbeitet werden.

Exponent

Spannenannotation über mehrere dipl-Token

Werte

AnnotationswertBeschreibung
numerischer WertSeitenzahl als lateinische oder römische Zahlenangabe

Richtlinien und Hinweise

  • wird aus dem Faksimilé übernommen
  • ist keine Seitenangabe vorhanden, wird auch keine eingetragen

Metadaten

Metadaten sind Daten über Daten (Odebrecht 2018, S.72). In Korpora beschreiben sie z. B. die Eigenschaften der Korpusdokumente. RIDGES enthält bibliographische und inhaltliche Metadaten. Somit bilden die Metadaten extralinguistische Informationen zu den Korpusdokumenten ab.

Allgemeingültige Prinzipien

  • Bei Werten mit offener Klasse wird NA angegeben, wenn ein Wert nicht bekannt ist.
  • Ebenen und Werte bei geschlossenen Klassen sind auf Englisch, Freitextfelder werden auf Deutsch ausgefüllt.
  • Einige Metadatenbündel repräsentieren mehrdimensionale Eigenschaften (audience-design, purpose-design und field-design).
  • Bibliographische Metadaten haben oft eine Belegform und eine standardisierte Form. Als Standard müssen nach Möglichkeit die GND bzw. Wikidata hinzugezogen werden.



Art der Metadaten und dazugehörige Ebenen



Bibliographische und formale Metadaten

Zu bibliographischen und formalen Metadaten zählen Angaben zu Titel, Autor:innen, Veröffentlichungsdatum und -orten sowie Angaben zur Zitation. Sofern nicht anders angegeben haben sie die Form einer Zeichenkette.

Angaben zum Titel

full-title

AnnotationswertBeschreibung
ZeichenketteLangtitel, so wie auf dem Buch/Text genannt, mit allen Untertiteln, mit Angaben wie Bd. 1

Richtlinien und Hinweise

  • Wenn im Digitalisat, das wir verwendet haben, kein Titel steht (wie bspw. in unserer Version von Das Buch der Natur): Hier wird der Eintrag aus einer wissenschaftlichen Bibliographie genommen.
  • Vorrangig werden Angaben aus der GND (Gemeinsame Normdatei) genommen. Wenn kein GND-Eintrag vorhanden ist, werden die Angaben vom Scanort übernommen.
  • Bei Zeitungsartikeln wird die Überschrift ggf. mit Unterüberschriften übernommen.
  • Die Schreibung wird nach clean-Konvention (wobei Nasalstriche korrekt aufgelöst werden) übernommen. Interpunktionszeichen werden abgerückt, Abkürzungspunkte werden am Token belassen.
  • Auch wenn der Titel sehr lang ist (mehrere Zeilen), wird er in Gänze übernommen.
  • Fußnotenkennzeichnungen werden für dieses Metadatum nicht übernommen.

first-title

AnnotationswerteBeschreibung
ZeichenketteErster Titel (ohne Untertitel), Schreibung in clean-Konvention

Richtlinien und Hinweise

  • Es kann sein, dass “full title” und “first title” gleich sind.
  • Fußnotenkennzeichnungen werden für dieses Metadatum nicht übernommen.



Angaben zu den Autor:innen

Allgemeine Richtlinien und Hinweise

Falles es mehrere Autor:innen gibt, füllen wir alle Felder genauso für author2, author3 etc. aus.

author1

AnnotationswertBeschreibung
ZeichenketteName des Autors wie im Buch/Text

Richtlinien und Hinweise

  • So wie auf dem Buch/Text genannt, im Nominativ (“von Libavum” wird zu Libavius), mit allen Titeln und sonstigen Angaben.
  • Wenn auf dem Digitalisat kein:e Autor:in genannt ist, dann
    a) wird die Schreibung (wie in GND oder anderer wissenschaftlicher Bibliographie) genommen, wenn Autor:in bekannt
    b) wird der Wert unknown eingetragen, wenn Autor:in nicht bekannt/angegeben (das gibt es bspw. bei Zeitungsartikeln).

author1-gnd

AnnotationswertBeschreibung
ZeichenketteName des Autors wie in der GND

Richtlinien und Hinweise

  • Wenn der:die Autor:in einen Eintrag in der GND hat, wird hier die standardisierte Schreibweise wie in der GND verwendet (in der Form “Vorname Nachname”).
  • Wenn in author1 der Wert unknown steht, wird hier NA angegeben.
AnnotationswertBeschreibung
ZeichenketteGND stable link

Richtlinien und Hinweise

  • Stable Link zum GND-Eintrag über den:die Autor:in
  • Wenn in author1 der Wert unknown steht, wird hier NA angegeben.

author1-academic

AnnotationswerteBeschreibung
yesakademische Ausbildung nachweisbar
nofehlende akademische Ausbildung nachweisbar
unknownkeine akademische Ausbildung nachweisbar

Richtlinien und Hinweise

  • Wichtig ist die akademische Ausbildung, wie sie zur Zeit des:r Autor:in aktuell ist, das Fach ist unwichtig. Wir fassen akademische Ausbildung hier weit.
  • Indizien für eine akademische Ausbildung sind Ausdrücke wie Artist, Medicus, Doktor; auch die Berufsangabe Arzt.
  • Wenn author1=unknown, wird hier der Wert NA eingetragen.



Veröffentlichungsdatum

date

AnnotationswertBeschreibung
JJJJ (Int)Erscheinungsjahr in arabischen Ziffern
JJJJ-MMErscheinungsjahr und Monat
JJJJ-MM-TTErscheinungsjahr, Monat und Tag in arabischen Ziffern
unknownWenn keine Jahreszahl angegeben ist

Richtlinien und Hinweise

  • Grundlage sind werkinterne Angaben
  • Falls im Werk keine angegeben wird, wird die bibliographische Angabe genommen, die bei der Scandatei steht.
  • Wie, wie oft bei Zeitungstexten, das genaue Datum bekannt ist, wird die Form JJJJ-MM-TT verwendet. Falls nur Jahr und Monat bekannt sind, wird JJJJ-MM verwendet.
  • Wenn es sich um die Beilage zu einer Zeitungsausgabe handelt und in der Beilage selbst nur eine Jahreszahl angegeben ist, in der Zeitungausgabe aber auch der Monat oder Tag genannt werden, wird diese Angabe auch für die Beilage übernommen.



Angaben zum Veröffentlichungsort

Angaben zum Druckort

place

AnnotationswertBeschreibung
ZeichenketteDruckort(e), wie sie im Buche/Texte stehen

Richtlinien und Hinweise

  • Der Druckort wird, bzw. die Druckorte werden, aus den Angaben im Buch/Text übernommen.
  • Die Werte werden in clean-Konvention angegeben.
  • Wenn im Buch/Text mehrere Druckorte angegeben sind, werden sie in den Metadaten kommasepariert angegeben.
  • Wenn im Buch/Text kein Druckort angegeben ist, wird der Druckort aus der Scanbibliographie übernommen.

place-wikidata

AnnotationswertBeschreibung
ZeichenketteOrtsname(n) aus Wikidata

Richtlinien und Hinweise

  • Es wird der deutsche Name des Ortes aus Wikidata angegeben, wenn vorhanden.
  • Wenn kein deutscher Name vorhanden ist, wird der englische Name aus Wikidata angegeben.

place-id-wikidata

AnnotationswertBeschreibung
ZeichenketteID aus Wikidata



Weitere Angaben

AnnotationswertBeschreibung
ZeichenketteGND stable link

Richtlinien und Hinweise

  • Stable Link zum GND-Eintrag über das Werk.
  • Wenn es keinen Normdatenbankeintrag für das Original gibt, wird der Wert NA angegeben.

bibl

AnnotationswertBeschreibung
ZeichenketteKurze bibliographische Angabe

Richtlinien und Hinweise

  • Für Zitierzwecke etc.

source-lang

Falls es einen Vorlagentext gibt, wird die Ursprungssprache nach ISO 639-3 angegeben.

AnnotationswertBeschreibung
engEnglisch
latLatein
NAKein Vorlagentext

Richtlinien und Hinweise

  • Für Übersetzungen oder Übertragungen oder Kompilationen, die Frage ist hier: Gibt es einen Vorlagentext?
  • Für Sprachen, die oben nicht gelistet sind, können die ISO-Codes dieser Seite entnommen werden.
  • Falls es keinen klaren Ursprungstext gibt, wird der Wert NA angegeben.
  • Wenn es mehrere Ursprungstexte gibt, werden die Werte als kommaseparierte Liste ohne Leerzeichen angegeben (z.B.: eng,lat).
  • Die Begriffe Übersetzung/Übertragung sind hier weitgefasst zu verstehen.

source-bibl

AnnotationswertBeschreibung
ZeichenketteAgaben zum Vorlagentext, z. B. Bibliographie

Richtlinien und Hinweise

  • Freitext
  • Falls es einen Vorlagentext gibt, wird die bibliographische Angabe oder der GND-Link eingetragen.
  • Falls bekannt ist, ob der Text übersetzt, kompiliert oder übertragen, wurde, kann das hier auch angegeben werden.
AnnotationswertBeschreibung
ZeichenketteOrt, wo der Scan liegt (URL)

scan-pages

AnnotationswertBeschreibung
XX-XXSeiten aus dem Digitalisat

Richtlinien und Hinweise

  • Es werden die Seiten aus dem Digitalisat, angegeben, die von uns bearbeitet sind. - Es werden die Seitenangaben genommen, wie sie im Buch/in der Zeitung selbst stehen.
  • Die Angaben erfolgen mit Zahlen (13-27) oder römische Zahlen (i-iv).
  • Wenn keine Seitenzahlen angegeben sind, steht hier der Wert NA.

text-type

AnnotationswertBeschreibung
proseProsa
verseVers
mixedgemischt

Richtlinien und Hinweise

  • Angaben über die allgemeine Textgestaltung.
  • Prosa: der Text ist komplett in Prosaform verfasst. Hierzu zählen auch Kochrezepte.
  • Verstext: der Text ist komplett in Reimform oder in metrisch gebundener Form verfasst.
  • Gemischt: der Text ist teilweise prosaisch, teilweise gereimt verfasst.

verse-type

AnnotationswertBeschreibung
end-rhyme
meter
rhyme-meter
NA

Richtlinien und Hinweise

  • Wenn im Metadatum “text_type” die Werte verse oder mixed angegeben sind, dann wird hier eingetragen, welche Gestaltungselemente dafür verwendet wurden.
  • Steht im Metadatum der Wert prose, wird hier der Wert NA eingetragen.

publication-statement

AnnotationswertBeschreibung
ZeichenketteWie es im Buche oder Texte steht

Richtlinien und Hinweise

  • In clean-Konvention.
  • Bei Zeitungen/Zeitschriften wird der Wert NA eingetragen (hier wird das Impressum nicht angegeben).

volume-title

AnnotationswertBeschreibung
ZeichenketteName von Zeitung/Zeitschrift/herausgegebenem Werk/Lexikon etc.

Richtlinien und Hinweise

  • Wenn der Text nicht in einem übergeordneten Werk erschienen ist, wird der Wert NA angegeben.
  • Bei Zeitungen, wenn verfügbar, auch die Nummer der Ausgabe mit angeben.

printer-gnd

AnnotationswertBeschreibung
ZeichenketteName/Person

Richtlinien und Hinweise

  • Namenschreibung wird, so bekannt, aus der GND übernommen.
  • Bei Zeitungen NA.
AnnotationswertBeschreibung
ZeichenketteGND stable link

Richtlinien und Hinweise

  • Stable link zum GND-Eintrag.
  • Wenn kein Eintrag verfügbar ist, wird der Wert NA angegeben.

publisher-gnd

AnnotationswertBeschreibung
ZeichenketteFirma/Person

Richtlinien und Hinweise

  • Namenschreibung wird, so bekannt, aus der GND übernommen.
  • Bei Zeitungen NA.
AnnotationswertBeschreibung
ZeichenketteGND-Link

Richtlinien und Hinweise

  • Stable link zum GND-Eintrag.
  • Wenn kein Eintrag verfügbar ist, wird der Wert NA angegeben.

funding

Informationen darüber, wie sich der:die Autor:in finanziert

AnnotationswertBeschreibung
commissioned-workEs wird ein Auftrag für ein Buch vergeben, bspw. von einer Fürstin oder der Kirche.
enterpriseDer:die Autor:in muss das Buch auf dem freien Markt verkaufen.
researchDer:die Autor:in wird durch eine akademische Stelle finanziert, es ist also weniger wichtig, ob das Buch selbst Geld bringt.
journalismJournalistische Texte – gemeint sind hier alle Texte, die in nichtwissenschaftlichen Zeitungen erscheinen.

edition

AnnotationswertBeschreibung
ZahlNummer des Werkes
unclearWenn Nummer unklar
NABei Zeitungen

Richtlinien und Hinweise

  • Angabe als einfache Zahl
  • Wenn es nur eine Edition gibt, dann 1.

publication-type

AnnotationswertBeschreibung
monographMonographie
lexiconLexikon
edited volumeSammelwerk
journalZeitschrift
newspaperZeitung
otherAndere

Richtlinien und Hinweise

  • Bei monograph werden auch Kräutermonographien mitgezählt.
  • journal meint wissenschaftliche Zeitschrift.
  • Bei other kann man unter dem Metadatum notes-opus beschreiben, was es ist.

volume

AnnotationswertBeschreibung
ZeichenketteBibliographische Kurzangaben

Richtlinien und Hinweise

  • Bibliographische Kurzangaben zu Edition, ggf. Herausgeber:in, Journal bei nichtselbständigen Werken.
  • Bei Zeitungen wird der Wert NA eingetragen.

author1-notes

AnnotationswertBeschreibung
ZeichenketteKurzbiographie

Richtlinien und Hinweise

  • Freitext
  • Relevant sind Berufe, andere Texte, Vernetzung etc.

notes-opus

AnnotationswertBeschreibung
ZeichenketteWeitere Angaben zum Werk

Richtlinien und Hinweise

  • Freitext
  • Alles, was man noch so zum Werk sagen will, zur Entstehung, dazu Editions/Printings/Circulation (wenn bekannt und recherchierbar), gibt es moderne Nachdrucke?



Inhaltliche Angaben

Registerparameter und anderes

Angaben zum Audience design

An wen richtet sich das Werk vor allem. Hier werden Vorworte und alle anderen Hinweise genutzt. Oft richtet sich ein Werk an mehrere Gruppen.

ad-laypersons

Richtet das Werk sich an die Allgemeinheit?

Annotationswert
yes
no
unclear

ad-professionals

Annotationswert
yes
no
unclear

Richtlinien und Hinweise

  • Generell professionals im Kontext der jeweiligen Zeit -Heiler:innen, Drogist:innen, Ärzt:innen, Apotheker:innen, Botaniker:innen gelten auch als professionals

ad-academics

Annotationswert
yes
no
unclear

Richtlinien und Hinweise

  • Wenn das Werk im akademischen Kontext steht, wird der Wert yes vergeben.

ad-evidence

AnnotationswertBeschreibung
ZeichenketteAngaben dazu, wodurch das audience design hergeleitet wird

Richtlinien und Hinweise

  • Freitext
  • Angaben dazu, woher die Informationen zum Audience design bezogen wurden, wie z.B. Vorwort, Erscheinungsort, biographisches Wissen über Autor:in, etc.

Weitere inhaltliche Angaben

herb-list

Annotationswert
yes
no

Richtlinien und Hinweise

  • Hier wird der Wert yes eingetragen, wenn es sich um eine Sammlung von Kräutermonographien oder ein Lexikon von Kräutern handelt, oder auch Zeitungsartikel, die einfach die verschiendenen Kräuter beschreiben.
  • Gilt auch für allgemeine Lexika, in denen noch anderes steht.

preface

Annotationswert
yes
no

Richtlinien und Hinweise

  • Gibt an, ob der Text ein Vorwort ist.



Angaben zum Zweck

Was ist der hauptsächliche Zweck des Werks? Hier werden nutzen alle Quellen (Vorwort, anderes Wissen etc.) genutzt. Manchmal kann ein Werk mehrere Zwecke haben.

purpose-compiling

Annotationswert
yes
no
unclear

Richtlinien und Hinweise

Hier sind die Sammlungen von Kräutermonographien gemeint.

purpose-entertainment

Annotationswert
yes
no
unclear

purpose-teaching

Annotationswert
yes
no
unclear

Richtlinien und Hinweise

  • Hier sind auch allgemeine Information der Öffentlichkeit gemeint, wie z.B. Texte zu Kräutern in Zeitungen darüber, wie etwas angebaut wird und den Geschmack. Der Zwecke muss aber wirklich die Instruktion sein (z.B. ein Lehrbuch). Reine Nachschlagewerke sind hier nicht gemeint.

purpose-research

Annotationswert
yes
no
unclear



Angaben zum Gebiet

Hier werden Gebiete angegeben, die das Werk hauptsächlich behandelt. Oft sind Pharmazie und Medizin kaum voneinander zu unterscheiden. Die Einträge fallen dann eher inklusiv aus und es wird beides angegeben.

field-medicine

Annotationswert
main
periphery
no
unclear

field-pharmacy

Annotationswert
main
periphery
no
unclear

field-botany

Annotationswert
main
periphery
no
unclear

Richtlinien und Hinweise

  • Hier geht es nur um “echte” Botanik.

field-gardening

Annotationswert
main
periphery
no
unclear

field-cooking

Annotationswert
main
periphery
no
unclear

field-religion

Annotationswert
main
periphery
no
unclear

field-astrology

Annotationswert
main
periphery
no
unclear

field-alchemy

Annotationswert
main
periphery
no
unclear



Weiteres

author1-knowledge

Annotationswert
yes
no

Richtlinien und Hinweise

Hier wird angegeben, ob der:die Autor:in eigenes neues Wissen einbringt oder der:die Autor:in andere Werke kompiliert/übersetzt. Es geht hier um wissenschaftliche Beiträge, sonst NA.

author1-knowledge-evidence

AnnotationswertBeschreibung
ZeichenketteAngaben dazu, wodurch der Eintrag zu author1-knowledge hergeleitet wird

Richtlinien und Hinweise

  • Freitext
  • Wenn author1-knowledge NA, hier auch NA




Bisher

MetadatumAnnotationswerteBeschreibung
authorZeichenketteName des Autors des Textes.
biblZeichenketteVoller bibliographischer Eintrag für die Quelle inklusive der im Korpus annotatierten Seitenzahlen.
annis:docZeichenketteAnnis Dokumentenkürzel (z.B 1639_PflantzGartVorrede_Rhagor. )
dateJJJJ (Int)Datum der Veröffentlichung, normalerweise das Jahr.
publisherZeichenketteVerlag/Verleger.
placeZeichenketteVerlagsort.
titleZeichenketteTitel der Arbeit, aus dem das Dokument extrahiert wurde.
translatorZeichenketteÜbersetzer des Textes, wenn vorhanden.
trans_fromit
lat
Sprache, aus der der Text übersetzt wurde.
editorZeichenketteHerausgeber des Textes (wenn zusätzlich zum Verlag/Verleger angegeben).
versionz.B. 10.0Version, in der das jeweilige Dokument zum Korpus hinzugefügt wurde.
edition_firstyes
no
Wenn bekannt, wird hier angegeben, ob es sich bei dem Faksimile um eine Erstauflage (yes) handelt oder nicht (no).
issueIntNummer des Bandes, wenn vorhanden.
maintopicscience
non-science
Angabe darüber, ob der Text eher Alltags- oder Wissenschaftsthemen behandelt.
topicadditiv aus:
Al
As
B
G
K
L
M
R
Ordnet einem Text einen oder mehrere Themenbereiche zu. Additiver Wert aus den verschiedenen Kürzeln, alphabetisch geordnet. Al: Alchemie, As: Astronomie, B: Botanik, G: Gärtnerei, K: Küche, L: Linguistik, M: Medizin, R: Religion,. Beispielwerte sind B, BM oder BKM.
registerherbologyRegister des Textes.
lingualismmonoling
multiling
Gibt an, ob größere Textstellen vorhanden sind, die nicht auf Deutsch verfasst wurden. Dies gilt nicht für einzelne Übersetzungen von Pflanzennamen.
orig_dateJJJJ (Int)Ist ein Text eine Nichterstauflage, dann kann hier das Jahr der Erstauflage stehen, wenn bekannt.
repositoryURLURL zum Repositorium des Faksimiles.
lang_typeenhg
nhg
Angabe des Sprachtyps. enhg: frühneuhochdeutsch (early new high german), nhg: neuhochdeutsch (new high german)
lang_areamd
obd
NA
Das Sprachgebiet wird angegeben. md: mitteldeutsch, obd: oberdeutsch. Bei jüngeren Texten, die schon weitesgtehend standardisiert sind und denen kein Sprachgebiet zugeordnet werden konnte, wird als Wert NA angegeben.
text_typeprose
lyric
mixed
Angaben über die allgemeine Textgestaltung. Prosa: der Text ist komplett in Prosaform verfasst, Poesie: der Text ist komplett in Reimform verfasst; gemischt: der Text ist teilweise prosaisch, teilweise gereimt verfasst.
lyric_typeend_rhyme
meter
rhyme_meter
Wenn im Metadatum “text_type” die Werte “lyric” oder “mixed” angegeben sind, dann wird hier eingetragen, welche Gestaltungselemente dafür verwendet wurden.
wormwoodyes
no
Gibt an, ob ein Textabschnitt zum Thema “Wermut” transkribiert wurde.
herb_sortingyes
no
Gibt an, ob es sich bei dem Text um eine Kräutermonographiesammlung handelt, d.h. dass nacheinander verschiedene Kräuter abgehandelt werden.

Dokumente

In diesem Korpus arbeiten wir überwiegend mit Auszügen aus den historischen Vorlagen. Dabei können mehrere Auszüge einer historische Vorlage vorliegen.

Die Datei- und Dokumentnamen sind nach dem Schema “YYYY_IDTitle_Autorennachname” aufgebaut. Zu beachten ist, dass die Dokumente, die zwei Abschnitte aus derselben Publikation haben, noch einen weiteren Abschnitt “YYYY_IDTitleAbschnitt_Autornnachname” besitzen. Alle Kurztitel werden, den Standards der ‘clean’-Normalisierung gemäß, nach Originalschreibweise realisiert, wobei Sonderzeichen, die der modernen Orthografie nicht entsprechen an den modernen Zeichensatz angepasst werden. Umlaute werden durch “ae”, “ue” und “oe” ersetzt.

  1. 1914_Kraeuterbuch_Losch
  2. NatürlichePflanzenfamilien_1887_Engler
  3. 1874_GemeinnuetzigesKraeuterbuch_Siegmund
  4. 1870_FloraDerPreussischenRheinlande_Wirtgen
  5. 1870_DeutschePflanzennamen_Grassmann
  6. 1843_VorlesungenUeberKraeuterkunde_Link
  7. 1860_GrossesIllustriertesKraeuterbuch_Mueller
  8. 1840_NochEinigeWorteVorrede_Meyen
  9. 1840_NochEinigeWorteUeberDenBefruchtungsakt_1840_Meyen
  10. 1828_EigenschaftenAllerHeilpflanzenAbbisz_Anonymous
  11. 1828_EigenschaftenAllerHeilpflanzenWegtritt_Anonymous
  12. 1821_BeschreibungZweiterNeuenPflanzenarten_Flora
  13. 1821_UeberDieWissenschaftlicheBehandlung_Flora
  14. 1809_GetreueDarstellungUndBeschreibung_Hayne
  15. 1799_Apothekerlexikon_Hahnemann
  16. 1792_GrundrissKraeuterkunde_Willdenow
  17. 1774_UnterrichtKraeuterUndWurzeltrocknung_Eisen
  18. BeschreibungderGraeser_c27-31_1769_Schrebers
  19. BeschreibungderGraeser_c37-48_1769_Schrebers
  20. 1766_EinleitungZuDerKraeuterkenntnisz_Oeder
  21. 1750_BlackwellischesKraeuterbuch_Blackwell
  22. 1735_MysterivmSigillorvm_Hiebner
  23. 1722_FloraSaturnizans_Henckel
  24. 1719_ViridariumReformatum_Valentini
  25. 1696_TheatrumBotanicum_Verzascha
  26. 1687_SchweizerischerBotanicus_vonRoll
  27. 1675_SonderbaresKraeuterbuchAcorus_Anonymous
  28. 1675_SonderbaresKraeuterbuchAbsinthium_Anonymous
  29. 1675_SonderbaresKraeuterbuchAbiesCandida_Anonymous
  30. ThesaurusSanitatis_304-321_1673_Nasser
  31. 1673_ThesaurusSanitatisWeibsbild_Nasser
  32. 1662_Phythologia_Becher
  33. 1652_Wund-Artzney_Greiff
  34. 1639_PflantzGartVorrede_Rhagor
  35. 1639_PflantzGartGartenkraeuter_Rhagor
  36. 1639_PflantzGartZweige_Rhagor
  37. Kraeuterbuch_1609_Carrichter
  38. 1609_KraeutterbuchVorrede_Carrichter
  39. 1609_HortulusSanitatisDerWeisseThannen_Uffenbach
  40. 1609_HortulusSanitatisVorrede_Uffenbach
  41. 1603_AlchymistischePractic_Libavius
  42. 1603_AlchymistischePracticVorrede_Libavius
  43. 1588_NeuwKreuterbuchBeyfusz_Theodorus
  44. 1588_NeuwKreuterbuchVorrede_Theodorus
  45. 1588_ParadeiszgaertleinAbbisz_Rosbach
  46. 1588_ParadeiszgaertleinVorrede_Rosbach
  47. NewKreueterbuch_1563_Handsch
  48. 1563_NewKreuterbuchVorrede_Handsch
  49. 1557_WieSichMeniglichEinführung_vonBodenstein
  50. 1557_WieSichMeniglichVorrede_vonBodenstein
  51. 1580_ExperimentaRoszBappeln_Schnellenberg
  52. Experimenta-VR_1550_Schellenbeg
  53. NewKreueterbuch_1543_Fuchs
  54. 1543_NewKreuterbuchEnisz_Fuchs
  55. 1543_NewKreuterbuchVorrede_Fuchs
  56. 1539_NewKreuetterBuchWormkraut_Bock
  57. 1539_NewKreuetterbuchAenis_Bock
  58. 1539_NewKreuetterBuchVorrede_Bock
  59. 1532_ContrafaytKreuterbuchMaioron_Brunfels
  60. ContrafaytKreuterbuch- CCXXXVII-CCXLVIII_1532_Brunfels
  61. 1532_ContrafaytKreuterbuchEnisz_Brunfels
  62. 1532_ContrafaytKreuterbuchSauramffer_Brunfels
  63. 1532_ContrafaytKreuterbuchVorrede_Brunfels
  64. 1532_ArtzneyBuchleinDerKreutterBetonica_Tallat
  65. 1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat
  66. ArtzneyBuchleinDerKreutter-Cretanus_1532_Tallat
  67. 1532_ArtzneyBuchleinDerKreutterVorrede_Tallat
  68. 1487_GartDerGesundheitArthemisia_vonCuba
  69. 1487_GartDerGesundheitEnysz_vonCuba
  70. 1487_GartDerGesundheitRosenmarin_vonCuba
  71. 1487_GartDerGesundheitVorrede_vonCuba
  72. 1482_BuchDerNaturEinleitungBuchV_vonMegenberg
  73. BuchDerNatur-Canamellis_1482_vonMegenberg

1. 1914_Kraeuterbuch_Losch

Titel:Kräuterbuch: Unsere Heilpflanzen in Wort und Bild
Kürzel:1914_Kraeuterbuch_Losch
Autor:Friedrich Losch
Jahr:1914
Ort:Eßlingen, München
Verlag:Schreiber
Seitenangabe:163-168
Publikationstyp:Monographie
dipl-Einheiten:3961
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, script, title

2. NatürlichePflanzenfamilien_1887_Engler

Titel:Die natürlichen Pflanzenfamilien
Kürzel:NatürlichePflanzenfamilien_1887_Engler
Autor:Adolf Engler
Jahr:1887
Ort:Leipzig
Verlag:Wilhelm Engelmann
Seitenangabe:280-286
Publikationstyp:Monographie
dipl-Einheiten:3828
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, head, hi_rend, lang, lb, lemma, pb, pb_n, persname, pos, quote, script

3. 1874_GemeinnuetzigesKraeuterbuch_Siegmund

Titel:Gemeinnütziges Kräuterbuch
Kürzel:1874_GemeinnuetzigesKraeuterbuch_Siegmund
Autor:Ferdinand Siegmund
Jahr:1874
Ort:Wien und Pest
Verlag:Hartleben
Seitenangabe:316-325
Publikationstyp:Monographie
dipl-Einheiten:4527
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, hi_rend, lang, lb, lemma, pb, pb_n, persname, pos, quote, reader_ref, script

4. 1870_FloraDerPreussischenRheinlande_Wirtgen

Titel:Flora Der Preussischen Rheinlande
Kürzel:1870_FloraDerPreussischenRheinlande_Wirtgen
Autor:Wirtgen, Philipp Wilhelm
Jahr:1870
Ort:Bonn
Verlag:NA
Seitenangabe:1-22
Publikationstyp:Monographie
dipl-Einheiten:7519
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, figure, head, hi_rend, lang, lb, lemma, morph_ellipsis, note, pb, pb_n, pos, quote, script

5. 1870_DeutschePflanzennamen_Grassmann

Titel:Deutsche Pflanzennamen
Kürzel:1870_DeutschePflanzennamen_Grassmann
Autor:Grassmann, Hermann
Jahr:1870
Ort:Stettin
Verlag:NA
Seitenangabe:1-23
Publikationstyp:Monographie
dipl-Einheiten:10282
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, head, hi_rend, lang, lb, lemma, morph_ellipsis, pb, pb_n, pos, prot, quote, script, unclear
Titel:Vorlesungen Über Kräuterkunde
Kürzel:1843_VorlesungenUeberKraeuterkunde_Link
Autor:Link , Heinrich Friedrich
Jahr:1843
Ort:Berlin
Verlag:Verlag von C. G. Lüderitz
Seitenangabe:28-48
dipl-Einheiten:7995
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, head, hi_rend, lang, lb, lemma, morph_ellipsis, note, pb, pb_n, pos, prot, quote, reader_ref, script

7. 1860_GrossesIllustriertesKraeuterbuch_Mueller

Titel:Das große illustrierte Kräuter-Buch
Kürzel:1860_GrossesIllustriertesKraeuterbuch_Mueller
Autor:Ferdinand Müller
Jahr:1860
Ort:Ulm
Verlag:NA
Seitenangabe:617-622
Publikationstyp:Monographie
dipl-Einheiten:3852
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, head, hi_rend, lang, lb, lemma, pb, pb_n, persname, pos, quote, reader_ref, script

8. 1840_NochEinigeWorteVorrede_Meyen

Titel:Noch einige Worte über den Befruchtungsakt und die Poljembryonie bei den höheren Pflanzen (Vorwort)
Kürzel1840_NochEinigeWorteVorrede_Meyen
Autor:Meyen, Franz Julius Ferdinand
Jahr:1840
Ort:Berlin
Verlag:Haude und Spenersche Buchhandlung (S. J. Joseephy.)
Seitenangabe:III-IV
Publikationstyp:Monographie
dipl-Einheiten:365
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, head, hi_rend, lang, lb, lemma, note, pb, pb_n, pos, prot, quote, script

9. 1840_NochEinigeWorteUeberDenBefruchtungsakt_1840_Meyen

Titel:Noch einige Worte über den Befruchtungsakt und die Poljembryonie bei den höheren Pflanzen
Kürzel1840_NochEinigeWorteUeberDenBefruchtungsakt_1840_Meyen
Autor:Meyen, Franz Julius Ferdinand
Jahr:1840
Ort:Berlin
Verlag:Haude und Spenersche Buchhandlung (S. J. Joseephy.)
Seitenangabe:24-50
Publikationstyp:Monographie
dipl-Einheiten:7619
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, hi_rend, lang, lb, lemma, morph_ellipsis, note, pb, pb_n, pos, prot, quote, reader_ref, script

10. 1828_EigenschaftenAllerHeilpflanzenAbbisz_Anonymous

Titel:Die Eigenschaften Aller Heilpflanzen
Kürzel1828_EigenschaftenAllerHeilpflanzenAbbisz_Anonymous
Autor:NA
Jahr:1828
Ort:München
Verlag:Jos. Lindauer’sche Buchhandlung
Seitenangabe:3-21
dipl-Einheiten:6849
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, comp, comp_orth, hi_rend, lang, lb, lemma, morph_ellipsis, pb, pb_n, pos, prot, quote, script, unclear

11. 1828_EigenschaftenAllerHeilpflanzenWegtritt_Anonymous

Titel:Die Eigenschaften Aller Heilpflanzen
Kürzel:1828_EigenschaftenAllerHeilpflanzenWegtritt_Anonymous
Autor:NA
Jahr:1828
Ort:München
Verlag:Jos. Lindauer’sche Buchhandlung
Seitenangabe:149-165
Publikationstyp:Monographie
dipl-Einheiten:5561
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, head, hi_rend, lang, lb, lemma, pb, pb_n, pos, quote, script

12. 1821_BeschreibungZweiterNeuenPflanzenarten_Flora

Titel:Flora oder Botanische Zeitung 7
Kürzel:1821_BeschreibungZweiterNeuenPflanzenarten_Flora
Autor:Sieber
Jahr:1821
Ort:Regensburg
Verlag:Königl. botanische Gesellschaft
Seitenangabe:97-112
Publikationstyp:Zeitschrift
dipl-Einheiten:3636
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, head, lang, lb, lemma, morph_ellipsis, pb, pb_n, pos, prot, quote, script, unclear

13. 1821_UeberDieWissenschaftlicheBehandlung_Flora

Titel:Flora oder Botanische Zeitung 6
Kürzel:1821_UeberDieWissenschaftlicheBehandlung_Flora
Autor:B. Wilbrand
Jahr:1821
Ort:Regensburg
Verlag:Königl. botanische Gesellschaft
Seitenangabe:81-96
Publikationstyp:Zeitschrift
dipl-Einheiten:3312
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, head, lang, lb, lemma, note, pb, pb_n, pos, prot, quote, reader_ref, script, unclear

14. 1809_GetreueDarstellungUndBeschreibung_Hayne

Titel:Getreue Darstellung und Beschreibung der in der Arzneykunde gebräuchlichen Gewächse, wie auch solcher, welche mit ihnen verwechselt werden können
Kürzel:1809_GetreueDarstellungUndBeschreibung_Hayne
Autor:Friedrich Gottlob Hayne
Jahr:1809
Ort:Berlin
Verlag:NA
Seitenangabe:NA
Publikationstyp:Monographie
dipl-Einheiten:3177
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, head, hi_rend, lang, lb, lemma, pb, persname, pos, quote, script, title, unclear

15. 1799_Apothekerlexikon_Hahnemann

Titel:Apothekerlexikon
Kürzel:1799_Apothekerlexikon_Hahnemann
Autor:Samuel Hahnemann
Jahr:1793
Ort:Leipzig
Verlag:NA
Seitenangabe:437-446
Publikationstyp:Monographie
dipl-Einheiten:4244
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, head, hi_rend, lang, lb, lemma, pb, pb_n, pos, quote, script

16. 1792_GrundrissKraeuterkunde_Willdenow

Titel:Grundriss der Kräuterkunde zu Vorlesungen entworfen
Kürzel:1792_GrundrissKraeuterkunde_Willdenow
Autor:Willdenow, Carl Ludwig
Jahr:1792
Ort:Berlin
Verlag:Haude und Spener
Seitenangabe:282-305
Publikationstyp:Monographie
dipl-Einheiten:5094
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, head, hi_rend, lang, lb, lemma, morph_ellipsis, pb, pb_n, pos, prot, quote, reader_ref, script, unclear

17. 1774_UnterrichtKraeuterUndWurzeltrocknung_Eisen

Titel:Unterricht von der allgemeinen Kräuter- und Wurzeltrocknung
Kürzel:1774_UnterrichtKraeuterUndWurzeltrocknung_Eisen
Autor:Eisen, Johann Georg
Jahr:1774
Ort:Riga
Verlag:NA
Seitenangabe:44-72
Publikationstyp:Monographie
dipl-Einheiten:3982
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, head, hi_rend, lang, lb, lemma, morph_ellipsis, pb, pb_n, pos, prot, quote, reader_ref, script, unclear

18. BeschreibungderGraeser_c27-31_1769_Schrebers

Titel:Beschreibung der Gräser nebst ihren Abbildungen nach der Natur
Kürzel:BeschreibungderGraeser _c27-31_1769_Schrebers
Autor:Schreber , Johann Christian Daniel
Jahr:1769
Ort:Leipzig
Verlag:Siegfried Lebrecht Crusius
Seitenangabe:27-31
Puplikationstyp:Monographie
dipl-Einheiten:2273
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, column, figure, figure_p, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, quotemark, reader_ref, script, title, unclear

19. BeschreibungderGraeser_c37-48_1769_Schrebers

Titel:Beschreibung der Gräser nebst ihren Abbildungen nach der Natur
Kürzel:BeschreibungderGraeser _c37-48_1769_Schrebers
Autor:Schreber , Johann Christian Daniel
Jahr:1769
Ort:Leipzig
Verlag:Siegfried Lebrecht Crusius
Seitenangabe:37-48
Puplikationstyp:Monographie
dipl-Einheiten:5262
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, column, figure, figure_p, head, hi_rend, lang, lb, lemma, note, pb, pb_n, , persname, pos, reader_ref, script, title, unclear

20. 1766_EinleitungZuDerKraeuterkenntnisz_Oeder

Titel:Einleitung Zu Der Kräuterkenntnisz
Kürzel:1766_EinleitungZuDerKraeuterkenntnisz_Oeder
Autor:Oeder , George Christian
Jahr:1764
Ort:Kopenhagen
Verlag:NA
Seitenangabe:304-339
dipl-Einheiten:7115
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, head, hi_rend, lang, lb, lemma, morph_ellipsis, pb, pb_n, pos, prot, quote, reader_ref, script, unclear

21. 1750_BlackwellischesKraeuterbuch_Blackwell

Titel:Vermehrtes und verbessertes Blackwellisches Kräuter-Buch, das ist Elisabeth Blackwell Sammlung der Gewächse die zum Arzney-Gebrauch in den Apothecken aufbehalten werden, deren Beschreibung und Kräfften
Kürzel:1750_BlackwellischesKraeuterbuch_Blackwell
Autor:Elisabeth Blackwell
Jahr:ca. 1750
Ort:Nürnberg
Verlag:Nicolaus Friedrich Eisenberger
Seitenangabe:NA
Publikationstyp:Monographie
dipl-Einheiten:5609
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, head, hi_rend, lang, lb, lemma, pb, persname, pos, quote, script, title, unclear

22. 1735_MysterivmSigillorvm_Hiebner

Titel:Mysterivm Sigillorvm
Kürzel:1735_MysterivmSigillorvm_Hiebner
Autor:Hiebner von Schneebergk, Israel
Jahr:1735
Ort:Erfurt
Seitenangabe:65-89
dipl-Einheiten:7864
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, head, hi_rend, lang, lb, lemma, morph_ellipsis, note, pb, pb_n, pos, position_verb, prot, quote, reader_ref, script, unclear

23. 1722_FloraSaturnizans_Henckel

Titel:Flora saturnizans, Die Verwandschafft des Pflanzen mit dem Mineral Reich
Kürzel:1722_FloraSaturnizans_Henckel
Autor:Henckel, Johann Friedrich
Jahr:1722
Ort:Leipzig
Verlag:Johann Christian Martini
Seitenangabe:647-671
Publikationstyp:Monographie
dipl-Einheiten:6219
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, head, hi_rend, lang, lb, lemma, morph_ellipsis, note, pb, pb_n, pos, prot, quote, reader_ref, script, unclear

24. 1719_ViridariumReformatum_Valentini

Titel:Viridarium Reformatum, Seu Regnum Vegetabile, Das ist: Neu-eingerichtetes und Vollständiges Kräuter-Buch
Kürzel:1719_ViridariumReformatum_Valentini
Autor:Michael Bernhard Valentini
Jahr:1719
Ort:Frankfurt am Main
Verlag:Heinscheidt
Seitenangabe:459-465
Publikationstyp:Monographie
dipl-Einheiten:3596
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, head, hi_rend, lang, lb, lemma, pb, pb_n, persname, pos, reader_ref, script, title

25. 1696_TheatrumBotanicum_Verzascha

Titel:Theatrum Botanicum. Das ist: Neu Vollkommenes Kräuter-Buch: Worinnen Allerhand Erdgewächse der Bäumen, Stauden und Kräutern, welche in allen vier Theilen der Welt, sonderlich aber in Europa herfür kommen, neben ihren Fürtrefflichen Würckungen, und deren Gebrauch, wider allerley Kranckheiten an Menschen und Vieh, Mit sonderbahrem Fleiß auff eine ganz neue Art und Weise beschrieben, Auch mit schönen, theils neuen Figuren geziert, und neben denen ordenlichen, so wohl Kräuter- als Kranckheit-Registern, mit nutzlichen Marginalien vorgestellet sind. Allen Aerzten sonderlich auch denen auff dem Land wohnenden höchst nutzlich und ergetzlich
Kürzel:1696_TheatrumBotanicum_Verzascha
Autor:Bernhard Verzascha
Jahr:1696
Ort:Basel
Verlag:Bertsch [u.a.]
Seitenangabe:659-664
Publikationstyp:Monographie
dipl-Einheiten:3893
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, reader_ref, script, title

26. 1687_SchweizerischerBotanicus_vonRoll

Titel:Der Schweizerische Botanicus
Kürzel:1687_SchweizerischerBotanicus_vonRoll
Autor:Timotheus von Roll
Jahr:1687
Ort:NA
Verlag:Franz Carl Rooß
Seitenangabe:54-79
Publikationstyp:Monographie
dipl-Einheiten:3510
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, head, hi_rend, lang, lb, lemma, morph_ellipsis, pb, pb_n, pos, prot, reader_ref, script, unclear
Anmerkung:Aus der Originaltranskription der Studierende wurden 2 Seiten gelöscht. Diese warenim der Transkription zugrundeliegenden PDF doppelt vorhanden und wurden von den Studierenden auch doppelt annotiert.

27. 1675_SonderbaresKraeuterbuchAcorus_Anonymous

Titel:Curioser Botanicus oder sonderbares Kräuter Buch
Kürzel:SonderbaresKraeuterbuch-11-36_1675_Anonymous
Autor:NA
Jahr:1675
Ort:NA
Verlag:NA
Seitenangabe:21-36
Publikationstyp:Monographie
dipl-Einheiten:2876
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, figure_p, head, hi_rend, lang, lb, lemma, pb, pb_n, persname, pos, quote, script, unclear

28. 1675_SonderbaresKraeuterbuchAbsinthium_Anonymous

Titel:Curioser Botanicus oder sonderbares Kräuter Buch
Kürzel:1675_SonderbaresKraeuterbuchAbsinthium_Anonymous
Autor:NA
Jahr:1675
Ort:NA
Verlag:NA
Seitenangabe:11-21
Publikationstyp:Monographie
dipl-Einheiten:1907
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, comp, comp_orth, figure, figure_p, head, hi_rend, lang, lb, lemma, morph_ellipsis, pb, pb_n, pos, prot, quote, script, unclear

29. 1675_SonderbaresKraeuterbuchAbiesCandida_Anonymous

Titel:Curioser Botanicus oder sonderbares Kräuter Buch
Kürzel:1675_SonderbaresKraeuterbuchAbiesCandida_Anonymous
Autor:NA
Jahr:1675
Ort:NA
Verlag:NA
Seitenangabe:1-11
Publikationstyp:Monographie
dipl-Einheiten:2245
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, comp, comp_orth, figure_p, head, hi_rend, lang, lb, lemma, morph_ellipsis, pb, pb_n, pos, prot, quote, script, unclear

30. ThesaurusSanitatis_304-321_1673_Nasser

Titel:Thesaurus Sanitatis
Kürzel:1673_ThesaurusSanitatisWeibsbild_Nasser
Autor:Adrian Nasser
Jahr:1673
Ort:Nürnberg
Verlag:Johann Hoffmann
Seitenangabe:304-321
Publikationstyp:Monographie
dipl-Einheiten:4493
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, head, hi_rend, lang, lb, lemma, pb, pb_n, persname, pos, quote, reader_ref, script, title

31. 1673_ThesaurusSanitatisWeibsbild_Nasser

Titel:Thesaurus Sanitatis
Kürzel:1673_ThesaurusSanitatisWeibsbild_Nasser
Autor:Adrian Nasser
Jahr:1673
Ort:Nürnberg
Verlag:Johann Hoffmann
Seitenangabe:497-524
Publikationstyp:Monographie
dipl-Einheiten:7041
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, head, hi_rend, lang, lb, lemma, morph_ellipsis, pb, pb_n, pos, prot, quote, reader_ref, script, unclear

32. 1662_Phythologia_Becher

Titel:Phythologia; Das ist: Deß erläuterten Medicinalischen Parnassi Ander Theil, Nemlich das Kräuter-Buch. Band 2.
Kürzel:1662_Phythologia_Becher
Autor:Johann Joachim Becher
Jahr:1662
Ort:Ulm
Verlag:Johann Görlin
Seitenangabe:305-319
Publikationstyp:Monographie
dipl-Einheiten:4321
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, figure, head, hi_rend, lang, lb, lemma, pb, pb_n, pos, script, title

33. 1652_Wund-Artzney_Greiff

Titel:Wund-Artzney
Kürzel:1652_Wund-Artzney_Greiff
Autor:Guilelmus Fabricius Hildanus, Friedrich Greiff
Jahr:1652
Ort:Frankfurt am Main
Verlag:Johann Beyer
Seitenangabe:218-223
Publikationstyp:Monographie
dipl-Einheiten:5253
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, head, hi_rend, lang, lb, lemma, morph_ellipsis, note, pb, pb_n, pos, quote, reader_ref, script, unclear, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

34. 1639_PflantzGartVorrede_Rhagor

Titel:Pflantz-Gart (VR)
Kürzel:PflantzGart-Vorrede_1639_Rhagor
Autor:Daniel Rhagor
Jahr:1639
Ort:Bern
Verlag:Ben Stephan Schmid
Seitenangabe:1-10
Publikationstyp:Monographie
dipl-Einheiten:2318
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, head, hi_rend, lang, lb, lemma, note, pb, pb_n, pos, quote, reader_ref, script, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge, kaus, kon, lin, hypo

35. 1639_PflantzGartGartenkraeuter_Rhagor

Titel:Pflantz-Gart (Capitel 4)
Kürzel:1639_PflantzGartGartenkraeuter_Rhagor
Autor:Daniel Rhagor
Jahr:1639
Ort:Bern
Verlag:Ben Stephan Schmid
Seitenangabe:33-45
Publikationstyp:Monographie
dipl-Einheiten:2846
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, head, hi_rend, lang, lb, lemma, morph_ellipsis, note, pb, pb_n, pos, quote, reader_ref, script, unclear, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

36. 1639_PflantzGartZweige_Rhagor

Titel:Pflantz-Gart
Kürzel:1639_PflantzGartZweige_Rhagor
Autor:Daniel Rhagor
Jahr:1639
Ort:Bern
Verlag:Ben Stephan Schmid
Seitenangabe:92-110
Publikationstyp:Monographie
dipl-Einheiten:4067
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, figure, head, hi_rend, lang, lb, lemma, morph_ellipsis, note, pb, pb_n, pos, script, unclear, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge, kaus, kon, lin, hypo

37. Kraeuterbuch_1609_Carrichter

Titel:Kräutterbuch des Edelen und hochgelehrten herren Bartholomei Carrichters
Kürzel:Kraeuterbuch_1609_Carrichter
Autor:Bartholomeus Carrichter
Jahr:1609
Ort:Straßburg
Verlag:Antonium Bertram
Seitenangabe:47-75
Publikationstyp:Monographie
dipl-Einheiten:4992
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, head, hi_rend, lang, lb, lemma, morph_ellipsis, pb, pb_n, pos, reader_ref, script, unclear

38. 1609_KraeutterbuchVorrede_Carrichter

Titel:Kräutterbuch des Edelen und hochgelehrten herren Bartholomei Carrichters (Vorrede)
Kürzel:Kraeuterbuch-VR_1609_Carrichter
Autor:Bartholomeus Carrichter
Jahr:1609
Ort:Straßburg
Verlag:Antonium Bertram
Seitenangabe:11-24
Publikationstyp:Monographie
dipl-Einheiten:1832
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, column, figure, figure_p, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, quote, reader_ref, script, title, unclear

39. 1609_HortulusSanitatisDerWeisseThannen_Uffenbach

Titel:Hortulus Sanitatis
Kürzel:1609_HortulusSanitatisDerWeisseThannen_Uffenbach
Autor:Peter Uffenbach
Jahr:1609
Ort:Frankfurt am Main
Verlag:Ionae Rhodij
Seitenangabe:1-21
Publikationstyp:Monographie
dipl-Einheiten:6516
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, head, hi_rend, lang, lb, lemma, morph_ellipsis, note, pb, pb_n, pos, quote, script, unclear, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

40. 1609_HortulusSanitatisVorrede_Uffenbach

Titel:Hortulus Sanitatis (Vorrede)
Kürzel:1609_HortulusSanitatisVorrede_Uffenbach
Autor:Peter Uffenbach
Jahr:1609
Ort:Frankfurt am Main
Verlag:Ionae Rhodij
Seitenangabe:NA
Publikationstyp:Monographie
dipl-Einheiten:3379
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, column, figure, figure_p, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, quote, quotemark, reader_ref, script, title, unclear

41. 1603_AlchymistischePractic_Libavius

Titel:Alchymistische Practic
Kürzel:1603_AlchymistischePractic_Libavius
Autor:Andreas Libavius
Jahr:1603
Ort:Frankfurt
Verlag:Johann Saur
Seitenangabe:5-26
Publikationstyp:Monographie
dipl-Einheiten:5063
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, head, hi_rend, lang, lb, lemma, morph_ellipsis, note, pb, pb_n, pos, quote, reader_ref, script, unclear, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

42. 1603_AlchymistischePracticVorrede_Libavius

Titel:Alchymistische Practic (Vorrede)
Kürzel:1603_AlchymistischePracticVorrede_Libavius
Autor:Andreas Libavius
Jahr:1603
Ort:Frankfurt
Verlag:Johann Saur
Seitenangabe:3-4
Publikationstyp:Monographie
dipl-Einheiten:441
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, head, lang, lb, lemma, pb, pb_n, persname, pos, quote, reader_ref, script, title, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

43. 1588_NeuwKreuterbuchBeyfusz_Theodorus

Titel:Neuw Kreuterbuch
Kürzel:1588_NeuwKreuterbuchBeyfusz_Theodorus
Autor:Tabernaemontanus, Jacobus Theodorus
Jahr:1588
Ort:Frankfurt am Main
Verlag:NA
Seitenangabe:33-44
Puplikationstyp:Monographie
dipl-Einheiten:9761
Beschreibung:Kräutertext
Annotationsebene:dipl, clean, norm, abbr, author_ref, column, figure, figure_p, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, reader_ref, script, title, unclear

44. 1588_NeuwKreuterbuchVorrede_Theodorus

Titel:Neuw Kreuterbuch (Vorrede)
Kürzel:1588_NeuwKreuterbuchVorrede_Theodorus
Autor:Tabernaemontanus, Jacobus Theodorus
Jahr:1588
Ort:Frankfurt am Main
Verlag:NA
Seitenangabe:NA
Puplikationstyp:Monographie
dipl-Einheiten:6656
Beschreibung:Kräutertext
Annotationsebene:dipl, clean, norm, abbr, author_ref, column, figure, figure_p, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, quote, reader_ref, script, title, unclear

45. 1588_ParadeiszgaertleinAbbisz_Rosbach

Titel:Paradeiszgärtlein
Kürzel:1588_ParadeiszgaertleinAbbisz_Rosbach
Autor:Conrad Rosbach
Jahr:1588
Ort:Frankfurt am Main
Verlag:Johann Spieß
Seitenangabe:1-43
Publikationstyp:Monographie
dipl-Einheiten:5054
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, comp, comp_orth, figure, head, hi_rend, lang, lb, lemma, morph_ellipsis, pb, pb_n, pos, prot, quote, reader_ref, reference, script, unclear, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

46. 1588_ParadeiszgaertleinVorrede_Rosbach

Titel:Paradeiszgärtlein (Vorrede)
Kürzel:1588_ParadeiszgaertleinVorrede_Rosbach
Autor:Conrad Rosbach
Jahr:1588
Ort:Frankfurt am Main
Verlag:Johann Spieß
Seitenangabe:NA
Publikationstyp:Monographie
dipl-Einheiten:2678
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, column, figure, figure_p, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, quote, reader_ref, script, title, unclear

47. NewKreueterbuch_1563_Handsch

Titel:New Kreüterbuch: Mit den allerschönsten vnd artlichsten Figuren aller Gewechß, dergleichen vormals in keiner sprach nie an tag kommen
Kürzel:NewKreueterbuch_1563_Handsch
Autor:Georg Handsch
Jahr:1563
Ort:Prag
Verlag:Melantrich von Auentin und Valgriß
Seitenangabe:277-283
Publikationstyp:Monographie
dipl-Einheiten:3785
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, head, hi_rend, lang, lb, lemma, pb, pb_n, persname, pos, reader_ref, script, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

48. 1563_NewKreuterbuchVorrede_Handsch

Titel:New Kreüterbuch: Mit den allerschönsten vnd artlichsten Figuren aller Gewechß, dergleichen vormals in keiner sprach nie an tag kommen (Vorrede)
Kürzel:NewKreueterbuch-VR_1563_Handsch
Autor:Georg Handsch
Jahr:1563
Ort:Prag
Verlag:Melantrich von Auentin und Valgriß
Seitenangabe:NA
Publikationstyp:Monographie
dipl-Einheiten:2662
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, column, figure, figure_p, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, quote, reader_ref, script, title, unclear

49. 1557_WieSichMeniglichEinführung_vonBodenstein

Titel:Wie sich meniglich von dem Cyperlin, so Podagra genennet, hüten soll
Kürzel:1557_WieSichMeniglichEinführung_vonBodenstein
Autor:von Bodenstein, Adam
Jahr:1557
Ort:Basel
Verlag:Bartholome Stähälin
Seitenangabe:28-47
Publikationstyp:Monographie
dipl-Einheiten:5508
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, head, lang, lb, lemma, morph_ellipsis, pb, pb_n, persname, pos, quote, reader_ref, script, unclear, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

50. 1557_WieSichMeniglichVorrede_vonBodenstein

Titel:Wie sich meniglich von dem Cyperlin, so Podagra genennet, hüten soll (Vorrede)
Kürzel:1557_WieSichMeniglichVorrede_vonBodenstein
Autor:von Bodenstein, Adam
Jahr:1557
Ort:Basel
Verlag:Bartholome Stähälin
Seitenangabe:NA
Publikationstyp:Monographie
dipl-Einheiten:707
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, head, hi_rend, lang, lb, lemma, pb, persname, pos, quote, reader_ref, script, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

51. 1580_ExperimentaRoszBappeln_Schnellenberg

Titel:Experimenta von zwentzig Pestilentz Wurtzelen unnd Kreutter
Kürzel:1580_ExperimentaRoszBappeln_Schnellenberg
Autor:Schnellenberg, Tarquinius
Jahr:1550
Ort:Strassburg
Verlag:Rihel
Seitenangabe:33-43
Publikationstyp:Monographie
dipl-Einheiten:5635
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, column, figure, figure_p, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, reader_ref, script, title, unclear

52. Experimenta-VR_1550_Schellenbeg

Titel:Experimenta von zwentzig Pestilentz Wurtzelen unnd Kreutter (Vorrede)
Kürzel:1580_ExperimentaVorrede_Schnellenberg
Autor:Schnellenberg, Tarquinius
Jahr:1550
Ort:Strassburg
Verlag:Rihel
Seitenangabe:2-3
Publikationstyp:Monographie
dipl-Einheiten:491
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, column, figure, figure_p, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, quote, reader_ref, script, title, unclear

53. NewKreueterbuch_1543_Fuchs

Titel:New Kreüterbuch
Kürzel:NewKreueterbuch_1543_Fuchs
Autor:Fuchs, Leonhard
Jahr:1543
Ort:Basel
Verlag:Michael Isingrin
Seitenangabe:2-e4
Publikationstyp:Monographie
dipl-Einheiten:5221
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, figure, head, hi_rend, lang, lb, lemma, morph_ellipsis, pb, pb_n, persname, pos, quote, reader_ref, script, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

54. 1543_NewKreuterbuchEnisz_Fuchs

Titel:New Kreüterbuch
Kürzel:1543_NewKreuterbuchEnisz_Fuchs
Autor:Fuchs, Leonhard
Jahr:1543
Ort:Basel
Verlag:Michael Isingrin
Seitenangabe:Kapitel 19-25
Publikationstyp:Monographie
dipl-Einheiten:2821
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, figure_p, head, hi_rend, lang, lb, lemma, note, pb, pos, quote, persname, reader_ref, script, title, comp_n, comp_n_graph, comp_n_mod, infl_fuge, attr_gen, adja_uninfl, morph_ellipsis, comp_a, comp_a_graph, comp_lex, comp_amb

55. 1543_NewKreuterbuchVorrede_Fuchs

Titel:New Kreüterbuch (Vorrede)
Kürzel:1543_NewKreuterbuchVorrede_Fuchs
Autor:Fuchs, Leonhard
Jahr:1543
Ort:Basel
Verlag:Michael Isingrin
Seitenangabe:NA
Publikationstyp:Monographie
dipl-Einheiten:2221
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, column, figure, figure_p, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, quote, reader_ref, script, title, unclear

56. 1539_NewKreuetterBuchWormkraut_Bock

Titel:New Kreütter Buch: von Underscheydt, Würckung und Namen der Kreütter so in teütschen Landen wachsen; auch der selbigen eygentlichem und wolgegründtem Gebrauch in der Artznei, zu behalten und zu fürdern Leibs Gesuntheyt fast nutz und tröstlichen, vorab gemeynem Verstand
Kürzel:1539_NewKreuetterBuchWormkraut_Bock
Autor:Hieronymus Bock
Jahr:1539
Ort:Straßburg
Verlag:Rihel
Seitenangabe:XCVI-C
Publikationstyp:Monographie
dipl-Einheiten:4408
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, reader_ref, script, title, unclear, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

57. 1539_NewKreuetterbuchAenis_Bock

Titel:New Kreütter Buch: von Underscheydt, Würckung und Namen der Kreütter so in teütschen Landen wachsen; auch der selbigen eygentlichem und wolgegründtem Gebrauch in der Artznei, zu behalten und zu fürdern Leibs Gesuntheyt fast nutz und tröstlichen, vorab gemeynem Verstand
Kürzel:1539_NewKreuetterbuchAenis_Bock
Autor:Hieronymus Bock
Jahr:1539
Ort:Straßburg
Verlag:Rihel
Seitenangabe:CXXXIIIJ-CXXXVIIJ
Publikationstyp:Monographie
dipl-Einheiten:4055
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, reader_ref, script, title, comp_n, comp_n_graph, comp_n_mod, infl_fuge, attr_gen, adja_uninfl, morph_ellipsis, comp_a, comp_a_graph, comp_lex, comp_amb

58. 1539_NewKreuetterBuchVorrede_Bock

Titel:New Kreütter Buch: von Underscheydt, Würckung und Namen der Kreütter so in teütschen Landen wachsen; auch der selbigen eygentlichem und wolgegründtem Gebrauch in der Artznei, zu behalten und zu fürdern Leibs Gesuntheyt fast nutz und tröstlichen, vorab gemeynem Verstand (Vorrede)
Kürzel:1539_NewKreuetterBuchWormkraut_Bock
Autor:Hieronymus Bock
Jahr:1539
Ort:Straßburg
Verlag:Rihel
Seitenangabe:VII-X
Publikationstyp:Monographie
dipl-Einheiten:2021
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, quote, reader_ref, script, title, unclear, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

59. 1532_ContrafaytKreuterbuchMaioron_Brunfels

Titel:Contrafayt kreüterbuch
Kürzel:1532_ContrafaytKreuterbuchMaioron_Brunfels
Autor:Otto Brunfels
Jahr:1532
Ort:Straßburg
Verlag:Hans Schotten
Seitenangabe:312-323
Publikationstyp:Monographie
dipl-Einheiten:4359
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, figure, head, hi_rend, lang, lb, lemma, pb, pb_n, persname, pos, reader_ref, script, unclear, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

60. ContrafaytKreuterbuch- CCXXXVII-CCXLVIII_1532_Brunfels

Titel:Contrafayt kreüterbuch
Kürzel:ContrafaytKreuterbuch- CCXXXVII-CCXLVIII_1532_Brunfels
Autor:Otto Brunfels
Jahr:1532
Ort:Straßburg
Verlag:Hans Schotten
Seitenangabe:CCXXXVII-CCXLVIII
Publikationstyp:Monographie
dipl-Einheiten:3988
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, hi_rend, lang, lb, lemma, pb, pb_n, persname, pos, quote, reader_ref, script, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

61. 1532_ContrafaytKreuterbuchEnisz_Brunfels

Titel:Contrafayt kreüterbuch
Kürzel:1532_ContrafaytKreuterbuchEnisz_Brunfels
Autor:Otto Brunfels
Jahr:1532
Ort:Straßburg
Verlag:Hans Schotten
Seitenangabe:CCLVII-CCLXX
Publikationstyp:Monographie
dipl-Einheiten:3975
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, figure_p, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, quote, reader_ref, script, title, comp_n, comp_n_graph, comp_n_mod, infl_fuge, attr_gen, adja_uninfl, morph_ellipsis, comp_a, comp_a_graph, comp_lex, comp_amb

62. 1532_ContrafaytKreuterbuchSauramffer_Brunfels

Titel:Contrafayt kreüterbuch
Kürzel:1532_ContrafaytKreuterbuchSauramffer_Brunfels
Autor:Otto Brunfels
Jahr:1532
Ort:Straßburg
Verlag:Hans Schotten
Seitenangabe:CCLXXI-CCXC
Publikationstyp:Monographie
dipl-Einheiten:4401
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, figure_p, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, quote, reader_ref, script, title, comp_n, comp_n_graph, comp_n_mod, infl_fuge, attr_gen, adja_uninfl, morph_ellipsis, comp_a, comp_a_graph, comp_lex, comp_amb

63. 1532_ContrafaytKreuterbuchVorrede_Brunfels

Titel:Contrafayt kreüterbuch (Vorrede)
Kürzel:1532_ContrafaytKreuterbuchVorrede_Brunfels
Autor:Otto Brunfels
Jahr:1532
Ort:Straßburg
Verlag:Hans Schotten
Seitenangabe:VIII-IX
Publikationstyp:Monographie
dipl-Einheiten:664
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, head, lang, lb, lemma, note, pb, pb_n, persname, pos, quote, script, title, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

64. 1532_ArtzneyBuchleinDerKreutterBetonica_Tallat

Titel:Artzney Buchlein der kreutter
Kürzel:1532_ArtzneyBuchleinDerKreutterBetonica_Tallat
Autor:Johannes Tallat
Jahr:1532
Ort:Leipzig
Verlag:Michael Blum
Seitenangabe:NA
Publikationstyp:Monographie
dipl-Einheiten:4630
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, head, hi_rend, lang, lb, lemma, note, pb, persname, pos, reader_ref, script, title, unclear, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

65. 1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat

Titel:Artzney Buchlein der kreutter
Kürzel:1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat
Autor:Johannes Tallat
Jahr:1532
Ort:Leipzig
Verlag:Michael Blum
Seitenangabe:ab Abrotanum
Publikationstyp:Monographie
dipl-Einheiten:3530
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, head, hi_rend, lang, lb, lemma, pb, persname, pos, quote, reader_ref, script, title, unclear, comp_n, comp_n_graph, comp_n_mod, infl_fuge, attr_gen, adja_uninfl, morph_ellipsis, comp_a, comp_a_graph, comp_lex, comp_amb, kaus, kon, lin, hypo

66. ArtzneyBuchleinDerKreutter-Cretanus_1532_Tallat

Titel:Artzney Buchlein der kreutter
Kürzel:ArtzneyBuchleinDerKreutter-Cretanus_1532_Tallat
Autor:Johannes Tallat
Jahr:1532
Ort:Leipzig
Verlag:Michael Blum
Seitenangabe:Cretanus bis Dens leonis
Publikationstyp:Monographie
dipl-Einheiten:1120
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, infl_fuge, comp_amb, comp_n, comp_n_graph, comp_n_mod, comp_lex, comp_a, comp_a_graph, adja_uninfl, attr_gen, morph_ellipsis, lang, abbr, pb, pb_n, lb, head, hi_rend, script, author_ref, quote

67. 1532_ArtzneyBuchleinDerKreutterVorrede_Tallat

Titel:Artzney Buchlein der kreutter (Vorrede)
Kürzel:1532_ArtzneyBuchleinDerKreutterVorrede_Tallat
Autor:Johannes Tallat
Jahr:1532
Ort:Leipzig
Verlag:Michael Blum
Seitenangabe:NA
Publikationstyp:Monographie
dipl-Einheiten:270
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, figure, head, hi_rend, lang, lb, lemma, pb, persname, pos, quote, reader_ref, script, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge, kaus, kon, lin, hypo

68. 1487_GartDerGesundheitArthemisia_vonCuba

Titel:Gart der Gesundheit
Kürzel:1487_GartDerGesundheitArthemisia_vonCuba
Autor:Johannes von Cuba
Jahr:1487
Ort:Ulm
Verlag:NA
Seitenangabe:NA
Publikationstyp:Monographie
dipl-Einheiten:4700
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, attr_gen, author_ref, clause_type, figure, head, hi_rend, lang, lb, lemma, pb, persname, pos, reader_ref, script, title, unclear, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

69. 1487_GartDerGesundheitEnysz_vonCuba

Titel:Gart der Gesundheit
Kürzel:1487_GartDerGesundheitArthemisia_vonCuba
Autor:Johannes von Cuba
Jahr:1487
Ort:Ulm
Verlag:NA
Seitenangabe:Kapitel 15-23
Publikationstyp:Monographie
dipl-Einheiten:3922
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, column, figure, head, hi_rend, lang, lb, lemma, pb, persname, pos, quote, reader_ref, script, title, unclear, comp_n, comp_n_graph, comp_n_mod, infl_fuge, attr_gen, adja_uninfl, morph_ellipsis, comp_a, comp_a_graph, comp_lex, comp_amb

70. 1487_GartDerGesundheitRosenmarin_vonCuba

Titel:Gart der Gesundheit
Kürzel:1487_GartDerGesundheitRosenmarin_vonCuba
Autor:Johannes von Cuba
Jahr:1487
Ort:Ulm
Verlag:NA
Seitenangabe:Kapitel 23-33
Publikationstyp:Monographie
dipl-Einheiten:3843
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, column, figure, head, hi_rend, lang, lb, lemma, pb, persname, pos, quote, reader_ref, script, title, comp_n, comp_n_graph, comp_n_mod, infl_fuge, attr_gen, adja_uninfl, comp_lex, comp_amb, kaus, kon, lin, hypo

71. 1487_GartDerGesundheitVorrede_vonCuba

Titel:Gart der Gesundheit (Vorrede)
Kürzel:1487_GartDerGesundheitVorrede_vonCuba
Autor:Johannes von Cuba
Jahr:1487
Ort:Ulm
Verlag:NA
Seitenangabe:aij-aiij
Publikationstyp:Monographie
dipl-Einheiten:1352
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, head, lang, lb, lemma, pb, pb_n, persname, pos, reader_ref, script, title, unclear, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge, kaus, kon, lin, hypo

72. 1482_BuchDerNaturEinleitungBuchV_vonMegenberg

Titel:Das Buch der Natur
Kürzel:1482_BuchDerNaturEinleitungBuchV_vonMegenberg
Autor:Conradus von Megenberg
Jahr:1482
Ort:Augsburg
Verlag:NA
Seitenangabe:NA
Publikationstyp:Monographie
dipl-Einheiten:5215
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, head, hi_rend, lang, lb, lemma, pb, persname, pos, reader_ref, script, adja_uninfl, comp_amb, comp_lex, comp_n, comp_n_graph, comp_n_mod, comp_a, comp_a_graph, infl_fuge

73. BuchDerNatur-Canamellis_1482_vonMegenberg

Titel:Das Buch der Natur
Kürzel:BuchDerNatur-Canamellis_1482_vonMegenberg
Autor:Conradus von Megenberg
Jahr:1482
Ort:Augsburg
Verlag:NA
Seitenangabe:NA
Publikationstyp:Monographie
dipl-Einheiten:5077
Beschreibung:Kräutertext
Annotationsebenen:dipl, clean, norm, abbr, author_ref, column, figure, figure_p, head, hi_rend, lang, lb, lemma, note, pb, pb_n, persname, pos, quote, reader_ref, script, title, unclear

Zuordnung von Annotationen und Dokumenten

RIDGES hat eine lange Versionsgeschichte. Deshalb sind nicht alle Annotationen in allen Dokumenten enthalten. Die meisten Annotationsebenen wurden von Studierenden der Humboldt-Universität zu Berlin erstellt. Viele wurden aber auch von einzelnen Forscher:innen angelegt, die selbst entschieden haben, welche Dokumente sie annotieren wollen.

In der folgenden Tabelle sind je Annotationsebene die annotierten Dokumente aufgeführt.
Einige Annotationsebenen wurden gruppiert, wenn sie in exakt den gleichen Dokumenten annotiert wurden.

Annotationsebeneannotierte Dokumente
author_ref1603_AlchymistischePractic_Libavius,
1603_AlchymistischePracticVorrede_Libavius,
1532_ArtzneyBuchleinDerKreutterBetonica_Tallat,
1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat,
1532_ArtzneyBuchleinDerKreutterCretanus_Tallat,
1532_ArtzneyBuchleinDerKreutterVorrede_Tallat,
1769_BeschreibungDerGraeser_Schrebers27-31,
1769_BeschreibungDerGraeser_Schrebers37-48,
1750_BlackwellischesKraeuterbuch_Blackwell,
1482_BuchDerNaturEinleitungBuchV_vonMegenberg,
BuchDerNatur-Canamellis_1482_vonMegenberg,
1532_ContrafaytKreuterbuchMaioron_Brunfels,
1532_ContrafaytKreuterbuchEnisz_Brunfels,
1532_ContrafaytKreuterbuchSauramffer_Brunfels,
1532_ContrafaytKreuterbuchBeyfussz_Brunfels,
1532_ContrafaytKreuterbuchVorrede_Brunfels,
1870_DeutschePflanzennamen_Grassmann,
1766_EinleitungZuDerKraeuterkenntnisz_Oeder,
1580_ExperimentaRoszBappeln_Schnellenberg,
Experimenta-VR_1550_Schellenbeg,
1821_UeberDieWissenschaftlicheBehandlung_Flora,
1821_BeschreibungZweiterNeuenPflanzenarten_Flora,
1870_FloraDerPreussischenRheinlande_Wirtgen,
1722_FloraSaturnizans_Henckel,
1487_GartDerGesundheitArthemisia_vonCuba,
1487_GartDerGesundheitEnysz_vonCuba,
1487_GartDerGesundheitRosenmarin_vonCuba,
1487_GartDerGesundheitVorrede_vonCuba,
1874_GemeinnuetzigesKraeuterbuch_Siegmund,
1809_GetreueDarstellungUndBeschreibung_Hayne,
1860_GrossesIllustriertesKraeuterbuch_Mueller,
1792_GrundrissKraeuterkunde_Willdenow,
1609_HortulusSanitatisDerWeisseThannen_Uffenbach,
1609_HortulusSanitatisVorrede_Uffenbach,
1914_Kraeuterbuch_Losch,
1609_KraeutterbuchZwilling_Carrichter,
1609_KraeutterbuchVorrede_Carrichter,
1735_MysterivmSigillorvm_Hiebner,
NatürlichePflanzenfamilien_1887_Engler,
1588_NeuwKreuterbuchBeyfusz_Theodorus,
1588_NeuwKreuterbuchVorrede_Theodorus,
NewKreueterbuch_1563_Handsch,
1539_NewKreuetterBuchWormkraut_Bock,
1539_NewKreuetterbuchAenis_Bock,
1539_NewKreuetterBuchVorrede_Bock,
1543_NewKreuterbuchWermuot_Fuchs,
1543_NewKreuterbuchEnisz_Fuchs,
1543_NewKreuterbuchVorrede_Fuchs,
1563_NewKreuterbuchVorrede_Handsch,
1840_NochEinigeWorteUeberDenBefruchtungsakt_1840_Meyen,
1840_NochEinigeWorteVorrede_Meyen,
1588_ParadeiszgaertleinAbbisz_Rosbach,
1588_ParadeiszgaertleinVorrede_Rosbach,
1639_PflantzGartZweige_Rhagor,
1639_PflantzGartGartenkraeuter_Rhagor,
1639_PflantzGartVorrede_Rhagor,
1687_SchweizerischerBotanicus_vonRoll,
1675_SonderbaresKraeuterbuchAcorus_Anonymous,
1696_TheatrumBotanicum_Verzascha,
1673_ThesaurusSanitatisWeibsbild_Nasser,
ThesaurusSanitatis_304-321_1673_Nasser,
1774_UnterrichtKraeuterUndWurzeltrocknung_Eisen,
1719_ViridariumReformatum_Valentini,
1843_VorlesungenUeberKraeuterkunde_Link,
1557_WieSichMeniglichEinführung_vonBodenstein,
1557_WieSichMeniglichVorrede_vonBodenstein,
1652_Wund-Artzney_Greiff
clean, dipl, norm, lemma, script, lang, lb, pb, pos, abbr, gram, technicaltermalle
column1769_BeschreibungDerGraeser_Schrebers27-31,
1769_BeschreibungDerGraeser_Schrebers37-48,
BuchDerNatur-Canamellis_1482_vonMegenberg,
1580_ExperimentaRoszBappeln_Schnellenberg,
Experimenta-VR_1550_Schellenbeg,
1487_GartDerGesundheitEnysz_vonCuba,
1487_GartDerGesundheitRosenmarin_vonCuba,
1609_HortulusSanitatisVorrede_Uffenbach,
1609_KraeutterbuchVorrede_Carrichter,
1543_NewKreuterbuchVorrede_Fuchs,
1588_NeuwKreuterbuchBeyfusz_Theodorus,
1588_NeuwKreuterbuchVorrede_Theodorus,
1588_ParadeiszgaertleinVorrede_Rosbach
comp, comp_orth, prot1870_DeutschePflanzennamen_Grassmann,
1828_EigenschaftenAllerHeilpflanzenAbbisz_Anonymous,
1766_EinleitungZuDerKraeuterkenntnisz_Oeder,
1821_UeberDieWissenschaftlicheBehandlung_Flora,
1821_BeschreibungZweiterNeuenPflanzenarten_Flora,
1870_FloraDerPreussischenRheinlande_Wirtgen,
1722_FloraSaturnizans_Henckel,
1792_GrundrissKraeuterkunde_Willdenow,
1609_HortulusSanitatisDerWeisseThannen_Uffenbach,
1609_KraeutterbuchZwilling_Carrichter,
1735_MysterivmSigillorvm_Hiebner,
1840_NochEinigeWorteUeberDenBefruchtungsakt_1840_Meyen,
1840_NochEinigeWorteVorrede_Meyen,
1687_SchweizerischerBotanicus_vonRoll,
1675_SonderbaresKraeuterbuchAbiesCandida_Anonymous,
1675_SonderbaresKraeuterbuchAbsinthium_Anonymous,
1673_ThesaurusSanitatisWeibsbild_Nasser,
1774_UnterrichtKraeuterUndWurzeltrocknung_Eisen,
1843_VorlesungenUeberKraeuterkunde_Link
comp_n, comp_n_graph, comp_n_mod, comp_lex, infl_fuge1603_AlchymistischePractic_Libavius,
1603_AlchymistischePracticVorrede_Libavius,
1532_ArtzneyBuchleinDerKreutterBetonica_Tallat,
1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat,
ArtzneyBuchleinDerKreutter-Cretanus_1532_Tallat,
1532_ArtzneyBuchleinDerKreutterVorrede_Tallat,
1482_BuchDerNaturEinleitungBuchV_vonMegenberg,
1532_ContrafaytKreuterbuchMaioron_Brunfels,
1532_ContrafaytKreuterbuchBeyfussz_Brunfels,
1532_ContrafaytKreuterbuchSauramffer_Brunfels ,
1532_ContrafaytKreuterbuchEnisz_Brunfels ,
1532_ContrafaytKreuterbuchVorrede_Brunfels,
1487_GartDerGesundheitArthemisia_vonCuba,
1487_GartDerGesundheitEnysz_vonCuba,
1487_GartDerGesundheitRosenmarin_vonCuba,
1487_GartDerGesundheitVorrede_vonCuba,
1609_HortulusSanitatisDerWeisseThannen_Uffenbach,
1609_KraeutterbuchZwilling_Carrichter,
NewKreueterbuch_1563_Handsch,
1539_NewKreuetterBuchWormkraut_Bock,
1539_NewKreuetterbuchAenis_Bock,
1539_NewKreuetterBuchVorrede_Bock,
1543_NewKreuterbuchWermuot_Fuchs,
1543_NewKreuterbuchEnisz_Fuchs,
1588_ParadeiszgaertleinAbbisz_Rosbach,
1639_PflantzGartZweige_Rhagor,
1639_PflantzGartGartenkraeuter_Rhagor,
1639_PflantzGartVorrede_Rhagor,
1557_WieSichMeniglichEinführung_vonBodenstein,
1557_WieSichMeniglichVorrede_vonBodenstein,
1652_Wund-Artzney_Greiff
comp_amb1603_AlchymistischePractic_Libavius,
1532_ArtzneyBuchleinDerKreutterBetonica_Tallat,
1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat,
ArtzneyBuchleinDerKreutter-Cretanus_1532_Tallat,
1482_BuchDerNaturEinleitungBuchV_vonMegenberg,
1532_ContrafaytKreuterbuchMaioron_Brunfels,
1532_ContrafaytKreuterbuchSauramffer_Brunfels,
1532_ContrafaytKreuterbuchEnisz_Brunfels,
1487_GartDerGesundheitArthemisia_vonCuba,
1487_GartDerGesundheitEnysz_vonCuba,
1487_GartDerGesundheitRosenmarin_vonCuba,
1609_HortulusSanitatisDerWeisseThannen_Uffenbach,
1609_KraeutterbuchZwilling_Carrichter,
NewKreueterbuch_1563_Handsch,
1539_NewKreuetterBuchWormkraut_Bock,
1539_NewKreuetterBuchVorrede_Bock,
1539_NewKreuetterbuchAenis_Bock,
1543_NewKreuterbuchWermuot_Fuchs,
1543_NewKreuterbuchEnisz_Fuchs,
1588_ParadeiszgaertleinAbbisz_Rosbach,
1639_PflantzGartZweige_Rhagor,
1639_PflantzGartGartenkraeuter_Rhagor,
1557_WieSichMeniglichEinführung_vonBodenstein,
1652_Wund-Artzney_Greiff
comp_a, comp_a_graph1603_AlchymistischePractic_Libavius,
1532_ArtzneyBuchleinDerKreutterBetonica_Tallat,
1532_ArtzneyBuchleinDerKreutterVorrede_Tallat,
1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat,1482_BuchDerNaturEinleitungBuchV_vonMegenberg,
1532_ContrafaytKreuterbuchMaioron_Brunfels,
1532_ContrafaytKreuterbuchBeyfussz_Brunfels,
1532_ContrafaytKreuterbuchSauramffer_Brunfels,
1532_ContrafaytKreuterbuchEnisz_Brunfels,
1532_ContrafaytKreuterbuchVorrede_Brunfels,
1487_GartDerGesundheitArthemisia_vonCuba,
1487_GartDerGesundheitEnysz_vonCuba,
1487_GartDerGesundheitVorrede_vonCuba,
1609_HortulusSanitatisDerWeisseThannen_Uffenbach,
1609_KraeutterbuchZwilling_Carrichter,
NewKreueterbuch_1563_Handsch,
1539_NewKreuetterBuchWormkraut_Bock,
1539_NewKreuetterbuchAenis_Bock,
1539_NewKreuetterBuchVorrede_Bock,
1543_NewKreuterbuchWermuot_Fuchs,
1543_NewKreuterbuchEnisz_Fuchs,
1588_ParadeiszgaertleinAbbisz_Rosbach,
1639_PflantzGartZweige_Rhagor,
1639_PflantzGartGartenkraeuter_Rhagor,
1639_PflantzGartVorrede_Rhagor,
1557_WieSichMeniglichEinführung_vonBodenstein,
1557_WieSichMeniglichVorrede_vonBodenstein,
1652_Wund-Artzney_Greiff
figure1603_AlchymistischePractic_Libavius,
1532_ArtzneyBuchleinDerKreutterVorrede_Tallat,
1769_BeschreibungDerGraeser_Schrebers27-31,
1769_BeschreibungDerGraeser_Schrebers37-48,
BuchDerNatur-Canamellis_1482_vonMegenberg,
1532_ContrafaytKreuterbuchMaioron_Brunfels,
1532_ContrafaytKreuterbuchEnisz_Brunfels,
1532_ContrafaytKreuterbuchSauramffer_Brunfels,
1532_ContrafaytKreuterbuchBeyfussz_Brunfels,
1532_ContrafaytKreuterbuchVorrede_Brunfels,
1580_ExperimentaRoszBappeln_Schnellenberg,
Experimenta-VR_1550_Schellenbeg,
1870_FloraDerPreussischenRheinlande_Wirtgen,
1487_GartDerGesundheitArthemisia_vonCuba,
1487_GartDerGesundheitEnysz_vonCuba,
1487_GartDerGesundheitRosenmarin_vonCuba,
1874_GemeinnuetzigesKraeuterbuch_Siegmund,
1809_GetreueDarstellungUndBeschreibung_Hayne,
1860_GrossesIllustriertesKraeuterbuch_Mueller,
1609_HortulusSanitatisVorrede_Uffenbach,
1609_KraeutterbuchVorrede_Carrichter,
1914_Kraeuterbuch_Losch,
NatürlichePflanzenfamilien_1887_Engler,
1543_NewKreuterbuchWermuot_Fuchs,
1543_NewKreuterbuchEnisz_Fuchs,
1543_NewKreuterbuchVorrede_Fuchs,
1563_NewKreuterbuchVorrede_Handsch,
1588_NeuwKreuterbuchBeyfusz_Theodorus,
1588_NeuwKreuterbuchVorrede_Theodorus,
NewKreueterbuch_1563_Handsch,
1539_NewKreuetterBuchVorrede_Bock,
1588_ParadeiszgaertleinAbbisz_Rosbach,
1588_ParadeiszgaertleinVorrede_Rosbach,
1639_PflantzGartZweige_Rhagor,
1662_Phythologia_Becher,
1675_SonderbaresKraeuterbuchAbiesCandida_Anonymous,
1675_SonderbaresKraeuterbuchAbsinthium_Anonymous,
1675_SonderbaresKraeuterbuchAcorus_Anonymous,
1696_TheatrumBotanicum_Verzascha,
1719_ViridariumReformatum_Valentini
figure_p1769_BeschreibungDerGraeser_Schrebers27-31,
1769_BeschreibungDerGraeser_Schrebers37-48,
BuchDerNatur-Canamellis_1482_vonMegenberg,
1532_ContrafaytKreuterbuchEnisz_Brunfels,
1532_ContrafaytKreuterbuchSauramffer_Brunfels,
1580_ExperimentaRoszBappeln_Schnellenberg,
Experimenta-VR_1550_Schellenbeg,
1609_HortulusSanitatisVorrede_Uffenbach,
1609_KraeutterbuchVorrede_Carrichter,
1543_NewKreuterbuchVorrede_Fuchs, 1588_NeuwKreuterbuchBeyfusz_Theodorus,
1588_NeuwKreuterbuchVorrede_Theodorus,
1588_ParadeiszgaertleinVorrede_Rosbach,
1588_ParadeiszgaertleinVorrede_Rosbach,
1675_SonderbaresKraeuterbuchAcorus_Anonymous
head1603_AlchymistischePractic_Libavius,
1603_AlchymistischePracticVorrede_Libavius,
1799_Apothekerlexikon_Hahnemann,
1532_ArtzneyBuchleinDerKreutterBetonica_Tallat,
1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat,
1532_ArtzneyBuchleinDerKreutterCretanus_Tallat,
1532_ArtzneyBuchleinDerKreutterVorrede_Tallat,
1769_BeschreibungDerGraeser_Schrebers27-31,
1769_BeschreibungDerGraeser_Schrebers37-48,
1750_BlackwellischesKraeuterbuch_Blackwell,
1482_BuchDerNaturEinleitungBuchV_vonMegenberg,
BuchDerNatur-Canamellis_1482_vonMegenberg,
1532_ContrafaytKreuterbuchMaioron_Brunfels,
1532_ContrafaytKreuterbuchEnisz_Brunfels,
1532_ContrafaytKreuterbuchSauramffer_Brunfels,
1532_ContrafaytKreuterbuchVorrede_Brunfels,
1870_DeutschePflanzennamen_Grassmann,
1828_EigenschaftenAllerHeilpflanzenWegtritt_Anonymous,
1766_EinleitungZuDerKraeuterkenntnisz_Oeder,
1580_ExperimentaRoszBappeln_Schnellenberg,
Experimenta-VR_1550_Schellenbeg,
1821_UeberDieWissenschaftlicheBehandlung_Flora,
1821_BeschreibungZweiterNeuenPflanzenarten_Flora,
1870_FloraDerPreussischenRheinlande_Wirtgen,
1722_FloraSaturnizans_Henckel,
1487_GartDerGesundheitArthemisia_vonCuba,
1487_GartDerGesundheitEnysz_vonCuba,
1487_GartDerGesundheitRosenmarin_vonCuba,
1487_GartDerGesundheitVorrede_vonCuba,
1809_GetreueDarstellungUndBeschreibung_Hayne,
1860_GrossesIllustriertesKraeuterbuch_Mueller,
1792_GrundrissKraeuterkunde_Willdenow,
1609_HortulusSanitatisDerWeisseThannen_Uffenbach,
1609_HortulusSanitatisVorrede_Uffenbach,
1609_KraeutterbuchZwilling_Carrichter,
1609_KraeutterbuchVorrede_Carrichter,
1735_MysterivmSigillorvm_Hiebner,
NatürlichePflanzenfamilien_1887_Engler,
1543_NewKreuterbuchVorrede_Fuchs,
1588_NeuwKreuterbuchBeyfusz_Theodorus,
1588_NeuwKreuterbuchVorrede_Theodorus,
NewKreueterbuch_1563_Handsch,
1539_NewKreuetterBuchWormkraut_Bock,
1539_NewKreuetterbuchAenis_Bock,
1539_NewKreuetterBuchVorrede_Bock,
1543_NewKreuterbuchWermuot_Fuchs,
1543_NewKreuterbuchEnisz_Fuchs,
1563_NewKreuterbuchVorrede_Handsch,
1840_NochEinigeWorteVorrede_Meyen,
1588_ParadeiszgaertleinAbbisz_Rosbach,
1588_ParadeiszgaertleinVorrede_Rosbach,
1639_PflantzGartZweige_Rhagor,
1639_PflantzGartGartenkraeuter_Rhagor,
1639_PflantzGartVorrede_Rhagor,
1662_Phythologia_Becher,
1687_SchweizerischerBotanicus_vonRoll,
1675_SonderbaresKraeuterbuchAbiesCandida_Anonymous,
1675_SonderbaresKraeuterbuchAbsinthium_Anonymous,
1675_SonderbaresKraeuterbuchAcorus_Anonymous,
1696_TheatrumBotanicum_Verzascha,
1673_ThesaurusSanitatisWeibsbild_Nasser,
ThesaurusSanitatis_304-321_1673_Nasser,
1774_UnterrichtKraeuterUndWurzeltrocknung_Eisen,
1719_ViridariumReformatum_Valentini,
1843_VorlesungenUeberKraeuterkunde_Link,
1557_WieSichMeniglichEinführung_vonBodenstein,
1557_WieSichMeniglichVorrede_vonBodenstein,
1652_Wund-Artzney_Greiff
hi_rend1603_AlchymistischePractic_Libavius,
1799_Apothekerlexikon_Hahnemann,
1532_ArtzneyBuchleinDerKreutterBetonica_Tallat,
1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat,
1532_ArtzneyBuchleinDerKreutterCretanus_Tallat,
1532_ArtzneyBuchleinDerKreutterVorrede_Tallat,
1769_BeschreibungDerGraeser_Schrebers27-31,
1769_BeschreibungDerGraeser_Schrebers37-48,
1750_BlackwellischesKraeuterbuch_Blackwell,
1482_BuchDerNaturEinleitungBuchV_vonMegenberg,
BuchDerNatur-Canamellis_1482_vonMegenberg,
1532_ContrafaytKreuterbuchMaioron_Brunfels,
1532_ContrafaytKreuterbuchEnisz_Brunfels,
1532_ContrafaytKreuterbuchSauramffer_Brunfels,
1532_ContrafaytKreuterbuchBeyfussz_Brunfels,
1870_DeutschePflanzennamen_Grassmann,
1828_EigenschaftenAllerHeilpflanzenAbbisz_Anonymous,
1828_EigenschaftenAllerHeilpflanzenWegtritt_Anonymous,
1766_EinleitungZuDerKraeuterkenntnisz_Oeder,
1580_ExperimentaRoszBappeln_Schnellenberg,
Experimenta-VR_1550_Schellenbeg,
1870_FloraDerPreussischenRheinlande_Wirtgen,
1722_FloraSaturnizans_Henckel,
1487_GartDerGesundheitArthemisia_vonCuba,
1487_GartDerGesundheitEnysz_vonCuba,
1487_GartDerGesundheitRosenmarin_vonCuba, 1874_GemeinnuetzigesKraeuterbuch_Siegmund,
1809_GetreueDarstellungUndBeschreibung_Hayne,
1860_GrossesIllustriertesKraeuterbuch_Mueller,
1792_GrundrissKraeuterkunde_Willdenow,
1609_HortulusSanitatisDerWeisseThannen_Uffenbach,
1609_HortulusSanitatisVorrede_Uffenbach,
1609_KraeutterbuchZwilling_Carrichter,
1609_KraeutterbuchVorrede_Carrichter,
1914_Kraeuterbuch_Losch,
1735_MysterivmSigillorvm_Hiebner,
NatürlichePflanzenfamilien_1887_Engler,
1543_NewKreuterbuchVorrede_Fuchs,
1588_NeuwKreuterbuchBeyfusz_Theodorus,
1588_NeuwKreuterbuchVorrede_Theodorus,
NewKreueterbuch_1563_Handsch,
1539_NewKreuetterBuchWormkraut_Bock,
1539_NewKreuetterbuchAenis_Bock,
1539_NewKreuetterBuchVorrede_Bock,
1543_NewKreuterbuchWermuot_Fuchs,
1543_NewKreuterbuchEnisz_Fuchs,
1563_NewKreuterbuchVorrede_Handsch,
1840_NochEinigeWorteUeberDenBefruchtungsakt_1840_Meyen,
1840_NochEinigeWorteVorrede_Meyen,
1588_ParadeiszgaertleinAbbisz_Rosbach,
1588_ParadeiszgaertleinVorrede_Rosbach,
1639_PflantzGartZweige_Rhagor,
1639_PflantzGartGartenkraeuter_Rhagor,
1639_PflantzGartVorrede_Rhagor
1662_Phythologia_Becher,
1687_SchweizerischerBotanicus_vonRoll,
1675_SonderbaresKraeuterbuchAbiesCandida_Anonymous,
1675_SonderbaresKraeuterbuchAbsinthium_Anonymous,
1675_SonderbaresKraeuterbuchAcorus_Anonymous,
1696_TheatrumBotanicum_Verzascha,
1673_ThesaurusSanitatisWeibsbild_Nasser,
ThesaurusSanitatis_304-321_1673_Nasser,
1774_UnterrichtKraeuterUndWurzeltrocknung_Eisen,
1719_ViridariumReformatum_Valentini,
1843_VorlesungenUeberKraeuterkunde_Link,
1557_WieSichMeniglichVorrede_vonBodenstein,
1652_Wund-Artzney_Greiff
kaus1, kaus2, kaus3, kaus4, kon1, kon2, lin1, lin2, lin3, lin4, hypo1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat,
1532_ArtzneyBuchleinDerKreutterVorrede_Tallat,
1487_GartDerGesundheitRosenmarin_vonCuba,
1487_GartDerGesundheitVorrede_vonCuba,
1639_PflantzGartZweige_Rhagor,
1639_PflantzGartVorrede_Rhagor
morph_ellipsis1603_AlchymistischePractic_Libavius,
1482_BuchDerNaturEinleitungBuchV_vonMegenberg,
1532_ContrafaytKreuterbuchMaioron_Brunfels,
1532_ContrafaytKreuterbuchBeyfussz_Brunfels,
1870_DeutschePflanzennamen_Grassmann,
1828_EigenschaftenAllerHeilpflanzenAbbisz_Anonymous,
1766_EinleitungZuDerKraeuterkenntnisz_Oeder,
1821_BeschreibungZweiterNeuenPflanzenarten_Flora,
1870_FloraDerPreussischenRheinlande_Wirtgen,
1722_FloraSaturnizans_Henckel,
1792_GrundrissKraeuterkunde_Willdenow,
1609_HortulusSanitatisDerWeisseThannen_Uffenbach,
1609_KraeutterbuchZwilling_Carrichter,
1735_MysterivmSigillorvm_Hiebner,
NewKreueterbuch_1563_Handsch,
1539_NewKreuetterBuchWormkraut_Bock,
1539_NewKreuetterBuchVorrede_Bock,
1543_NewKreuterbuchWermuot_Fuchs,
1840_NochEinigeWorteUeberDenBefruchtungsakt_1840_Meyen,
1588_ParadeiszgaertleinAbbisz_Rosbach,
1639_PflantzGartZweige_Rhagor,
1639_PflantzGartGartenkraeuter_Rhagor,
1639_PflantzGartVorrede_Rhagor,
1687_SchweizerischerBotanicus_vonRoll,
1675_SonderbaresKraeuterbuchAbiesCandida_Anonymous,
1675_SonderbaresKraeuterbuchAbsinthium_Anonymous,
1673_ThesaurusSanitatisWeibsbild_Nasser,
1774_UnterrichtKraeuterUndWurzeltrocknung_Eisen,
1843_VorlesungenUeberKraeuterkunde_Link,
1557_WieSichMeniglichEinführung_vonBodenstein,
1652_Wund-Artzney_Greiff
note1603_AlchymistischePractic_Libavius,
1532_ArtzneyBuchleinDerKreutterBetonica_Tallat,
1769_BeschreibungDerGraeser_Schrebers27-31,
1769_BeschreibungDerGraeser_Schrebers37-48,
BuchDerNatur-Canamellis_1482_vonMegenberg,
1532_ContrafaytKreuterbuchEnisz_Brunfels,
1532_ContrafaytKreuterbuchSauramffer_Brunfels,
1532_ContrafaytKreuterbuchVorrede_Brunfels,
1580_ExperimentaRoszBappeln_Schnellenberg,
Experimenta-VR_1550_Schellenbeg,
1821_UeberDieWissenschaftlicheBehandlung_Flora,
1870_FloraDerPreussischenRheinlande_Wirtgen,
1722_FloraSaturnizans_Henckel,
1609_HortulusSanitatisDerWeisseThannen_Uffenbach,
1609_HortulusSanitatisVorrede_Uffenbach,
1609_KraeutterbuchVorrede_Carrichter,
1914_Kraeuterbuch_Losch,
1735_MysterivmSigillorvm_Hiebner,
1543_NewKreuterbuchVorrede_Fuchs,
1563_NewKreuterbuchVorrede_Handsch,
1588_NeuwKreuterbuchBeyfusz_Theodorus,
1588_NeuwKreuterbuchVorrede_Theodorus,
1539_NewKreuetterBuchWormkraut_Bock,
1539_NewKreuetterbuchAenis_Bock,
1539_NewKreuetterBuchVorrede_Bock,
1543_NewKreuterbuchEnisz_Fuchs,
1840_NochEinigeWorteUeberDenBefruchtungsakt_1840_Meyen,
1840_NochEinigeWorteVorrede_Meyen,
1588_ParadeiszgaertleinVorrede_Rosbach,
1639_PflantzGartZweige_Rhagor,
1639_PflantzGartGartenkraeuter_Rhagor,
1639_PflantzGartVorrede_Rhagor,
1696_TheatrumBotanicum_Verzascha,
1843_VorlesungenUeberKraeuterkunde_Link,
1652_Wund-Artzney_Greiff
pb_n1603_AlchymistischePractic_Libavius,
1603_AlchymistischePracticVorrede_Libavius,
1799_Apothekerlexikon_Hahnemann,
1769_BeschreibungDerGraeser_Schrebers27-31,
1769_BeschreibungDerGraeser_Schrebers37-48,
BuchDerNatur-Canamellis_1482_vonMegenberg,
1532_ContrafaytKreuterbuchMaioron_Brunfels,
1532_ContrafaytKreuterbuchEnisz_Brunfels,
1532_ContrafaytKreuterbuchSauramffer_Brunfels,
1532_ContrafaytKreuterbuchBeyfussz_Brunfels,
1532_ContrafaytKreuterbuchVorrede_Brunfels,
1870_DeutschePflanzennamen_Grassmann,
1828_EigenschaftenAllerHeilpflanzenAbbisz_Anonymous,
1828_EigenschaftenAllerHeilpflanzenWegtritt_Anonymous,
1766_EinleitungZuDerKraeuterkenntnisz_Oeder,
1821_UeberDieWissenschaftlicheBehandlung_Flora,
1821_BeschreibungZweiterNeuenPflanzenarten_Flora,
1580_ExperimentaRoszBappeln_Schnellenberg,
Experimenta-VR_1550_Schellenbeg,
1870_FloraDerPreussischenRheinlande_Wirtgen,
1722_FloraSaturnizans_Henckel,
1487_GartDerGesundheitVorrede_vonCuba,
1874_GemeinnuetzigesKraeuterbuch_Siegmund,
1860_GrossesIllustriertesKraeuterbuch_Mueller,
1792_GrundrissKraeuterkunde_Willdenow,
1609_HortulusSanitatisDerWeisseThannen_Uffenbach,
1609_HortulusSanitatisVorrede_Uffenbach,
1914_Kraeuterbuch_Losch,
1609_KraeutterbuchZwilling_Carrichter,
1609_KraeutterbuchVorrede_Carrichter,
1735_MysterivmSigillorvm_Hiebner,
NatürlichePflanzenfamilien_1887_Engler,
1543_NewKreuterbuchVorrede_Fuchs,
1563_NewKreuterbuchVorrede_Handsch,
1588_NeuwKreuterbuchBeyfusz_Theodorus,
1588_NeuwKreuterbuchVorrede_Theodorus,
NewKreueterbuch_1563_Handsch,
1539_NewKreuetterBuchWormkraut_Bock,
1539_NewKreuetterbuchAenis_Bock,
1539_NewKreuetterBuchVorrede_Bock,
1543_NewKreuterbuchWermuot_Fuchs,
1840_NochEinigeWorteUeberDenBefruchtungsakt_1840_Meyen,
1840_NochEinigeWorteVorrede_Meyen,
1588_ParadeiszgaertleinAbbisz_Rosbach,
1588_ParadeiszgaertleinVorrede_Rosbach,
1639_PflantzGartZweige_Rhagor,
1639_PflantzGartGartenkraeuter_Rhagor,
1639_PflantzGartVorrede_Rhagor,
1662_Phythologia_Becher,
1687_SchweizerischerBotanicus_vonRoll,
1675_SonderbaresKraeuterbuchAbiesCandida_Anonymous,
1675_SonderbaresKraeuterbuchAbsinthium_Anonymous,
1675_SonderbaresKraeuterbuchAcorus_Anonymous,
1696_TheatrumBotanicum_Verzascha,
1673_ThesaurusSanitatisWeibsbild_Nasser,
ThesaurusSanitatis_304-321_1673_Nasser,
1774_UnterrichtKraeuterUndWurzeltrocknung_Eisen,
1719_ViridariumReformatum_Valentini,
1843_VorlesungenUeberKraeuterkunde_Link,
1557_WieSichMeniglichEinführung_vonBodenstein,
1652_Wund-Artzney_Greiff
persname1603_AlchymistischePracticVorrede_Libavius,
1532_ArtzneyBuchleinDerKreutterBetonica_Tallat,
1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat,
1532_ArtzneyBuchleinDerKreutterCretanus_Tallat,
1532_ArtzneyBuchleinDerKreutterVorrede_Tallat,
1769_BeschreibungDerGraeser_Schrebers27-31,
1769_BeschreibungDerGraeser_Schrebers37-48,
1750_BlackwellischesKraeuterbuch_Blackwell,
1482_BuchDerNaturEinleitungBuchV_vonMegenberg,
BuchDerNatur-Canamellis_1482_vonMegenberg,
1532_ContrafaytKreuterbuchMaioron_Brunfels,
1532_ContrafaytKreuterbuchEnisz_Brunfels,
1532_ContrafaytKreuterbuchSauramffer_Brunfels,
1532_ContrafaytKreuterbuchBeyfussz_Brunfels,
1532_ContrafaytKreuterbuchVorrede_Brunfels,
1580_ExperimentaRoszBappeln_Schnellenberg,
Experimenta-VR_1550_Schellenbeg,
1487_GartDerGesundheitArthemisia_vonCuba,
1487_GartDerGesundheitEnysz_vonCuba,
1487_GartDerGesundheitRosenmarin_vonCuba,
1487_GartDerGesundheitVorrede_vonCuba,
1874_GemeinnuetzigesKraeuterbuch_Siegmund,
1809_GetreueDarstellungUndBeschreibung_Hayne,
1860_GrossesIllustriertesKraeuterbuch_Mueller,
1609_HortulusSanitatisVorrede_Uffenbach,
1609_KraeutterbuchVorrede_Carrichter,
1914_Kraeuterbuch_Losch,
NatürlichePflanzenfamilien_1887_Engler,
1543_NewKreuterbuchVorrede_Fuchs,
1563_NewKreuterbuchVorrede_Handsch,
1588_NeuwKreuterbuchBeyfusz_Theodorus,
1588_NeuwKreuterbuchVorrede_Theodorus,
NewKreueterbuch_1563_Handsch,
1539_NewKreuetterBuchWormkraut_Bock,
1539_NewKreuetterbuchAenis_Bock,
1539_NewKreuetterBuchVorrede_Bock,
1543_NewKreuterbuchWermuot_Fuchs,
1543_NewKreuterbuchEnisz_Fuchs,
1588_ParadeiszgaertleinVorrede_Rosbach,
1675_SonderbaresKraeuterbuchAcorus_Anonymous,
1696_TheatrumBotanicum_Verzascha,
ThesaurusSanitatis_304-321_1673_Nasser,
1719_ViridariumReformatum_Valentini,
1557_WieSichMeniglichEinführung_vonBodenstein,
1557_WieSichMeniglichVorrede_vonBodenstein
quote1603_AlchymistischePractic_Libavius,
1603_AlchymistischePracticVorrede_Libavius,
1799_Apothekerlexikon_Hahnemann,
1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat,
1532_ArtzneyBuchleinDerKreutterCretanus_Tallat,
1532_ArtzneyBuchleinDerKreutterVorrede_Tallat,
1769_BeschreibungDerGraeser_Schrebers27-31,
1769_BeschreibungDerGraeser_Schrebers37-48,
1750_BlackwellischesKraeuterbuch_Blackwell,
BuchDerNatur-Canamellis_1482_vonMegenberg,
1532_ContrafaytKreuterbuchEnisz_Brunfels,
1532_ContrafaytKreuterbuchSauramffer_Brunfels,
1532_ContrafaytKreuterbuchBeyfussz_Brunfels,
1532_ContrafaytKreuterbuchVorrede_Brunfels,
1870_DeutschePflanzennamen_Grassmann,
1828_EigenschaftenAllerHeilpflanzenAbbisz_Anonymous,
1828_EigenschaftenAllerHeilpflanzenWegtritt_Anonymous,
1766_EinleitungZuDerKraeuterkenntnisz_Oeder,
1821_UeberDieWissenschaftlicheBehandlung_Flora,
1580_ExperimentaRoszBappeln_Schnellenberg,
Experimenta-VR_1550_Schellenbeg,
1821_BeschreibungZweiterNeuenPflanzenarten_Flora,
1870_FloraDerPreussischenRheinlande_Wirtgen,
1722_FloraSaturnizans_Henckel,
1487_GartDerGesundheitEnysz_vonCuba,
1487_GartDerGesundheitRosenmarin_vonCuba,
1874_GemeinnuetzigesKraeuterbuch_Siegmund,
1809_GetreueDarstellungUndBeschreibung_Hayne,
1860_GrossesIllustriertesKraeuterbuch_Mueller,
1792_GrundrissKraeuterkunde_Willdenow,
1609_HortulusSanitatisDerWeisseThannen_Uffenbach,
1609_HortulusSanitatisVorrede_Uffenbach,
1609_KraeutterbuchVorrede_Carrichter,
1735_MysterivmSigillorvm_Hiebner,
NatürlichePflanzenfamilien_1887_Engler,
1543_NewKreuterbuchVorrede_Fuchs,
1563_NewKreuterbuchVorrede_Handsch,
1588_NeuwKreuterbuchBeyfusz_Theodorus,
1588_NeuwKreuterbuchVorrede_Theodorus,
1539_NewKreuetterbuchAenis_Bock,
1539_NewKreuetterBuchVorrede_Bock,
1543_NewKreuterbuchWermuot_Fuchs,
1543_NewKreuterbuchEnisz_Fuchs,
1840_NochEinigeWorteUeberDenBefruchtungsakt_1840_Meyen,
1840_NochEinigeWorteVorrede_Meyen,
1588_ParadeiszgaertleinAbbisz_Rosbach,
1588_ParadeiszgaertleinVorrede_Rosbach,
1639_PflantzGartGartenkraeuter_Rhagor,
1639_PflantzGartVorrede_Rhagor,
1675_SonderbaresKraeuterbuchAbiesCandida_Anonymous,
1675_SonderbaresKraeuterbuchAbsinthium_Anonymous,
1675_SonderbaresKraeuterbuchAcorus_Anonymous,
1673_ThesaurusSanitatisWeibsbild_Nasser,
ThesaurusSanitatis_304-321_1673_Nasser,
1774_UnterrichtKraeuterUndWurzeltrocknung_Eisen,
1843_VorlesungenUeberKraeuterkunde_Link,
1557_WieSichMeniglichEinführung_vonBodenstein,
WieSichMeniglich-165-VR_1557_vonBodenstein,
1652_Wund-Artzney_Greiff
quotemark1609_HortulusSanitatisVorrede_Uffenbach,
BeschreibungDerGraeser-c27-31_1769_Schrebers
reader_ref1603_AlchymistischePractic_Libavius,
1603_AlchymistischePracticVorrede_Libavius,
1532_ArtzneyBuchleinDerKreutterBetonica_Tallat,
1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat,
1532_ArtzneyBuchleinDerKreutterVorrede_Tallat,
1769_BeschreibungDerGraeser_Schrebers27-31,
1769_BeschreibungDerGraeser_Schrebers37-48,
1482_BuchDerNaturEinleitungBuchV_vonMegenberg,
BuchDerNatur-Canamellis_1482_vonMegenberg,
1532_ContrafaytKreuterbuchMaioron_Brunfels,
1532_ContrafaytKreuterbuchEnisz_Brunfels,
1532_ContrafaytKreuterbuchSauramffer_Brunfels,
1532_ContrafaytKreuterbuchBeyfussz_Brunfels,
1766_EinleitungZuDerKraeuterkenntnisz_Oeder,
1580_ExperimentaRoszBappeln_Schnellenberg,
Experimenta-VR_1550_Schellenbeg,
1821_UeberDieWissenschaftlicheBehandlung_Flora,
1722_FloraSaturnizans_Henckel,
1487_GartDerGesundheitArthemisia_vonCuba,
1487_GartDerGesundheitEnysz_vonCuba,
1487_GartDerGesundheitRosenmarin_vonCuba,
1487_GartDerGesundheitVorrede_vonCuba,
1874_GemeinnuetzigesKraeuterbuch_Siegmund,
1860_GrossesIllustriertesKraeuterbuch_Mueller,
1792_GrundrissKraeuterkunde_Willdenow,
1609_HortulusSanitatisVorrede_Uffenbach,
1609_KraeutterbuchZwilling_Carrichter,
1609_KraeutterbuchVorrede_Carrichter,
1735_MysterivmSigillorvm_Hiebner,
NewKreueterbuch_1563_Handsch,
1539_NewKreuetterBuchWormkraut_Bock,
1539_NewKreuetterbuchAenis_Bock,
1539_NewKreuetterBuchVorrede_Bock,
1543_NewKreuterbuchWermuot_Fuchs,
1543_NewKreuterbuchEnisz_Fuchs,
1840_NochEinigeWorteUeberDenBefruchtungsakt_1840_Meyen,
1588_ParadeiszgaertleinAbbisz_Rosbach,
1588_ParadeiszgaertleinVorrede_Rosbach,
1639_PflantzGartGartenkraeuter_Rhagor,
1639_PflantzGartVorrede_Rhagor,
1687_SchweizerischerBotanicus_vonRoll,
1696_TheatrumBotanicum_Verzascha,
1673_ThesaurusSanitatisWeibsbild_Nasser,
ThesaurusSanitatis_304-321_1673_Nasser,
1774_UnterrichtKraeuterUndWurzeltrocknung_Eisen,
1719_ViridariumReformatum_Valentini,
1843_VorlesungenUeberKraeuterkunde_Link,
1557_WieSichMeniglichEinführung_vonBodenstein,
1557_WieSichMeniglichVorrede_vonBodenstein,
1652_Wund-Artzney_Greiff
title1603_AlchymistischePracticVorrede_Libavius,
1532_ArtzneyBuchleinDerKreutterBetonica_Tallat,
1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat,
1769_BeschreibungDerGraeser_Schrebers27-31,
1769_BeschreibungDerGraeser_Schrebers37-48,
1750_BlackwellischesKraeuterbuch_Blackwell,
BuchDerNatur-Canamellis_1482_vonMegenberg,
1532_ContrafaytKreuterbuchEnisz_Brunfels,
1532_ContrafaytKreuterbuchSauramffer_Brunfels,
1532_ContrafaytKreuterbuchVorrede_Brunfels,
1580_ExperimentaRoszBappeln_Schnellenberg,
Experimenta-VR_1550_Schellenbeg,
1487_GartDerGesundheitArthemisia_vonCuba,
1487_GartDerGesundheitEnysz_vonCuba,
1487_GartDerGesundheitRosenmarin_vonCuba,
1487_GartDerGesundheitVorrede_vonCuba,
1809_GetreueDarstellungUndBeschreibung_Hayne,
1609_HortulusSanitatisVorrede_Uffenbach,
1609_KraeutterbuchVorrede_Carrichter,
1914_Kraeuterbuch_Losch,
1543_NewKreuterbuchVorrede_Fuchs,
1563_NewKreuterbuchVorrede_Handsch,
1588_NeuwKreuterbuchBeyfusz_Theodorus,
1588_NeuwKreuterbuchVorrede_Theodorus,
1539_NewKreuetterBuchWormkraut_Bock,
1539_NewKreuetterbuchAenis_Bock,
1539_NewKreuetterBuchVorrede_Bock,
1543_NewKreuterbuchEnisz_Fuchs,
1588_ParadeiszgaertleinVorrede_Rosbach,
1662_Phythologia_Becher,
1696_TheatrumBotanicum_Verzascha,
ThesaurusSanitatis_304-321_1673_Nasser,
1719_ViridariumReformatum_Valentini
unclear1603_AlchymistischePractic_Libavius,
1532_ArtzneyBuchleinDerKreutterBetonica_Tallat,
1532_ArtzneyBuchleinDerKreutterAbrotanum_Tallat,
1769_BeschreibungDerGraeser_Schrebers27-31,
1769_BeschreibungDerGraeser_Schrebers37-48,
1750_BlackwellischesKraeuterbuch_Blackwell,
BuchDerNatur-Canamellis_1482_vonMegenberg,
1532_ContrafaytKreuterbuchMaioron_Brunfels,
1532_ContrafaytKreuterbuchEnisz_Brunfels,
1870_DeutschePflanzennamen_Grassmann,
1828_EigenschaftenAllerHeilpflanzenAbbisz_Anonymous,
1766_EinleitungZuDerKraeuterkenntnisz_Oeder,
1580_ExperimentaRoszBappeln_Schnellenberg,
Experimenta-VR_1550_Schellenbeg,
1821_UeberDieWissenschaftlicheBehandlung_Flora,
1821_BeschreibungZweiterNeuenPflanzenarten_Flora,
1722_FloraSaturnizans_Henckel,
1487_GartDerGesundheitArthemisia_vonCuba,
1487_GartDerGesundheitEnysz_vonCuba,
1487_GartDerGesundheitVorrede_vonCuba,
1809_GetreueDarstellungUndBeschreibung_Hayne,
1792_GrundrissKraeuterkunde_Willdenow,
1609_HortulusSanitatisDerWeisseThannen_Uffenbach,
1609_HortulusSanitatisVorrede_Uffenbach,
1609_KraeutterbuchZwilling_Carrichter,
1609_KraeutterbuchVorrede_Carrichter,
1735_MysterivmSigillorvm_Hiebner,
1543_NewKreuterbuchVorrede_Fuchs,
1563_NewKreuterbuchVorrede_Handsch,
1588_NeuwKreuterbuchBeyfusz_Theodorus,
1588_NeuwKreuterbuchVorrede_Theodorus,
1539_NewKreuetterBuchWormkraut_Bock,
1539_NewKreuetterBuchVorrede_Bock,
1588_ParadeiszgaertleinAbbisz_Rosbach,
1588_ParadeiszgaertleinVorrede_Rosbach,
1639_PflantzGartZweige_Rhagor,
1639_PflantzGartGartenkraeuter_Rhagor,
1687_SchweizerischerBotanicus_vonRoll,
1675_SonderbaresKraeuterbuchAbiesCandida_Anonymous,
1675_SonderbaresKraeuterbuchAbsinthium_Anonymous,
1675_SonderbaresKraeuterbuchAcorus_Anonymous,
1673_ThesaurusSanitatisWeibsbild_Nasser,
1774_UnterrichtKraeuterUndWurzeltrocknung_Eisen,
1557_WieSichMeniglichEinführung_vonBodenstein,
1652_Wund-Artzney_Greiff

Einrichtung der Arbeitsumgebung

Um am RIDGES Korpus zu arbeiten, ist die Installation und Einrichtung mehrerer Software-Tools notwending.

Annotationstool

Wir verwenden das Excel-Format für die Annotation der Dokumente. Dafür empfehlen wir, LibreOffice zu installieren. LibreOffice ist für verschiedene Betriebssysteme (Windows, Mac, Linux) verfügbar. Falls vorhanden, kann unter Windows auch Microsoft Excel verwendet werden.

Zugriff auf Korpusdaten über Git

Die Dateien des Korpus werden über Git synchronisiert und versioniert. Git ist wie ein digitaler Helfer, der deine Arbeitsschritte aufzeichnet und es ermöglicht, Änderungen an Projekten zu verfolgen und mit anderen zusammenzuarbeiten. Git besteht aus zwei Komponentenen: einen Git-Webserver auf auf dem die Dateien zentral gespeichert werden und einem Git-Client lokal auf dem eigenen Computer, mit dem man eigenen Änderungen verwaltet. Der Ort, an dem die Dateien abgelegt werden wird auch Git-Repository genannt. Mit dem Git-Client werden die Änderunge aus dem Git-Respository zwischen Webserver und dem eigenen Rechner synchronisiert.

RIDGES nutzt den Git-Webserver der Humboldt-Universität (HU GitLab) und der aktuelle Arbeitsstand der Dateien kann auch über den Webbrowser über https://scm.cms.hu-berlin.de/ridges/corpus zugriffen werden. Um Zugriff auf den Git-Webserver und das RIDGES-Projekt zu erhalten, muss man sich beim HU GitLab mit seinem HU-Account anmelden (https://scm.cms.hu-berlin.de/users/sign_in) oder für Externe einen Account anlegen lassen. Danach meldet man sich bei den Admistrator:innen des Projekts, um Zugang zu dem Korpusprojekt zu erhalten.

Danach muss man einen Git-Client installieren, um die Dateien lokal bearbeiten und synchronisieren zu können. Für Einsteiger:innen in Git empfehlen wir die Software GitHub Desktop zu installieren1. Ein alternativer graphischer Git-Client ist z.B. SourceGit.

Wenn man GitHub Deskop verwendet, kann man über das Menü “File -> Clone Repository” und dann das Tab “URL” die Dateien einmalig auf den eigenen Rechner übertragen lassen, in dem man die URL https://scm.cms.hu-berlin.de/ridges/corpus.git angibt.

Klonen der RIDGES Dateien über GitHubDesktop

Danach kann man die Dateien bearbeiten, Änderungen auf den Git-Webserver übertragen oder Änderungen anderer mit den lokalen Änderungen zusammenführen. In der Dokumentation vom GithHub Desktop sind diese Arbeitsschritte beschrieben. Es wird auch empfohlen, an einer Einführungsveranstaltung in Git teilzuhmenen oder eines der zahlreichen online verfügbaren Tutorials zu Git durchzuarbeiten.

Konvertierungs-Software

Wenn ein Dokument bereits in Excel vorliegt, kann es direkt editiert werden. Falls ein Dokument aber z.B. nach der Transkription in Excel umgewandelt werden muss oder die Excel Dateien in das ANNIS-Format gebracht werden sollen, ist wird das Kommandozeilentool annatto benötigt.

Unter https://github.com/korpling/annatto/#installing-and-running-annatto finden Sie Hinweise, wie man das Tool installiert und auf dem eigenen Computer ausführt. Es ist nicht notwendig, eigene Workflow-Dateien für Annatto zu erstellen, da für alle Schritte diese Dateien bereits im Git-Repository hinterlegt sind.


  1. Unter Linux bietet GitHub das Programm selbst nicht an. Unter https://github.com/shiftkey/desktop/releases/latest gibt es alternative Installationsprogramme für verschiedene Linux Versionen. Unter Ubuntu kann die deb-Installation-Datei GitHubDesktop-linux-amd64-<VERSION>-linux1.deb heruntergeladen und in der Kommandozeile installiert werden: sudo apt install ~/Downloads/GitHubDesktop-linux-amd64-*-linux1.deb

Bessere Versionskontrolle für Excel-Dateien

Excel-Dateien sind Binärdateien und das ist problematisch, wenn man in Git z.B. die lokalen Änderungen anzeigen oder Änderungen in der Git-Historie nachvollziehen will.

Um das zu vereinfachen kann man optional Annatto installieren und Git so konfigurieren, dass Annatto die Excel-Dateien zu Text-Dateien umwandelt und dieses in Git für die Änderungsansicht verwendet werden.

Bisher ist die Konfiguration nur unter Linux getestet, für Windows müssen die Skripte vermutlich angepasst werden.
  1. Annatto installieren: https://github.com/korpling/annatto/#installing-and-running-annatto
  2. Sicherstellen, dass die auführbare annatto-Datei in einem der Suchpfade für Programme (PATH Umgebungsvariable) liegt. Unter Linux kann das z.B. /usr/local/bin sein.
  3. In der Datei ~/.gitconfig im Home-Verzeichnis den folgenden Abschnitt hinzufügen und <RIDGES Git Repo> durch den lokalen Pfad zum Git-Repository ersetzen.
[diff "ridges"]
        binary = true
        textconv = <RIDGES Git Repo>/scripts/textconv-ridges.sh
        cachetextconv = true

Release-Prozess

Konvertierung ins ANNIS-Format

Die Excel-Dateien können mit einer Annatto-Workflowdatei nach GraphML konviertiert werden.

annatto run excel2graphml.toml

Die GraphML-Datei wird als ZIP-Datei im graphml/-Unterordner gespeichert und kann direkt in ANNIS importiert werden.

Während der Konvertierung werden unterschiedliche Konsistenzchecks ausgeführt und Warnungen ausgegeben, wenn diese Checks fehlschlagen. Das Ergebnis der Checks wird auch in der Datei conversion_checks.log gespeichert.

Veröffentlichung Dokumentation

  1. Ein lokales Git-Repository auf den Stand des Release bringen (z.B. durch auschecken des Tags)
  2. ./handbuch/render-and-publish.sh ausführen.

Für die Veröffentlichung ist ein SSH-Account auf dem Korpling-Server und Schreibrechte für das entsprechende Verzeichnis notwendig.

Referenzen

Bollmann, Marcel; Petran, Florian & Stefanie Dipper (2011): Rule-Based Normalization of Historical Texts. In: Proceedingsof the RANLP Workshop on Language Technologies for Digital Humanities and Cultural Heritage, Hissar, Bulgaria, 34-42.

Dickinson, Markus & Detmar Meurers (2003): Detecting Errors in Part-of-Speech Annotation. In: Proceedings of the 11th Conference of the European Chapter of the Association for Computational Linguistics (EACL-03). Budapest, Hungary.

Druskat, Stephan & Gast, Volker & Krause, Thomas et al. (2016): corpus-tools.org: An Interoperable Generic Software Tool Set for Multi-layer Linguistic Corpora. Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC 2016). http://www.lrec-conf.org/proceedings/lrec2016/summaries/918.html

Krause, Thomas & Amir Zeldes (2016). A new architecture for generic corpus query and visualization. Digital Scholarship in the Humanities, 31(1): 118–139. DOI: https://academic.oup.com/dsh/article/31/1/118/2605493

Krause, Thomas; Lüdeling, Anke; Odebrecht, Carolin & Amir Zeldes (2012): Multiple Tokenizations in a Diachronic Corpus. Exploring Ancient Languages through Corpora Conference (EALC), 14.-16.Juni 2012. Oslo, Norway.

Odebrecht, Carolin; Belz, Malte; Zeldes, Amir; Lüdeling, Anke; Krause, Thomas (2017): RIDGES Herbology: designing a diachronic multi-layer corpus. In: Lang Resources & Evaluation 51 (3), S. 695-725. DOI: https://link.springer.com/article/10.1007/s10579-016-9374-3

Reichmann, Oskar & Klaus-Peter Wegera (Hrsg.) (1993): Frühneuhochdeutsche Grammatik. Tübingen: Niemeyer Verlag.

Reul, Christian, Dennis Christ, Alexander Hartelt, Nico Balbach, Maximilian Wehner, Uwe Springmann, Christoph Wick, Christine Grundig, Andreas Büttner, and Frank Puppe (2019): OCR4all—An Open-Source Tool Providing a (Semi-)Automatic OCR Workflow for Historical Printings. Applied Sciences 9 (22), 4853. DOI: https://doi.org/10.3390/app9224853

Schmid, Helmut (1994): Probabilistic Part-of-Speech Tagging Using Decision Trees. Proceedings of International Conference on New Methods in Language Processing, Manchester, UK.

Empfohlene Literatur

Georges, Karl Ernst (2010) : Ausführliches deutsch-lateinisches Handwörterbuch. Unveränderter Nachdruck der achten verbesserten und vermehrten Auflage von Heinrich Georges. Darmstadt: WBG.

Hartweg Frederic & Klaus-Peter Wegera (2005): Frühneuhochdeutsch. Eine Einführung in die deutsche Sprache des Spätmittelalters und der frühen Neuzeit. 2., neu bearbeitete Auflage, Tübingen: Niemeyer Verlag.

Niermeyer, J.F. & C. van de Kieft (2002): Mediae Latinitatis Lexicon Minus. Überarbeitet von J.W.J. Burgers. Darmstadt: WBG.

OCR: http://www.cis.uni-muenchen.de/ocrworkshop/program.html
Adelung: http://woerterbuchnetz.de/Adelung/
Bibel: http://www.die-bibel.de/online-bibeln
Grimm: http://woerterbuchnetz.de/DWB/
Lexer: http://woerterbuchnetz.de/Lexer/