Metadaten sind Daten über Daten (Odebrecht 2018, S.72). In Korpora beschreiben sie z. B. die Eigenschaften der Korpusdokumente. RIDGES enthält bibliographische und inhaltliche Metadaten. Somit bilden die Metadaten extralinguistische Informationen zu den Korpusdokumenten ab.
Bei Werten mit offener Klasse wird NA angegeben, wenn ein Wert nicht bekannt ist.
Ebenen und Werte bei geschlossenen Klassen sind auf Englisch, Freitextfelder werden auf Deutsch ausgefüllt.
Einige Metadatenbündel repräsentieren mehrdimensionale Eigenschaften (audience-design, purpose-design und field-design).
Bibliographische Metadaten haben oft eine Belegform und eine standardisierte Form. Als Standard müssen nach Möglichkeit die GND bzw. Wikidata hinzugezogen werden.
Zu bibliographischen und formalen Metadaten zählen Angaben zu Titel, Autor:innen, Veröffentlichungsdatum und -orten sowie Angaben zur Zitation. Sofern nicht anders angegeben haben sie die Form einer Zeichenkette.
Wenn im Digitalisat, das wir verwendet haben, kein Titel steht (wie bspw. in unserer Version von Das Buch der Natur): Hier wird der Eintrag aus einer wissenschaftlichen Bibliographie genommen.
Vorrangig werden Angaben aus der GND (Gemeinsame Normdatei) genommen. Wenn kein GND-Eintrag vorhanden ist, werden die Angaben vom Scanort übernommen.
Bei Zeitungsartikeln wird die Überschrift ggf. mit Unterüberschriften übernommen.
Die Schreibung wird nach clean-Konvention (wobei Nasalstriche korrekt aufgelöst werden) übernommen. Interpunktionszeichen werden abgerückt, Abkürzungspunkte werden am Token belassen.
Auch wenn der Titel sehr lang ist (mehrere Zeilen), wird er in Gänze übernommen.
Fußnotenkennzeichnungen werden für dieses Metadatum nicht übernommen.
So wie auf dem Buch/Text genannt, im Nominativ (“von Libavum” wird zu Libavius), mit allen Titeln und sonstigen Angaben.
Wenn auf dem Digitalisat kein:e Autor:in genannt ist, dann
a) wird die Schreibung (wie in GND oder anderer wissenschaftlicher Bibliographie) genommen, wenn Autor:in bekannt
b) wird der Wert unknown eingetragen, wenn Autor:in nicht bekannt/angegeben (das gibt es bspw. bei Zeitungsartikeln).
Wenn der:die Autor:in einen Eintrag in der GND hat, wird hier die standardisierte Schreibweise wie in der GND verwendet (in der Form “Vorname Nachname”).
Wenn in author1 der Wert unknown steht, wird hier NA angegeben.
Wichtig ist die akademische Ausbildung, wie sie zur Zeit des:r Autor:in aktuell ist, das Fach ist unwichtig. Wir fassen akademische Ausbildung hier weit.
Indizien für eine akademische Ausbildung sind Ausdrücke wie Artist, Medicus, Doktor; auch die Berufsangabe Arzt.
Wenn author1=unknown, wird hier der Wert NA eingetragen.
Falls im Werk keine angegeben wird, wird die bibliographische Angabe genommen, die bei der Scandatei steht.
Wie, wie oft bei Zeitungstexten, das genaue Datum bekannt ist, wird die Form JJJJ-MM-TT verwendet. Falls nur Jahr und Monat bekannt sind, wird JJJJ-MM verwendet.
Wenn es sich um die Beilage zu einer Zeitungsausgabe handelt und in der Beilage selbst nur eine Jahreszahl angegeben ist, in der Zeitungausgabe aber auch der Monat oder Tag genannt werden, wird diese Angabe auch für die Beilage übernommen.
Es werden die Seiten aus dem Digitalisat, angegeben, die von uns bearbeitet sind. - Es werden die Seitenangaben genommen, wie sie im Buch/in der Zeitung selbst stehen.
Die Angaben erfolgen mit Zahlen (13-27) oder römische Zahlen (i-iv).
Wenn keine Seitenzahlen angegeben sind, steht hier der Wert NA.
Wenn im Metadatum “text_type” die Werte verse oder mixed angegeben sind, dann wird hier eingetragen, welche Gestaltungselemente dafür verwendet wurden.
Steht im Metadatum der Wert prose, wird hier der Wert NA eingetragen.
Alles, was man noch so zum Werk sagen will, zur Entstehung, dazu Editions/Printings/Circulation (wenn bekannt und recherchierbar), gibt es moderne Nachdrucke?
Generell professionals im Kontext der jeweiligen Zeit
-Heiler:innen, Drogist:innen, Ärzt:innen, Apotheker:innen,
Botaniker:innen gelten auch als professionals
Hier wird der Wert yes eingetragen, wenn es sich um eine Sammlung von Kräutermonographien oder ein Lexikon von Kräutern handelt, oder auch Zeitungsartikel, die einfach die verschiendenen Kräuter beschreiben.
Gilt auch für allgemeine Lexika, in denen noch anderes steht.
Was ist der hauptsächliche Zweck des Werks? Hier werden nutzen alle Quellen (Vorwort, anderes Wissen etc.) genutzt. Manchmal kann ein Werk mehrere Zwecke haben.
Hier sind auch allgemeine Information der Öffentlichkeit gemeint,
wie z.B. Texte zu Kräutern in Zeitungen darüber, wie etwas angebaut wird und den Geschmack. Der Zwecke muss aber wirklich die Instruktion sein (z.B. ein Lehrbuch). Reine Nachschlagewerke sind hier nicht gemeint.
Hier werden Gebiete angegeben, die das Werk hauptsächlich behandelt. Oft sind Pharmazie und Medizin kaum voneinander zu unterscheiden. Die Einträge fallen dann eher inklusiv aus und es wird beides angegeben.
Hier wird angegeben, ob der:die Autor:in eigenes neues Wissen einbringt oder der:die Autor:in andere Werke kompiliert/übersetzt. Es geht hier um wissenschaftliche Beiträge, sonst NA.
Voller bibliographischer Eintrag für die Quelle inklusive der im Korpus annotatierten Seitenzahlen.
annis:doc
Zeichenkette
Annis Dokumentenkürzel (z.B 1639_PflantzGartVorrede_Rhagor. )
date
JJJJ (Int)
Datum der Veröffentlichung, normalerweise das Jahr.
publisher
Zeichenkette
Verlag/Verleger.
place
Zeichenkette
Verlagsort.
title
Zeichenkette
Titel der Arbeit, aus dem das Dokument extrahiert wurde.
translator
Zeichenkette
Übersetzer des Textes, wenn vorhanden.
trans_from
it lat
Sprache, aus der der Text übersetzt wurde.
editor
Zeichenkette
Herausgeber des Textes (wenn zusätzlich zum Verlag/Verleger angegeben).
version
z.B. 10.0
Version, in der das jeweilige Dokument zum Korpus hinzugefügt wurde.
edition_first
yes no
Wenn bekannt, wird hier angegeben, ob es sich bei dem Faksimile um eine Erstauflage (yes) handelt oder nicht (no).
issue
Int
Nummer des Bandes, wenn vorhanden.
maintopic
science non-science
Angabe darüber, ob der Text eher Alltags- oder Wissenschaftsthemen behandelt.
topic
additiv aus: Al As B G K L M R
Ordnet einem Text einen oder mehrere Themenbereiche zu. Additiver Wert aus den verschiedenen Kürzeln, alphabetisch geordnet. Al: Alchemie, As: Astronomie, B: Botanik, G: Gärtnerei, K: Küche, L: Linguistik, M: Medizin, R: Religion,. Beispielwerte sind B, BM oder BKM.
register
herbology
Register des Textes.
lingualism
monoling multiling
Gibt an, ob größere Textstellen vorhanden sind, die nicht auf Deutsch verfasst wurden. Dies gilt nicht für einzelne Übersetzungen von Pflanzennamen.
orig_date
JJJJ (Int)
Ist ein Text eine Nichterstauflage, dann kann hier das Jahr der Erstauflage stehen, wenn bekannt.
repository
URL
URL zum Repositorium des Faksimiles.
lang_type
enhg nhg
Angabe des Sprachtyps. enhg: frühneuhochdeutsch (early new high german), nhg: neuhochdeutsch (new high german)
lang_area
md obd NA
Das Sprachgebiet wird angegeben. md: mitteldeutsch, obd: oberdeutsch. Bei jüngeren Texten, die schon weitesgtehend standardisiert sind und denen kein Sprachgebiet zugeordnet werden konnte, wird als Wert NA angegeben.
text_type
prose lyric mixed
Angaben über die allgemeine Textgestaltung. Prosa: der Text ist komplett in Prosaform verfasst, Poesie: der Text ist komplett in Reimform verfasst; gemischt: der Text ist teilweise prosaisch, teilweise gereimt verfasst.
lyric_type
end_rhyme meter rhyme_meter
Wenn im Metadatum “text_type” die Werte “lyric” oder “mixed” angegeben sind, dann wird hier eingetragen, welche Gestaltungselemente dafür verwendet wurden.
wormwood
yes no
Gibt an, ob ein Textabschnitt zum Thema “Wermut” transkribiert wurde.
herb_sorting
yes no
Gibt an, ob es sich bei dem Text um eine Kräutermonographiesammlung handelt, d.h. dass nacheinander verschiedene Kräuter abgehandelt werden.