Metadaten

Metadaten sind Daten über Daten (Odebrecht 2018, S.72). In Korpora beschreiben sie z. B. die Eigenschaften der Korpusdokumente. RIDGES enthält bibliographische und inhaltliche Metadaten. Somit bilden die Metadaten extralinguistische Informationen zu den Korpusdokumenten ab.

Allgemeingültige Prinzipien

Bei Werten mit offener Klasse wird NA angegeben, wenn ein Wert nicht bekannt ist.
Ebenen und Werte bei geschlossenen Klassen sind auf Englisch, Freitextfelder werden auf Deutsch ausgefüllt.
Einige Metadatenbündel repräsentieren mehrdimensionale Eigenschaften (audience-design, purpose-design und field-design).
Bibliographische Metadaten haben oft eine Belegform und eine standardisierte Form. Als Standard müssen nach Möglichkeit die GND bzw. Wikidata hinzugezogen werden.

Art der Metadaten und dazugehörige Ebenen

Bibliographische und formale Angaben
Inhaltliche Angaben

Bibliographische und formale Metadaten

Zu bibliographischen und formalen Metadaten zählen Angaben zu Titel, Autor:innen, Veröffentlichungsdatum und -orten sowie Angaben zur Zitation. Sofern nicht anders angegeben haben sie die Form einer Zeichenkette.

Angaben zum Titel

full-title

Annotationswert	Beschreibung
Zeichenkette	Langtitel, so wie auf dem Buch/Text genannt, mit allen Untertiteln, mit Angaben wie Bd. 1

Richtlinien und Hinweise

Wenn im Digitalisat, das wir verwendet haben, kein Titel steht (wie bspw. in unserer Version von Das Buch der Natur): Hier wird der Eintrag aus einer wissenschaftlichen Bibliographie genommen.
Vorrangig werden Angaben aus der GND (Gemeinsame Normdatei) genommen. Wenn kein GND-Eintrag vorhanden ist, werden die Angaben vom Scanort übernommen.
Bei Zeitungsartikeln wird die Überschrift ggf. mit Unterüberschriften übernommen.
Die Schreibung wird nach clean-Konvention (wobei Nasalstriche korrekt aufgelöst werden) übernommen. Interpunktionszeichen werden abgerückt, Abkürzungspunkte werden am Token belassen.
Auch wenn der Titel sehr lang ist (mehrere Zeilen), wird er in Gänze übernommen.
Fußnotenkennzeichnungen werden für dieses Metadatum nicht übernommen.

first-title

Annotationswerte	Beschreibung
Zeichenkette	Erster Titel (ohne Untertitel), Schreibung in clean-Konvention

Richtlinien und Hinweise

Es kann sein, dass “full title” und “first title” gleich sind.
Fußnotenkennzeichnungen werden für dieses Metadatum nicht übernommen.

Angaben zu den Autor:innen

Allgemeine Richtlinien und Hinweise

Falles es mehrere Autor:innen gibt, füllen wir alle Felder genauso für author2, author3 etc. aus.

author1

Annotationswert	Beschreibung
Zeichenkette	Name des Autors wie im Buch/Text

Richtlinien und Hinweise

So wie auf dem Buch/Text genannt, im Nominativ (“von Libavum” wird zu Libavius), mit allen Titeln und sonstigen Angaben.
Wenn auf dem Digitalisat kein:e Autor:in genannt ist, dann
a) wird die Schreibung (wie in GND oder anderer wissenschaftlicher Bibliographie) genommen, wenn Autor:in bekannt
b) wird der Wert unknown eingetragen, wenn Autor:in nicht bekannt/angegeben (das gibt es bspw. bei Zeitungsartikeln).

author1-gnd

Annotationswert	Beschreibung
Zeichenkette	Name des Autors wie in der GND

Richtlinien und Hinweise

Wenn der:die Autor:in einen Eintrag in der GND hat, wird hier die standardisierte Schreibweise wie in der GND verwendet (in der Form “Vorname Nachname”).
Wenn in author1 der Wert unknown steht, wird hier NA angegeben.

author1-gnd-link

Annotationswert	Beschreibung
Zeichenkette	GND stable link

Richtlinien und Hinweise

Stable Link zum GND-Eintrag über den:die Autor:in
Wenn in author1 der Wert unknown steht, wird hier NA angegeben.

author1-academic

Annotationswerte	Beschreibung
`yes`	akademische Ausbildung nachweisbar
`no`	fehlende akademische Ausbildung nachweisbar
`unknown`	keine akademische Ausbildung nachweisbar

Richtlinien und Hinweise

Wichtig ist die akademische Ausbildung, wie sie zur Zeit des:r Autor:in aktuell ist, das Fach ist unwichtig. Wir fassen akademische Ausbildung hier weit.
Indizien für eine akademische Ausbildung sind Ausdrücke wie Artist, Medicus, Doktor; auch die Berufsangabe Arzt.
Wenn author1=unknown, wird hier der Wert NA eingetragen.

Veröffentlichungsdatum

date

Annotationswert	Beschreibung
JJJJ (Int)	Erscheinungsjahr in arabischen Ziffern
JJJJ-MM	Erscheinungsjahr und Monat
JJJJ-MM-TT	Erscheinungsjahr, Monat und Tag in arabischen Ziffern
`unknown`	Wenn keine Jahreszahl angegeben ist

Richtlinien und Hinweise

Grundlage sind werkinterne Angaben
Falls im Werk keine angegeben wird, wird die bibliographische Angabe genommen, die bei der Scandatei steht.
Wie, wie oft bei Zeitungstexten, das genaue Datum bekannt ist, wird die Form JJJJ-MM-TT verwendet. Falls nur Jahr und Monat bekannt sind, wird JJJJ-MM verwendet.
Wenn es sich um die Beilage zu einer Zeitungsausgabe handelt und in der Beilage selbst nur eine Jahreszahl angegeben ist, in der Zeitungausgabe aber auch der Monat oder Tag genannt werden, wird diese Angabe auch für die Beilage übernommen.

Angaben zum Veröffentlichungsort

Angaben zum Druckort

place

Annotationswert	Beschreibung
Zeichenkette	Druckort(e), wie sie im Buche/Texte stehen

Richtlinien und Hinweise

Der Druckort wird, bzw. die Druckorte werden, aus den Angaben im Buch/Text übernommen.
Die Werte werden in clean-Konvention angegeben.
Wenn im Buch/Text mehrere Druckorte angegeben sind, werden sie in den Metadaten kommasepariert angegeben.
Wenn im Buch/Text kein Druckort angegeben ist, wird der Druckort aus der Scanbibliographie übernommen.

place-wikidata

Annotationswert	Beschreibung
Zeichenkette	Ortsname(n) aus Wikidata

Richtlinien und Hinweise

Es wird der deutsche Name des Ortes aus Wikidata angegeben, wenn vorhanden.
Wenn kein deutscher Name vorhanden ist, wird der englische Name aus Wikidata angegeben.

place-id-wikidata

Annotationswert	Beschreibung
Zeichenkette	ID aus Wikidata

Weitere Angaben

work-gnd-link

Annotationswert	Beschreibung
Zeichenkette	GND stable link

Richtlinien und Hinweise

Stable Link zum GND-Eintrag über das Werk.
Wenn es keinen Normdatenbankeintrag für das Original gibt, wird der Wert NA angegeben.

bibl

Annotationswert	Beschreibung
Zeichenkette	Kurze bibliographische Angabe

Richtlinien und Hinweise

Für Zitierzwecke etc.

source-lang

Falls es einen Vorlagentext gibt, wird die Ursprungssprache nach ISO 639-3 angegeben.

Annotationswert	Beschreibung
`eng`	Englisch
`lat`	Latein
`NA`	Kein Vorlagentext

Richtlinien und Hinweise

Für Übersetzungen oder Übertragungen oder Kompilationen, die Frage ist hier: Gibt es einen Vorlagentext?
Für Sprachen, die oben nicht gelistet sind, können die ISO-Codes dieser Seite entnommen werden.
Falls es keinen klaren Ursprungstext gibt, wird der Wert NA angegeben.
Wenn es mehrere Ursprungstexte gibt, werden die Werte als kommaseparierte Liste ohne Leerzeichen angegeben (z.B.: eng,lat).
Die Begriffe Übersetzung/Übertragung sind hier weitgefasst zu verstehen.

source-bibl

Annotationswert	Beschreibung
Zeichenkette	Agaben zum Vorlagentext, z. B. Bibliographie

Richtlinien und Hinweise

Freitext
Falls es einen Vorlagentext gibt, wird die bibliographische Angabe oder der GND-Link eingetragen.
Falls bekannt ist, ob der Text übersetzt, kompiliert oder übertragen, wurde, kann das hier auch angegeben werden.

scan-link

Annotationswert	Beschreibung
Zeichenkette	Ort, wo der Scan liegt (URL)

scan-pages

Annotationswert	Beschreibung
XX-XX	Seiten aus dem Digitalisat

Richtlinien und Hinweise

Es werden die Seiten aus dem Digitalisat, angegeben, die von uns bearbeitet sind. - Es werden die Seitenangaben genommen, wie sie im Buch/in der Zeitung selbst stehen.
Die Angaben erfolgen mit Zahlen (13-27) oder römische Zahlen (i-iv).
Wenn keine Seitenzahlen angegeben sind, steht hier der Wert NA.

text-type

Annotationswert	Beschreibung
`prose`	Prosa
`verse`	Vers
`mixed`	gemischt

Richtlinien und Hinweise

Angaben über die allgemeine Textgestaltung.
Prosa: der Text ist komplett in Prosaform verfasst. Hierzu zählen auch Kochrezepte.
Verstext: der Text ist komplett in Reimform oder in metrisch gebundener Form verfasst.
Gemischt: der Text ist teilweise prosaisch, teilweise gereimt verfasst.

verse-type

Annotationswert	Beschreibung
`end-rhyme`
`meter`
`rhyme-meter`
`NA`

Richtlinien und Hinweise

Wenn im Metadatum “text_type” die Werte verse oder mixed angegeben sind, dann wird hier eingetragen, welche Gestaltungselemente dafür verwendet wurden.
Steht im Metadatum der Wert prose, wird hier der Wert NA eingetragen.

publication-statement

Annotationswert	Beschreibung
Zeichenkette	Wie es im Buche oder Texte steht

Richtlinien und Hinweise

In clean-Konvention.
Bei Zeitungen/Zeitschriften wird der Wert NA eingetragen (hier wird das Impressum nicht angegeben).

volume-title

Annotationswert	Beschreibung
Zeichenkette	Name von Zeitung/Zeitschrift/herausgegebenem Werk/Lexikon etc.

Richtlinien und Hinweise

Wenn der Text nicht in einem übergeordneten Werk erschienen ist, wird der Wert NA angegeben.
Bei Zeitungen, wenn verfügbar, auch die Nummer der Ausgabe mit angeben.

printer-gnd

Annotationswert	Beschreibung
Zeichenkette	Name/Person

Richtlinien und Hinweise

Namenschreibung wird, so bekannt, aus der GND übernommen.
Bei Zeitungen NA.

printer-gnd-link

Annotationswert	Beschreibung
Zeichenkette	GND stable link

Richtlinien und Hinweise

Stable link zum GND-Eintrag.
Wenn kein Eintrag verfügbar ist, wird der Wert NA angegeben.

publisher-gnd

Annotationswert	Beschreibung
Zeichenkette	Firma/Person

Richtlinien und Hinweise

Namenschreibung wird, so bekannt, aus der GND übernommen.
Bei Zeitungen NA.

publisher-gnd-link

Annotationswert	Beschreibung
Zeichenkette	GND-Link

Richtlinien und Hinweise

Stable link zum GND-Eintrag.
Wenn kein Eintrag verfügbar ist, wird der Wert NA angegeben.

funding

Informationen darüber, wie sich der:die Autor:in finanziert

Annotationswert	Beschreibung
`commissioned-work`	Es wird ein Auftrag für ein Buch vergeben, bspw. von einer Fürstin oder der Kirche.
`enterprise`	Der:die Autor:in muss das Buch auf dem freien Markt verkaufen.
`research`	Der:die Autor:in wird durch eine akademische Stelle finanziert, es ist also weniger wichtig, ob das Buch selbst Geld bringt.
`journalism`	Journalistische Texte – gemeint sind hier alle Texte, die in nichtwissenschaftlichen Zeitungen erscheinen.

edition

Annotationswert	Beschreibung
Zahl	Nummer des Werkes
`unclear`	Wenn Nummer unklar
`NA`	Bei Zeitungen

Richtlinien und Hinweise

Angabe als einfache Zahl
Wenn es nur eine Edition gibt, dann 1.

publication-type

Annotationswert	Beschreibung
`monograph`	Monographie
`lexicon`	Lexikon
`edited volume`	Sammelwerk
`journal`	Zeitschrift
`newspaper`	Zeitung
`other`	Andere

Richtlinien und Hinweise

Bei monograph werden auch Kräutermonographien mitgezählt.
journal meint wissenschaftliche Zeitschrift.
Bei other kann man unter dem Metadatum notes-opus beschreiben, was es ist.

volume

Annotationswert	Beschreibung
Zeichenkette	Bibliographische Kurzangaben

Richtlinien und Hinweise

Bibliographische Kurzangaben zu Edition, ggf. Herausgeber:in, Journal bei nichtselbständigen Werken.
Bei Zeitungen wird der Wert NA eingetragen.

author1-notes

Annotationswert	Beschreibung
Zeichenkette	Kurzbiographie

Richtlinien und Hinweise

Freitext
Relevant sind Berufe, andere Texte, Vernetzung etc.

notes-opus

Annotationswert	Beschreibung
Zeichenkette	Weitere Angaben zum Werk

Richtlinien und Hinweise

Freitext
Alles, was man noch so zum Werk sagen will, zur Entstehung, dazu Editions/Printings/Circulation (wenn bekannt und recherchierbar), gibt es moderne Nachdrucke?

Inhaltliche Angaben

Registerparameter und anderes

Angaben zum Audience design

An wen richtet sich das Werk vor allem. Hier werden Vorworte und alle anderen Hinweise genutzt. Oft richtet sich ein Werk an mehrere Gruppen.

ad-laypersons

Richtet das Werk sich an die Allgemeinheit?

Annotationswert
`yes`
`no`
`unclear`

ad-professionals

Annotationswert
`yes`
`no`
`unclear`

Richtlinien und Hinweise

Generell professionals im Kontext der jeweiligen Zeit -Heiler:innen, Drogist:innen, Ärzt:innen, Apotheker:innen, Botaniker:innen gelten auch als professionals

ad-academics

Annotationswert
`yes`
`no`
`unclear`

Richtlinien und Hinweise

Wenn das Werk im akademischen Kontext steht, wird der Wert yes vergeben.

ad-evidence

Annotationswert	Beschreibung
Zeichenkette	Angaben dazu, wodurch das audience design hergeleitet wird

Richtlinien und Hinweise

Freitext
Angaben dazu, woher die Informationen zum Audience design bezogen wurden, wie z.B. Vorwort, Erscheinungsort, biographisches Wissen über Autor:in, etc.

Weitere inhaltliche Angaben

herb-list

Annotationswert
`yes`
`no`

Richtlinien und Hinweise

Hier wird der Wert yes eingetragen, wenn es sich um eine Sammlung von Kräutermonographien oder ein Lexikon von Kräutern handelt, oder auch Zeitungsartikel, die einfach die verschiendenen Kräuter beschreiben.
Gilt auch für allgemeine Lexika, in denen noch anderes steht.

preface

Annotationswert
`yes`
`no`

Richtlinien und Hinweise

Gibt an, ob der Text ein Vorwort ist.

Angaben zum Zweck

Was ist der hauptsächliche Zweck des Werks? Hier werden nutzen alle Quellen (Vorwort, anderes Wissen etc.) genutzt. Manchmal kann ein Werk mehrere Zwecke haben.

purpose-compiling

Annotationswert
`yes`
`no`
`unclear`

Richtlinien und Hinweise

Hier sind die Sammlungen von Kräutermonographien gemeint.

purpose-entertainment

Annotationswert
`yes`
`no`
`unclear`

purpose-teaching

Annotationswert
`yes`
`no`
`unclear`

Richtlinien und Hinweise

Hier sind auch allgemeine Information der Öffentlichkeit gemeint, wie z.B. Texte zu Kräutern in Zeitungen darüber, wie etwas angebaut wird und den Geschmack. Der Zwecke muss aber wirklich die Instruktion sein (z.B. ein Lehrbuch). Reine Nachschlagewerke sind hier nicht gemeint.

purpose-research

Annotationswert
`yes`
`no`
`unclear`

Angaben zum Gebiet

Hier werden Gebiete angegeben, die das Werk hauptsächlich behandelt. Oft sind Pharmazie und Medizin kaum voneinander zu unterscheiden. Die Einträge fallen dann eher inklusiv aus und es wird beides angegeben.

field-medicine

Annotationswert
`main`
`periphery`
`no`
`unclear`

field-pharmacy

Annotationswert
`main`
`periphery`
`no`
`unclear`

field-botany

Annotationswert
`main`
`periphery`
`no`
`unclear`

Richtlinien und Hinweise

Hier geht es nur um “echte” Botanik.

field-gardening

Annotationswert
`main`
`periphery`
`no`
`unclear`

field-cooking

Annotationswert
`main`
`periphery`
`no`
`unclear`

field-religion

Annotationswert
`main`
`periphery`
`no`
`unclear`

field-astrology

Annotationswert
`main`
`periphery`
`no`
`unclear`

field-alchemy

Annotationswert
`main`
`periphery`
`no`
`unclear`

Weiteres

author1-knowledge

Annotationswert
`yes`
`no`

Richtlinien und Hinweise

Hier wird angegeben, ob der:die Autor:in eigenes neues Wissen einbringt oder der:die Autor:in andere Werke kompiliert/übersetzt. Es geht hier um wissenschaftliche Beiträge, sonst NA.

author1-knowledge-evidence

Annotationswert	Beschreibung
Zeichenkette	Angaben dazu, wodurch der Eintrag zu author1-knowledge hergeleitet wird

Richtlinien und Hinweise

Freitext
Wenn author1-knowledge NA, hier auch NA

Bisher

Metadatum	Annotationswerte	Beschreibung
author	Zeichenkette	Name des Autors des Textes.
bibl	Zeichenkette	Voller bibliographischer Eintrag für die Quelle inklusive der im Korpus annotatierten Seitenzahlen.
annis:doc	Zeichenkette	Annis Dokumentenkürzel (z.B 1639_PflantzGartVorrede_Rhagor. )
date	JJJJ (Int)	Datum der Veröffentlichung, normalerweise das Jahr.
publisher	Zeichenkette	Verlag/Verleger.
place	Zeichenkette	Verlagsort.
title	Zeichenkette	Titel der Arbeit, aus dem das Dokument extrahiert wurde.
translator	Zeichenkette	Übersetzer des Textes, wenn vorhanden.
trans_from	`it` `lat`	Sprache, aus der der Text übersetzt wurde.
editor	Zeichenkette	Herausgeber des Textes (wenn zusätzlich zum Verlag/Verleger angegeben).
version	z.B. `10.0`	Version, in der das jeweilige Dokument zum Korpus hinzugefügt wurde.
edition_first	`yes` `no`	Wenn bekannt, wird hier angegeben, ob es sich bei dem Faksimile um eine Erstauflage (`yes`) handelt oder nicht (`no`).
issue	Int	Nummer des Bandes, wenn vorhanden.
maintopic	`science` `non-science`	Angabe darüber, ob der Text eher Alltags- oder Wissenschaftsthemen behandelt.
topic	additiv aus: `Al` `As` `B` `G` `K` `L` `M` `R`	Ordnet einem Text einen oder mehrere Themenbereiche zu. Additiver Wert aus den verschiedenen Kürzeln, alphabetisch geordnet. `Al`: Alchemie, `As`: Astronomie, `B`: Botanik, `G`: Gärtnerei, `K`: Küche, `L`: Linguistik, `M`: Medizin, `R`: Religion,. Beispielwerte sind `B`, `BM` oder `BKM`.
register	`herbology`	Register des Textes.
lingualism	`monoling` `multiling`	Gibt an, ob größere Textstellen vorhanden sind, die nicht auf Deutsch verfasst wurden. Dies gilt nicht für einzelne Übersetzungen von Pflanzennamen.
orig_date	JJJJ (Int)	Ist ein Text eine Nichterstauflage, dann kann hier das Jahr der Erstauflage stehen, wenn bekannt.
repository	URL	URL zum Repositorium des Faksimiles.
lang_type	`enhg` `nhg`	Angabe des Sprachtyps. `enhg`: frühneuhochdeutsch (early new high german), `nhg`: neuhochdeutsch (new high german)
lang_area	`md` `obd` `NA`	Das Sprachgebiet wird angegeben. md: mitteldeutsch, obd: oberdeutsch. Bei jüngeren Texten, die schon weitesgtehend standardisiert sind und denen kein Sprachgebiet zugeordnet werden konnte, wird als Wert `NA` angegeben.
text_type	`prose` `lyric` `mixed`	Angaben über die allgemeine Textgestaltung. Prosa: der Text ist komplett in Prosaform verfasst, Poesie: der Text ist komplett in Reimform verfasst; gemischt: der Text ist teilweise prosaisch, teilweise gereimt verfasst.
lyric_type	`end_rhyme` `meter` `rhyme_meter`	Wenn im Metadatum “text_type” die Werte “lyric” oder “mixed” angegeben sind, dann wird hier eingetragen, welche Gestaltungselemente dafür verwendet wurden.
wormwood	`yes` `no`	Gibt an, ob ein Textabschnitt zum Thema “Wermut” transkribiert wurde.
herb_sorting	`yes` `no`	Gibt an, ob es sich bei dem Text um eine Kräutermonographiesammlung handelt, d.h. dass nacheinander verschiedene Kräuter abgehandelt werden.