Einrichtung der Arbeitsumgebung
Um am RIDGES Korpus zu arbeiten, ist die Installation und Einrichtung mehrerer Software-Tools notwending.
Annotationstool
Wir verwenden das Excel-Format für die Annotation der Dokumente. Dafür empfehlen wir, LibreOffice zu installieren. LibreOffice ist für verschiedene Betriebssysteme (Windows, Mac, Linux) verfügbar. Falls vorhanden, kann unter Windows auch Microsoft Excel verwendet werden.
Zugriff auf Korpusdaten über Git
Die Dateien des Korpus werden über Git synchronisiert und versioniert. Git ist wie ein digitaler Helfer, der deine Arbeitsschritte aufzeichnet und es ermöglicht, Änderungen an Projekten zu verfolgen und mit anderen zusammenzuarbeiten. Git besteht aus zwei Komponentenen: einen Git-Webserver auf auf dem die Dateien zentral gespeichert werden und einem Git-Client lokal auf dem eigenen Computer, mit dem man eigenen Änderungen verwaltet. Der Ort, an dem die Dateien abgelegt werden wird auch Git-Repository genannt. Mit dem Git-Client werden die Änderunge aus dem Git-Respository zwischen Webserver und dem eigenen Rechner synchronisiert.
RIDGES nutzt den Git-Webserver der Humboldt-Universität (HU GitLab) und der aktuelle Arbeitsstand der Dateien kann auch über den Webbrowser über https://scm.cms.hu-berlin.de/ridges/corpus zugriffen werden. Um Zugriff auf den Git-Webserver und das RIDGES-Projekt zu erhalten, muss man sich beim HU GitLab mit seinem HU-Account anmelden (https://scm.cms.hu-berlin.de/users/sign_in) oder für Externe einen Account anlegen lassen. Danach meldet man sich bei den Admistrator:innen des Projekts, um Zugang zu dem Korpusprojekt zu erhalten.
Danach muss man einen Git-Client installieren, um die Dateien lokal bearbeiten und synchronisieren zu können. Für Einsteiger:innen in Git empfehlen wir die Software GitHub Desktop zu installieren1. Ein alternativer graphischer Git-Client ist z.B. SourceGit.
Wenn man GitHub Deskop verwendet, kann man über das Menü “File -> Clone Repository” und dann das Tab “URL” die Dateien einmalig auf den eigenen Rechner übertragen lassen, in dem man die URL https://scm.cms.hu-berlin.de/ridges/corpus.git angibt.

Danach kann man die Dateien bearbeiten, Änderungen auf den Git-Webserver übertragen oder Änderungen anderer mit den lokalen Änderungen zusammenführen. In der Dokumentation vom GithHub Desktop sind diese Arbeitsschritte beschrieben. Es wird auch empfohlen, an einer Einführungsveranstaltung in Git teilzuhmenen oder eines der zahlreichen online verfügbaren Tutorials zu Git durchzuarbeiten.
Konvertierungs-Software
Wenn ein Dokument bereits in Excel vorliegt, kann es direkt editiert werden. Falls ein Dokument aber z.B. nach der Transkription in Excel umgewandelt werden muss oder die Excel Dateien in das ANNIS-Format gebracht werden sollen, ist wird das Kommandozeilentool annatto benötigt.
Unter https://github.com/korpling/annatto/#installing-and-running-annatto finden Sie Hinweise, wie man das Tool installiert und auf dem eigenen Computer ausführt. Es ist nicht notwendig, eigene Workflow-Dateien für Annatto zu erstellen, da für alle Schritte diese Dateien bereits im Git-Repository hinterlegt sind.
-
Unter Linux bietet GitHub das Programm selbst nicht an. Unter https://github.com/shiftkey/desktop/releases/latest gibt es alternative Installationsprogramme für verschiedene Linux Versionen. Unter Ubuntu kann die deb-Installation-Datei
GitHubDesktop-linux-amd64-<VERSION>-linux1.debheruntergeladen und in der Kommandozeile installiert werden:sudo apt install ~/Downloads/GitHubDesktop-linux-amd64-*-linux1.deb↩