In zwei Themenblöcken werden die Aufbereitung von Ressourcen entsprechend den DTA-Richtlinien einerseits sowie die Arbeit mit den bestehenden DTA-Korpora andererseits näher beleuchtet.
Im Rahmen des ersten Themenblocks werden verschiedene Schritte der TEI/P5-kompatiblen Aufbereitung von Ressourcen gezeigt. Grundlage bilden dabei die im DTA-Basisformat (DTABf) zusammengefassten DTA-Richtlinien zur Transkription und zur Annotation historischer Texte. Ausgehend von verschiedenen Szenarien der Textaufbereitung (bestehende Transkriptionen aus unterschiedlichen Formaten; neue Transkriptionsvorhaben) werden Hinweise zur Zuverlässigkeit von Bildvorlagen und Transkription gegeben, Möglichkeiten der halbautomatischen Konvertierung in das DTA-Basisformat vorgeführt und anhand praktischen Übungen vermittelt; die DTABf-kompatible Textaufbereitung mithilfe des DTA-oXygen-Frameworks DTAoX wird erprobt. Darüber hinaus wird gezeigt, wie mithilfe des DTAE-Metadatenformulars ein TEI-Header mit ausführlichen Metadaten zu einem historischen Dokument erstellt werden kann. Schließlich werden Methoden der Kontrolle und Überarbeitung abgeschlossener XML-Textausgaben innerhalb der Qualitätssicherungsplattform DTAQ (Ticket-System, integrierte XML-/Text-Editoren) vorgestellt.
Der zweite Themenblock widmet sich den Inhalten der linguistischen Analyse im DTA und den Möglichkeiten der wissenschaftlichen Auswertung der DTA-Korpora. Die Teilnehmerinnen und Teilnehmer erhalten Einblicke in die Nutzung der im DTA verwendeten Suchmaschine DDC, welche die Auswertung des DTA-Gesamtkorpus sowie ausgewählter Teilkorpora in Hinblick auf bestimmte linguistische oder textstrukturelle Merkmale erlaubt. Über die im DTA verfügbaren Möglichkeiten der Visualisierung linguistischer Phänomene wird schließlich gezeigt, welche zusätzlichen Möglichkeiten die Integration der Korpustexten in die CLARIN-D-Infrastruktur bietet.
Hinweise zur Teilnahme:
Eine Anmeldung bis zum 15. Juni unter dta@bbaw.de ist erforderlich
Termin:
07.07.2014 09:00 - 17:00
Anmeldeschluss:
15.06.2014
Veranstaltungsort:
Akademiegebäude am Gendarmenmarkt, Einstein-Saal,Jägerstrasse 22/23, 10117 Berlin
10117 Berlin
Berlin
Deutschland
Zielgruppe:
jedermann
E-Mail-Adresse:
Relevanz:
international
Sachgebiete:
Informationstechnik, Sprache / Literatur
Arten:
Seminar / Workshop / Diskussion
Eintrag:
03.06.2014
Absender:
Gisela Lerch
Abteilung:
Presse- und Öffentlichkeitsarbeit
Veranstaltung ist kostenlos:
ja
Textsprache:
Deutsch
URL dieser Veranstaltung: http://idw-online.de/de/event47498
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).