idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store

Event


institutionlogo


07/07/2014 - 07/07/2014 | Berlin

Aufbau historischer Sprachressourcen: Arbeiten mit den Angeboten des Deutschen

Am 7. Juli 2014 veranstaltet das DTA einen Workshop zum Thema „Aufbau historischer Sprachressourcen: Arbeiten mit den Angeboten des Deutschen Textarchivs“. Der Workshop wendet sich an Nutzerinnen und Nutzer des DTA ebenso wie an Interessierte, die die Angebote des DTA kennenlernen möchten. Es werden bewährte und zum Teil neu im DTA entwickelte Methoden und Hilfsmittel zum Aufbau und zur Analyse von Korpora vorgestellt und deren Anwendung im Rahmen praktischer Übungen eingeübt.

In zwei Themenblöcken werden die Aufbereitung von Ressourcen entsprechend den DTA-Richtlinien einerseits sowie die Arbeit mit den bestehenden DTA-Korpora andererseits näher beleuchtet.

Im Rahmen des ersten Themenblocks werden verschiedene Schritte der TEI/P5-kompatiblen Aufbereitung von Ressourcen gezeigt. Grundlage bilden dabei die im DTA-Basisformat (DTABf) zusammengefassten DTA-Richtlinien zur Transkription und zur Annotation historischer Texte. Ausgehend von verschiedenen Szenarien der Textaufbereitung (bestehende Transkriptionen aus unterschiedlichen Formaten; neue Transkriptionsvorhaben) werden Hinweise zur Zuverlässigkeit von Bildvorlagen und Transkription gegeben, Möglichkeiten der halbautomatischen Konvertierung in das DTA-Basisformat vorgeführt und anhand praktischen Übungen vermittelt; die DTABf-kompatible Textaufbereitung mithilfe des DTA-oXygen-Frameworks DTAoX wird erprobt. Darüber hinaus wird gezeigt, wie mithilfe des DTAE-Metadatenformulars ein TEI-Header mit ausführlichen Metadaten zu einem historischen Dokument erstellt werden kann. Schließlich werden Methoden der Kontrolle und Überarbeitung abgeschlossener XML-Textausgaben innerhalb der Qualitätssicherungsplattform DTAQ (Ticket-System, integrierte XML-/Text-Editoren) vorgestellt.

Der zweite Themenblock widmet sich den Inhalten der linguistischen Analyse im DTA und den Möglichkeiten der wissenschaftlichen Auswertung der DTA-Korpora. Die Teilnehmerinnen und Teilnehmer erhalten Einblicke in die Nutzung der im DTA verwendeten Suchmaschine DDC, welche die Auswertung des DTA-Gesamtkorpus sowie ausgewählter Teilkorpora in Hinblick auf bestimmte linguistische oder textstrukturelle Merkmale erlaubt. Über die im DTA verfügbaren Möglichkeiten der Visualisierung linguistischer Phänomene wird schließlich gezeigt, welche zusätzlichen Möglichkeiten die Integration der Korpustexten in die CLARIN-D-Infrastruktur bietet.

Information on participating / attending:
Eine Anmeldung bis zum 15. Juni unter dta@bbaw.de ist erforderlich

Date:

07/07/2014 09:00 - 07/07/2014 17:00

Registration deadline:

06/15/2014

Event venue:

Akademiegebäude am Gendarmenmarkt, Einstein-Saal,Jägerstrasse 22/23, 10117 Berlin
10117 Berlin
Berlin
Germany

Target group:

all interested persons

Email address:

Relevance:

international

Subject areas:

Information technology, Language / literature

Types of events:

Seminar / workshop / discussion

Entry:

06/03/2014

Sender/author:

Gisela Lerch

Department:

Presse- und Öffentlichkeitsarbeit

Event is free:

yes

Language of the text:

German

URL of this event: http://idw-online.de/en/event47498


Help

Search / advanced search of the idw archives
Combination of search terms

You can combine search terms with and, or and/or not, e.g. Philo not logy.

Brackets

You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

Phrases

Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

Selection criteria

You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).