Der Kurs kombiniert Linguistik und Informatik. Ihnen werden Methoden der digitalen Textforensik vermittelt, mit Schwerpunkt auf NLP und ML. Sie lernen, wie Textdaten maschinenlesbar bereinigt und strukturiert und wie relevante Merkmale aus den verarbeiteten Texten gewonnen werden können.
Sie lernen verschiedene ML-Methoden kennen, etwa zum automatischen Klassifizieren von Texten oder zum Herauslesen von Stimmungen und Meinungen im Text. Ebenso lernen Sie Evaluierungstechniken kennen, mit denen Sie die Güte der ML-Verfahren messen können. Diese Kenntnisse werden Sie in praktischen Übungen am PC vertiefen, etwa mit den Werkzeugen NLTK, Spacy oder Pattern.
Inhalt
Grundlagen digitaler Textforensik
Korpuserstellung und -strukturierung
Datenbereinigung (z.B. Rauschen aus Texten entfernen)
Werkzeuge des Preprocessings (NLTK, Spacy, Pattern, etc.)
Merkmalsextraktion (Feature Engineering), um Texte entsprechend der Problemstellung zu repräsentieren
Modellbildung
praxisnahe Übungen zu Anwendungsbeispielen: Erkennung von Schreibstilen, Sprachprofiling, Stimmungsanalyse in Texten, automatische Textklassifikation
Visualisierung der gewonnenen Informationen
Nach dem Seminar können Sie...
Grundlegende Problemstellungen hinsichtlich der Verarbeitung von Textdaten selbstständig lösen
Texte bereinigen, strukturieren sowie wichtige Merkmale erkennen bzw. extrahieren, um Texte entsprechend der Aufgabenstellung zu repräsentieren
Modelle bilden, mit deren Hilfe Texte klassifiziert werden können
Autorenstile erkennen, charakteristische Eigenschaften des Autors (z.B. Geschlecht, Alter, Bildungsniveau oder Sprachdialekte) bestimmen oder die Stimmung aus Texten ableiten
Dieses Seminar bietet Ihnen...
Vermittlung gängiger Methoden und Werkzeuge der digitalen Textforensik
Erkenntnisse aus dem aktuellen Forschungsstand in NLP und ML
Praxistipps aus unserer eigenen Gutachtertätigkeit in diesem Bereich
viele praxisnahe Übungen anhand von Fallbeispielen
Austausch mit Experten und Vernetzung mit anderen Anwendern der Computerlinguistik und der Text-Forensik
Information on participating / attending:
Date:
09/30/2019 - 10/02/2019
Event venue:
Fraunhofer SIT
Rheinstraße 75
64295 Darmstadt
Hessen
Germany
Target group:
Business and commerce, Scientists and scholars
Email address:
Relevance:
transregional, national
Subject areas:
Economics / business administration, Information technology, Media and communication sciences
Types of events:
Seminar / workshop / discussion
Entry:
07/19/2019
Sender/author:
MA Anna Spiegel
Department:
Presse- und Öffentlichkeitsarbeit
Event is free:
no
Language of the text:
German
URL of this event: http://idw-online.de/en/event64268
You can combine search terms with and, or and/or not, e.g. Philo not logy.
You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).
Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.
You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).
If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).