idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
Science Video Project
idw-Abo

idw-News App:

AppStore

Google Play Store

Event


institutionlogo


10/30/2019 - 11/01/2019 | Darmstadt

Textforensik mit NLP und maschinellem Lernen

Ein Großteil der weltweit verfügbaren Informationen liegt als Text vor. Das Suchen nach relevanten Informationen im Text, um z.B. Texte nach Themen oder Stimmungen einzuordnen oder den Autor zu identifizieren, ist für viele Anwendungen wichtig. Herausforderungen hierbei sind Unstrukturiertheit von Texten oder das Fehlen von Metadaten.
Um trotzdem relevante Informationen aus Texten abzuleiten, lernen Sie Methoden der Natürlichen Sprachverarbeitung (NLP) und des maschinellen Lernens (ML) kennen.

Der Kurs kombiniert Linguistik und Informatik. Ihnen werden Methoden der digitalen Textforensik vermittelt, mit Schwerpunkt auf NLP und ML. Sie lernen, wie Textdaten maschinenlesbar bereinigt und strukturiert und wie relevante Merkmale aus den verarbeiteten Texten gewonnen werden können.

Sie lernen verschiedene ML-Methoden kennen, etwa zum automatischen Klassifizieren von Texten oder zum Herauslesen von Stimmungen und Meinungen im Text. Ebenso lernen Sie Evaluierungstechniken kennen, mit denen Sie die Güte der ML-Verfahren messen können. Diese Kenntnisse werden Sie in praktischen Übungen am PC vertiefen, etwa mit den Werkzeugen NLTK, Spacy oder Pattern.

Inhalt

Grundlagen digitaler Textforensik
Korpuserstellung und -strukturierung
Datenbereinigung (z.B. Rauschen aus Texten entfernen)
Werkzeuge des Preprocessings (NLTK, Spacy, Pattern, etc.)
Merkmalsextraktion (Feature Engineering), um Texte entsprechend der Problemstellung zu repräsentieren
Modellbildung
praxisnahe Übungen zu Anwendungsbeispielen: Erkennung von Schreibstilen, Sprachprofiling, Stimmungsanalyse in Texten, automatische Textklassifikation
Visualisierung der gewonnenen Informationen

Nach dem Seminar können Sie...

Grundlegende Problemstellungen hinsichtlich der Verarbeitung von Textdaten selbstständig lösen
Texte bereinigen, strukturieren sowie wichtige Merkmale erkennen bzw. extrahieren, um Texte entsprechend der Aufgabenstellung zu repräsentieren
Modelle bilden, mit deren Hilfe Texte klassifiziert werden können
Autorenstile erkennen, charakteristische Eigenschaften des Autors (z.B. Geschlecht, Alter, Bildungsniveau oder Sprachdialekte) bestimmen oder die Stimmung aus Texten ableiten

Dieses Seminar bietet Ihnen...

Vermittlung gängiger Methoden und Werkzeuge der digitalen Textforensik
Erkenntnisse aus dem aktuellen Forschungsstand in NLP und ML
Praxistipps aus unserer eigenen Gutachtertätigkeit in diesem Bereich
viele praxisnahe Übungen anhand von Fallbeispielen
Austausch mit Experten und Vernetzung mit anderen Anwendern der Computerlinguistik und der Text-Forensik

Information on participating / attending:

Date:

10/30/2019 - 11/01/2019

Event venue:

Fraunhofer SIT
Rheinstraße 75
64295 Darmstadt
Hessen
Germany

Target group:

Business and commerce, Scientists and scholars

Relevance:

transregional, national

Subject areas:

Economics / business administration, Information technology, Media and communication sciences

Types of events:

Seminar / workshop / discussion

Entry:

07/19/2019

Sender/author:

MA Anna Spiegel

Department:

Presse- und Öffentlichkeitsarbeit

Event is free:

no

Language of the text:

German

URL of this event: http://idw-online.de/en/event64269


Help

Search / advanced search of the idw archives
Combination of search terms

You can combine search terms with and, or and/or not, e.g. Philo not logy.

Brackets

You can use brackets to separate combinations from each other, e.g. (Philo not logy) or (Psycho and logy).

Phrases

Coherent groups of words will be located as complete phrases if you put them into quotation marks, e.g. “Federal Republic of Germany”.

Selection criteria

You can also use the advanced search without entering search terms. It will then follow the criteria you have selected (e.g. country or subject area).

If you have not selected any criteria in a given category, the entire category will be searched (e.g. all subject areas or all countries).