Die Bedeutung des Textmining in Pharmazie, Medizin, Chemie und Biologie wird in Zukunft weiter wachsen. Das ist das Fazit eines Symposiums zum Einsatz von Textmining-Verfahren in den Life Sciences am 5. Oktober auf Schloss Birlinghoven in Sankt Augustin. Bereits zum zweiten Mal hatten das Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen (SCAI) und das Softwareunternehmen TEMIS (Heidelberg) Experten aus Industrie und akademischer Forschung zu einem Erfahrungsaustausch eingeladen.
In diesen Gebieten Fachleuten ist es aufgrund der enormen Menge der Literatur längst praktisch unmöglich, selbst in eng umrissenen Arbeitsgebieten alle relevanten Veröffentlichungen zu verfolgen und zu berücksichtigen. Daher ist der Bedarf nach automatischen Verfahren zur Analyse großer Textmengen, dem so genannten Textmining, in den Life Sciences seit jeher groß und nimmt weiter zu. Wo und in welcher Form derartige Methoden heute bereits eingesetzt werden, aber auch, was an Fragen in der nahen Zukunft noch zu lösen sein wird, stellten Experten in Fachvorträgen und Systemvorführungen vor.
Die Beteiligung von circa 50 Experten vorwiegend aus der europäischen pharmazeutischen Industrie verdeutlichte nicht nur, welche Bedeutung dem Thema Textmining dort inzwischen beigemessen wird, sondern kann auch als Beleg für ein erfolgreiches Beispiel der Zusammenarbeit zwischen öffentlicher Forschung und Privatwirtschaft gesehen werden: Die beiden Veranstalter SCAI und TEMIS kooperieren seit zwei Jahren eng bei der Entwicklung innovativer Produkte und Dienstleistungen. Wie nahe auf diesem Gebiet Systeme im produktiven Einsatz einerseits und offene Forschungsfragestellungen andererseits beieinander liegen, wurde im Vortragsprogramm deutlich.
Georg Rosenfeld von der Zentralverwaltung der Fraunhofer-Gesellschaft (FhG) unterstrich die Bedeutung und das Potenzial von Textmining als Zukunftstechnologie, und erklärte, das Thema sei für die FhG einer der Schwerpunkte der anwendungsorientierten Forschung, denen man in den kommenden Jahren besondere Bedeutung beimessen werde. Sophia Ananiadou vom nationalen Zentrum für Textmining in Großbritannien beschrieb in ihrem Beitrag die enormen Anforderungen an die Verarbeitung biomedizinischer Daten, die sich nicht zuletzt aus der Größe und Komplexität der verwendeten Terminologien ergeben. Udo Hahn von der Universität Jena gab den Zuhörern einen breiten Überblick über die notwendigen sprachverarbeitenden Verfahren, die die Computerlinguistik für derartige Aufgaben bereithält.
Wie die Umsetzung der Analyse-Anforderungen aus der Pharma- und Chemiebranche bei einer industriell einsetzbaren Software aussieht, beschrieb Günther Kurapkat von TEMIS in Heidelberg. Eine offene Architektur, die die Möglichkeit zur Integration aufgabenspezifischer Wissensquellen einerseits mit generellen Verfahren der Verarbeitung von geschriebener Sprache andererseits unterstützt, ist die Voraussetzung für eine breite Einsetzbarkeit in unterschiedlichen Szenarien in den Life Sciences.
Dass dieses Konzept bei TEMIS keine Zukunftsmusik ist, sondern sich heute bereits vielfach im produktiven Einsatz befindet, wurde in den anschließenden Präsentationen von Eric Ferrandis von IPSEN Pharma, Helmut Grotz von MDL Informationssysteme und Mathias Göschl von LION Bioscience deutlich. Bei IPSEN werden mit einer von TEMIS und SCAI gemeinsam entwickelten Software Informationen über die Interaktion von Proteinen aus wissenschaftlichen Publikationen extrahiert. MDL verwendet dieselben Systeme, um automatisch Informationen über chemische Reaktionen zu ermitteln, während LION die Software von TEMIS als Basis der Text-Mining-Funktionalitäten seiner Systeme SRS und LTE gewählt hat.
Ein Anwendungsbeispiel aus der Pflanzenbiologie beschrieb Juliane Fluck vom SCAI, die mithilfe einer angepassten Komponente zur Erkennung von Proteinen der Arabidopsis thaliana den normalerweise rein manuellen Prozess der Annotierung von Information in eine Pflanzenontologie erheblich effizienter gestalten konnte. Martin Hofmann, Leiter der Abteilung Bioinformatik am SCAI, betrat in seinem abschließenden Vortrag Neuland, als er Arbeiten am SCAI vorstellte, die die automatische Ermittlung chemischer Strukturinformationen aus Grafiken beschrieb.
Über SCAI
Die Abteilung Bioinformatik am Fraunhofer Institut SCAI forscht in enger Kooperation mit der Industrie auf den Gebieten
- semantischen Textanalyse und Textmining in den Life Sciences und der Medizin,
- semantische Services im Kontext des Grid-Computing und
- angewandte Chemieinformatik.
Zu den Kunden und Kooperationspartnern gehören NEC, Lion Bioscience, TEMIS, BioSoveIT und AVENTIS Pharma sowie die Max-Planck-Institute für Molekulare Pflanzenphysiologie (Golm) und für Informatik (Saarbrücken).
Über TEMIS
TEMIS ist das führende europäische Softwareunternehmen im Bereich Textmining in den Life Sciences. Vom Hauptsitz in Paris und den Niederlassungen in Deutschland, Italien, Großbritannien und den USA aus arbeitet TEMIS mit Kunden wie Novartis, Roche, IPSEN und MDL, aber auch mit Unternehmen aus anderen Bereichen wie TotalFinaElf, DaimlerChrysler, Credit Lyonnais oder LexisNexis am Einsatz von Textmining Verfahren in unterschiedlichsten Szenarien wie Klassifikation und Indexierung, Patentanalyse, Markt- und Mitbewerberbeobachtung oder Kundenfeedbackanalyse.
Ansprechpartner:
TEMIS Deutschland GmbH
Stefan Geißler
Tel.: 06221 / 13753-12
stefan.geissler@temis-group.com
www.temis-group.com
Fraunhofer-Institut für Algorithmen und Wissenschaftliches Rechnen (SCAI)
Abteilung Bioinformatik
Dr. Martin Hofmann
Tel. 02241 / 14-2802
martin.hofmann@scai.fraunhofer.de
www.scai.fraunhofer.de
http://www.temis-group.com
http://www.scai.fraunhofer.de/bio.html
Merkmale dieser Pressemitteilung:
Biologie, Chemie, Ernährung / Gesundheit / Pflege, Informationstechnik, Medizin, Wirtschaft
überregional
Buntes aus der Wissenschaft, Forschungsprojekte, Wissenschaftliche Tagungen
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).