Mit „Kmasker plants“ Genomsequenzen einfacher bearbeiten

idw – Informationsdienst Wissenschaft

Nachrichten, Termine, Experten

Grafik: idw-Logo
idw-Abo
Science Video Project


Teilen: 
20.01.2020 06:36

Mit „Kmasker plants“ Genomsequenzen einfacher bearbeiten

IPK Geschäftsstelle Presse und Öffentlichkeitsarbeit
Leibniz-Institut für Pflanzengenetik und Kulturpflanzenforschung

    - Die korrekte Charakterisierung von Pflanzengenomen kann durch große Mengen repetetitiver Sequenzen erschwert werden.
    - Forscher haben ein Bioinformatik-Tool für die automatische Erkennung repetitiver Genomabschnitte entwickelt, welches auf der Identifizierung von k-meren (Nukleotidsequenzen einer vorbestimmten Länge) aufbaut.
    - Das Werkzeug wurde unter dem Namen „Kmasker plants“ im The Plant Journal veröffentlicht.
    - „Kmasker plants“ steht als Webservice zur Verfügung oder kann installiert werden via: https://github.com/tschmutzer/kmasker.

    Gatersleben, 20.01.2020 Die Entwicklung von Next-Generation-Sequencing (NGS) hat es Forschern ermöglicht, Genome zu untersuchen, die zuvor als zu komplex oder aufgrund ihrer Größe als zu teuer galten. Trotzdem ist die Analyse komplexer Pflanzengenome, die oft einen enormen Anteil an repetitiven Sequenzen besitzen, noch immer eine Herausforderung. Daher haben Bioinformatiker des Leibniz-Instituts für Pflanzengenetik und Kulturpflanzenforschung (IPK) in Gatersleben, der Martin-Luther-Universität Halle-Wittenberg (MLU) und des Leibniz-Instituts für Pflanzenbiochemie (IPB) nun „Kmasker plants“ entwickelt – ein Programm, welches durch die Identifizierung repetitiver Sequenzen die Analyse von Pflanzengenomen vereinfacht.

    In der Bioinformatik wird der Begriff k-mer verwendet, um eine Nukleotidsequenz einer bestimmten Länge „k“ zu beschreiben. Indem sie solche Sequenzen festlegen und zählen, können Forscher sich wiederholende, also repetitive, Sequenzen in dem Genom, welches sie gerade untersuchen, quantifizieren und entsprechenden Positionen zuordnen. Bereits 2014 benutzten Wissenschaftler des IPK in Gatersleben diesen Ansatz, um das in-silico (Computer-basierte) Werkzeug „Kmasker“ zu entwicklen. Es diente der Erkennung von Wiederholungen bei der Charakterisierung des Genoms der Gerste (Schmutzer et al., 2014).
    Die Verwendung von NGS gewinnt immer weiter an Bedeutung, dennoch ist die fehlerfreie Zusammensetzung der komplexen Genome aus NGS Ergebnissen noch immer eine Herausforderung. Aus diesem Grund beschlossen die Wissenschaftler vor Kurzem, ihrer Machbarkeitsstudie neues Leben einzuhauchen und ihr Projekt zu erweitern. Angeleitet von Dr. Thomas Schmutzer, ehemals Mitglied der Arbeitsgruppe „Bioinformatik und Informationstechnologie“ des IPK, heute tätig am Institut für Agrarwissenschaften der MLU, arbeiteten Forscher der Universität in Halle, des IPK in Gatersleben, des IPB in Halle sowie von Wageningen University & Research gemeinsam an der Neukonzeptionierung und Entwicklung von „Kmasker plants“. Die Zusammenarbeit wurde von den zwei Servicezentren „GCBN“ und „CiBi“ des Deutschen Netzwerks für Bioinformatik-Infrastruktur “de.NBI” unterstützt.

    „Kmasker plants“ ermöglicht die schnelle und referenzfreie Analyse von Nukleotidsequenzen, basierend auf genomweit abgeleiteten k-meren. In Erweiterung der vorherigen Version können nun auch Vergleichsstudien zwischen verschiedenen Kultursorten oder nah verwandten Arten gemacht werden. Weiterhin ermöglicht das Tool die Identifizierung von geeigneten Sequenzen für die Fluoreszenz-in-situ-Hybridisierung (FISH) sowie von sogenannten „guide RNAs“ für die CRISPR/Cas9-basierte gezielte Veränderung von Genen. Zudem wurde „Kmasker plants“ als Webservice veröffentlicht, welcher vorberechnete Indizes für Gerste, Weizen und andere ausgewählte bedeutsame Nutzpflanzen beinhaltet. Dr. Schmutzer betont, „dass dieses Werkzeug es Pflanzenforschern auf der ganzen Welt ermöglichen wird, Pflanzengenome zu testen und so, beispielsweise, interessante Repeat-freie Sequenzen zu identifizieren.“ Außerdem sei es dank der erweiterten Features möglich, Sequenzkandidatenregionen zu finden, die sich im Genom einer Art vervielfacht haben, aber in anderen Arten fehlen oder in kleineren Kopienanzahlen vorkommen. Dies ist ein häufig auftretender Effekt, welcher zur Entstehung landwirtschaftlich wichtiger phänotypischer Variationen verschiedener Kulturarten führt. Ein bedeutsames Beispiel ist das Vrn-H2 Gen, das in Wintergerste in einer einzigen Kopie vorhanden ist, während es in Sommergerste fehlt.

    Der „Kmasker plants“ Webservice steht als Teil der IPK Crop Analysis Tool Suite (CATS) und somit als Service der de.NBI Service Plattform zur Verfügung. Alternativ kann auf den Quellcode via GitHub direkt zugegriffen und „Kmasker plants“ installiert werden.

    Original publication: Beier et al. (2019), Kmasker plants - a tool for assessing complex sequence space in plant species. The Plant Journal.
    DOI: 10.1111/tpj.14645


    Wissenschaftliche Ansprechpartner:

    Dr. Sebastian Beier
    Leibniz Institute of Plant Genetics and Crop Plant Research (IPK)
    Tel.: +49 39482 5659
    E-mail: beiers@ipl-gatersleben.de

    Dr. Thomas Schmutzer
    Martin-Luther-Universität Halle-Wittenberg (MLU)
    Tel.: +49 345 55-22692
    E-Mail: thomas.schmutzer@landw.uni-halle.de


    Originalpublikation:

    Beier et al. (2019), Kmasker plants - a tool for assessing complex sequence space in plant species. The Plant Journal. DOI: 10.1111/tpj.14645


    Merkmale dieser Pressemitteilung:
    Journalisten, Wissenschaftler
    Biologie, Informationstechnik, Mathematik
    überregional
    Forschungsergebnisse, Wissenschaftliche Publikationen
    Deutsch


    Was kurze Sequenzstücke (k-mer) verraten. Anwendungen und Methoden des bioinformatischen Tools „Kmasker plants“ zur Analyse von Sequenzdaten.


    Zum Download

    x

    Hilfe

    Die Suche / Erweiterte Suche im idw-Archiv
    Verknüpfungen

    Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.

    Klammern

    Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).

    Wortgruppen

    Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.

    Auswahlkriterien

    Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).

    Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).

    Cookies optimieren die Bereitstellung unserer Dienste. Durch das Weitersurfen auf idw-online.de erklären Sie sich mit der Verwendung von Cookies einverstanden. Datenschutzerklärung
    Okay