Informatiker der Universität Jena entwickeln neues Modell zur Datensicherung
Jena (18.07.02) In vielen Bereichen der Wirtschaft spielen heute Datenbanken eine entscheidende Rolle, um mit sehr großen Datenmengen effizient und sicher umgehen zu können. Von den Großbanken, mit ihren Millionen von Kontobewegungen pro Tag, die in Datenbanken sicher aufgezeichnet werden müssen, bis hin zu Datenbanken in der Genforschung, wo riesige Informationsmengen erzeugt und aufbewahrt werden. Solche Daten sind Teil des Kapitals dieser Unternehmen und müssen daher sorgfältig geschützt werden. Sie dürfen unter keinen Umständen, z. B. bei einem Stromausfall oder Computerabsturz, verloren gehen. Wie sie schnell und zuverlässig gesichert und nach Störungen wiederhergestellt werden können, haben jetzt Informatiker der Friedrich-Schiller-Universität Jena untersucht.
Man benutzt in der industriellen Praxis Verfahren, wie sie auch am heimischen PC üblich sind: Von wichtigen Daten werden regelmäßig Sicherungskopien angefertigt (Backup). Im Fehlerfall ist man dann in der Lage, die Datenbank von der Sicherungskopie aus wiederherzustellen (Restore). Allerdings umfassen industrielle Datenbanken mehrere Millionen oder gar Milliarden Datensätze, so dass eine Sicherung viele Stunden dauern kann. Die normale Datenbanknutzung wird dabei behindert oder es reicht der geplante Zeitraum, etwa in den Nachtstunden, gar nicht mehr aus, um die Datensicherung fertig zu stellen.
In Praxis und Wissenschaft existieren natürlich Lösungsvarianten für diese Problematik, beispielsweise indem man nur Teile der Datenbanken sichert. "Trotz allem ist die schiere Menge der zu kopierenden Daten der begrenzende Faktor", erklärt der Jenaer Informatiker Christoph Gollmick. Er setzt darauf, Parallelität bei Sicherung und Wiederherstellung auszunutzen. Dabei wird nicht nur auf einer Festplatte gespeichert, sondern gleichzeitig auf mehreren Festplatten parallel, womit ein deutlicher Zeitvorteil erzielt wird.
Wie steuert man aber in der Praxis das Kopieren einer Datenbank, die auf 50 oder mehr Festplatten gespeichert ist und deren Sicherungskopie auf 16 Festplatten verteilt werden soll? In welcher Reihenfolge geht man vor, und wie stellt man sicher, dass im Fehlerfall auch das Wiederherstellen schnell geht? Diese und weitere Fragen wurden von Jenaer Informatikern erstmalig wissenschaftlich untersucht.
Am Lehrstuhl für Datenbanken und Informationssysteme der Friedrich-Schiller-Universität haben Christoph Gollmick und Dr. Uta Störl nun verschiedene Verfahren entwickelt und getestet, um paralleles Sichern und paralleles Wiederherstellen geeignet durchzuführen. Ein Referenzsystem für die Untersuchungen war dabei das Datenbankprodukt "DB2" der Firma IBM, einem langjährigen Partner des Lehrstuhls. Mit Hilfe eines neu entwickelten Puffer-Prozess-Modells sind die Jenaer Informatiker in der Lage, alle möglichen Varianten für das parallele Sichern und Wiederherstellen zu programmieren. Diese Flexibilität erlaubt es, nicht nur schnelle Verfahren, sondern auch Robustheit gegenüber Störungen anzubieten. So kann eine lang laufende Sicherung z. B. auch dann fortgesetzt werden, wenn bei einem der parallel eingesetzten Sicherungsgeräte die Elektronik ausfällt.
Die beiden Jenaer Informatiker - Dr. Uta Störl arbeitet nach abgeschlossener Promotion mittlerweile bei der Dresdner Bank in Frankfurt - hoffen, dass ihre Verfahren bald in kommerzielle Datenbankprodukte einfließen, da diese, wie ihre Recherchen zeigten, paralleles Sichern und paralleles Wiederherstellen meist nur rudimentär beherrschen.
Kontakt:
Dipl.-Inf. Christoph Gollmick
Institut für Informatik der Universität Jena
Ernst-Abbe-Platz 2, 07743 Jena
Tel. 03641/946367
Fax: 03641/946302
E-Mail: gollmick@informatik.uni-jena.de
Merkmale dieser Pressemitteilung:
Informationstechnik
überregional
Forschungsergebnisse
Deutsch
Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).