In der Softwareentwicklung werden die große Sprachmodelle (LLMs) bereits umfänglich genutzt. Fähigkeiten wie den generierten Code auch auszuführen oder Dateien zu bearbeiten, würden die Produktivität weiter steigern. Agentische Programmierassistenten (KI-Agenten), die das können, gibt es bereits. Sie weisen jedoch Einschränkungen auf, insbesondere in Bezug auf Sicherheit und Datenschutz, was ihre breite Einführung in der Wissenschaft und Industrie behindert. Das am Center for Advanced Systems Understanding des HZDR entwickelte Framework Terok ermöglicht Software-Entwickler*innen nun eine verantwortungsvollere Auseinandersetzung mit den Möglichkeiten von KI-Agenten.
KI-gestütztes Programmieren ist eine neuartige, spannende und bahnbrechende Technologie, die in Wissenschaft und Industrie schnell angenommen wurde. In einem „Chatbot-Modus“ kommuniziert der Programmierer mit einem LLM. Nutzerinnen müssen dabei sogenannte Prompts formulieren, um den gewünschten Code vom LLM zu erhalten. Dieser Code muss dann vom Chatbot in das Softwareprojekt übertragen werden. Agentische Programmierassistenten sind noch leistungsfähiger. Sie können ebenso Code schreiben, aber auch selbständig Dateien lesen, Code ausführen sowie auf Resultate dieser Aktionen reagieren. Der Ansatz ähnelt dem, den ein Mensch verfolgen würde. Nutzer und Nutzerinnen, die mit diesen Programmierassistenten arbeiten, berichten von einem minimalen Bedarf an Benutzerinteraktion, da die KI-Agenten autonom und selbst-korrigierend arbeiten.
„In der Programmierwelt wird derzeit diskutiert, wie man mit agentischen Programmierassistenten umgehen soll“, sagt Dr. Andreas Knüpfer, Leiter des CASUS Scientific Computing Core (SCC)-Teams. „Die Meinungen reichen von ‚Es ist durch und durch böse und niemand sollte es anfassen‘ bis hin zu ‚Morgen werden alle Programmierer durch KI ersetzt sein‘. Mit beiden Extremen haben wir nicht viel am Hut.“ Das SCC-Team erkannte das enorme Potenzial für das Programmieren im Allgemeinen und auch speziell für das wissenschaftliche Programmieren. Reale Anwendungsfälle aus der Wissenschaft mit bereits verfügbaren KI-Agenten zu nutzen, kam jedoch nicht in Frage. Agentische KI-Systeme sind am leistungsfähigsten, wenn der Agent weitgehend uneingeschränkt läuft. Sie bieten dann aber keinen Schutz vor Sabotageakten oder Fehlfunktionen. Im ersten Fall können sensible Daten wie Passwörter gestohlen werden. Im zweiten Fall können die Agenten wichtige Daten löschen. Terok geht daher auf eine lange Liste potenzieller Gefahrenherde ein, die in der Vergangenheit bereits aktiv ausgenutzt wurden.
Arbeit mit realen Daten aus aktuellen Projekten
„Um das volle Potenzial dieses neuen KI-Agenten-Modus auszuschöpfen, müssen wir in der Lage sein, reale Daten aus relevanten Projekten zu nutzen“, sagt der leitende Entwickler Dr. Jiří Vyskočil. „Wir wollten verschiedene LLMs und Softwaretools miteinander vergleichen können – ihre Eignung für unterschiedliche Programmieraufgaben, ihre Potenziale und ihre Fallstricke. Deshalb haben wir Ende 2025 mit der Arbeit an Terok begonnen.“
Das quelloffene Framework Terok nutzt Containerisierung und eine Reihe zusätzlicher Sicherheitsfunktionen, um das Verhalten der Agenten auf lokaler Hardware zu kontrollieren. Terok selbst ist kein KI-Agent. Vielmehr ermöglicht es den Nutzerinnen und Nutzern, zwischen verschiedenen LLMs zu wechseln, auf die sie Zugriff haben. „Egal, welches LLM oder welcher Agent verwendet wird, Terok bietet Schutz“, erklärt Vyskočil. Direkt einsatzbereit sind führende kommerzielle Agenten wie Claude des US-Unternehmens Anthropic sowie solche aus dem akademischen Sektor in Deutschland wie Blablador und KISSKI Chat AI. Selbstverständlich lässt sich Terok mit selbst gehosteten LLMs verbinden. Zudem ermöglicht Terok die Verwaltung mehrerer Projekte mit parallelen Aufgaben in jedem Projekt und bietet eine vorgefertigte Umgebung mit einfacher Installation.
„Terok kann als Sicherheitsnetz für agentische KI betrachtet werden“, sagt Knüpfer. „Als junges akademisches Projekt in einem sich rasant entwickelnden Bereich ist es sicherlich noch nicht voll ausgereift und abgeschlossen. Aber es macht einen großen Unterschied im Vergleich zum naiven Einsatz agentischer LLMs auf dem eigenen Laptop ohne ein solches Netz. Anwenderinnen und Anwender können nun endlich erfahren, wie sich all diese verschiedenen LLMs hinsichtlich ihrer Fähigkeiten sowie der Kosten für spezifische Aufgaben unterscheiden. Für uns im Team ist Terok wie der Schlüssel zu einem Abenteuerspielplatz, der bisher tabu war.“
CASUS-Direktor Prof. Thomas D. Kühne ist ein aktiver Terok-Nutzer. Er motiviert seine Arbeitsgruppe, dieses neue Tool auszuprobieren: „Ich stand den bisherigen Alternativen bis hin zu OpenClaw aus verschiedenen Gründen skeptisch gegenüber. Jetzt arbeite ich seit einigen Wochen mit Terok und muss zugeben, dass ich total begeistert bin. Aufgaben, deren Erledigung früher Wochen dauerte, lassen sich nun in einem halben Tag bewältigen.” Das SCC-Team freut sich sehr auf Rückmeldungen aus der Community und heißt jeden willkommen, der bei der Weiterentwicklung von Terok mithelfen möchte.
Dr. Andreas Knüpfer | Forschungsgruppenleiter
Center for Advanced Systems Understanding (CASUS) am HZDR
a.knuepfer@hzdr.de
https://www.casus.science/?page_id=20994
Mit Terok durchgeführtes Projekt zur Berechnung der Wärmeleitungsgleichung.
Quelle: A. Knüpfer/CASUS
Merkmale dieser Pressemitteilung:
Journalisten, Studierende, Wirtschaftsvertreter, Wissenschaftler, jedermann
Chemie, Informationstechnik, Physik / Astronomie, Werkstoffwissenschaften
überregional
Forschungs- / Wissenstransfer, Forschungsergebnisse
Deutsch

Sie können Suchbegriffe mit und, oder und / oder nicht verknüpfen, z. B. Philo nicht logie.
Verknüpfungen können Sie mit Klammern voneinander trennen, z. B. (Philo nicht logie) oder (Psycho und logie).
Zusammenhängende Worte werden als Wortgruppe gesucht, wenn Sie sie in Anführungsstriche setzen, z. B. „Bundesrepublik Deutschland“.
Die Erweiterte Suche können Sie auch nutzen, ohne Suchbegriffe einzugeben. Sie orientiert sich dann an den Kriterien, die Sie ausgewählt haben (z. B. nach dem Land oder dem Sachgebiet).
Haben Sie in einer Kategorie kein Kriterium ausgewählt, wird die gesamte Kategorie durchsucht (z.B. alle Sachgebiete oder alle Länder).