Nachricht vom

Absolvierende bereiten sich auf ihre Promotion vor, Postdocs unterstützen sie dabei – das ist das Prinzip des Pre-Doc Awards der Universität Leipzig. Im vergangenen Herbst startete die achte Kohorte mit 13 Tandems in ihre einjährige Förderphase. Mit dabei sind auch Informatiker Charly Zimmer und Geophysikerin Dr. Josefine Umlauft, die im ScaDS.AI an der Verwendung von generativer KI für Vorhersage- und Prognoseaufgaben in den Erdsystemwissenschaften forschen. Das Universitätsmagazin hat das Tandem besucht.

Wie habt ihr euch als Tandem für den Pre-Doc Award gefunden?

Charly Zimmer: Ich habe im Master Data Science an der Uni Leipzig studiert und habe im vergangenen Sommersemester angefangen, nach einem Thema für meine Masterarbeit zu suchen. Dann bin ich aufs ScaDS.AI gekommen und war mit Josefine im Kontakt, um ein Thema zu erarbeiten. Im Oktober war ich mit der Masterarbeit fertig und wollte dann noch die Promotion anschließen. Nur war es damals nicht möglich für uns, direkt eine Promotionsfinanzierung aufzutreiben und deswegen war dann das Pre-Doc Programm eine gute Möglichkeit, mich in dem Thema weiter zu fördern und daran weiterarbeiten zu können. 

Was ist das Thema Ihres Promotionsvorhabens?

Zimmer: Das Thema ist Datenrekonstruktion in Fernerkundungsdaten, sogenannte Remote Sensing Daten. Das sind Daten, die mit Satelliten aufgenommen werden, zum Beispiel Oberflächentemperatur, Bodenfeuchte oder Vegetationsbedeckung. Durch verschiedene Faktoren, vor allem durch Wolkenverdeckungen und Satellitenlaufbahnen, haben diese Daten oft sehr große Lücken. Für die Verarbeitung und für die Analyse von den Daten ist es aber hinderlich, wenn Lücken vorliegen. Deswegen haben wir ein System entwickelt, das mithilfe von Deep-Learning-Methoden über die fehlenden Daten Vorhersagen macht. 

Deep Learning ist eine Form der Künstlichen Intelligenz (KI), die auf tiefen neuronalen Netzen basiert. Diese Netze ermöglichen es, komplexe Muster in großen Datenmengen zu erkennen und zu lernen.

Josefine Umlauft: Stellen Sie sich einen Satelliten vor, der über Leipzig die Oberflächentemperatur misst. Jetzt ist aber gerade eine Wolke über Leipzig an Tag X der Messungen oder die Flugbahn des Satelliten deckt eben Leipzig gar nicht ab. Wir wollen aber gerne genau an Tag X wissen, wie die Temperatur war. Dann kann man schauen: Wie war es denn ein paar Tage davor oder ein paar Tage danach bzw. in der Nähe von Leipzig? Aus diesen Informationen kann man dann mithilfe von Deep Learning ziemlich gute Vorhersagen für Tag X machen. 

Wie geht ihr mit potentiellen Fehlern um, die durch Künstliche Intelligenz hervorgerufen werden? Halluzinationen sind zum Beispiel bei generativer KI wie ChatGPT ein großes Thema.

Zimmer: Es ist immer schwer nachzuvollziehen, warum das System genau auf die Resultate kommt, die es dann berechnet. Bei meinem Thema kann man sich immer auf die optische Kohärenz beziehen, das heißt: Sehen die Vorhersagen passend aus? Passen die Vorhersagen zu den Werten, die für diese Region und um diese Zeit wirklich vorliegen? Außerdem haben wir versucht, uns vor allem über Verteilungen anzuschauen, ob die Werte, die vorhergesagt werden, in dem Wertebereich liegen, wo sie ungefähr liegen sollten. 

Umlauft: Was Charly auch gemacht hat, sind synthetische Tests, bei denen man künstliche Lücken erzeugt. Dafür nimmt man einen Datensatz, der keine Lücken aufweist und schneidet da künstlich Lücken rein. Dann schaut man, was die KI macht und vergleicht es mit den realen Daten. Wenn man das in einem gewissen Umfang durchexerziert, in Raum und Zeit und verschiedene Szenarien testet, dann bekommt man ein ganz gutes Gefühl dafür, ob es in die richtige Richtung geht.

Welche Relevanz hat das Thema denn in einem größeren Kontext der Umwelt- und Klimaforschung?

Umlauft: Die Satelliten-Umlaufbahnen verursachen wirklich sehr große Lücken und auf einer Karte fehlen oft große Streifen an Daten, teilweise ganze Länder. Wenn man aber vorhersagen möchte, wie sich das Klima oder bestimmte Parameter in der Zukunft verhalten werden, sind diese Daten die Grundlage dafür. Je mehr fehlt, umso schlechter also die Vorhersage. 

Zimmer: Man kann die Arbeit als Vorverarbeitungsschritt verstehen, wo dann andere Arbeiten ansetzen können und die lückengefüllten Daten für Analysen oder Vorhersagen verwendet werden können.

zur Vergrößerungsansicht des Bildes: Zu sehen ist Charly Zimmer bei seiner Präsentation des Forschungsvorhabens. Er steht vor einem großen Monitor.
Predoc Charly Zimmer beim Kick off der Kohorte 2024/25. Dem Tandem mit Dr. Josefine Umlauft steht auch Prof. Dr. Miguel Mahecha zur Seite. Foto: Christian Hüller/Universität Leipzig

Wie haben Sie sich für eine Promotion entschieden?

Zimmer: Das war für mich ein langer Entscheidungsprozess. Ich habe schon während des Masterstudiums überlegt: Will ich jetzt arbeiten? Will ich jetzt promovieren? Ich hatte schon verschiedene Anstellungen, auch als SHK und WHK und hatte da schon einen Einblick in die Forschung bekommen, wusste aber da noch nicht so richtig, ob das das ist, was ich machen möchte. 

Durch die Masterarbeit habe ich dann gemerkt, wieviel Spaß ich doch an Forschung habe. Das war dann am Ende für mich der ausschlaggebende Faktor, wegen dem ich gesagt habe, ich gehe die Promotion an und ich kann mir sicher sein, dass es das ist, was ich wirklich machen möchte. Mit Data Science kann man in vielen verschiedenen Bereichen arbeiten. Vorher habe ich an Sprachverarbeitung gearbeitet, das hat auch Spaß gemacht. Aber jetzt mit dem Gebiet Klima- und Umweltforschung habe ich etwas gefunden, wo ich wirklich dahinter stehe und woran ich weiter arbeiten möchte.

Was bringt Ihnen beiden der Pre-Doc Award? 

Zimmer: Für mich ist der Pre-Doc Award eine Chance, um in erster Linie einen Einblick in die Wissenschaft zu bekommen und auch, um einen Fuß in die Tür zu stellen und einfach erst mal anfangen können zu forschen. Dadurch wird man ja auch gesehen von Leuten in dem Forschungsgebiet, kann sich mit denen austauschen. Und gerade wenn sich dann Förderungsmöglichkeiten ergeben, ist man vielleicht derjenige, der zuerst angesprochen wird, weil man schon auf dem Radar ist. Auch die Vernetzung mit den anderen Pre-Docs hilft sehr gut weiter.

Umlauft: Das sehe ich auch so. Ich finde grundsätzlich, dass das Verfahren gerade im Vergleich zu klassischen DFG- oder BMBF-Anträgen sehr niederschwellig war und eine Flexibilität schafft. Wenn man gerade einen Studierenden mit Talent und Motivation hat und keine Zeit hat, neun Monate zu warten, bis man irgendwann eine 50/50-Antwort bekommt, kann man schon ein bisschen was anbieten und jemandem wie Charly die Möglichkeit geben, weiter an dem Thema zu arbeiten. 

Zurückdenkend an meine Master- und Doktorandenzeit ist die Masterarbeit natürlich schon ein bisschen wissenschaftliches Arbeiten, aber es ist eben noch nicht das Paper schreiben oder am Antrag arbeiten. So viel Forschungsalltag kriegt man noch nicht mit. Mit dem PreDoc-Award hat man dagegen die Möglichkeit zu gucken: Wie ist das für dich? Kannst du dir wirklich vorstellen, in dem Feld zu arbeiten, das Thema weiterzuentwickeln? Dafür hat man sonst ja gar keine Zeit. 

Zimmer: Ich glaube auch, es ist wenig Zeit, sich während des Masterstudiums und auch während der Masterarbeit nebenbei um eine Stelle zu kümmern, gerade wenn man promovieren möchte, gerade wenn man in Leipzig bleiben möchte.

Wo sehen Sie sich am Ende des Jahres?

Zimmer: Optimalerweise bin ich Ende des Jahres hier am ScaDS.AI als Promotionsstudent angestellt und habe dann die Sicherheit, dass ich die nächsten Jahre in dem Themengebiet weiterarbeiten kann.

Mit dem Pre-Doc Award fördert die Universität Leipzig auf der einen Seite Studienabsolvent:innen während der Promotionsvorbereitung, auf der anderen Seite Postdocs in ihrer Fähigkeit, (zukünftige) Promovierende zu betreuen. Der Award stellt zudem eine Auszeichnung für bisherige Studienleistungen (für Predocs) bzw. Forschungsleistungen und Drittmittelerfolge (für Postdocs) dar. Ziel ist es, innerhalb der Förderphase des Pre-Doc Awards das Promotionsprojekt gemeinsam auszureifen und eine Finanzierung dafür einzuwerben.

Die Ausschreibung für die nächste Kohorte läuft bis 31. Mai 2025.

Kommentare

Keine Kommentare gefunden!

Ihr Kommentar

Hinterlassen Sie gern einen Kommentar. Bitte beachten Sie dafür unsere Netiquette.