Mit maschinellem Lernen in neue Wissenschaftsfelder eintauchen
Jakob Macke, Professor für Maschinelles Lernen in der Wissenschaft, sprach mit uns über Gemeinsamkeiten und Unterschiede von Computational Neuroscience und Maschinellem Lernen - und den Spaß am Eintauchen in verschiedene wissenschaftliche Bereiche.
Jakob Macke, © Friedhelm Albrecht/ Universität Tübingen
BN, Duppé: Herr Macke, Sie wurden letztes Jahr auf die Professur „Maschinelles Lernen in der Wissenschaft“ an der Universität Tübingen berufen, die im Rahmen des Exzellenzclusters “Maschinelles Lernen – Neue Perspektiven für die Wissenschaften” eingerichtet wurde. Wie sind Sie als etablierter Neurowissenschaftler zum Maschinellen Lernen gekommen?
Macke: In meiner Forschung habe ich mich immer sowohl für maschinelles Lernen, als auch für Neurowissenschaften interessiert. Hier baut die Computational Neuroscience ja genau die Brücke zwischen den Disziplinen. In Tübingen wird sich jetzt der Fokus meiner Forschung erweitern: Im Exzellenzcluster gehen wir nicht ‚nur‘ Anwendungen in den Neurowissenschaften nach, sondern arbeiten auch an Anwendungen für und in anderen Bereichen.
Anders herum gefragt: Wie sind Sie eigentlich Neurowissenschaftler geworden?
Ich habe ursprünglich Mathematik studiert und ich habe mich schon damals für maschinelles Lernen und Statistik interessiert. Als Student kam dann das Interesse für die Neurowissenschaften dazu. Ich habe mich eigentlich immer gefragt: Wie kommt die Welt in unseren Kopf? Wie messen wir mit unserem Sinnesorganen Umwelteinflüsse und schaffen daraus ein Modell unserer Welt, welches uns erlaubt Handlungen auszuführen? Konkret habe ich dann einen Sommer in einem neurowissenschaftlichen Labor in Cold Spring Harbor in New York verbracht und dort experimentelle Daten aus der 2-Photonen Mikroskopie analysiert. Dank dieser praktischen Erfahrung habe ich mich dann entschieden, meine Promotion nicht in der Mathematik oder der Statistik auszuführen, sondern Neurowissenschaften und maschinelles Lernen zu verbinden.
Damit schlagen Sie ja im Grunde eben jene Brücke, die Computational Neuroscience ausmacht: experimentelle Daten mittels Algorithmen zu interpretieren und zu verarbeiten. Wo liegt der Unterschied zum Maschinellem Lernen an sich?
Eigentlich sind es ja zwei getrennte Disziplinen, die jeweils ihr eigenes wissenschaftliches Arbeiten haben. Sie überlappen aber auch: Computational Neuroscience beschäftigt sich grundsätzlich mit der Frage, wie man mit Hilfe mathematischer oder rechnerischer Modellierung die Nervensysteme besser verstehen kann.
Also versucht man konkrete experimentelle Befunde mit Hilfe von Modellen zu erklären. Die experimentelle Beobachtung könnte folgendermaßen lauten: Während einer Gedächtnisaufgabe feuern einige Neuronen im Gehirn stark. Die Modellierungsaufgabe besteht darin, ein Modell zu finden, das erklärt warum das so ist: Was sind die neuronalen Grundlagen? Welchen Zweck mag das erfüllen? In der Praxis bedeutet es oft, dass die theoretischen Arbeiten aus experimentellen Arbeiten hervorgehen.
Außerdem fokussiert man sich häufig auf sehr einfache experimentelle Beobachtungen. Da das Gehirn so komplex ist, muss man zwangsläufig die Fragestellungen stark reduzieren, damit man angesichts dieser Komplexität konkrete Aussagen treffen kann.
Letztlich bedeutet all dies, dass Modellierer oft viel Zeit damit verbringen, ein sehr präzises Modell für eine bestimmte Fragestellung “von Hand” bzw. mit ihrem Expertenwissen zu erstellen.
Im Gegensatz dazu geht maschinelles Lernen eher der allgemeinen Frage nach, wie man aus Daten lernen kann. Das heißt es geht im ersten Schritt gar nicht um Gehirne, sondern vor allem um künstliche Informationsverarbeitungssysteme. Am Anfang steht hier ein komplexer hochdimensionaler Datensatz in dem man versucht Muster zu erkennen. Man versucht viel weniger zu verstehen warum etwas ist wie es ist, sondern konzentriert sich darauf, ein System zu konstruieren, das funktioniert.
In der Computational Neuroscience wären dann Algorithmen das Mittel zum Zweck und dementsprechend das ML zum Tool? Und bei reinem maschinellem Lernen? Was sind da die Fragestellungen?
Im maschinellen Lernen beschäftigt man sich mit Fragestellungen zu Themen wie man Algorithmen entwickeln kann, die aus Daten lernen können. Hier gibt es verschiedene Wege: Die klassische Aufgabe im maschinellen Lernen ist das sogenannte ‚überwachte Lernen‘, d.h. man gibt einem Algorithmus Eingabe und Ausgabesignale; der Algorithmus soll dann lernen wie diese Eingabesignale mit den Ausgabesignalen assoziiert werden können. Um das klassische Beispiel anzuführen. Ein Algorithmus wird mit vielen Bildern gefüttert; auf manchen sind Katzen. Der Algorithmus soll selbst erkennen lernen, auf welchen Bildern Katzen sind und auf welchen nicht. Hier ergründet man nicht was es bedeutet eine Katze zu sein oder was eine Katze ausmacht, der Algorithmus erlernt lediglich das Erkennen statistischer Muster, anhand derer er eine Katze erkennen kann.
Nun investiert man gerade durch den Exzellenzcluster Maschinelles Lernen für die Wissenschaft viel in die Erforschung des ML, um dieses Wissen verschiedenen Disziplinen zur Verfügung zu stellen. Das eben angeführte Beispiel der Objekterkennung ist nun sehr einfach gesetzt. Gerade in Ihrer Arbeit steckt aber noch einiges mehr an Komplexität was diese Algorithmen und das maschinelle Lernen betrifft.
Die Idee der Forschungsarbeit im Exzellenzcluster ist, dass maschinelles Lernen sehr mächtige Werkzeuge zur Verfügung stellt, die es den Wissenschaftler:innen erlauben, ihre Arbeit schneller und effizienter zu machen als mit konventionellen Methoden.
Es gibt viele Situationen bei denen maschinelles Lernen helfen kann – gerade im Hinblick auf Zeitersparnis und Effektivität. Algorithmen können hier Arbeit abnehmen, um schneller die Möglichkeiten ausloten, mit denen man die Daten erklären kann. Die Wissenschaftler:innen müssen also nicht mehr lange suchen und sehr viele verschiedene Modelle konstruieren, ausprobieren und vergleichen, um ein passendes Modell zu finden. Das kann der Computer erledigen und so den wissenschaftlichen Erkenntnisgewinn fördern.
Hier sprechen Sie sicherlich auch den Algorithmusdetektiv an, den Sie entwickelt haben. Deshalb auch die Frage: Wie kommt eine Fragestellung zustande? Sind Sie hier (noch) neurowissenschaftlich aktiv oder arbeiten Sie immer mit unterschiedlichen Disziplinen?
Die meisten unserer Arbeiten entstehen aus Kooperationen mit anderen wissenschaftlichen Disziplinen. Oft beginnen sie mit einer konkreten Fragestellung oder wir merken, dass es hier ein wissenschaftliches Problem gibt, das mit maschinellem Lernen gelöst werden kann.
Die von Ihnen angesprochene Arbeit zu dem ‚Algorithmusdetektiv‘ drehte sich beispielsweise um die Frage, wie wir biophysikalische Modelle auf Daten angleichen können. Wir hatten Beobachtungen von den Messungen einer Zelle, die wir mit einem biophysikalischen Modell erklären wollten. Damals haben wir uns die Zähne daran ausgebissen, das selbst zu machen. Schlussendlich haben wir uns entschieden, es zu automatisieren. Und dann haben wir festgestellt, dass wir nicht nur dieses konkrete Problem damit lösen können, sondern damit eigentlich Algorithmen finden können, die auch auf andere Probleme anwendbar sind. Wir haben also mit einem konkreten Problem begonnen und haben dann festgestellt, dass die Methodik auch auf andere Modelle anwendbar ist, zunächst innerhalb der Neurowissenschaften und dann auch in anderen Disziplinen.
Derzeit arbeiten wir mit Geophysiker:innen zusammen. Hier geht es natürlich nicht mehr um das Modell wie eine Zelle antwortet, sondern wir versuchen ein Modell zu finden wie Eisschmelzprozesse in der Antarktis stattfinden. Das ist natürlich eine ganz andere wissenschaftliche Fragestellung aber die zugrunde liegende Mathematik, die zugrunde liegenden Inferenzprobleme, die wir lösen, sei es für biophysikalische Modelle, für Eisschmelze in der Antarktis oder für Modelle von Gravitationswellen in der Physik sind eigentlich stark verwandt.
Es macht auch großen Spaß mit diesen Aufgaben in ganz unterschiedliche Felder einzutauchen; dabei ist es natürlich extrem wichtig mit Expert:innen aus dem Feld zusammen zu arbeiten, die sich inhaltlich gut auskennen. Wir sind hier eher die Amateure, die sich auf die Expertise der jeweiligen Kolleg:innen stützen. Es macht aber immer wieder auf‘s Neue Spaß sich in die Herausforderungen ‚hineinzuknien‘und man bekommt Einblick in spannende Wissenschaftsfelder, zu denen unsere Arbeit dann einen Beitrag leisten kann.
Um auf den Anfang der Frage zurückzukommen: die Neurowissenschaften bleiben weiterhin unsere wissenschaftliche Heimat. Sie ist nach wie vor das wissenschaftliche Feld, aus dem die meisten unserer Anwendungen kommen. Und natürlich das, in dem wir am ehesten unsere eigene neurowissenschaftliche Expertise einbringen können.
Sehen Sie einen Wandel im Forschungsfeld der Neurowissenschaften mit den neuen Möglichkeiten die das maschinelle Lernen eröffnet?
Das Zusammenspiel zwischen maschinellem Lernen und den Neurowissenschaften ist im Moment extrem spannend. Zum einen können wir mit ML mächtige Werkzeuge hernehmen, um Daten zu analysieren. Zum anderen ist das Gehirn in gewisser Weise der mächtigste Informationsverarbeitungsalgorithmus, den es gibt. Dadurch nährt sich die Hoffnung, dass wir – je besser wir das Gehirn verstehen – auch dessen Verarbeitungsprinzipien übernehmen können, um zu versuchen sie in bessere Algorithmen umsetzen zu können. Und es gibt eine Reihe von Beispielen – weniger aus meiner Arbeit – die gezeigt haben, dass diese Inspiration auch wichtig für einige der Fortschritte des maschinellen Lernens in den letzten Jahren war. Das bedeutet, dass die Explosion in maschinellem Lernen und der KI, nicht nur, aber zu einem beträchtlichen Teil durch Ideen aus den Neurowissenschaften befeuert wurde. Es zeichnet sich hier eine ganz klare Richtung ab, wie diese beiden Felder interagieren können.
Wenn man das Ganze von der anderen Seite betrachtet, ist aber auch klar, dass die Neurowissenschaften vom maschinellen Lernen lernen können. ML erzeugt künstliche Informationsverarbeitungsalgorithmen und dabei können auch Hypothesen dafür entstehen, wie das Gehirn Aufgaben lösen kann. Wenn wir also einem Algorithmus eine schwierige Aufgabe beigebracht haben, können wir analysieren, wie der Algorithmus diese Aufgabe gelöst hat und dann überprüfen ob das Gehirn diese Aufgabe ähnlich löst oder nicht. Es können also auch aus der Analyse von ML Algorithmen neue neurowissenschaftliche Fragestellungen erwachsen. Moderne ML Algorithmen sind oft so komplex, dass es eine Menge Arbeit erfordert, um zu verstehen, wie sie funktionieren. Wenn man sie, oder auch nur Aspekte davon, verstanden hat, kann man den Weg zurück gehen und neurowissenschaftlich untersuchen ob es das Gehirn ähnlich oder anders löst. In beiden Fällen kann man daraus etwas lernen. Unser Ziel ist ja nicht zu zeigen, dass beide, der Algorithmus und das Gehirn, auf die gleiche Weise arbeiten, vielmehr geht es darum aus Unterschieden zu lernen und die Wissenschaft weiter zu bringen.
Also bio-inspired vs algorithm-inspired learning. Beides ist natürlich sehr datenintensiv und benötigt große Datenmengen. In diesem Kontext ist Datenintegration/ Datenmanagement ein großes Thema für die Wissenschaft der Zukunft. Gerade sind die ersten Vorgutachten für Dateninfrastrukturen verschiedener Disziplinen gelaufen. Welche Rolle spielt diese Thematik in Ihrer Forschung?
Ich glaube ein professionelleres und ein transparenteres Datenmanagement ist aus meiner Sicht eine der ausschlaggebenden Entwicklungen der Neurowissenschaften der letzten Jahre gewesen. Das Feld hat hier extrem dazu gelernt, wie wichtig es ist das gemeinsam und professionell anzugehen. Das finde ich sehr begrüßenswert und gut, gerade weil es damit noch weiter professionalisiert werden soll. Eine Grundvoraussetzung für unsere Arbeit ist natürlich, dass wir nicht nur Zugang zu den Daten haben, sondern dass diese Daten auch auf professionelle Art und Weise so gemanagt sind, dass wir sie direkt nutzen können. Deshalb halte ich diese Initiativen nicht nur für äußerst wertvoll, sondern schätze sie auch als sehr wichtig für unsere Arbeit und für das wissenschaftliche Feld als Ganzes ein.
Jetzt hat sich kürzlich die Situation für Sie als gestaltende Kraft im maschinellem Lernen und der Computational Neuroscience nochmals geändert. Sie werden das BCCN Tübingen leiten. Wird die Computational Neuroscience in Tübingen fortan stärker ML-orientiert sein?
Da diese Aufgabe für mich ja sehr neu ist, sehe ich diese Leitungsaufgabe auch als Koordinationssaufgabe. Deswegen wird es für mich erstmal wichtig sein, dass wir uns im Zentrum in Tübingen gemeinsam überlegen wie wir uns ausrichten wollen. In Tübingen ist sowohl auf der neurowissenschaftlichen Seite als auch auf der Seite des Maschinellen Lernens sehr viel Kompetenz vorhanden. Deswegen ist es natürlich naheliegend, dass man versucht die Stärke der beiden Disziplinen noch sehr viel intensiver miteinander zu verknüpfen als das bisher schon geschehen ist.
Ein zweiter Aspekt, der für meine eigene Forschungen in den nächsten Jahren wichtiger sein wird und den wir damit auch in das Bernstein Zentrum reintragen werden, ist die Verbindung mit dem klinische Neurowissenschaften. Gerade Tübingen hat eine sehr starke klinische Neurowissenschaft und ich glaube, dass es auch in diesem Bereich große Potenziale gibt: durch maschinelles Lernen könnte man nicht nur die neurowissenschaftliche Grundlagenforschung stärken, sondern auch die Klinische Forschung, wie beispielsweise die Neurologie. Das sind beides Aspekte, die für meine persönliche Forschung in Zukunft eine große Rolle spielen werden. Und deswegen werde ich auch versuchen, dass wir innerhalb ist Bernstein Netzwerks und des Bernstein Zentrums die Stärken dieser Verbindung nutzen können.
Wie sehen Sie die von Ihnen gerade angesprochene Verbindung zum Bernstein Netzwerk? Und wie würden Sie die Vernetzung mit den anderen Bernstein Zentren und ihren unterschiedlichen Forschungsschwerpunkten bewerten?
Ich glaube, dass das Bernstein Netzwerk dadurch lebt und darauf aufbauen kann, dass es verschiedene Zentren mit unterschiedlichen wissenschaftlichen Schwerpunkten gibt. Es wäre schade, wenn sich die einzelnen Zentren nur geografisch unterscheiden aber nicht in ihrer wissenschaftlichen Ausrichtung.
Ich denke, es wird für das Bernstein Netzwerk in den nächsten Jahren sehr spannend und auch herausfordernd sein, die Stärken einzubringen der einzelnen Standorte hervorzuheben und gleichzeitig zu berücksichtigen, dass es Forschungsgruppen gibt, die sich jetzt nicht eins-zu-eins auf diese Zentren abbilden lassen: Tübingen hat wie gesagt einen Fokus auf der Zusammenführung aus Maschinellem Lernen und Neurowissenschaften aber natürlich gibt es auch an anderen Standorten in Deutschland exzellente Gruppen. Lokale Expertise und wissenschaftliche Schwerpunkte unabhängig von der Frage des Standorts zusammenzubringen, ist, glaube ich, eine Chance und eine Herausforderung für das Netzwerk zugleich.
Zweitens verändert sich die Welt und auch das wissenschaftliche Feld wandelt sich. Aspekte, die vielleicht jahrelang im Zentrum standen fallen weg und werden bis zu einem gewissen Grad durch neue Entwicklungen, wie z.B. einen stärkeren Fokus auf Maschinelles Lernen, abgelöst und damit zwangsläufig mit anderen Themen verknüpft. Es ist es wichtig, dass das Bernstein Netzwerk diese Veränderungen aufgreift und den Wandel aktiv mitgestaltet.
Interview: C. Duppé (Bernstein Netzwerk), Februar 2021