Das Berlin Institute for Foundations of Learning and Data BIFOLD. Neuer Leuchtturm der deutschen KI Forschung
Klaus-Robert Müller ist einer der Direktoren des neuen Berlin Institute for Foundations of Learning and Data, kurz BIFOLD. Lesen Sie hier das exklusive Interview.
/BN, C. Duppé/ Klaus-Robert Müller arbeitet seit mehr als 25 Jahren auf dem Gebiet der KI. Er ist Mitglied des BCCN Berlin und war bis 2015 Koordinator des Bernstein Fokus Neurotechnology. Seit 2018 leitet er das Berliner Zentrum für Maschinelles Lernen BZML, das jetzt mit dem Berlin Big Data Center BBDC zu BIFOLD, dem Berlin Institute for Foundations of Learning and Data, fusioniert.
Bernstein Netzwerk (BN): Guten Tag Herr Müller. Das Berlin Institute for Foundations of Learning and Data, kurz BIFOLD, soll zum Leuchtturm der deutschen KI Forschung auf globaler Ebene werden. Wo sehen Sie die strukturellen und inhaltlichen Stärken dieses neuen Verbundes?
In den beiden Zentren, die wir jetzt im BIFOLD bündeln, versuchen wir die technischen Grundlagen der KI zu erforschen. Zum einen im Bereich Maschinelles Lernen, zum anderen im Bereich des Datenbankmanagements. Mit BIFOLD soll die Möglichkeit entstehen, die technischen Kerndisziplinen des Maschinellen Lernens und des Big Data intensiv gemeinschaftlich zu erforschen und miteinander zu verzahnen. In der Folge sollen die Schnittstellen zu anderen Wissenschaftsdisziplinen hergestellt werden. Es geht einerseits darum, die Daten selbst zu managen und interessante Fragen an die Daten zu stellen, beispielsweise auch mit großen Datenströmen umzugehen. Gleichzeitig geht es um die Weiterentwicklung des Maschinellen Lernens an sich, vor allem um kernbasierte Lernmethoden und deep learning.
In unserem Institut haben wir uns auf drei Wissenschaftsbereiche fokussiert: die Medizin, die Digital Humanities und die Ingenieurswissenschaften.
In diesem Fokus auf Grundlagenforschung und der nationalen strategischen Ausrichtung erkennt man eine starke Parallele zum Bernstein Netzwerk, das 2004 als strategische Leuchtturmförderung des BMBF begonnen hat. Sehen Sie strukturelle Ähnlichkeiten zwischen den Anfängen der neuen KI Zentren, BIFOLD und dem Bernstein Netzwerk?
Als Mitbegründer des Bernstein Zentrums Berlin war ich beim Treffen mit dem BMBF dabei, als die Bernstein Idee vorgestellt wurde. Zunächst ist zu sagen, dass die KI Strategie des Bundes vom Volumen her gesehen eine Nummer größer ist. Inhaltlich sind beide sehr verschieden. Im Bernstein Netzwerk geht es um die Fachrichtung Computational Neuroscience. Bei der KI Strategie des Bundes geht es um KI im Allgemeinen, die sich in vielen Bereichen abbildet, natürlich auch mit Anwendung in der Computational Neuroscience.
Bestehen trotzdem strukturelle Parallelen, beispielsweise in der Etablierung von Zentren für Maschinelles Lernen als wissenschaftliche Hotspots?
Bedingt, ja. In den Gesprächen mit dem BMBF zur Anbahnung der Zentren habe ich immer das Bernstein Netzwerk und die Bernstein Zentren klar als ein Vorbild und erfolgreiches Beispiel erwähnt. Das Bernstein Netzwerk ist eine Erfolgsgeschichte, aus der man lernen kann und aus der auch gelernt wurde. Im Bernstein Netzwerk ist es uns gelungen, ein interdisziplinäres Ausbildungskonzept zu schaffen, das über die Disziplinen der Cognitive Science, Neuroscience und Mathematik bis hin zur Physik und Informatik reicht. Es hat ‚mehrsprachige‘ ForscherInnen hervorgebracht hat, die in der heutigen Wissenschaft sehr gefragt sind. Auch dies ist einer der Gründe für den Boom der Computational Neuroscience und die tollen Ergebnisse, die zu Recht auf das Konto des Bernstein Netzwerks gehen.
Im Grunde ist es in den KI Zentren ähnlich, nur dass die Disziplinen andere sind. Vor BIFOLD existierten Maschinelles Lernen und die Big Data Disziplinen parallel nebeneinander aber sie redeten nicht miteinander. Das wird sich durch das neue Institut ändern.
Was genau ist das Ziel von BIFOLD im Hinblick auf anwendungsbezogene Fragestellungen?
In der Medizin befassen wir uns mit Fragen zu Genetik und Pathologie. Die Herausforderungen im klinischen Alltag liegen zum Beispiel in der Intensivmedizin, wo robuste Algorithmen zur Diagnose und Anomaliedetektion fehlen. Daran arbeiten wir.
In der Quantenchemie setzen wir Maschinelles Lernen ein, um etwa die Schrödinger Gleichung auf eine etwas unkonventionelle Art zu ‚lösen‘. Der Durchbruch dort klingt vergleichsweise simpel. Wenn man die Schrödinger Gleichung für ein Molekül lösen möchte, geht das nur approximativ. Die Approximation zum Lösen der Gleichung hat, um das salopp zu sagen, ein riesiges wissenschaftliches Feld glücklich gemacht und wurde mit dem Nobelpreis gekürt. Es ist ein sehr aktives Feld – extrem relevant für die Physik, die Materialwissenschaften und die physikalische Chemie. Der Pferdefuß an der Stelle ist, dass diese klassische Approximation – density functional theory genannt — zwischen 5 Stunden bis 7 Tagen Rechenzeit pro Molekül benötigt. Meine neueren Arbeiten zu Maschinellem Lernen für die Quantenchemie haben nun geholfen, diese Approximation – in anderen Worten: diesen komplizierten Differentialgleichungssimulationsschritt – durch Vorhersagen von Lernalgorithmen zu ersetzen, sozusagen einen Shortcut einzubauen. Damit können jetzt Berechnungen innerhalb von einer Millisekunde durchgeführt werden und sogar Vorhersagen in chemischer Genauigkeit für unbekannte Moleküle und Materialien gemacht werden.
Wie können wir uns die Arbeit von BIFOLD im Hinblick auf die Digital Humanities vorstellen?
Mit den Digital Humanities sind wir im BZML neu gestartet, denn wir haben gesehen, dass man mit Maschinellem Lernen höchst interessante Dinge für die Geisteswissenschaften herausfinden kann: im Grunde handelt es sich um eine Herangehensweise, die so vorher nicht existierte und deshalb neue Erkenntnisse hervorbringen konnte, wie beispielsweise ein besseres Verständnis der Zensur von Texten oder neues Wissen im Hinblick auf die Propagierung von Bildern in der Geistesgeschichte.
Um das Feld unserer Interessen abzurunden: Wir sind auch in den Ingenieurswissenschaften sehr aktiv, vor allem im (mobilen) Kommunikationsbereich. Gerade wenn wir an Videostreaming denken, sollte man sich vor Augen führen, dass jedes zweite Bit im Internet mit dem H264 Standard codiert ist, hier haben wir mit Maschinellem Lernen Verbesserungen erzielen können, die bereits in die nächste Generation der Kodierstandards einfließen. Auch der neue 5G Standard geht nicht ohne ML oder Big Data. Auch dafür steht das neue Institut BIFOLD: wir arbeiten an Anwendungen der KI die uns alle betreffen.
Anwendungsorientierung ist ein zentrales Thema in BIFOLD, denn „Nichts ist praktischer als eine gute Theorie“. Wie kann es gelingen, KI zu einem relevanten Wirtschaftsfaktor werden zu lassen?
KI ist schon lange ein riesiger Wirtschaftsfaktor. Die großen Unternehmen, die wir alle kennen und täglich nutzen, sind im Grunde genommen KI Unternehmen. Larry Page sagte einmal Google sei eine ‚machine learning company‘. Insoweit ist die KI schon lange in der Wirtschaft angekommen – nur vielleicht im Bewusstsein der Deutschen nicht in dem Maße, wie sie es sein könnte oder müsste – aber da hat sich ja in den letzten Jahren erfreulicherweise schon viel getan.
Dies war einer der zentralen Antriebe für die KI Strategie des Bundes. Im letzten Zwischenbericht der Bundesregierung wurde Europa herausgehoben als forschungsstarker Standort – mit einer Anzahl an Patentanmeldungen, die selbst im Vergleich mit China und USA Top Plätze einnimmt.
Ich glaube viele Dinge, die in den Produkten der Internetunternehmen stecken, kommen aus Europa oder sogar aus Deutschland. Wir haben zwar kein Google gegründet aber vielleicht ist das damals auch gar nicht so möglich gewesen. Wenn man jetzt in die Zukunft schaut, stellt sich die Frage, was es an Randbedingungen braucht, damit solche Unternehmen oder solche neuen Wirtschaftszweige entstehen. Es braucht Expertise und gut ausgebildete Menschen. Außerdem braucht es ein neues Bewusstsein für KI. Die Unternehmen müssen verstehen, dass sie nicht so weiter machen können wie bisher. Verstehen Sie mich nicht falsch: Ich glaube, dass sich in den letzten Jahren unglaublich viel in dieser Richtung getan hat in unserem Land. Unsere Regierung hat jetzt auch die ersten wichtigen Schritte gemacht. Sicherlich wäre da auch immer noch mehr möglich, aber ich denke wir sind insgesamt auf einem guten Weg.
Lassen Sie uns noch kurz über erklärbare KI sprechen, die Sie zu einem Kernziel erkoren haben. Nachvollziehbarkeit und Transparenz ist für viele Menschen wichtig, gerade wenn es um medizinische Entscheidungen geht. Auch Datenschutz ist Ihnen ein großes Anliegen. Gibt es einen deutschen/ europäischen KI Weg, der diese Themen anders angeht als China oder die USA?
Hier möchte ich vorsichtig splitten. Die erklärbare KI ist etwas, das im Grunde aus Deutschland kommt – insbesondere aus Berlin. Die erste Arbeit von mir in diesem Bereich wurde 2010 publiziert. Damals haben wir die Grundlagen gelegt und heute nutzen viele unsere Tools. Im letzten März habe ich mit Kollegen zusammen ein Paper veröffentlicht in dem es um das Clever Hans/ Kluger Hans Phänomen geht: Modelle machen zwar gute Vorhersagen, aber aus völlig unsinnigen und falschen Gründen, d.h. die Modelle nutzen für ihre Vorhersagen Artefakte in den Daten. Das ist höchst gefährlich. Deshalb ist es sehr wichtig dies transparent zu machen, so dass Ingenieure ihre Modelle verbessern können und auch erstmal verstehen können, was falsch läuft.
Die Frage nach der Ethik in der KI ist natürlich sehr wichtig. Es ist selbstverständlich, dass man sich über ethische Aspekte der KI Gedanken macht. Dennoch kann man sich nicht ausschließlich um die Ethik in der KI kümmern und die technische Seite dabei den USA etc. überlassen. Man muss beides zusammen denken und daher auch die Leute entsprechend bilden. Meines Erachtens sollten man hier nicht in Schwarz-Weiss Malerei verfallen und die USA als die Bösen abstempeln: Ich kann mich sehr gut erinnern, dass jemand aus den Reihen des Google Managements einmal vorgeschlagen hatte, mit dem amerikanischen Verteidigungsministerium zusammen zu arbeiten – was zu einem so großen Widerstand in der Mitarbeiterschaft führte, dass dieser Plan ad ata gelegt wurde – ein sehr eindrückliches ethisches Statement.
Insgesamt müssen die Leute einfach benutzbare technische Werkzeuge an der Hand haben, mit denen sie KI bauen können, die erklärbar ist, die fair ist, und die ‚trustworthy‘ ist. Auch dafür steht BIFOLD.
Neben der Ethik ist natürlich immer der Rechtsrahmen maßgeblich, in dem man sich bewegt….
Ja, hierzu gibt es auch eine Stellungnahme der Leopoldina und der Akademien: Big Data and Privacy. Die Arbeitsgruppe dazu habe ich geleitet. Diese Stellungnahme umfasst die rechtlichen und technischen Aspekte hierzu. Um es kurz zu fassen: Privatsphäre ist den Menschen in unserer Gesellschaft wichtig. De Fakto verlieren wir sie immer mehr dadurch, dass wir unreflektiert unsere Daten hergeben oder nicht den Rahmen schaffen, um Unternehmen auf die Finger schauen zu können. Diese Studie untersucht, was man technisch und regulatorisch machen könnte, um wieder etwas mehr Privatsphäre zurück zu bekommen.
Gleichzeitig ist es aber auch wichtig, nicht dieses wunderbare zarte Pflänzchen der vielen Unternehmen, die in diesem Bereich entstehen, damit zu töten. Das ist sicherlich ein anspruchsvoller Spagat zwischen Hürden höher setzen, um Privatsphäre zurückzugewinnen, und neuen technischen Schritten, um Neues zu erforschen. Demnach müssen von Seiten des Justizministeriums neue Regeln aufgestellt werden und wir Wissenschaftler müssen auch einiges dafür tun. Wenn alle ihre Hausaufgaben machen, werden wir in ein paar Jahren Systeme haben, mit denen unsere Privatsphäre besser geschützt ist.
BILFOLD soll ja auch gerade durch die Verflechtung von Forschung und Wirtschaft Synergien schaffen, vor allem auch durch die Ausbildung einer neuen Generation von WissenschaftlerInnen, die nicht nur im Forschungsbereich tätig ist, sondern auch darüber hinaus.
In Berlin gibt es eine längere Historie, was Ausgründungen aber auch Kooperationen mit der Industrie angeht. Es gibt sehr viele Unternehmen, die mit uns zusammenarbeiten, was durch BIFOLD noch stärker intensiviert werden soll.
Ich glaube wir sind schon seit längerem auf einem sehr guten Weg. Aus meiner Arbeitsgruppe sind so ungefähr 14-16 Unternehmen hervorgegangen. In diesen sind sicherlich mittlerweile 500 Leute angestellt, die in Berlin arbeiten. Aber es sind ja nicht nur wir. Viele meiner Kollegen sind bei Ausgründen mindestens ebenso aktiv. Da kann man schon von einem Wirtschaftsfaktor sprechen, der nachhaltig wirkt.