Gerhard Weikum
Suchmaschinen können denken lernen
Herr Professor Weikum, Sie entwickeln Suchmaschinen. Eine Technologie, mit der man offenbar viel Geld verdienen kann, wie man an Google sehen kann. Wann finden wir Sie auf der Forbes-Liste?
(Lacht) Ich bin ja Wissenschaftler und kein Unternehmer. Wenn es mein Lebensziel wäre, Milliardär zu werden, müsste ich mich mehr mit Werbung beschäftigen.
Aber das tun Sie nicht…
Nein, nein, mein Ehrgeiz geht eher dahin, spannende Dinge in meiner täglichen Arbeit zu erleben. Und das kann ich hier in der Wissenschaft.
Woran arbeiten Sie konkret?
Wir forschen derzeit an einem neuen Suchmaschinentyp: der semantischen Suche. Wir wollen eine Suchmaschine entwickeln, die die Bedeutung von Informationen im Web besser versteht und entsprechend bessere Treffer erzielt.
Ihre Suchmaschine ist also intelligent - sie denkt mit.
Ja, nehmen Sie zum Beispiel eine meiner Lieblingsanfragen: "Das Drama, in dem drei Frauen einem schottischen Edelmann prophezeien, dass er König werden wird." Das ist Shakespeares "Macbeth". Wenn ich das mit Google oder einer anderen Suchmaschine suche, werde ich das Stück selbst kaum finden, dafür ist die Anfrage viel zu kompliziert formuliert. Wenn ich dann noch etwas variiere, und statt schottischer Edelmann britischer Edelmann schreibe, oder Kaiser statt König, dann wird es für die Suchmaschine noch viel schwieriger: Sie ist nicht dafür konfiguriert, Inhalte zu interpretieren. Die semantische Suchmaschine schon.
Wie macht sie das?
Zum einen füttern wir sie mit Hintergrundwissen, mit Weltwissen, wenn Sie so wollen. Unsere Suchmaschine weiß zum Beispiel, dass Hexen in der Literatur typischerweise weiblich sind und somit die Rolle der dritten Hexe in Macbeth ein Hinweis auf drei Frauen ist. Zum anderen programmieren wir die Suchmaschine so, dass sie Sätze auf den Webseiten mit Methoden der Computerlingustik bearbeiten kann. Sie kann aus Sätzen Personen oder Organisationen extrahieren und zwischen ihnen eine Beziehung herstellen. Wenn ich zum Beispiel eingebe, "Leben des Wissenschaftlers Max Planck", dann wird sie wissen, dass ich Biografisches über die Person Max Planck suche, auch wenn ich das Wort "Biografie" nicht verwende. Anders die heutigen Suchmaschinen: Sie liefern mir auf diese Frage hin eine Menge Treffer über lebenswissenschaftliche Arbeiten an verschiedenen Max-Planck-Instituten. Sie können nicht unterscheiden, ob mit meiner Frage die Person Max Planck gemeint ist oder das Institut.
Die große Masse der Anfragen beantwortet auch Google problemlos. Wozu brauche ich eine so spezialisierte Suche?
Die Ergebnisse der herkömmlichen Suchmaschinen sind gar nicht schlecht. Wenn man die alltäglichen Anfragen, also aktuelle Tagesthemen, das Wetter oder billige Flüge auf die Balearen, betrachtet, dann erfüllen sie ihren Zweck voll und ganz, da gibt es nur sehr limitierte Verbesserungsmöglichkeiten. Man muss nur sehen: 99 Prozent aller Anfragen betreffen nur ein Prozent aller möglichen Themen im Netz. Sowie ich Spezialwissen suche, stoßen die herkömmlichen Suchmaschinen an Grenzen.
Was kann die "Peer-to-peer"-Suche, die Sie ebenfalls gerade entwickeln, besser machen?
Bei "Peer-to-peer" geht es um die Vorstellung, dass jeder Nutzer irgendwann auf seinem Rechner eine maßgeschneiderte Suchmaschine hat, die seine Informationsbedürfnisse genau befriedigt. Als Wissenschaftler suche ich ja oft nach Fachliteratur oder nach Kollegen, die sich irgendwo auf der Welt mit einem exotischen Thema beschäftigen. Dafür reicht mir Google nicht, ich brauche eine Suchmaschine, die individuell auf mich abgestimmt ist.
Dafür muss die Suchmaschine Sie aber sehr gut kennen.
Das ist das Ziel. Die "Peer-to-peer"-Suchmaschine soll den jeweiligen Nutzer gut beobachten, um seine Informationsbedürfnisse besser zu verstehen. Sie wird sich merken, was er in der letzten Woche oder im letzten Monat gesucht hat und daraus automatisch ein Interessenprofil erstellen. In dem Fall, dass er keines der von ihr präsentierten Suchergebnisse anklickt und die Anfrage umformuliert, gibt er indirekt Feedback: Die Suchmaschine hat wieder etwas über ihn gelernt und kann die Suche beim nächsten Mal näher eingrenzen.
Rennen die Datenschützer Ihnen für diese Vorschläge nicht die Türen ein?
Nein, denn die Suchmaschine befindet sich ja nur lokal auf Ihrem Rechner. Die Daten werden nicht weitergegeben an andere große Server und Suchdienste im weltweiten Netz. Niemand wird ohne Ihr Wissen, Informationen über Ihre Vorlieben und Ihr Themenprofil sammeln.
Wann und wo werden Ihre Suchmaschinen zur Anwendung kommen?
Wir wollen unsere Software zunächst innerhalb der Max-Planck-Gesellschaft einsetzen. Aber wir haben auch externe Partner wie "The European Library", das Portal der Nationalbibliotheken in Europa. Dort arbeiten wir an der Verbesserung einer Metasuchmaschine für Bibliotheken, mit der man in Zukunft alle nationalen Bibliotheken Europas durchsuchen kann. Die Nutzer werden sich auf dem Portal anmelden und von der Suchmaschine als Abonnent des Bibliotheksdienstes wiedererkannt. Ohne sich um ihre Privatsphäre fürchten zu müssen, würden dann Langzeitprofile von ihnen erstellt. Außerdem arbeiten wir mit dem "European Archive" zusammen, dem europäischen Ableger von archive.org.
...eine digitale Bibliothek, die Internetseiten archiviert und konserviert.
Ja, dem Archiv geht es darum, die Historie des Internets zu bewahren. Eine Fundgrube für Forscher! Sie können dort sehr interessante analytische Studien betreiben, zum Beispiel erforschen, wie sich bestimmte Märkte in den vergangenen Jahrzehnten entwickelt haben. Sie können auch fragen: Was hat die Welt vor und nach der Fußballweltmeisterschaft im letzten Jahr über Deutschland gedacht? Nur mit Google kann man all das nicht recherchieren. Um mit dem Internetarchiv richtig arbeiten zu können, brauche ich eine Suchmaschine, die zwei Dinge kann: Sie muss die Daten besser verstehen und sie muss den Nutzer besser verstehen. Daran arbeiten wir.
Werden Sie Google vom Thron stoßen?
Nein (lacht). Die großen Suchmaschinen werden für die massenhaften Anfragen weiterhin erste Wahl sein. Unsere Suchmaschinen sind vor allem für die interessant, die nach Spezialwissen suchen. Jeder Wissenschaftler, jeder Journalist und jeder Marktforscher soll dafür sein individuelles Werkzeug in die Hand bekommen. Das ist unsere Vision.
Gerhard Weikum ist Direktor am Max-Planck-Institut für Informatik in Saarbrücken.
Das Interview führte Johanna Metz.