
Algorithmen sollen vorhersagen, wie wir in Zukunft fernschauen: Um diese Vorhersagen treffen zu können, sammelt Netflix Milliarden von Daten über das TV-Nutzungsverhalten seiner Serien. Neil Hunt ist der Chief Product Officer, also der oberste Techniker, des Videodienstes. Zum Österreich-Start von Netflix erklärt er, welche Daten Netflix aufzeichnet und was er aus den Unmengen an Information herauslesen kann.
Herr Hunt, ich interessiere mich für die Technologie hinter Netflix. Netflix analysiert das TV-Verhalten jedes einzelnen Abonnenten. Wie funktioniert denn das?
Neil Hunt: Wir haben 50 Millionen Abonnenten, aber ich beschreibe das gerne folgendermaßen: Wir haben 50 Millionen Kanäle, die auf die einzelnen Abonnenten ausgerichtet sind. Leute fragen derzeit: Wie schaut das österreichische Netflix aus? Diese Frage ist falsch gestellt. Richtig müsste es lauten: Wie schaut Netflix für Sie persönlich aus und wie sieht Netflix im Gegensatz dazu für Ihre Arbeitskollegen oder Freunde aus? Denn jeder sollte seine eigene Version von Netflix haben. Meine Aufgabe ist es, Ihnen aus all den Filmen und Serien jene Titel zu liefern, die Sie tatsächlich ansprechen. Diese Titel müssen in unseren ersten 20 Vorschlägen sichtbar sein. Wir analysieren dafür die Daten, was Sie sich bisher angesehen haben und was sich im Vergleich dazu andere Menschen angesehen haben. Dann liefern wir Ihnen die besten Vorschläge ganz oben.
Sie nutzen dabei aber nicht nur Algorithmen, sondern Menschen, die jeden einzelnen Film und jede Serie im Netflix-Sortiment katalogisieren und verschlagworten. Dabei wird sogar eingetragen, ob ein Film deprimierend oder fröhlich ist. Wofür brauchen Sie denn solche Information?
Hunt: Diese Metadaten helfen uns Filme zu identifizieren, die gut zu Ihnen passen. Das beginnt damit, dass wir die strukturelle Distanz zwischen zwei Filmen berechnen können. Wissen Sie, was ich meine?
Nein, leider nicht. Was ist strukturelle Distanz?
Hunt: Sagen wir, Ihre Stimmung reicht von glücklich sein bis traurig sein. Wie groß ist die Distanz zwischen diesen beiden Gefühlen? Liegen die weit auseinander? Ich kann mir ansehen, wie viele Filme zwischen diesen beiden Stimmungen liegen, und je nachdem wie viele Schritte es sind, desto größer ist die Distanz. Wenn ich von einem fröhlichen Film zu einem traurigen Film, von dem einen Genre in ein ganz anderes Genre und von dem einen Hauptdarsteller zu dem anderen Hauptdarsteller wechsle, ist die strukturelle Distanz riesig. Aber wenn ich zwei Filme habe, in denen der selbe Schauspieler auftritt und die beide traurig sind, sind sie nahe beisammen. Mit diesen Metadaten kann ich die strukturelle Distanz ermitteln. Wenn Sie den einen Film mochten, werden Sie wohl auch den anderen mögen. Das ist alles ziemlich naheliegend.
Das heißt, wir Menschen suchen immer und immer wieder das selbe Fernseherlebnis?
Hunt: Nein. Das würde man meinen, wenn man sich einzig und allein die strukturelle Distanz ansieht. Aber wir berechnen auch Ähnlichkeiten im Fernsehverhalten. Rufen Sie zum Beispiel die Serie „Modern Family“ auf, dann bekommen Sie ähnliche Titel vorgeschlagen, zum Beispiel die Serie „Arrested Development“. Dafür ist die Zahl der Menschen entscheidend, die sowohl „Modern Family“ als auch „Arrested Development“ schauten – die ist vergleichsweise ziemlich groß. Aber das ist noch nicht alles: Wir achten gleichzeitig darauf, dass sich das Programm nicht zu ähnlich wird, es soll Diversität geben. Das Netflix-Programm wird Ihnen in Reihen präsentiert: Jede Reihe hat ein Thema, zum Beispiel liefert eine Reihe Filme, die gerade populär sind, und die Reihe darunter liefert Ihnen Empfehlungen, weil Sie neulich eine ähnliche Serie geschaut haben. Von Reihe zu Reihe soll es Diversität geben. Denn was Sie an einem Freitagabend ansehen wollen ist vielleicht etwas ganz Anderes, als was Sie am Samstagmorgen interessiert. Jede Reihe soll also einen anderen Aspekt Ihrer Fernsehnutzung widerspiegeln.
Sie berücksichtigen also auch, dass mein Fernsehbedürfnis nicht immer dasselbe ist? Zum Beispiel, dass ich nach einem langen Film lieber eine kurze Serie schaue?
Hunt: Ja. Wobei wir das Gegenteil beobachten: Nach einem Film ist die Wahrscheinlichkeit extrem hoch, dass Sie gleich noch einen Film ansehen. Also schlagen wir Ihnen weitere Filme vor. Wir sammeln einen riesigen Berg an statistischen Daten, was sich Menschen anschauen. Wir zeichnen übrigens auch auf, was Menschen nicht angeschaut haben, weil wir es nicht anbieten. Nennen Sie zum Beispiel irgendeine Serie, die wir nicht haben.
Okay: „Star Trek“, das findet man nicht im österreichischen Katalog.
Hunt: Vermutlich hat jemand anderer die Rechte für den deutschsprachigen Raum – aber auch diese Auswahl wird mit der Zeit besser werden. Wenn Sie kein „Star Trek“ finden, zeigen wir Ihnen nun andere Empfehlungen an. Dabei analysieren wir: Was haben sich Menschen angeschaut, die ebenfalls nach „Star Trek“ suchten, aber nicht fündig wurden?
Wie genau wissen Sie da Bescheid?
Hunt: Wir sammeln 15 Milliarden Daten pro Quartal, das sind 60 Milliarden Daten im Jahr. Eine ganze Menge.
Welche Daten sind das?
Hunt: Die Abrufe. 60 Milliarden Mal im Jahr klickt jemand auf ein Video und sieht es sich an. Wir kennen auch die Abfolge: Was sah die Person zuerst an, was danach. Was suchte jemand und was sah er sich dann tatsächlich an. Und aus diesen Daten kann man extrem viel herauslesen – inklusive der Information: Menschen, die nach „Star Trek“ suchten, sahen sich am Ende diese und jene Serien an.
Funktioniert das wirklich? Wissen Sie, ob Sie den Menschen tatsächlich den richtigen Content liefern?
Hunt: Ja, wir können das auf verschiedenen Ebenen testen. Am Wichtigsten sind „A/B-Testings“, bei denen wir überprüfen, ob ein neuer Vorschlag besser funktioniert als ein alter. Nehmen wir an, einer unserer Wissenschaftler hat eine Idee und wir setzen das technisch um. Dann probieren wir das bei 500.000 Konsumenten für zwei bis drei Monate aus und ermitteln: Schauen Sie nun mehr Stunden fern als früher, gibt es für die neuen Empfehlungen mehr Aufmerksamkeit? Solche Tests sind allerdings sehr teuer, deswegen machen wir schon zuvor Offline-Simulationen. Das ist jetzt kompliziert zu erklären: Wissen Sie, was reziproke Reihungen sind?
Nein, keine Ahnung.
Hunt: Nehmen wir an, ich ordne unseren gesamten Katalog neu und reihe ihn danach, was Sie meines Erachtens ansehen werden: Titel eins, Titel zwei, Titel drei und so weiter. Und dann liefere ich Ihnen das Programm in dieser Reihenfolge und schaue, worauf sie wirklich klicken. Klicken Sie auf Titel Nummer sieben, hatte ich einen Treffer von 1 zu 7. Klicken Sie auf meinen erstgereihten Titel, habe ich einen Treffer von 1 zu 1. Das ist das bestmögliche Ergebnis. Wir testen, welcher Algorithmus am besten vorhersagt, was Sie ansehen. Dafür nehmen wir Ihre alten TV-Statistiken und die Statistiken von zehn Millionen anderen Usern und schauen, welcher Algorithmus hier die höchste Trefferquote gehabt hätte.
Sie nutzen also alte Daten um zu schauen, welcher Algorithmus das am besten erraten hätte?
Hunt: Genau. Bekommen wir ein gutes Resultat in der Simulation, dann testen wir es auch in der Realität. Danach sehen wir, ob ein Algorithmus tatsächlich funktioniert oder ob er in der Realität ganz und gar nicht funktioniert, und dann grübeln wir lange, warum das so ist, und versuchen allgemeine Prinzipien abzuleiten. Über diese Erkenntnisse schreiben wir dann auch wissenschaftliche Aufsätze und reden auf Konferenzen.
Was haben Sie da zum Beispiel gelernt?
Hunt: Interessanterweise ist Diversität extrem wichtig. Ein Beispiel: Sie haben sich in der Vergangenheit eine Serie angeschaut, die Ihnen gut gefiel und ich habe fünf ganz ähnliche Serien im Programm. Man könnte vermuten, dass ich Ihnen all diese fünf Top-Resultate anzeigen sollte, weil sie genau Ihrem Geschmack entsprechen. Tatsächlich ist es aber so, dass Sie nur eines dieser fünf Angebote nutzen und danach etwas Abwechslung wollen. Ich kann Ihnen also nicht ausschließlich eine ähnliche Auswahl vorschlagen, lieber zeige ich Ihnen nur einen der fünf Titel. Und wenn Sie das nächste Mal wiederkommen, bekommen Sie noch so einen Titel vorgeschlagen.
Ich bin quasi ein Fisch, Sie werfen einen Köder aus und wenn ich den fresse, werfen Sie das nächste Mal einen noch größeren Köder aus?
Hunt: Eher: Sie sind ein Fisch und ich füttere Ihnen Ei. Und wenn Ihnen das Ei nicht mehr schmeckt, hole ich einen Marshmallow heraus.
Helfen Ihnen all diese Statistiken auch, das richtige Programm einzukaufen?
Hunt: Eindeutig. Wir wissen einiges über Sendungen, die bereits laufen: Wer bei uns danach suchte, welche Ratings es gab, wie hoch die Klickrate auf Webseiten wie Wikipedia und IMDB.com ist. Auf diese Information können wir zugreifen und feststellen: Okay, diesen Titel besitzen wir nicht, aber wir hätten definitiv eine Nachfrage danach und könnten so und so viel Geld dafür ausgeben.
Sie analysieren also den TV-Konsum Ihrer Abonnenten und kaufen den Content, der genau zu den einzelnen Konsumentengruppen passt?
Hunt: Wir sind noch nicht so weit, dass wir immer alles in jegliche Richtung kaufen können. Natürlich füllen wir gewisse Lücken: Stellen wir zum Beispiel fest, dass wir viel zu wenig Anime-Material liefern, dann suchen wir nach gutem Material. Aber stellen Sie es sich lieber so vor: Uns werden drei interessante Projekte vorgeschlagen und wir können eine Zahl berechnen, welches dieser Projekte uns wie viel Geld wert ist. Nehmen wir an, David Fincher will eine neue Serie machen, ich berechne dann: Geht sich das aus? Ja, total, das geht sich aus!
Zur Person:
Neil Hunt ist Chief Product Officer bei Netflix, sozusagen der oberste Techniker des Onlinestreamingdienst, für den er seit 1999 arbeitet. Zuvor war er bei der IT-Firma Pure Software tätig, die sich mit dem Testen von Computerprogrammen beschäftigt. Er studierte Informatik an der University of Durham in Großbritannien und machte das Doktorat an der University of Aberdeen in Schottland. Er ist übrigens auch auf Twitter: @neilhunt.
Das Interview entstand im Rahmen des Österreich-Starts von Netflix, dem wir vergangene Woche auch die Falter-Coverstory widmeten. Foto und Screenshots: Netflix