Neuer Sprachassistent, neues Sprachmodell, selbst die Suchfunktion richtet Google ganz auf die künstliche Intelligenz aus. Auf der Entwicklerkonferenz ruft der CEO Sundar Pichai eine neue Ära aus – und erklärt, wieso Google KI besonders gut könnte.
Einmal im Jahr öffnet Google seinen Maschinenraum und gewährt an der Entwicklerkonferenz Einblicke, woran die mehr als 180 000 Angestellten des Konzerns tüfteln. Selten dürfte der Druck auf Sundar Pichai dabei größer gewesen sein als an diesem Dienstag. Als der CEO des Alphabet-Konzerns auf die Bühne trat, schwebte eine große Frage über das Shoreline Amphitheatre in Mountain View: Welche Durchbrüche im Bereich der KI würde Pichai präsentieren können – und würde diese besser sein als die der Konkurrenz?
Google muss sich vorwerfen lassen, zu zögerlich auf den Zug der KI-Revolution aufgesprungen zu sein. Pichai sagte selbst jüngst in einer Rede, dass ihn die Geschwindigkeit, mit der die Gesellschaft KI angenommen habe, überrascht habe. Dabei war es einst der Google-Konzern, der mit seiner Grundlagenforschung die Basis für alle Sprachmodelle legte, auf denen heute die Produkte der Konkurrenz wie Chat-GPT aufbauen.
„Wir haben seit einem Jahrzehnt in KI investiert, wir führen in der Forschung, wir verfügen über eine weltweit einzigartige Infrastruktur für KI“, rief Pichai den Zuhörern am Dienstag in Erinnerung. Zudem sitzt Google auf einem riesigen Datenschatz, da Milliarden von Nutzern weltweit seit Jahren seine Produkte nutzten. In Anlehnung an das Sprachmodell Gemini rief er dann ein neues Zeitalter aus: «Bei Google ist die Gemini-Ära angebrochen.»
Was das konkret bedeutet, erklärten er und andere Google-Manager in den folgenden zwei Stunden.
Googles Suchfunktion verändert sich grundlegend
Die Google-Suche ist die Zugmaschine des Konzerns: Google hat einen Marktanteil von 89,5 Prozent bei Suchanfragen weltweit. Mit der um die Suchergebnisse drapierten Werbung verdient der Konzern rund 80 Prozent seines Umsatzes. 2023 waren das bemerkenswerte 175 Milliarden Dollar.
Künftig verändert sich nun die Google-Suche, sie wird interaktiv und multimedial. So erhalten Nutzer in Zukunft mehr als nur eine Liste mit Links präsentiert. Eine «KI-basierte Übersicht» liefert einen personalisierten Fließtext und ausgewählte Links und Produktvorschläge. „Lass Google das Googeln für dich machen“, so erklärte Pichai die Idee dahinter.
Ebenso können Nutzer künftig die Suchmaschine konsultieren, indem sie ihre Kamera auf etwas halten und laut fragen: Was ist das? Oder: Warum funktioniert das nicht? In ähnlicher Weise kann man mit der Funktion „Kreis zum Suchen“ Gegenstände in einem Foto recherchieren lassen und sie direkt kaufen. Googles Vorteil sei, sagte die für die Suche zuständige Managerin Liz Reid, dass der Konzern enorm viele Echtzeitinformationen über Menschen, Orte und Dinge habe; dass die Nutzer Google vertrauten; und dass Google mit Gemini über ein starkes Sprachmodell verfügt. Unausgesprochen schwang mit, dass neuen Konkurrenten wie Open AI ein solcher Datenschatz fehlt.
Google plant, die neuen KI-basierten Übersichten für komplexe Suchanfragen anzubieten, etwa für eine Anfrage wegen Yoga- oder Pilates-Studios mit Offerten in der Nähe von Boston. «Ich denke nicht, dass wir jemals eine KI-basierte Übersicht für die Suchanfrage ‹Walmart› bringen werden. „Die Leute wollen in dem Fall einfach zu walmart.com weitergeleitet werden“, sagte Reid in einem Interview.
Googles Sprachmodell Gemini wird schneller und mächtiger
Google stellte am Montag auch eine neue Version seines Sprachmodells Gemini vor, das schneller und leistungsstärker Anfragen beantworten kann. Konkret können Nutzer dem Modell bis zu 1 Million Eingabepunkte – sogenannte Token – einspeisen; das entspricht etwa einem PDF von 1500 Seiten. Bis Ende des Jahres sollen es 2 Millionen Token sein.
KI verbessert künftig Googles Sprachassistenten: Unter dem Projektnamen Astra präsentiert der Konzern einen smarten Assistenten, der menschlicher klingt und schneller reagiert als der bisherige. Astra kann damit offenbar mit dem neuen Sprachassistenten von Open AI mithalten, den der Konkurrent am Montag vorgestellt hatte. „Es ist ein universell einsetzbarer KI-Agent, der im täglichen Leben tatsächlich hilfreich ist“, so fasste es der Leiter von Googles KI-Einheit Deepmind, Demis Hassabis, zusammen.
„Wir befinden uns in einem Moment, den es einmal pro Generation gibt, in dem wir grundlegend neu darüber nachdenken, was das Handy für seinen Nutzer tun kann“, sagte Sameer Samat, der den Bereich Android-Ökosystem leitet. Das Sprachmodell soll Nutzer beispielsweise in Telefonaten vor Betrügern warnen können. Zahlreiche der KI-Funktionen würden aus Datenschutzgründen auf dem Gerät selbst ausgeführt.
Google stellte außerdem neue KI-Produkte vor, mit denen man Musik, Bilder und Videos generieren kann. Sie alle erinnern daran, dass Konsumenten bereits von Open AI und anderen Konkurrenten kennen. Gemini wirbelt außerdem die Büroprodukt-Palette von Google auf: Die KI soll künftig lange E-Mail-Threads, PDF und aufgezeichnete Videokonferenzen für die Nutzer zusammenfassen.
Und selbst die legendären Google Glasses könnten dank KI ein zweites Leben bekommen: Bei einer Videovorführung von Google sah man eine künstlich intelligente Hornbrille, die an das einst gescheiterte Produkt erinnerte. Man teste KI-Anwendungen für Geräte, teilt der Konzern nur allgemein mit.
Produkte kommen erst schrittweise auf den Markt
Bei der Produkteinführung wählt Google einen anderen Ansatz als die Konkurrenz von Open AI: Die neuen KI-Produkte und Funktionen werden schrittweise auf den Markt gebracht. So stehen die KI-Übersichten bei der Google-Suche etwa zunächst nur Nutzern in den USA zur Verfügung. Die neuen Android-Funktionen sind zunächst nur in einer Testumgebung verfügbar.
„Google verfolgt bei KI einen mutigen und doch verantwortungsbewussten Ansatz, damit KI für jeden nützlich sein kann“, so fasste der CEO Pichai die Strategie zusammen. Und er betonte im Laufe der Präsentation immer wieder: Google kratze erst an der Oberfläche dessen, was KI möglich machen werde. Die KI-Revolution steht erst am Anfang.