Auf Googles Entwicklerkonferenz hat CEO Sundar Pichai seine Pläne für künstliche Intelligenz vorgestellt. Der Chatbot wird weltweit verfügbar – in der EU und der Schweiz aber nicht. Die wichtigsten Fragen und Antworten.
Bard spricht, anders als der Konkurrent Chat-GPT, vorerst nur wenige Sprachen, nämlich Englisch, Japanisch und Koreanisch.
Imago/Jakub Porzycki
Seit Monaten stellt man sich im Silicon Valley eine Frage: Wie wird Google auf den bahnbrechenden Erfolg von Chat-GPT reagieren?
Schliesslich ist der Konzern aus Mountain View eine der grössten Forschungseinrichtungen für künstliche Intelligenz und entwickelt gar den Typus Sprachmodell, auf dem die neuen KI-Produkte der Konkurrenz basieren. Doch der plötzliche Erfolg von Open AI vor wenigen Monaten, gepaart mit der Kooperation mit dem Erzrivalen Microsoft, erwischte Google auf dem falschen Fuss.
Überstürzt präsentierte der Konzern im Februar seinen eigenen Chatbot namens Bard. Der sorgt jedoch vor allem für Schlagzeilen, weil er bei seiner Weltpremiere einen peinlichen Fehler aufwies. Google erntete dafür öffentlichen Spott – und verlor an einem Tag 100 Milliarden Dollar Börsenwert. Auch dürfen bisher nur wenige, ausgewählte Testnutzer mit dem Chatbot Bard experimentieren.
Der einstige KI-Pionier muss Aufholjagd spielen. Der CEO Sundar Pichai gab sich zuletzt verschwiegen – Google teilte auch seine wissenschaftlichen Ergebnisse zur KI erst einmal nicht mehr – und verwies immer wieder auf die neue Entwicklerkonferenz i/o. Dort werde man Googles Innovationen punkto KI vorstellen.
Am Mittwoch haben dies Pichai und die führenden KI-Forscher des Konzerns nun getan. Im Outdoor-Amphitheater in Mountain View präsentierten sie bei der größten Veranstaltung des Konzerns einer auserwählten Zuhörerschaft vor Ort und einem Publikum von Hunderttausenden vor den Bildschirmen das, was Google im Bereich KI in den nächsten Monaten plante. „Mit unserem mutigen und verantwortungsvollen Ansatz verändern wir nun alle unsere Kernprodukte, einschliesslich der Suche“, sagte Pichai. Googles Ziel sei es, „KI hilfreich für jedermann“ zu machen.
Der CEO Sundar Pichai präsentiert am Mittwoch an der Entwicklerkonferenz IO – kurz für den Entwickler-Ausdruck «Input, Output» – die KI-Pläne des Alphabet-Konzerns.
Jeff Chiu / AP
Wird generative KI nun Teil der Google-Suche?
Bard wird aus dem Testlabor entlassen: Ab sofort können Nutzer in 180 Ländern den Chatbot frei nutzen – allerdings vorerst nicht in der EU und der Schweiz. Zur Begründung teilt Google lediglich mit, dass die Entscheidung, in welchen weiteren Ländern man den Chatbot lancieren werde, „im Zusammenspiel mit lokalen Regulierungsbehörden“ gefallen werde.
Ähnlich wie bei Chat-GPT und Bing benötigt man grundsätzlich ein Google-Nutzerkonto, um den Chatbot auszuprobieren. In einem Chatmodus kann man sich dann mit der KI unterhalten. Anders als bei der Konkurrenz erhält man allerdings oft keine Quellenangaben zu den Antworten.
Darüber hinaus kündigte Google die größte Überholung seiner Suchmaske seit Jahren an: Google will generative KI zukünftig direkt in seine Suchergebnisse integrieren. Unter der neuen Google-Suchmaske (Name: «Search Generative Experience», kurz SGE) soll der Nutzer dann auf seine Anfrage nicht mehr nur eine Liste mit – teilweise gesponserten – Links erhalten, sondern auch einen Antwortkasten mit dem Titel «Generative KI» – versehen mit dem Hinweis, dass „diese erst experimentell“ sei. Dort findet man dann Antworten im Fließtext-Format und kann mit einem Klick der KI im Chatmodus Folgefragen stellen.
Noch ist die neue Suchmaske allerdings erst für Testnutzer in den USA und auf Englisch zugänglich; Um sie auszuprobieren, muss man sich in eine Warteliste eintragen. Auch experimentiere Google derzeit noch damit, auf welche Suchanfragen genau die generative KI antworten wird. Man stehe erst ganz am Anfang der Integration, erläuterte Rajal Patel von Googles Such-Team bei einem Medien-Briefing. „Die Nutzer haben unterschiedliche Erwartungshaltungen, wenn sie eine Frage in die klassische Google-Suchmaske eingeben oder bei Bard.“
Das stellt einen großen Wandel für Google dar, nachdem der Konzern das Aussehen seiner Suchfunktion seit Jahren kaum verändert hatte – und dafür auch immer wieder kritisiert wurde. Doch die Suchfunktion ist in vielerlei Hinsicht das Herz des Konzerns. Nicht nur ist «googeln» längst zum Synonym dafür geworden, etwas im Internet zu suchen, sondern Werbeeinnahmen über Googles Suchfunktion bescheren dem Konzern auch stolze 55 Prozent seines Umsatzes.
„Generative KI wird das Suchen im Internet schlauer und gleichzeitig einfacher machen“, versprach Edwards.
Google-Managerin Cathy Edwards präsentierte an der Entwicklerkonferenz Googles neue Suchmaske.
Bild: Google
Wie viele Sprachen beherrscht Bard?
Bard spricht, anders als der Konkurrent Chat-GPT, vorerst nur wenige Sprachen, nämlich Englisch, Japanisch und Koreanisch. Google stellte jedoch in Aussicht, dass der Chatbot „im Laufe der nächsten Monate in den 40 gängigsten Sprachen der Welt“ verfügbar sein soll, damit mehr Menschen in ihrer Muttersprache mit der KI kommunizieren können.
Bevor man den Chatbot für weitere Sprachen öffnet, wolle man sichergehen, dass das Sprachgefühl des Chatbots nuanciert genug sei, hiess es zur Begründung. Deshalb wolle man erst noch weiteres Nutzer-Feedback einbauen, bevor man Bard für mehr Sprachen öffne. Hier geht Google anders als Open AI, dessen Chatbot keine Sprache grundsätzlich ausschließt, sondern auf manche lediglich schlecht funktioniert.
Wie gut ist das Sprachmodell, auf dem Bard basiert?
Googles Wissenschaftler haben in den vergangenen Jahren die KI-Forschung entscheidend geprägt. Insbesondere ein 2017 veröffentlichtes Forschungspapier zum sogenannten Transformer-Modell gilt bis heute als wegweisend. Dieser Ansatz erlaubte es, in schneller Zeit große Sprachmodelle zu trainieren und ebnete den Weg für die neue Generation der Chatbots. Die Transformer-Architektur wurde zur Grundlage für alle heute führenden Sprachmodelle, wie man etwa am Namen der GPT-Modelle von Open AI sieht („Generative Pre-trained Transformer“).
Googles eigenes Sprachmodell, das der Konzern auf der Entwicklerkonferenz 2021 erstmals vorstellte, nannte er Lamda; Auf dessen Grundlage wurde zunächst der Chatbot Bard trainiert. Dieses Modell war nicht öffentlich, erlangte aber Bekanntheit, als der Google-Mitarbeiter Blake Lemoine behauptete, es habe Gefühle.
Wie Pichai am Mittwoch bekanntgab, hat Google das Sprachmodell hinter Bard nun ausgetauscht. Das neue Modell namens Palm ist, besonders in der nun veröffentlichten zweiten Version, angeblich schneller und kostengünstiger, weil es beim Generieren von Antworten weniger Rechenkapazität verbrauchen soll.
Die Stärken von Palm 2 liegen laut Google insbesondere im Programmieren; Der Chatbot beherrscht 20 Sprachen wie C++, Javascript und Python. Zudem soll Bard künftig einem Laiennutzer erklären können, was genau eine bestimmte Programmierzeile bewirkt; Codes auf Fehler hin untersuchen können, und den Chatbot schlichtweg fragen: „Wie könnte man diesen Code noch verbessern?“. Diese Funktionen dürften Software-Ingenieuren enorm viel Zeit sparen.
Für Nutzer, die den Chatbot als Hilfe beim Programmieren zu Rate ziehen, liefert Bard nun immer auch Links dazu, aus welcher Quelle der Code stammt. Programmierer seien „eine der beliebtesten Anwendungen, wofür Nutzer bisher Bard verwenden“, sagte Managerin Sissie Hsiao, die den Chatbot bei Google verantwortet habe.
Palm 2 soll ausserdem in sektorspezifischen Ausführungen verfügbar sein: etwa einem Sprachmodell speziell für medizinische Anwendungen, das auch Röntgenbilder auswerten kann, und einem Eigens für den IT-Sicherheitsbereich.
Darüber hinaus arbeitet Google aber bereits an einem neuen Sprachmodell namens Gemini, mit dem die Bard-Anwendungen als nächstes trainiert werden sollen.
Wird der Chatbot auch in weitere Produkte integriert?
Ab sofort soll man die Antworten des Chatbots direkt in das Programm Gmail und Sheets exportieren können, etwa wenn man sich von der Sprach-KI einen Geschäftsplan aufstellen oder einen E-Mail-Entwurf formulieren lässt.
Außerdem sollen Nutzer auch mithilfe von Bildern mit Bard kommunizieren und dem Chatbot eine auf einem Foto basierende Frage stellen können. Ebenso soll der Chatbot seine Antworten in Bildform veranschaulichen, etwa auf Fragen wie «Welche Sehenswürdigkeiten gibt es in Washington?». Die Bild-Funktion ist jedoch noch Zukunftsmusik; schwammig hiess es, sie werde «kahl» kommen. Bei der Konkurrenz sind diese multimedialen Funktionen ebenfalls noch nicht öffentlich verfügbar.
Darüber hinaus plant Google, die Schnittstelle von Bard mit Drittfirmen zu teilen, damit diese den Chatbot in ihre eigenen Apps integrieren können. Open AI hatte den gleichen Weg eingeschlagen, um Chat-GPT noch weiter zu verbreiten. So kündigte Google am Mittwoch beispielsweise eine Kooperation mit der Software-Schmiede Adobe an: Mit dem Programm Adobe Firefly sollen Nutzer nun selbst Bilder erstellen können – ähnlich auch, wie dies mit Open AI’s Dall-E-Programm oder dem Programm Stable Diffusion möglich ist. Auch für diese Anwendungen muss man sich jedoch erst in eine Warteliste eintragen.
Wird Bard auch in Geschäftsanwendungen von Google zu finden sein?
Laut Google nutzen 9 Millionen zahlende Kunden jeden Tag Geschäftsanwendungen des Konzerns und sie sollen mittelfristig ebenfalls die Möglichkeiten der Sprach-KI nutzen können. „Google Cloud wird sie die großen Möglichkeiten der KI voll nutzen lassen“, versprach der Konzern seinen Geschäftskunden; Indirekt eine Kampfansage an den Konkurrenten Microsoft, der noch vor Google die Nummer Zwei im Weltweiten Cloud-Geschäft ist (Marktführer ist Amazons Datenwolke AWS). Ähnlich wie bei Microsoft sollen auch Nutzer von Googles Cloud künftig generative KI für eigene Anwendungen nutzen können – etwa Analysen hauseigener Daten oder Programmieren von spezifischen Anwendungen.
Auch soll die KI künftig Texte in verschiedenen Tonarten vertonen können – freudig, aufgeregt, bedächtig – sowie in verschiedenen Sprachen. Dies dürfte etwa für Verlage interessant sein. Außerdem sollen Nutzer mithilfe der KI unbegrenzte Produktbilder in Studioqualität erzeugen können, ohne dafür den Schreibtisch verlassen zu müssen.
Zunächst stehen aber auch diese neuen Anwendungen nur einer Gruppe von Testnutzern zur Verfügung.
Was unternimmt Google gegen «Deepfakes»?
Die Frage, wie generative KI auch für Falschinformationen missbraucht werden könnte, spiele bei allen Entscheidungen des Konzerns «eine entscheidende Rolle», hiess es am Mittwoch. Google sei es wichtig, die neue Technologie verantwortungsvoll anzuwenden, wiederholte Pichai mehrmals. Tatsächlich gibt es bereits zahlreiche Beispiele dafür, wie generative KI dabei hilft, Fotos und Videos für Propagandazwecke zu fälschen.
Deshalb gibt Google den Nutzern nun neue Werkzeuge an die Hand: Mit KI erstellte Inhalte werden von Googles Sprachmodellen künftig mit einem Art Wasserzeichen in den Metadaten versehen. Damit sollen Nutzer KI-Erzeugnisse als solche erkennen können. Ebenso kann man mit der Google-Rückwärtssuche sehen, in welchem Kontext bestimmte Bilder schon einmal aufgetaucht sind.
Gleichzeitig habe man sich entschieden, bestimmte KI-basierte Innovationen nur ausgewählte Nutzerkreise zugänglich zu machen – so etwa Googles neuer «Universal Translator»: eine KI-basierte Software, mit der man Videos in Sprachen vertonen kann, wobei die Lippenbewegungen und die Tonalität des Sprecher entsprechend angepasst werden. Man kann sich ausmalen, wie die Software für Deepfake-Videos missbraucht werden könnte.
Warum Google die Sprach-KI nicht schneller in seine Produkte integriert?
CEO Pichai und andere Redner an der Konferenz verweisen immer wieder darauf, dass man nicht in Eile sei, die neue Sprach-KI in die vielen Produkte des Konzerns zu integrieren. Die neue Form künstlicher Intelligenz steht erst ganz am Anfang. „Wir orientieren uns an unseren KI-Prinzipien und wollen verantwortungsbewusst vorgehen“, sagte Pichai. In den vergangenen Wochen zeigte sich, dass etwa Halluzinationen von Chatbots problematische Folgen haben können. „Wir wollen uns Zeit lassen, wie wir die neue KI mit unseren Werten vereinen können, bevor wir aufs Gaspedal drücken.“
Für Google als einen der weltgrößten Konzerne steht sehr viel auf dem Spiel – nicht zuletzt die eigene Reputation. Genau deshalb bezeichnet der Konzern alle neuen KI-Produkte als „Experimente“. Doch die Tatsache, dass Google all diese nun auf einen Schlag der Weltöffentlichkeit vorstellte, zeigt auch, wie sehr der Konzern zurzeit unter Zugzwang steht, mit der Konkurrenz mitzuhalten.