Er ist witzig, charmant und schnell: Open AIs neuer KI-Sprachassistent wirkt wie aus Hollywood
Mit einem neuen Sprachassistenten wird es Open AI den Nutzern erleichtern, KI immer und überall zu nutzen. Zudem stellt die Firma eine neue Gratis-Version des mächtigen Sprachmodells GPT-4 vor. Das ist eine direkte Kampfansage an Apple und Google.
Neuerdings kombiniert Open AI KI-Antworten aus Bild, Text und Audio.
Jaap Arriens / NurPhoto / Getty
Wer nach Hinweisen dafür sucht, dass in den USA ein Machtkampf um die Führung in künstlicher Intelligenz tobt, der muss diese Woche ins Silicon Valley schauen. Genau 24 Stunden, bevor Google ab Dienstag an seiner Entwicklerkonferenz Durchbrüche bei künstlicher Intelligenz demonstrieren will, sorgte Open AI am Montag für Aufsehen. Die Firma hinter dem Chatbot GPT stellt ihr bis dato leistungsstärkstes Sprachmodell GPT-4 nun in einer neuen Version namens GPT-4o allen Nutzern kostenlos zur Verfügung – ein Paukenschlag.
Der Buchstabe „o“ in der Bezeichnung des Modells steht für das lateinische Wort „omni“ (alle). Das teilte die Cheftechnologin Mira Murati bei einer live übertragenen Präsentation am Firmensitz in San Francisco mit. Die mehr als 100 Millionen Nutzer, die den Chatbot Chat-GPT bereits nutzten, konnten nun auf ein markant schnelleres und klügeres Modell zugreifen. Das neue Modell kann laut Open AI in seinen Ergebnissen auch Audio, Text und Bild kombinieren.
„Ein wichtiger Teil unserer Mission ist es, jedemmann fortschrittliche KI-Werkzeuge kostenlos zur Verfügung zu stellen“, schrieb später der CEO Sam Altman auf seinem Blog. „Wir sind eine Firma, und wir werden immer Dinge finden, für die wir Geld verlangen, und das wird uns dabei helfen, herausragende KI (hoffentlich) Milliarden von Menschen gratis zur Verfügung zu stellen.“
Der Hollywood-Film „Her“ inspirierte Altman
Zudem stellte Open AI einen Sprachassistenten vor – und dieser funktioniert verblüffend gut. Wer bisher Konversationen mit anderen Assistenten wie „Alexa“, „Siri“ oder „Google“ frustrierend fand, weil diese einen nicht schlichten Weg nicht verstehen, dürfte angenehm überrascht werden.
Open AIs Assistent klingt tatsächlich wie ein Mensch, man kann ihn unterbrechen, und er antwortet ohne Verzögerung. Ausgelöst wird er durch den Zuruf „Hey Chat-GPT“. Der Assistent ist locker in der Sprache, bisweilen sogar witzig, und gibt sich emotional. Im Gegensatz zu früheren Spracherkennungsfunktionen von Open AI kann der neue Sprachassistent dank GPT-4o auch einzelne Sprecher unterscheiden und Hintergrundgeräusche ausblenden.
Gemeinsam mit Open AI kann der neue Assistent die Gefühle des Nutzers in der Stimme und im Gesichtsausdruck erkennen und entsprechend darauf reagieren. Erinnerungen werden wach an den Hollywood-Film «Her» aus dem Jahr 2013, bei dem sich der Hauptdarsteller in einen künstlich intelligenten Sprachassistenten verliebt. In einer Rede hatte Altman vergangenes Jahr erzählt, dass er von dem Film inspiriert worden sei. „Es fühlt sich an wie KI aus einem Film“, schrieb der CEO am Montag auf seinem Blog mit Blick auf den Sprachassistenten. „Ich finde es immer noch überraschend, dass das nun Realität ist.“
In den sozialen Netzwerken zeigte Open AI am Montagnachmittag in zahlreichen Videos, wie insbesondere der Sprachassistent das Leben von Nutzern künftig prägen könnte, beispielsweise von Menschen mit Sehbehinderung oder als Nachhilfelehrer von Schülern.
Das ist wild.
OpenAI hat gerade ChatGPT-4o eingestellt und es wird das Spiel der KI-Assistenten komplett verändern.
10 wilde Beispiele:
1. Visueller Assistent in Echtzeitpic.twitter.com/D3qWzHGzaD
– Min Choi (@minchoi) 13. Mai 2024
Auch kann der Sprachassistent nun zwischen Personen dolmetschen; Murati führte dies auf Italienisch und Englisch vor. Für welche Sprachen dies möglich sein wird, teilte Open AI bisher nicht mit. Für Interessenten ohne Abo sollen die neuen Funktionen «in den nächsten Wochen» zur Verfügung gestellt werden. Für Plus-Nutzer war Chat-GPT 4o in den USA bereits am Montagnachmittag nutzbar.
Google und Apple stehen nun unter Zugzwang
„Mit einem Computer zu reden, hat sich für mich nie natürlich angefühlt“, schrieb Altman nach der Produktpräsentation auf seinem privaten Blog. „Jetzt tut es das.“ Er gab auch einen Vorgeschmack auf das, woran man bei Open AI zurzeit offenbar tüftelte: „Wir arbeiten an Personalisierung, Zugriff auf Ihre Informationen, die Möglichkeit, für Sie Aufgaben auszuführen, und mehr – ich sehe eine aufregende Zukunft vor uns, in der Computer.“ mehr für uns tun als je zuvor.»
Klar ist, dass Open AI mit den Produktvorstellungen die Messlatte für die etablierten Technologiekonzerne enorm hochlegt. Insbesondere Google und Apple stehen nun unter Zugzwang, bei ihren jeweiligen Entwicklerkonferenzen am 14. Mai und am 10. Juni die KI-Funktionen von Open AI zu übertrumpfen.
Die Schlüsselfrage ist, wie sich die großen Konzerne noch differenzieren wollen – oder ob sie einen anderen Ansatz wählen. Wie «Bloomberg» kürzlich berichtete, plant Apple eine Zusammenarbeit mit Open AI. Angeblich soll die nächste Version des Betriebssystems für das iPhone Funktionen von Chat-GPT beinhalten.