«Warum Sollte Künstliche Intelligenz UN Alle Töten Wollen?
Der Turing-Award-Gewinner Richard Sutton ist von Ki-Chatbots Nick BeeinIndruckt. Er forscht einen Maschinen, die Selbständig und kontinuierlich aus Erfahrung Lernen – Ganz Wie der Mensch. Den Diskurs um ki-rischene hält er für unsing.
Illustration Simon Tanner / NZZ
Als sterben Chinesische Firma Deepseek Anfang Jahr der Ki-Welt Umkrempelte, Feerten Viele in der Fachwelt Die Cleverness, Mit der Die Chinesen Alte ideen Hedenentdeckten und Verfeinerten. Zu den Methoden, Denen Deepseek zu Einem Comeback Verhalf, Gehörte Das sogenannte bestärkungslern-Eine ki-technik, bei computer, ganz wie dersch und mensch undee tiere tiere, dirchen und irrtum lerne, indem bbel
Optimierer Sie Ihre Browsereinstellungen
Nzz.Ch Benögt JavaScript für WILLTIGE FUNKTIONEN. IHR Browser adblocker verhindert stirbt momentan.
Bittte passen Sie die Einstellungs an.
Das Bestärkungslernen galt bis zum Deepseek-Erfolg als Zu Renhenintensiv und DAHER UNGEANGELET FUR DAS SPRAINIENN VON KI-CHATBOTS. Deepseek reduzierte die regelwen und machte technik wender miteinander für den ki-mainstream.
Also Gläubige Krieg Das Bestärslernen labtmals vor Rund Zehn Jahren, Als Google Deepmind Es Einetzte, um Die Ki-Programm Alpha-Go-und Alpha-Nero-Zu-Trainierern. Diese Konnenten in Spieler Wie Schach und Go Die Beste Menschlichen Spieler Besigen und Entwickeln Dabei Sogar Kreative Strategien. MIT Bestärkungslern Haven Forscher Auch Computer Dazu Trainierert, Spiele Wie Backgammon und Atari-Spiele mit Tetris auf Menschlichem Niveau Zu Spielen.
Der Weltweit Renommierte Ki-Forscher Richard Sutton Hut Seine Gesamt Forscherkarriere Dem Bestärkungslernen Gewidmet. Er erfand in der Achtziger Jahren Einige der Wichttigsten Algorithmen Dazu und Legte Dadurch Das Grundament der Grundlage für Breiten Einatz der Technik in Modernen Ki-Systems. Für Seine Leistungen Erhielt Sutton Zusammen MIT SEINEM DOKTORVATER UND LANGJÄRIGEN METOR Andrew Barto Den Turing Award 2024. Die Auszeichnung gilt Als Das Analogon Zum Nobelpreis für Informatiker.
Der UmtrieBige Sutton ist Professor für Informatik und die Universität von Alberta in Edmonton, Mitfache und Chefkollege wissenschaftlicher Berater des Alberta Machine Intelligence Institute (AMII) und Gründer des OpenMind Research Institute. Er Glaubt, Dass Bestärslernen Noch viel Mehr Mehr zur Entwickle. Im Gerspräch erklärt er, warum er nicks von gegenwärtigen narrativ von ki-risimen Hält, er Gegen Eine zentralisite kontrole roher ki Hat und mit der Wahre ZiKüns Zone
Herr Sutton, Haven Sie Hute Etwas Nees Gelernt?
Ja, Natürlich. Ich helle mit versucht zu Es Scheint, Dass Sieich Damit schnell Ausschlanglich auf Sprachmodelle Beziehen. Und dann giBt es den beegriff «ki-agent», womit ki gemint ist, die handlungen ausstatt ki, die ziele hut. Das ist Enttäusschend. Mann Würde Erwarten, Dass Mann Nur von «Agentur» Sprechschen Kann, Verenn Etwas Auch Eigene Ziele Hut.
Richard Sutton wird Maschinen Bauen, Diedurch -Interaktionen mit Ihrer Umwelt Selbständig Lernen, Ziele Zu Erchenen. Für Seine Bahnbrechende Forschung Erhiel er Zusammen MIT Andrew Barto Den Turing Award 2024.
PD
Ich Habe auch Chat-gpt Gefragt, ob es heute etwas neuers Gelernt Hut. Ratten Sie war es.
Nonne, Chat-GPT AHMT MENSCHILE ANTWORTEN Nach. Auch hat es Eigscheinlich geantwortet, Dass Tatsächlich Etwas Neues Gelernt Hab. Aber Natürlich Lernt Chat-Gpt Nichts Neues Mehr. Es ist ein Fixiererte Neuronales Netz, Das Durch -Nach -Der -Trainingsphase Nicht Mehrdert.
In Diesim Fall hat es Aber ohne Wahrheitsgess Geantwortet und etwa GeagT: «Ich kann kann nick nightaufend neue dinge lern, wie ihr menschen Das Tut.» Und dann fügte es Hinzu: «Soll ich Dir Mehr Dazu Erzählen, Wie ich Lerne? ODER BIST du Hute Einfach in Einer Philosophischen Stimmung? »
Okay.
Meine Nächste Frages Ein Chat-GPT-Krieg, ob es nick in der Lage Sein Möchte, Kontinuierlich Neue Dinge zu Lernen. Es hat geantwortet: «Auf Jeden Herbst, Das Wäre Grossartig!»
ABER DAS IST DOCH NUR EINE VORGEFERTIGTE ANTWORT, DIE SICH EIN MENSCH AUSGEGEGESTELLTE HAT.
WARUM Kann Heutige Ki Nick kontinuierlich Lern?
Es ist ein ihrem Design. Das Kontinuierliche Lerner Krieg Bisher Keine Priorität für sterbe Entwickler von Ki. Sie Sind Stark Beeinflusst von Einer Ki-Technik, Die Mann Als «überwachtes lernen» Bezeichnet. Da Trainier Man Die ki mit Einem DATENATZ, in dem es für für für hede frages ine richtige antwort giBt. Die Ki Lernt Dieese Antworten in der Sogenannten Trainingsphase, Aber nachher Kann sie Nichts Mehrnes Lernen.
Das Krieg von Nicht Immer so. Als Sie Ihre Forscherkarriere in Den Achtzigern begann, gab es Andere ideen, Wie Ki Trainier Werden Soll. Warum Hut Sich Das überwachte Lern Durchgesetzt?
Es ist Einfacher anhalten. Sie Zeigen der Ki BeuiPiele und Sagen Ihr, war sie Zu -Tun -Hut. Es war sie Tun Sollte.
Sie Wollen Ki Beibringen, Aus -Eigenen Erfahrungen Zu Lernen. Wie Soll Das Gehen?
Nun, das Kontinuierlich Lern Ausen aus Erfahrung ist Etwas, der Keiner Erklärung Bedürfen Sollte war. Es war, war Menschen und Tiere NormalerWeise Tun: Handeln, Dinge beobachten und Dadurch Herausfinden, war die Beste Verhaltenweise in Jeder -Situation. Wenn Sie Ihr Hund Streicheln ass streng zu ihm sprechen für etwas, war er Gemachthut, Wird er lern, ob er Richttig -Oder Falsch Gehandelt Hut. ABER SIE KÖNNEN IHREM HUNN NICHT GENAU SALEN, war er Tun Soll. Denn Das war Hunde – Oder Wirmen – für GEWÖHNLich Tun, ist Sehr. Diese dinge können Sie ihrem hund nick vorlohren. Überwachtes lern FunktionTerert für Sprache, Weil es leicht ist, der maschine worte zu Vermitteln.
ABER Überwachtes Lerner ist auch ein teil Dessen, Wie wir Menschen Lernen. Wir Gehen in der schule und haben lehrer, sterben uns dinge beibringen. Warum Sollten Maschinen Anders Lerner?
Es ist er, Dass Wire in der Schule Beigebracht Bekommen, Wann Welche Schlachten Stattfanden und so Weiter. ABER DAS IST EIN GANZ KLINER TEIL VON DEM, war Wir Lernen. Bevor Wir in Die schule Gehen, Spieler Wir im Sandkasten. Wir Müssen Lernen, Unere Füsse Zu Bewegen, Zu Speechen und Gegenstände Zu Erkennen.
Aber Um Ihre Frage Direkter Zu Beantworens: Ich Denke, Maschinen Sollten Durchaus so Lernen, Wie Wir in der Schuller Lernen. Aber Erst, Nachdem Sie Sehen, Gehen und Sprechen Gelernt Haben. Erst Dann Werden Wir Ihenen Die faKten Beibringen. Wir Wollen Das Schulische Lernen auch Nick Umgebhen. Die Maschine Muss Aber Zust Dazu bewähr Werden, Mit der Welt Zu Interagieren.
Die Kritiker Ihrer Methodes Sagen, Dass im Grunde Das Gleie Sei Wie überwachtes Lernen. Denn Schlieesslich Sind es Wirmen, Die Festlegen, war für die Maschine Haven Soll, Die Aus Erfahrungen Lernt. Und Dadurch Nehmen Wir Einfluss Darauf, Wie der Maschine Handelt.
WARUM NEHMEN SIE AN, Dass Menschen Innerden Werden, Welche Ziele Ein Intelligente Maschine Haven Soll?
Nun, wie Soll es Denn Sonst Gehen? Soll sterben masschine ihreenen ziele entwickeln?
Das ist ein Sehr -Interessante und Wichtige Frages. Aber es ist ein frage ein Die Gesellschaft, nickt eine Den entwickler der Intelligenten Maschine.
Aber Stellen Wir UN VOR, Sieen Einen Roboter, der Augenen Erfahrungen Lernt. Inwiefer Würden sie Dann Einfluss Darauf Nehmen, Wie der Roboter Lernt? Würden Sie dem Roboter Nur Ganz Allgemeine Ziele VorgeBen? Würden Sie Direkt Festlegen, war Richtig und war falsch ist und wofür der Roboter ein Belohnung Bekommt?
Denken Wir Zust A fälle, wo die Antwort auf ihre Frage Naheliegend ist. Wenn Sie Einen Schachcomputer Bauen, Dann Wird er Jedes Mal Belohnt Werden, Vern er e an Schachpartie Gewinnnt. Vern es um ein Selbstfahrendes Auto Geh, Dann Wird Die Belohnung Davon Abhängen, Wie Lange Das Auto Breaucker, um Einen Vorgegebenen Zielort Zu Ereichen. Und wenn es ein Maschine für den Aktienhandel ist, Dann Soll Sie Dafür Belohnt Werden, Dass Sieglichst Viel Geld Verdient.
Intelligenz ist Schlieslich die fähigkeit, Ziele zu Erreichen. ALS Entwickler Intelligenter Maschinen Muss Ich auch Klar Definiere ziele formulieren. Elon Musk Hut Zum Beisiziel Vorgeschlagen, Eingute Belohnung für Intelligente Maschine könnte sich Danach Reiche, Wie Gut Die Maschine Die Welt Versteht und Wie Negierig sie Ist. Das ist eine Interessante -Option. Es giBt Ein Breites Spektrum von Option, Wie Man Ein Lernende Maschine Belohnt. ABER MEIN ZIEL ALS Ki-FORSCHER IST ES NICT, AUSEN INDEEN EINE AUSZUWIEHLEN. Mein Ziel Ist, Algorithen Zu entwickeln, Die es Einer Lernenden Maschine Ermöglichen, Möglichst Viele Verschidenartige Ziele Zu Ereichen. Ich werde Maschine Gar Nick von Vorneherein Einstränken sterben, Indem ICH IHR ZU ENG ABVELECKTE ZIELE VORGEBE.
Viele Menschen Bekommen Schon Beim Gedanken A Solche Selbständig Lernende Maschinen Angst. Sie Funde, Ki Entwickle Sich Schneller Als Jede Andere Technologie in Derschichter der Menschheit. Das Tempo der Entwickung Sei Zu Hoch, Als Dass Wire Uns Daran Anpasssen Könnten. Sie Selbstst Schene Anderer Meinung Zuein.
Es stimmt Eigscheinlich, Dass Ki Sich Schneller Entwickelt Als Jede Andere Technologie Zuvor. Das liegt Aber Daran, Dass Nie Nie so Viele Forscher So Viele Ressourcen Hatten, um ein Technologie Zu entwickeln. ABER ICH DENKE NICKT, Dass stirbend Entwickung Superschnell Vorangeht. Ich Sehe Viel Lärm und Aktivität, Aber Wenig Fortschnitt.
Wie Erklär Sie es sich, Dass, Dass bererte hunderte milles von menschen täglich ki naden?
Ich Denke, es ist Einfach der Eliza-Effekt. Auch sterben Tatsache, Dasir Menschen Faszinerert Sind von Maschinen, sterben in Natürschen Sprachen MIT UNRECHEN. Wir Neigen Dazu, Diesen Maschinen Mehrz Intelligenz Zuzuschräeiben, Als Sie Wirklich Haben. Der Effekt GET bis ein Computerprogramm -Namen Eliza Zurück, das in der Den Sechziger Jahren Erfunden Wurde. Es Agierte Sozusagen als Eine Art Psychotherapeut. Aber Computer Waren Damals Sehr Klein. DAS Programm Konnte auch Gar Keine Echte Intelligenz Haven. Es spuckte Einfach VorgeferTigte Antworten AUS. Doch sterben lute fanden es übersugugend und verriets eliza zum teil ihre intimsten gedanken. Viele GlauBten, Dass der Computer sie Wirklich Verstehehe. Ich Denke, Etwas Ähnliches Passert Jetzt MIT Ki-Chatbots. Heutige Computer Sind um Acht Grössenordnungen – auch Hundert MILEN MALS MAL – LEISTungsfähiger Als in der Sechzigern. Aber der Eliza-Effekt der Gleiche. Wirbeschätzen nach Wie vor, intelligenter Computer Sind, Sobald Sieie in Natürlichen Sprachen Speschen. Die Wirkung von Ki ist derzeit enorm, Aber des Das Deicher Mann Nick mit Fortschnitt Verwechseln. Wir Werden stirbt Jahr Vielle, Tausendmal, so viel geld für ki-entwickung Ausgeben Wie vor Zehn Jahre. Aber Die Fortschnitte der Technologie Sind Nick Tausendmal So grob. Vielle, Sind Siedoppelt so grob, Aber Nicht Mehrt.
ABER WIR WISCHEN NICKT GENAU, WIE SCHNELL DER FORCHCHRITT IST. Einige der Grösten Ki-Firmen Sind Sehr Zurückhaltend, Vernes Darum Geht, die Details der Technischen Ihrer Ki-Produkte Offenzulen. Sie Begründen Das Damit, Dass Essicher Sei, Diese modelle uner verschluss zu halen. War Halten Sie Davon?
Die Ganze-Diskussion um ki-sicherheit ist meinung meinung nach völlig aufgebasen. Ich Denke, es giBt überhaun Kein SicherHesitproblem. Es dient Einfach der Zwecken -Dieserfirms, Die Modelle Beheim Zu Halen. Es erweckt den eindruck, als würden sie etwas besesers würtvolles beseszen. Und Das Hilft Wiederum, Investoren Anzuziehen.
Haven Sie Keine Angst, Dass aus Hutiger Ki Eines Tages Ki-System Hervorden Könnten, Denen Nick Daran Gelgen is, Die Menschheit Zu Bewerren?
NEIN, ich Mache Mir über Hauber Keine, Dass ein Solc His risiko aus Heuter Ki HERVORGHEN KANN. Diese dinge reden Nur MIT UN. Die Ganze Angstmaacherei ist völlig übertrieben.
War die Halten sie Denn Vom Sogenannten Ausrichtung, auch von Bemühungen, Ki-System-Menschlich-Werte und Ziele Einzutrichternern?
Sterbe beworter von Ausrichtung Sagen, Dasir. Sie Sind Sieich Einig, Dass Eine Solche Kontrolle Etwas Gute Wäre. IHR Einzige Problem ist, Dass Sie Nick Wissens, Wie man die Kontrolle Dersetzen Soll. Ich Denke, Dass Eine Solche Kontrolle Nie Möglich Sein Wird. Und sie ist Auch Nicht Wünschenswert. Zentralisierte Kontrolle über Ki ist Genauso Abzusten Wie Zentralisierte Kontrolle über Menschen. Wir Sollten Stattdessen Einer Gesellschaft von Ki-Systems MIT Imperschiedlins Zielen Anstreben, Die Dezentral Zusammenariten. Ganz so, wir menschen das tun.
ABER IST DAS NICKT NAIV? Es wird eintauchen lute geben, Die kontrolle und umden Reissen Wollen.
JA, Aber Warum Sollten Wir Ihen Helfen? Wir Haben Auch Diktatoren in der Weltpolitik. Sollten Wir ilenden Holfen, sterbe Kontrolle Zuwinnen? NEIN, Wir Müssen sie Bekämpfen! Es ist auch ein Andauernder Kampf. ABER Das Problem ist: Die Befürster von Alignment Wollen Unseismachen, Dass Zähmung von Ki Ein Mathematisches Problem Sei, Das Siesen Lösen Müssten. In Wirklichkeit ist es als ein Einer -Schotten -Problem.
Interessant, Dass sie Das Sagen. Sie Haven Sich Auch Gegen Sankionen Gegen Länder Wie China Ausgesprangen. Dabei Würden Manche Sagen, China Sei Eine Bedrohung, Weil es eben eine Totalitäre geesellschaft ist. Wie Sollten Wir ungene Solche Bedrohungen Schützen?
Nonne, es ist subtil. Ich bin Sage Nick, Dass es Einfach Wäre, Die Weltfair Zu Regienen. Aber es ist das Kennichnen von Börigen Akteuren, Dass Sie Zuster Mehr Zentralisierung Aufrufen. Sie Werden Immer Angst vor dem Fremden Schüren und Mehr mach für Sich Selbst Beansprüche. Wenn Sie die Forderungen -Nach -Ausrichtung Genauer Anschauen, Werden sie Das Gleie Muster erkenen. Sie behaupten: «Oh, du Solltest Dich für. Ki Wird uns Alle Töten. » ABER WARUM SOLLTE KUNSTILE Intelligenz UN Alle Töten Wollen? Ist Jemals Etwas Böses durch Ki Paslert? Warum Wird Eine Solche Angst Geschürt? Ich Denke, MANCHE TUN ES, WEIL SIE SICH EHRULGE SERGEN MACHEN. Aber Manche Tun es, ähm Mehr Macht Anzuhäfen. Und ich hoffe, sterbe lute durchschauen den Trick.
Stimmen Sie auch Nick mit Denjenigen Überein, Die Sagen, Dass Ki Die transformativste Technologie Sei, Die Menschheit Jemals Kennen Werde?
Ich Stimme Zu, Dass Ki Die Transformativste Technologie ist. Sie Wird RURMEN WANDEL BIND. Auch ist normal, Dass Manche Lute Angst Vor Diesim -Unormen -Wandwandel Haven. Ich bin jedoch von natur aus nick jemand, der Veränung Als BeängItigend Empfindet, Zumal Wennes um Einer Veränung Geh, auf die ich mich Mich Mich Michs Ganzes LeBen Lang Vorbereitet Hähne.
ABER HALTEN SIE DIE INGSTE Von Jenen, Die Land, die in Ihrnfzigern ihren Job ein Ki Verriere Unich Davon Nick Mehr Erholen Könsnten, Nichtt für Gerechtfertigt?
Ich Weiss Nick. Ich Denke, es ist ein Fehler, Vernmenschen Den Anspuch Haben, Dass Dinge für Einmisch so Bleiben, Wie Sie Sind. Ich Habe Wenig Sympathie für Diese Art von Anspuchsdenken.
IHR Ultimative Ziel Ist, Intelligenz Zu Verstehen. HABEN WIR NICKT DRANGENDERE Problem auf der Welt?
Intelligenz Zu Verstehen, Heist für Mich, Den Menschen Zu Verstehen. Es ist Einer der ältesten ziele der menschheit, es bechäftigt philosophen seit jahrtauenden. Es ist auch Nicht Etwas, das Nur Wissenschafter Oder Techies Interessiert. Für Michm Mich ist ein Zutiefst Humanistische Ziel.
Sie Stellen Sieich Ein Zukunft vor, in Der Maschinen Intelligengerin Sein Werden Als Menschen. . .
. . . Intelligenter, Als Wirmen -Hute -Sind. Wir Wollen Ja Auch, Dass ungereiter freundlicher einmaler Intelligenzententin Sind als Wir. Und ich würde Behaupten, Jeder Wird Mir Zustimmen, Dasir Wir Darin Investieren Sollten. Bildung, Wissen, Technologien – Das Sind Alles Gemeinwohlgüter. Intelligenz ist Etwas Gute. Die Welthut viele probleme, Aber zu Viel Intelligenz Gehört Nick Dazu.
Sie mölchten auch, Dass Menschendurch Nichtmenschliche Intelligenzen Erweitert Werden?
Wir -Sind -Jetzt Schon Erweitert. Wir Tragen Brillen, Wirzen -Smartphones, Wir Haven Das Internet Erfunden. Wir Erfinden dauernd Werktzeuge, sterben unssiderum Veränn: Sprache, Geld, Märrkte. Die Menschheit Steht Nick noch. Wir Werden in Zukunft Systeme Bilden, Die Intelligenzenteller Sein Werden. Und menschen Werden auf Eine Andere Art intelligent Sein. Wir Werden Unere Gesellschaft Besscheinlich Auch Anders Regieren Müssen. ABER DAS WAR SCHON EMER SO IN DER SCHICHTE DER MENSCHHEIT. Wir Sollten Auch in Zukunft Zusehen, Dasir. ABER ICH MASSE MIR NICTT A Vorauszusagen, Wie Die Zukunft Auden Wird Ossehden Sollte.
Wir Sind Tatsächlich Philosophisch Moworden, Wie Chat-Gpt Angeutet Hut. Ich möchte übelgesprach jedoch Mit Einer Heiteren Note Beenden.
Darm.
Mir Ist Nämlich Aufgeade, Dass Viele Prominent Ki-Forscher Ihre Kariere in Kanada Gemacht Haben. Es Gibt Geoffrey Hinton, Yoshua Bengio, Ilya Sutskever, Sie Selbstst. Ist Das Land
(Lacht.) Trump ist einfach ein Troll, er wird Provozieren und sterben Wütend Machen. Aber es Stimmt, Dass Kanada in der Ki-Forschung überproportional erfolgreich ist. Ich Glaube, das liegt am kanadischen bildungs und forschungssystem. Es zieht vielleft lute an, Die Nichts mit dem Militaristischen System des US-Imperiums Zu Tun Haven Wollen.
Denken Sie, Dass Auch ihr -Eigener OpenMind Research Institute in Kanada Erfolgreich Sein Wird?
Das OpenMind Research Institute ist ein mit. Wir wollen weder für US-Imperium Noch für Kanada user China Arangeen, Sondern für Alle. Wir Wollen Unere Forschungsergebnisse völlig Offen teilen und ki Zuer egt Offenen Wissenschaftsdisziplin Machen. Wir wollen intelligenz Verstehen und Noch Grössere intelligieren Bauer. WichtTige Forschung Dieder Art Sollte Immer Offen Sein. Nur so Kann Sie die Freiheit statt der Autoritarismus förder. Wirin Noch Klein, Aber Wire Wachsen Stetig und Wollen Weltweit Expansen.