Turing-Test und AI 10 17

Pexels/Google Deepmind, CC BY-SA

1950 schlug der britische Informatiker Alan Turing eine experimentelle Methode zur Beantwortung der Frage vor: Können Maschinen denken? Er meinte, wenn ein Mensch nach fünf Minuten Befragung nicht erkennen könne, ob er mit einer künstlich intelligenten Maschine (KI) oder einem anderen Menschen spreche, würde dies zeigen, dass KI über eine menschenähnliche Intelligenz verfügt.

Obwohl KI-Systeme zu seinen Lebzeiten Turings Test noch lange nicht bestanden hatten, spekulierte er darüber

„[…] in etwa fünfzig Jahren wird es möglich sein, Computer […] so zu programmieren, dass sie das Nachahmungsspiel so gut spielen, dass ein durchschnittlicher Vernehmer nach fünf Minuten keine mehr als 70-prozentige Chance hat, die richtige Identifizierung vorzunehmen.“ Befragung.

Heute, mehr als 70 Jahre nach Turings Vorschlag, hat es keine KI geschafft, den Test erfolgreich zu bestehen, indem sie die von ihm dargelegten spezifischen Bedingungen erfüllt. Dennoch, wie einige Schlagzeilen reflektieren, einige Systeme sind ziemlich nahe gekommen.

Ein aktuelles Experiment hat drei große Sprachmodelle getestet, darunter GPT-4 (die KI-Technologie hinter ChatGPT). Die Teilnehmer verbrachten zwei Minuten damit, mit einer anderen Person oder einem KI-System zu chatten. Die KI wurde aufgefordert, kleine Rechtschreibfehler zu machen – und abzubrechen, wenn der Tester zu aggressiv wurde.


Innerself-Abonnieren-Grafik


Mit dieser Aufforderung gelang es der KI, die Tester gut zu täuschen. In Verbindung mit einem KI-Bot konnten Tester nur in 60 % der Fälle richtig erraten, ob sie mit einem KI-System sprachen.

Angesichts der rasanten Fortschritte beim Entwurf natürlicher Sprachverarbeitungssysteme könnte es sein, dass KI in den nächsten Jahren den ursprünglichen Test von Turing besteht.

Aber ist die Nachahmung von Menschen wirklich ein wirksamer Intelligenztest? Und wenn nicht, welche alternativen Benchmarks könnten wir verwenden, um die Fähigkeiten der KI zu messen?

Einschränkungen des Turing-Tests

Während ein System, das den Turing-Test besteht, uns gibt einige Wenn Sie beweisen, dass es intelligent ist, ist dieser Test kein entscheidender Intelligenztest. Ein Problem besteht darin, dass es zu „falsch negativen Ergebnissen“ kommen kann.

Heutige große Sprachmodelle sind oft so konzipiert, dass sie sofort erklären, dass sie nicht menschlich sind. Wenn Sie ChatGPT beispielsweise eine Frage stellen, wird der Antwort häufig der Satz „als KI-Sprachmodell“ vorangestellt. Selbst wenn KI-Systeme grundsätzlich die Fähigkeit hätten, den Turing-Test zu bestehen, würde diese Art der Programmierung diese Fähigkeit außer Kraft setzen.

Der Test birgt auch das Risiko bestimmter Arten von „falsch positiven Ergebnissen“. Als Philosoph Ned Block wies darauf hin, In einem Artikel aus dem Jahr 1981 heißt es, dass ein System den Turing-Test möglicherweise einfach dadurch bestehen könnte, dass es fest codiert wird und eine menschenähnliche Reaktion auf jede mögliche Eingabe auslöst.

Darüber hinaus konzentriert sich der Turing-Test insbesondere auf die menschliche Kognition. Wenn sich die Kognition von KI von der Kognition von Menschen unterscheidet, kann ein erfahrener Befrager eine Aufgabe finden, bei der sich KI und Menschen in der Leistung unterscheiden.

Zu diesem Problem schrieb Turing:

Dieser Einwand ist sehr stichhaltig, aber wir können zumindest sagen, dass wir uns über diesen Einwand nicht beunruhigen müssen, wenn es dennoch möglich ist, eine Maschine zu konstruieren, die das Nachahmungsspiel zufriedenstellend spielt.

Mit anderen Worten: Während das Bestehen des Turing-Tests ein guter Beweis dafür ist, dass ein System intelligent ist, ist das Nichtbestehen des Turing-Tests kein guter Beweis dafür, dass ein System intelligent ist nicht klug.

Darüber hinaus ist der Test kein gutes Maß dafür, ob KIs bei Bewusstsein sind, ob sie Schmerz und Vergnügen empfinden können oder ob sie eine moralische Bedeutung haben. Nach Ansicht vieler Kognitionswissenschaftler umfasst das Bewusstsein eine bestimmte Gruppe geistiger Fähigkeiten, darunter ein Arbeitsgedächtnis, Gedanken höherer Ordnung und die Fähigkeit, die eigene Umgebung wahrzunehmen und zu modellieren, wie sich der Körper in dieser bewegt.

Der Turing-Test beantwortet nicht die Frage, ob KI-Systeme funktionieren oder nicht diese Fähigkeiten haben.

Die wachsenden Fähigkeiten der KI

Der Turing-Test basiert auf einer bestimmten Logik. Das heißt: Menschen sind intelligent, daher ist wahrscheinlich alles, was Menschen effektiv imitieren kann, intelligent.

Aber diese Idee sagt uns nichts über die Natur der Intelligenz. Eine andere Möglichkeit, die Intelligenz von KI zu messen, besteht darin, kritischer darüber nachzudenken, was Intelligenz ist.

Derzeit gibt es keinen einzigen Test, der künstliche oder menschliche Intelligenz zuverlässig messen kann.

Im weitesten Sinne können wir uns Intelligenz als Folgendes vorstellen Fähigkeit um eine Reihe von Zielen in unterschiedlichen Umgebungen zu erreichen. Intelligentere Systeme sind solche, die eine größere Bandbreite an Zielen in einer größeren Bandbreite von Umgebungen erreichen können.

Daher besteht die beste Möglichkeit, die Fortschritte beim Entwurf universeller KI-Systeme im Auge zu behalten, darin, deren Leistung bei einer Vielzahl von Aufgaben zu bewerten. Forscher des maschinellen Lernens haben eine Reihe von Benchmarks entwickelt, die dies ermöglichen.

Zum Beispiel war GPT-4 in der Lage, richtig zu antworten 86 % der Fragen bezogen sich auf das Sprachverständnis im Rahmen mehrerer Aufgaben – ein Maßstab zur Messung der Leistung bei Multiple-Choice-Tests in einer Reihe akademischer Fächer auf Hochschulniveau.

Es erzielte auch ein positives Ergebnis AgentBench, ein Tool, das die Fähigkeit eines großen Sprachmodells messen kann, sich als Agent zu verhalten, indem es beispielsweise im Internet surft, Produkte online kauft und an Spielen teilnimmt.

Ist der Turing-Test noch relevant?

Der Turing-Test ist ein Maß für die Nachahmung – für die Fähigkeit der KI, menschliches Verhalten zu simulieren. Große Sprachmodelle sind erfahrene Nachahmer, was sich nun in ihrem Potenzial zum Bestehen des Turing-Tests widerspiegelt. Aber Intelligenz ist nicht dasselbe wie Nachahmung.

Es gibt so viele Arten von Intelligenz, wie es Ziele gibt, die erreicht werden müssen. Der beste Weg, die Intelligenz der KI zu verstehen, besteht darin, ihre Fortschritte bei der Entwicklung einer Reihe wichtiger Fähigkeiten zu überwachen.

Gleichzeitig ist es wichtig, dass wir bei der Frage, ob KI intelligent ist, nicht ständig „die Zielvorgaben ändern“. Da sich die Fähigkeiten der KI rasch verbessern, finden Kritiker der Idee der KI-Intelligenz ständig neue Aufgaben, die KI-Systeme möglicherweise nur schwer bewältigen können – und stellen dann fest, dass sie übersprungen wurden noch eine Hürde.

In diesem Umfeld ist die relevante Frage nicht, ob KI-Systeme intelligent sind, sondern genauer gesagt, was Arten an Intelligenz, die sie möglicherweise haben.Das Gespräch

Simon Goldstein, außerordentlicher Professor, Dianoia Institute of Philosophy, Australian Catholic University, Australische Katholische Universität und Cameron Domenico Kirk-Giannini, Assistenzprofessor für Philosophie, Rutgers University

Dieser Artikel wird erneut veröffentlicht Das Gespräch unter einer Creative Commons-Lizenz. Lies das Original Artikel.