OpenAI: Dieser KI-Agent soll Bestellungen aufgeben und Tische reservieren

16

Am Donnerstag hat OpenAI ein neues Programm namens
Operator vorgestellt, das mithilfe von künstlicher Intelligenz (KI)
Aufgaben in einem Webbrowser erledigen kann. Zunächst ist es nur in den USA
verfügbar. Aus Sicht von OpenAI ist es der nächste Schritt auf dem Weg zu einer
Welt, in der KI-Assistenten selbstständig Alltagsaufgaben erledigen.

Im von OpenAI vorgestellten Live-Demovideo suchte Operator
beispielsweise nach einem Restaurant in San Francisco und versuchte, einen Tisch
zu einer bestimmten Uhrzeit zu reservieren. Außerdem konnte Operator bei einem
Onlineshop einen Warenkorb von verschiedenen Lebensmitteln zusammenstellen, auf
Basis einer handschriftlichen Einkaufsliste, die ihm ein Angestellter von
OpenAI zuvor vorgegeben hatte. Das soll laut OpenAI seinen Nutzern Zeit
ersparen.

Die Branche nennt KI-Programme, die mehr oder weniger
autonom agieren, Agenten. Anders als
reine Chatbots sollen sie nicht nur auf einzelne Anfragen antworten, sondern mehrere
Arbeitsschritte im Sinne ihrer Nutzer erledigen können. An solchen Systemen arbeiten
auch viele andere Unternehmen.

Google hat vor wenigen Tagen verkündet, dass
der KI-Assistent Gemini ebenfalls mehrere Schritte mit einem Befehl ausführen
kann. Mit dieser Funktion bewirbt etwa Samsung seine neue
Smartphone-Serie. Zuvor hatte bereits Anthropic sein Modell Claude 3.5 Sonnet präsentiert, mit dem laut dem Unternehmen Entwickler das
System anweisen können, ihren Computer so zu nutzen, wie es Menschen tun.

Operator kann tippen, klicken und scrollen

Laut OpenAI kann Operator jede beliebige Website bedienen,
die in einem Webbrowser aufrufbar ist. Dazu nutzt das System Screenshots, um den
Inhalt von Websites zu analysieren und anschließend etwa den Mauszeiger zu bewegen
oder die Tastatur zu bedienen. Zudem soll das System sich selbst korrigieren können.
Kommt es nicht weiter, meldet es sich beim Nutzer. In dem Demovideo
dokumentierte Operator jeden seiner Schritte, sodass die Nutzer immer nachvollziehen
konnten, was das KI-System gerade machte.

In Europa können ChatGPT-Nutzer das neue System nicht nutzen.
Momentan ist Operator nur in den USA für Nutzer verfügbar, die das Plus-Abonnement
von ChatGPT abgeschlossen haben, das 200 US-Dollar pro Monat kostet.
OpenAI-Chef Sam Altman sprach bei der Präsentation davon, dass das Unternehmen
plane, in den nächsten Monaten Operator auch zum regulären ChatGPT-Plus-Preis
von derzeit 20 US-Dollar pro Monat anbieten zu wollen. Derzeit sei Operator
noch eine research preview, eine Forschungsdemonstration. Das kann als
Hinweis darauf verstanden werden, dass sich der KI-Agent noch in einer frühen
Entwicklungsphase befindet.

Das deckt sich mit Berichten erster unabhängiger Tester wie
des US-amerikanischen Techjournalisten Casey Newton. Wer auf der Suche nach
einem fertigen virtuellen Assistenten sei, an den man bequem Einkaufs-
und Rechercheaufgaben auslagern könne, werde enttäuscht, schreibt
er bei Platformer. “Derzeit ist der Einsatz von Operator
wesentlich langsamer, frustrierender und teurer, als wenn Sie diese Aufgaben
einfach selbst erledigen.”

Und doch gewähre Operator einen Blick darauf, “wie die
Zukunft aussehen könnte”, schreibt Newton. Ähnlich stellt es auch OpenAI dar. “Agenten
werden wirklich verändern, wie Menschen arbeiten”, sagte Altman. Aber: “Wir
müssen noch viel verbessern.”