Klicke die Ampeln an! Verschiebe das Puzzlestück! Diese kleinen Tests im Internet können einen zur Verzweiflung bringen. Doch ohne sie wären wir aufgeschmissen. Jetzt droht der Untergang der sogenannten Captchas und damit das Ende einer Ära.

Es ist eine ganz besondere Frustration, neu- und einzigartig für unsere Zeit. Die Frustration, einem Computer beweisen zu müssen, dass man ein Mensch ist – und daran zu scheitern. Klicke die Ampeln an, befiehlt der Computer. Aber gehört dieses eine Kästchen links unten, in dem nur ein paar Millimeter Ampelstange zu sehen sind, noch zur Ampel?
Offenbar nicht. Nächstes Rätsel.
Captchas heissen diese Tests. Sie wurden nötig, als Menschen begannen, das Internet zu missbrauchen – also kurz nach dessen Einführung. Heute verbringe die Menschheit jeden Tag zusammengerechnet 500 Jahre damit, Captchas zu lösen, schätzt die Sicherheitsfirma Cloudflare.
Jetzt aber kommen Captchas an ihre Grenzen. Denn es braucht Aufgaben, die für jeden Menschen einfach zu lösen sind, für Computer aber nicht. Die zu finden, wird schwieriger. Denn die KI wird immer kompetenter, der Mensch aber bleibt, wie er ist.
Nun suchen Entwickler neue Zugänge, um Mensch und Maschine auseinanderzuhalten. An ihrem Erfolg hängt die Zukunft des Internets. Denn so nervig Captchas auch sind – ohne sie wären wir aufgeschmissen.
Alles begann mit den bösen Bots
Captcha ist ein Akronym aus den Anfangsbuchstaben von «Completely Automated Public Turing Test to Tell Computers and Humans Apart,» zu Deutsch: komplett automatisierter öffentlicher Turing-Test, um Computer und Menschen auseinanderzuhalten. Der Informatiker Manuel Blum hat sich die Abkürzung ausgedacht, in Anlehnung an das Englische «Hab ich dich!»: «Gotcha!»
Das war 2002. Manuel Blum hatte damals schon den Turing-Preis, die höchste Auszeichnung der Informatik, gewonnen und leitete eine Forschungsgruppe an der amerikanischen Carnegie-Mellon-Universität. Bei ihm lernte ein begabter Doktoratsstudent: Luis von Ahn, ein Sprössling einer Familie von Süsswarenfabrikanten in Guatemala, den schon als Kind die Maschinen der Fabrik mehr interessiert haben sollen als die Bonbons, die herauskamen.
Um die Jahrtausendwende kam der Technologiechef des Webportals Yahoo mit einem Problem auf Blum zu: Für die Chatrooms und Mail-Adressen von Yahoo meldeten sich nicht nur echte Menschen an, sondern auch Bots. Betrüger erzeugten automatisiert Nutzerkonten, um Informationen abzugreifen oder Spam-Mails zu verschicken. Blum und von Ahn überlegten sich, wie man das verhindern könnte.
In einem Forschungsaufsatz legten sie ihre Ideen dar. Der Grundgedanke: Um Bots und Menschen voneinander zu unterscheiden, braucht man Aufgaben, die für Menschen einfach sind, für Bots aber nicht. Und die findet man, indem man sich anschaut, womit KI-Forscher kämpfen.
Zum Beispiel konnten Computer damals noch nicht so gut Schrift lesen, wenn sie etwas verzerrt war. Der Mensch ist darin viel besser. Das allererste Captcha war entstanden.
Das Ur-Captcha: In den 2000er Jahren reichte es, ein paar Buchstaben abzutippen.
Es ist sehr einfach zu erzeugen. Ein Computer nimmt ein Wort, verzerrt es und zeigt es an. Wer es schafft, das Wort abzutippen, ist ein Mensch.
Das Problem von Yahoo war gelöst. Doch von Ahn liess ein Gedanke nicht los: jener an die Tausende Stunden Lebenszeit, die Menschen mit dem Lösen von Captchas vergeudeten.
Captchas digitalisierten ganze Bibliotheken
Van Ahn hat ein Talent dafür, Mühsames und Spiel zu etwas Nützlichem zu verbinden. Ein paar Jahre später sollte er mit seinem Schweizer Studenten Severin Hacker die Sprach-Lern-App Duolingo gründen.
Auch zum Captcha-Problem hatte er eine geniale Idee. Die «New York Times» scannte damals ihr Archiv ein, Google ganze Bibliotheken. Von Ahn war an den Projekten beteiligt und kannte deren Problem: Etwa jedes fünfte Wort der gescannten Dokumente war für die Computer nicht zu entziffern, wegen schlechten Drucks oder Verzerrungen. Könnte man nicht diese Wörter als Captchas ausspielen, so dass Menschen sie abtippten?
Nur ein Problem gab es dabei. In diesem Fall war die richtige Lösung des Captchas dem Computer gar nicht bekannt. Wie sollte man dann die Entzifferung also überprüfen? Van Ahns Lösung: Man muss zwei Wörter zugleich ausspielen. Ein künstlich verzerrtes, wie in den alten Captchas. Bei dem kennt der Computer die richtige Lösung und kann Bots abhalten. Dazu stellt man ein zweites Wort aus den Archiv-Scans. Wenn genug Menschen dieses maschinell unlesbare Wort gleichlautend abgetippt haben, kann man es als «entziffert» abspeichern.
Recaptcha: Ein Wort dient dazu, dass man sich als Mensch ausweisen kann. Mit dem anderen verrichtet man Gratisarbeit.
Google kaufte 2009 die Rechte an dieser Captcha-Version und verbreitete sie unter dem Namen Recaptcha: Websites wie Facebook, Twitter und Ticketmaster bauten sie bei sich ein. Um 2010 wurden jeden Tag 100 Millionen solcher Captchas angezeigt – und so täglich mehr als 150 Bücher digitalisiert.
Aber nach einigen Jahren trat das ein, was bei Captchas immer wieder passiert: Ihr Erfolg macht sie nutzlos. Denn aus den von Menschen abgetippten Wörtern wurden neue Datensätze – und die wiederum nutzte man, um die KI weiterzubringen. Bald konnten Computer so gut Wörter entziffern wie der Mensch. Die Text-Captchas waren überholt.
Ein Wettlauf kam in Schwung. Weil die KI, auch dank Captchas, immer schneller Fortschritte machte, mussten immer neue Herausforderungen her; Dinge, die für den Menschen einfach sind, für KI aber schwer.
Ab 2012 begann Google damit, Bilder-Captchas auszuspielen. Anfangs waren das Fotos von Hausnummern und Strassennamen von Google Street View. Doch diese Herausforderung währte nur kurz. 2014 präsentierte Google einen Algorithmus, der beides, Strassennamen-Captchas und Hausnummern, mit 99 Prozent Wahrscheinlichkeit erkannte. Und so begann eine neue Ära.
Markiere alle Fahrräder! Der Beginn einer Ära
Das Bild aus dem Strassenverkehr, in neun Quadrate unterteilt, auf denen man Velos, Busse, Ampeln oder Zebrastreifen anklicken muss, ist vielleicht das bekannteste Captcha überhaupt.
Bei dieser Art Captcha geht es darum, Bilder zu erkennen.
Es wurde 2014 eingeführt und ist der Champion des Mobilzeitalters. Schliesslich ist es am Smartphone weit angenehmer, Bilder anzutippen, als Text einzugeben. Obwohl schon 2017 eine dritte Recaptcha-Version herauskam, steckt das sogenannte «Recaptcha V2» bis heute in mehr als zwei Millionen Websites.
Hat Google diese Verkehrs-Captchas in Umlauf gebracht, um Daten darüber zu sammeln, was ein Velo ist und wie Zebrastreifen aussehen? Die Vermutung liegt nahe. Schliesslich ging man bei der Digitalisierung von Bibliotheken genau so vor, ausserdem baut Googles Mutterkonzern selbstfahrende Autos, denen man beibringen muss, sich im Verkehr zurechtzufinden.
Bewiesen ist diese Vermutung nicht, gelohnt hätte sich die Sache allemal: Forscher der Universität von Irvine in Kalifornien haben sich die Mühe gemacht, auszurechnen, wie viel die Arbeitszeit wert ist, die Menschen beim Lösen von Googles Recaptchas geleistet haben. Sie kommen auf 819 Millionen Stunden Klick-Arbeit. Bei einem Mindestlohn von 7 Dollar 50 wäre diese mehr als 6 Milliarden Dollar wert. Und für die Menge an Daten, die durch Recaptchas entstanden ist, hätte Google auf dem freien Markt zwischen 8 und 32 Milliarden Dollar bezahlen müssen, schätzen die Wissenschafter.
Heutige KI kann Zebrastreifen und Velos sehr gut erkennen – alles andere wäre auch höchst beunruhigend, wo doch Robotaxis mancherorts bereits zum Alltag gehören. Warum aber werden die Strassenverkehrs-Captchas immer noch genutzt?
Menschen erkennt man an Mausbewegung und Cookies
Die Erklärung ist, dass Captchas schon seit 2013 anders funktionieren, als man denkt. Es geht nicht mehr nur darum, sie korrekt zu lösen. Denn das können Bots schon lange. Heute geht es darum, beim Lösen menschlich zu wirken.
Das erklärt auch jene Captchas, bei denen man einfach neben dem Text «I’m not a robot» ein Häkchen setzen muss.
Recaptcha V2 funktioniert, weil die Mausbewegung analysiert wird.
Während man dieses Häkchen setzt, analysiert die Website im Hintergrund, wie man die Maus bewegt: erratisch wie der Mensch oder geregelt wie ein Bot? Auch der Surf-Verlauf und gespeicherte Cookies geben Hinweise auf Menschlichkeit.
Es braucht einen neuen Endgegner
Nur wer den Computer nicht überzeugen kann, muss zusätzlich ein Bilderrätsel lösen. Auch dabei wird das Verhalten analysiert.
Doch auch dieses letzte Unterscheidungsmerkmal zwischen Mensch und Bot fällt nun weg. Forscher der ETH um den Informatiker Andreas Plesner haben im Herbst gezeigt, dass Maschinen den menschlichen Nutzer perfekt simulieren können.
Mit einigen öffentlich verfügbaren Programmen konnten sie Bots bauen, die leicht alle Hürden von Captcha V2 überwinden: mit 100 Prozent Erfolgsrate. Sie bewegen die Maus menschenähnlich zum «I’m not a robot»-Häkchen und klicken in der richtigen Geschwindigkeit auf Kästchen mit Velos. Wenn man mit den Bots vorher populäre Seiten wie Wikipedia und Facebook besucht, wird ihnen oft gar kein Bilderrätsel angezeigt.
Die Ära des Bilderkennungs-Captchas ist endgültig zu Ende.
Wenige Dinge sind für Menschen einfach und für KI schwierig
Vielleicht ist auch Ihnen schon ein Captcha der neuesten Generation begegnet: der Hund, den man mit Pfeilchen so ausrichten muss, dass er in eine bestimmte Richtung schaut. Das Puzzlestück, das man an die richtige Stelle ziehen muss. Die Anleitung zu solchen Captchas ist oft in den Bilddaten versteckt, statt dass Text danebensteht, damit die KI sie nicht so leicht knacken kann.
Forscher überlegen sich immer neue Captchas: Hier muss man ein Puzzleteil positionieren.
Der Nachteil: Auch für Menschen sind solche Captchas zunehmend verwirrend. Der Bereich der Dinge, die für Menschen einfach sind und für KI schwierig, schwindet dahin.
Andreas Plesner hat noch eine Idee parat: Es gibt Störalgorithmen für Fotos, mit denen man KI verwirren kann. Beispielsweise kann man ein Bild von einer Avocado so manipulieren, dass Menschen weiterhin eine Avocado sehen, die KI aber plötzlich einen Vogel.
Allerdings, wenn uns die Geschichte der Captchas eines lehrt, ist es das, dass man die Maschinen nicht lang für dumm verkaufen können wird.
Google hat kapituliert und auf Überwachung umgestellt
Google hat schon vor Jahren reagiert und eine dritte Captcha-Version eingeführt. Man kann sie als Kapitulation betrachten.
Denn diese neue Version verzichtet auf die Captcha-Rätsel. Und sie liefert auch kein eindeutiges Urteil, ob jemand ein Bot ist oder ein Mensch. Stattdessen bekommt jeder aufgrund seines Surf-Verhaltens einen Bot-Score zwischen null und eins. Website-Betreiber müssen entscheiden, ab welcher Bot-Wahrscheinlichkeit sie Besucher von ihrer Seite ausschliessen wollen.
Für die Annehmlichkeit, kein Rätsel lösen zu müssen, bezahlen Nutzer mit Massenüberwachung. Denn wer seine Identität im Internet verbirgt, hat weniger Daten, um seine Menschlichkeit auszuweisen. Er wird im Netz benachteiligt, erreicht den Web-Shop vielleicht nicht, wenn es darum geht, Tickets für das nächste Taylor-Swift-Konzert zu ergattern.
Verfallen Sie also nicht in Frustration, wenn Sie das nächste Mal einem schwierigen Captcha begegnen. Behandeln Sie diese aussterbende Spezies mit Nachsicht. Denn Captchas haben viel für uns getan. Und ohne sie wird die Welt auch nicht besser.
Ein Artikel aus der «»