Wer es verpasst hat, zu widersprechen, dessen alte Texte, Fotos und Videos landen in den Trainingsdaten der KI. Meta erschliesst damit einen wahren Datenschatz.

Mit einem Klick auf den blauen Kreis können Nutzer von Facebook, Instagram und Whatsapp mit der KI von Meta chatten.
Nun ist die Deadline verstrichen. Bis zum 27. Mai hatten Nutzer Zeit, der Verwendung ihrer Daten von Facebook und Instagram zu widersprechen. Wer das nicht getan hat, dessen Daten werden künftig benutzt, um die künstliche Intelligenz (KI) von Meta zu verbessern. Zum Konzern Meta gehören Facebook, Instagram und Whatsapp.
Konkret wird Meta Posts und Kommentare, Informationen aus öffentlichen Profilen sowie Fotos und Videos aus Stories und Reels benutzen, um seine KI zu trainieren. Private Chats mit Freunden und Familie werden aber nicht fürs Training benutzt, schreibt Meta. Auch per Whatsapp verschickte Nachrichten kann Meta nicht verwenden, da sie Ende-zu-Ende-verschlüsselt sind. Meta selbst hat auf diese Nachrichten also keinen Zugriff.
Bereits vor einem Jahr hatte Meta angekündigt, die Daten europäischer Nutzer in ihre KI einfliessen zu lassen. Nach massiver Kritik vonseiten der Datenschutzbehörden wurde dieser Versuch jedoch zunächst verschoben. Nun hatte das Unternehmen eine einmonatige Frist erlassen, innerhalb deren die Nutzer aktiv widersprechen konnten, dass Meta ihre Daten für die KI verwendet.
In Regionen mit weniger starken Datenschutzregelungen, wie den USA, Australien oder Asien, werden die Nutzerdaten bereits seit langem fürs Trainieren der Meta-KI genutzt. Meta weist in seiner Ankündigung ausserdem darauf hin, dass Open AI und Google ebenfalls vergleichbare Daten zum Trainieren ihrer KI nutzen – das aber weniger transparent machen.
Was in der KI ist, bekommt man nicht mehr heraus
Wer die Deadline zum Widersprechen verpasst hat, der muss nun davon ausgehen, dass die von ihm geposteten Inhalte in die KI-Modelle von Meta einfliessen. Zwar kann man auch später noch seinen Widerspruch kundtun, dieser gilt aber nur noch für Inhalte, die in Zukunft gepostet werden. Alle alten Posts können von Meta für die KI genutzt werden.
Das eigene Facebook- oder Instagram-Konto zu löschen, hilft nur wenig. Meta muss dann zwar die Daten von ihren Servern löschen. Aber alles, was bereits in die KI eingeflossen ist, kann aus dieser nicht mehr entfernt werden.
Erst recht nicht, wenn die Daten in eines der Llama-Modelle einfliessen. Diese grossen Sprachmodelle veröffentlicht Meta seit 2023 und stellt sie frei zur Verfügung. Jeder kann die Llama-Modelle herunterladen, nutzen oder anderen zur Verfügung stellen. Selbst wenn Meta im Nachhinein also problematische Inhalte entfernen wollte, könnte es das nicht mehr tun. Denn mit der Veröffentlichung verliert es die Kontrolle über das Modell.
Konversationen mit der Meta-KI, die seit März in Whatsapp, Instagram und Facebook verfügbar ist, fliessen grundsätzlich in die Trainingsdaten ein.
Wenn Chat-GPT das eigene Gesicht malt
Welche Konsequenzen es für Nutzer hat, wenn ihre Daten in die KI einfliessen, ist schwierig abzuschätzen. Sicher ist, dass KI-Modelle Daten wiedergeben können, die sie während des Trainings gesehen haben. Forscher haben gezeigt, dass KI-Chatbots bei bestimmten Anfragen beginnen, eins zu eins Inhalte aus ihren Trainingsdaten wiederzugeben – oft inklusive persönlicher Informationen wie Namen, Adressen, Telefonnummern und E-Mail-Adressen echter Menschen. Meta gibt an, solche identifizierenden Angaben aus den Daten herausfiltern zu wollen.
Ebenso denkbar ist es, dass die KI auf eine entsprechend passende Anweisung hin das Gesicht eines Nutzers generiert, das in den Facebook-Fotos vorkam, die zum Trainieren verwendet wurden. Schliesslich hat KI bereits unter Beweis gestellt, dass sie Bilder im Stile bestimmter Künstler erstellen kann, wenn sie solche Bilder während des Trainings gesehen hat. Ein Umstand, der viele Künstler beunruhigt und erbost, die meist kein Einverständnis für die Nutzung ihrer Bilder als KI-Trainingsmaterial gegeben haben.
Obwohl Meta explizit verspricht, nur die Daten erwachsener Nutzer in die KI einzuspeisen, kann es auch Kinder treffen. Denn häufig werden Bilder von Kindern von erwachsenen Nutzern, etwa den Eltern, auf Facebook oder Instagram geteilt.
Heutzutage sind mehr Menschen vorsichtig mit dem, was sie im Internet öffentlich von sich und insbesondere ihren Kindern preisgeben. Doch gerade in den frühen Zeiten von Facebook waren viele Menschen im Internet sehr freigiebig mit persönlichen Informationen. Dass die eigenen Ferienfotos so eines Tages in einer KI landen könnten, konnte damals niemand ahnen.
Die Zentrale für Verbraucherschutz Nordrhein-Westfalen kritisiert daher das Vorgehen von Meta und hat Klage eingereicht. Im Eilverfahren hat das Oberlandesgericht Köln aber entschieden, dass Meta keine aktive Zustimmung der Nutzer einholen, sondern nur die Möglichkeit zum Widerspruch geben muss.
Bessere Daten, bessere KI
Bis vor einem Jahr versuchte Meta noch, an möglichst hochwertige Text-Quellen zu gelangen. Bücher, Zeitungen, wissenschaftliche Texte und Transkripte wurden in die KI eingespeist. Doch nun erweisen sich die Daten von Facebook und Instagram als wahrer Schatz. Denn Meta will erreichen, dass die KI so natürlich wie möglich klingt. Dazu muss sie Umgangssprache, Humor und Anspielungen verstehen und wiedergeben können. Da sich all das regional stark unterscheidet, braucht es Daten aus Europa, damit die KI für europäische Nutzer gut funktioniert.
Ausserdem sollen KI-Modelle heute neben Text auch mit Videos, gesprochener Sprache und Bildern umgehen können. Um solche KI zu trainieren, sind Bilder oder Videos zusammen mit beschreibendem Text wie Kommentaren extrem wertvoll. Genau das bieten die Posts auf den sozialen Netzwerken.
Und noch etwas dürfte dazu beitragen, dass Meta nun unbedingt die Posts verwenden will: Der KI gehen die frischen Daten aus. Der Grossteil aller je im Internet veröffentlichten Texte ist bereits in KI-Modelle eingespeist worden. Nur wenige mögliche Datenquellen sind noch nicht ausgeschöpft.
Immerhin gab es für die Europäerinnen und Europäer die Möglichkeit, sich dagegen zu wehren, dass KI sich ihre Daten einverleibt. Die Künstler, Autoren und Schauspieler, auf deren Werken die beeindruckenden Fähigkeiten der KI-Chatbots beruhen, hatten diese Option nicht.