Was hat Meta mit den Daten vor?
Meta hat im April angekündigt, vom 27. Mai an wie in den USA auch in Europa sämtliche öffentlichen Beiträge, Kommentare und Fotos der Nutzer von Instagram, Facebook und Threads sowie Interaktionen mit Metas auf Künstlicher Intelligenz (KI) basierenden Chatbot zum Training seiner KI zu verwenden. Große KI-Sprachmodelle, auf denen Anwendungen wie ChatGPT oder auch Metas KI-Assistent basieren, werden mit Unmengen an Textdaten aus unterschiedlichsten Quellen trainiert, darunter Bücher, Websites, Artikel – oder soziale Medien. Amerikanische Anbieter verraten meist aber nicht, mit welchen Daten die KI-Modelle trainiert werden. Ausgenommen sind Meta zufolge private Nachrichten und Beiträge von Konten, deren Inhaber nicht volljährig sind. Auch Whatsapp-Nachrichten sind nicht betroffen, weil sie grundsätzlich Ende-zu-Ende-verschlüsselt sind. Wer seine Daten nicht für das KI-Training hergeben möchte, muss aktiv widersprechen.
Warum hält Meta die Nutzung der Daten für gerechtfertigt?
Der Konzern argumentiert, dass das Training mit Beiträgen auf sozialen Medien in der Branche üblich sei. Es gebe ein gesellschaftliches Interesse, dass dabei auch deutschsprachige Beiträge verwendet würden. Nur so verstünden die KI-Produkte die deutsche Kultur und Sprache und die deutschen Werte. Tatsächlich mahnen KI-Fachleute seit Jahren, dass die bekanntesten großen KI-Modelle vor allem mit amerikanischen Daten trainiert würden und dementsprechend geprägt seien. Allerdings sind diese Mahnungen meist mit der Forderung verknüpft, dass es eigene europäische KI-Modelle brauche – und nicht amerikanische KI-Modelle mit europäischem Anstrich.
Darf Meta das?
Das ist Auslegungssache – und ein großer Streitpunkt zwischen Meta, Verbraucherschützern und Datenschutzaktivisten. Meta beruft sich nach Artikel 6 der Datenschutzgrundverordnung (DSGVO) auf das „berechtigte Interesse“. Die europäischen Datenschutzbehörden haben sich im vergangenen Dezember auf – eher weitgefasste – Leitlinien für die Verarbeitung personenbezogener Daten durch KI-Modelle geeinigt. Demnach können sich Digitalkonzerne prinzipiell auf dieses „berechtigte Interesse“ berufen, müssen dafür aber drei Bedingungen erfüllen: Der Anspruch auf Datenverarbeitung muss legitim und wirklich notwendig sein; letzten Endes müssen die Grundrechte der Betroffenen mit dem Interesse des Unternehmens abgewogen werden. Verbraucherschützer betonen, die Leitlinien seien nur eine Behördenmeinung und „kein Blankoschein für ein KI-Training auf Grundlage des berechtigten Interesses“.
Welche Kritik gibt es an dem Vorhaben?
Die Verbraucherzentrale Nordrhein-Westfalen hat vor dem Oberlandesgericht Köln eine einstweilige Verfügung gegen Meta beantragt. Sie kritisiert unter anderem die kurze Frist und den Umstand, dass nur eingeloggte Nutzer der Regelung widersprechen könnten, nicht aber solche, deren Profil womöglich gehackt oder gesperrt worden ist. Auch die von Datenschutzaktivist Max Schrems geleitete Organisation NOYB hat eine Abmahnung an Meta verschickt und droht mit einer europäischen Verbandsklage. Schrems kritisiert, dass Nutzer der Regelung aktiv widersprechen müssen anstatt von Meta um Einwilligung gebeten zu werden.
Wie kann ich widersprechen?
Wer seine Daten nicht für das KI-Training hergeben möchte, muss aktiv widersprechen. Meta hat dafür jeweils Formulare auf Facebook und Instagram bereitgestellt. Eine Begründung muss nicht angegeben werden. Der Widerspruch muss bis zum 26. Mai erfolgen, ab dem 27. Mai können Nutzerbeiträge in Trainings einfließen. Auch danach lässt sich noch Widerspruch einlegen, der dann aber nur für künftige Trainings gilt. Auf Instagram lässt sich das Formular über die Einstellungen finden, auf die Nutzer über die drei Striche am rechten Bildrand auf ihrer Profilseite gelangen. Unter den recht weit unten liegenden Unterpunkten „Privacy Center“ oder „Info“ findet sich die „Datenschutzrichtlinie“. Im ersten Absatz auf den Link „zu widersprechen“ tippen und, falls sie nicht automatisch angezeigt wird, die E-Mail-Adresse eintragen und absenden. Es folgt eine Bestätigung per E-Mail. Analog funktioniert der Prozess auch auf Facebook. Über ihre Profilseite müssen Nutzer „Einstellungen und Privatsphäre“ öffnen, dann auf Einstellungen klicken und dort wiederum den Punkt „Datenschutzrichtlinie“ anwählen. Grundsätzlich gilt ein Widerspruch bei einem der Netzwerke auch für das jeweils andere, insofern die Konten miteinander verknüpft sind.
Welche Rechte haben Urheber?
Neben den Millionen von Privatnutzern stehen insbesondere Kreativschaffende unter Handlungsdruck, die Facebook oder Instagram als Werbe- und Vertriebskanal für ihre Bilder, Musikstücke oder Texte nutzen. Als Urheber können sie sich auf den Schutz des Urheberrechtsgesetzes berufen. Allerdings sah die Umsetzung der EU-Richtlinie in deutsches Recht im Jahr 2018 die Reichweite von KI-Chatbots noch nicht voraus. Ohne vorherige Einwilligung oder gültige Lizenz kann eine Urheberrechtsverletzung vorliegen, wenn Daten verarbeitet werden. Das Urheberrecht sieht neben einem Auskunfts- und Unterlassungsanspruch auch Schadenersatz vor. Allerdings müsste der Urheber Meta als Betreiber der sozialen Netzwerke sowie der KI einen Verstoß nachweisen.
Gibt es Ausnahmen im Urheberrecht?
In Amerika berufen sich Betreiber von KI-Modellen beim Datentraining häufig auf „Fair Use“. Mithilfe der Doktrin vermeiden sie es, Lizenzgebühren an Verlagshäuser, Autoren, Musiker oder Fotografen zu zahlen. Die Anwendung der Fair-Use-Doktrin ist in der EU nicht möglich. Hier sehen die EU-Richtlinie zum Urheberrecht und das nationale Gesetzeswerk in Deutschland bestimmte Ausnahmen („Schranken“) zur Datennutzung vor. So erlaubt Paragraph 44b Urheberrechtsgesetz die Nutzung geschützter Werke ohne Zustimmung des Rechteinhabers. Die Ausnahme greift nur, wenn die Werke rechtmäßig zugänglich, also online abrufbar, sind und für das Text- und Data-Mining verwendet werden. Darunter versteht man eine automatisierte Analyse, um Muster in großen Datenmengen erkennen zu können. Zudem können sich nur Forschungseinrichtungen nach Paragraph 60d UrhG auf das Privileg berufen. Eine kommerzielle Nutzung, wie Meta sie plant, wäre damit hierzulande nicht möglich.
Gibt es in Deutschland schon Urteile?
Im Streit zwischen Urhebern und KI-Betreibern liegt hierzulande noch keine rechtskräftige Entscheidung vor. Das Landgericht Hamburg wies 2024 die Klage eines Fotografen gegen den Verein Laion ab. Laion erstellt aus Agenturbildern Datenbanken, auf die KI-Bildgeneratoren Zugriff haben. Aus Sicht der Richter war dies unbedenklich, da Laion ihrer Meinung nach Forschung betreibt. Über die Berufung muss nun das Hanseatische Oberlandesgericht entscheiden. Mit Spannung wird im September ein Prozess am Landgericht München erwartet. Dann beginnt der Prozess der Verwertungsgesellschaft GEMA gegen das US-Unternehmen Open AI, den Entwickler von ChatGPT.