Urheberrecht: KI-Training mit Büchern ist erlaubt – wenn man sie kauft

6

Sie lesen den KI-Newsletter “Natürlich intelligent” vom 26. Juni 2025. Um den Newsletter jeden Donnerstag per Mail zu erhalten, melden Sie sich hier an.

Wenn Sie sich englischsprachige Videos
anschauen, haben Sie in letzter Zeit vielleicht vernommen, dass
jemand in ein Thema eintauchen will. Der englische Begriff dafür – “delve” –
wird nämlich häufiger verwendet. Möglicherweise, weil er oft in
ChatGPT-Antworten auftaucht. Das ist das Ergebnis einer Studie des
Max-Planck-Instituts für Bildungsforschung. Worte wie “meticulous” (akribisch,
sorgfältig), “realm” (Reich, Bereich) oder “intricate” (kompliziert,
verworren) werden demnach verbreiteter. Und das nicht nur in abgelesenen
ChatGPT-Antworten, sondern auch in freier Rede. Der KI-Slang geht offenbar in
die menschliche Sprache über. Wer weiß, vielleicht geben wir bald Antworten
auch immer schön strukturiert in Stichpunkten.

Das müssen Sie wissen: Anthropic darf mit Büchern trainieren – wenn sie gekauft sind

Die KI-Branche verblüfft mich immer
wieder. Das Unternehmen Anthropic hat offenbar Millionen gebrauchte Bücher gekauft,
wohlgemerkt physische Exemplare, um dann die Buchrücken abzutrennen und die
Seiten einscannen zu lassen. Stapelweise Altpapier hatte ich bisher eher nicht vor
Augen, wenn ich versucht habe, mir vorzustellen, wie Sprachmodelle trainiert
werden.

Dieses Detail stammt aus der
Urteilsbegründung zu einem Gerichtsverfahren in Kalifornien. Es ging darin um die
Frage, ob KI-Unternehmen Bücher zum Training ihrer Sprachmodelle nutzen dürfen,
ohne sich vorher die Zustimmung der Autoren einzuholen. Das Gericht hat nun
geurteilt: Ja, Anthropic darf das.

Es
ist ein wichtiges Urteil für
die gesamte KI-Branche, schließlich steht und fällt ihr Erfolg damit, dass sie ihre
Sprachmodelle mit urheberrechtlich geschützten Inhalten trainiert. Das hat überhaupt erst ermöglicht, dass ihre Chatbots die eloquenten Antworten
generieren können, die ihre (zahlenden) Nutzer bei ihnen suchen. Der Richter
folgte Anthropics Argumentation, dass das KI-Start-up die Bücher nicht kopieren
würde, sondern mit dem Training etwas Neues erschaffen würde und bezog sich
damit auf die sogenannte Fair-Use-Regel.

Ähnlich
urteilte in dieser Woche ein anderes US-Gericht in einem Prozess gegen den
Facebook-Konzern Meta. Auch hier hatten Autoren gegen die Verwendung ihrer
Bücher als Trainingsdaten geklagt. Der Richter wies ihre Klage zwar ab, allerdings
vor allem weil sie die falschen Argumente vorgebracht hätten. Er betonte: Sein
Urteil solle nicht so verstanden werden, dass Metas KI-Training komplett legal
wäre. In Großbritannien wiederum hatte die US-Bildagentur Getty Images gegen
den KI-Bildgenerator Stable Diffusion geklagt, ein Tag nach Bekanntwerden des
Anthropic-Urteils in dieser Woche aber seine Klage wieder fallen gelassen.

Definitiv
illegal ist es, Bücher raubzukopieren. Bevor Anthropic im großen Stil Bücher
gekauft hat, soll es laut dem Urteil sieben Millionen Bücher verwendet haben, ohne dafür zu bezahlen,
was auf jeden Fall eine Urheberrechtsverletzung ist. Auch Meta wird vorgeworfen,
mit Raubkopien trainiert zu haben. Es könnten Strafen in Milliardenhöhe auf die
Konzerne zukommen, analysiert mein Kollege Eike Kühl. 

Darüber sollten Sie nachdenken: Macht ChatGPT uns dümmer?

Wer regelmäßig Chatbots nutzt, sei
es um sich schnell einen Text entwerfen, einen Artikel übersetzen oder
Programmierzeilen generieren zu lassen, kann irgendwann das Gefühl
bekommen, dass sich eine klebrige Pollenschicht über die eigenen
Hirnsynapsen legt und das Denken verlangsamt. Diese
Sorge bestärkt eine kürzlich veröffentlichte Studie des MIT Media Lab. Sie zeigt, dass Teilnehmer, die
ChatGPT für das Verfassen von Essays nutzten, geringere Gehirnaktivitäten
aufwiesen als solche, die es nicht taten. Stattdessen begannen die
ChatGPT-Nutzer nach einigen Monaten sogar, KI-generierte Inhalte nahezu
komplett zu kopieren, die Prüflinge wurden also fauler und rutschten in eine Art
Passivität ab. Und: Sie merkten sich kaum etwas von dem, was die KI in ihrem
Auftrag geschrieben hatte.

Die untersuchte Teilnehmergruppe war mit etwa 50 Probanden relativ
klein, zudem wurde die Studie bisher nicht unabhängig geprüft. Dennoch ist sie eine Warnung: In Deutschland
dürften etliche Schülerinnen und Schüler, Studentinnen und Studenten heimlich ChatGPT
nutzen, um ihre Hausaufgaben zu machen
oder ihre Seminararbeiten zu verfassen. Die
Studienautorin warnt eindrücklich vor den Folgen
solcher Hilfsmittel für die Gehirnentwicklung junger Menschen. Die werden aber
solch kostenlose Werkzeuge weiternutzen, wenn man an Prüfungsformaten festhält,
die KI schnell für sie lösen kann.

Deshalb muss sich die Art, wie
gelehrt und gelernt wird, verändern. Eine KI-Strategie im
Bildungsbereich, das forderte in dieser
Woche auch der Deutsche Philologenverband. Die
Schülerinnen und Schüler sollen “selbst denken lernen und nicht lernen, denken
zu lassen”, sagte dessen Bundesvorsitzende Susanne Lin-Klitzling.

Das muss nicht bedeuten, komplett
auf KI zu verzichten. In der MIT-Studie zeigte sich, dass die Gruppe, die ihre
Aufsätze zuerst selbst geschrieben hatte, aber später im Prozess KI zu Hilfe nahm,
um den Aufsatz umzuschreiben, auch bei diesem Arbeitsschritt starke Hirnaktivitäten
hatte. Man darf daraus wohl
schlussfolgern: Erst denken, dann prompten.  

Das können Sie ausprobieren: Die Video-KI von Midjourney

Midjourney hat seinen ersten KI-Videogenerator V1
vorgestellt. Wer Bilder, entweder reale oder
künstliche, auf der Plattform hochlädt, kann sich auf deren Basis kurze Videosequenzen
erstellen lassen. Beim Generieren eines Bildes kann man direkt angeben, dass daraus auch ein fünfsekündiger
Clip entstehen soll. Wie der genau aussehen soll, kann man im Vorfeld grob in
einem kurzen Text umreißen. 

Das funktioniert in einem ersten Test gut. Ein generiertes Papierschiffchen schwimmt malerisch in einem Rinnsal. Mammuts stapfen durch
den Schnee, ohne dass sich ihre Beine verheddern. Zumindest auf den
ersten Blick ist Midjourney konkurrenzfähig zu anderen aktuellen
Videogeneratoren wie Veo 3 von Google (das allerdings auch Ton generieren kann
und mehrere Einstellungen in einem Clip). 

Das gilt auch für den Preis:
Midjourney kann man zwar nicht kostenlos ausprobieren, dafür bekommt man für 10
Euro pro Monat schon einige Videos generiert, das teuerste Paket kostet 60 Dollar.
Google will für sein “AI Ultra”-Paket, zu dem auch Veo3 gehört, derzeit
immerhin 150 Dollar im Monat, bald sollen es 250 werden.