VG Wort wägt KI-Lizensierung ab

KI Kopf

Foto: shutterstock

Ich bin seit 2019 Mitglied des Verwaltungsrats der VG Wort und begleite die Diskussion daher schon seit Monaten intern, habe Fragen gestellt und versucht, die Vor- und Nachteile der Änderung des Wahrnehmungsvertrags der VG Wort für die Lizensierung von Werken für das Training von generativer KI für unternehmensintern genutzte KI-Modelle abzuwägen. Auch auf der Mitgliederversammlung der VG Wort wurde dazu eine intensive Debatte geführt. Der Beschluss für diese Lizenzen erging am 1.6.2024.

Der Raubzug der großen generativen KI-Modell-Entwickler an urheberrechtlich geschützten Werken hat mit dieser KI-Lizenz der VG Wort keinen unmittelbaren Zusammenhang. Auch meine Kollegin im Verwaltungsrat, Nina George, hat sich dazu ebenfalls geäußert.

Nutzung der Werke in firmeninternen generativen KI

Es ist wichtig, zu verstehen, dass die VG Wort natürlich selbst mit eurer Einwilligung nur die *legale* Nutzung der Werke in firmeninternen generativen KI regeln kann. Sie kann nicht die *illegale* Nutzung durch ChatGPT und Co verhindern. Leider. Aber eines nach dem anderen. 2019 traten umfangreiche Änderungen im europäischen Urheberrecht in Kraft, das dazu geführt hat, dass in Deutschland  § 44b des UrhG zu Text- und Data-Mining (auch liebevoll TDM genannt) so formuliert wurde: „Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen.“

Urheber*innen oder Lizenzinhaber*innen können der Verwendung der Werke mittels eines sogenannten „Nutzungsvorbehalts“ (oft auch Opt-Out genannt) widersprechen, allerdings nur, wenn es sich nicht um ein Text und Data Mining für wissenschaftliche Zwecke handelt. Bei wissenschaftlichem TDM ist wegen § 60d UrhG ein Nutzungsvorbehalt nicht möglich, die Werke können ohnehin ohne Zustimmung der Rechteinhaber*innen verwendet werden.

ChatGPT und Co. nehmen sich alles, was im Internet veröffentlicht ist

Diese Geschichte ist wichtig, weil die Paragraphen zum TDM in Europa jetzt als nachträgliche Legitimierung herangezogen werden, wenn es darum geht, generative KI zu trainieren und die Legalität des Verwendens von Werken von Künstler*innen zu behaupten, ohne jene um Erlaubnis zu fragen oder zu vergüten. Heißt: ChatGPT und Co. nehmen sich alles, was im Internet veröffentlicht ist und verwenden diese Werke für ihre Zwecke, ohne dafür zu bezahlen.

Befürworter*innen berufen sich darauf, dass das Training generativer KI in der technischen Beschreibung im TDM-Paragraphen ja so „mitgemeint“ gewesen sei. Dass die Gesetzgeber*innen in Brüssel die lange diskutierte EU-Richtlinie 2019 zum Urheberrecht noch nicht ahnen konnten, dass 2022 der Durchbruch mit KI erfolgen würde, wird dabei unterschlagen.

Erstens:

Alle gängigen Urheber*innenverbände, der Börsenverein des Deutschen Buchhandels und die VG Wort widersprechen dieser Lesart. Wir sind der Meinung, es handelt sich bei dem Vorgang des Trainings von generativer KI nicht oder jedenfalls nicht nur um TDM, sondern um andere und weitergehende Nutzungsarten. Das würde bedeuten, dass wir als Schrifsteller*innen auch unseren Verlagen gegenüber nach einer Information über diese andere Nutzungsart ein Opt-out-Recht hätten!

Auch und gerade die VG Wort hat ein Interesse daran, dass Urheber*innen vergütet werden, und will das über eine kollektive Wahrnehmung der Rechte ihrer Mitglieder erreichen.

Eine Studie der Initiative Urheberrecht; unter anderem vom Verband deutscher Schriftsteller*innen und der VG Wort mit finanziert bzw. initialisiert – hat festgestellt, dass es sich beim Training von KI nicht um TDM handelt und dass das Training von Modellen anhand urheberrechtlich geschützter Werke etliche Urheberrechtsverstöße darstellt.

Die VG Wort kämpft hier für das Urheberrecht und gegen die großen KI-Hersteller an der Seite der Urhebenden und Verlage, beide Gruppen räumen ihr im Wahrnehmungsvertrag Rechte ein.

Zweitens:

Wir Urheber*innenverbände sind der Meinung, es müssen a) Urheber*innen/Lizenznehmer*innen gefragt werden, bevor geschützte Werke zum Training von generativer KI verwendet werden, b) die verwendeten Werke müssen von den Anbietern transparent gemacht werden, c) die Rechteinhaber*innen müssen angemessen vergütet werden und d) Produkte, also Texte und Bilder o.ä., die mit generativer KI erstellt werden, müssen als solche gekennzeichnet werden. Siehe auch: Verband deutscher Schriftsteller*innen in Verdi Kunst und Kultur bzw. Initiative Urheberrecht zu KI.

Die VG Wort unterstützt den Anspruch der Urheber*innen und Lizenznehmer*innen an ihren Werken mit Hinblick auf generative KI! Auch die Änderung des Wahrnehmungsvertrags durch die VG Wort soll diesen Anspruch unterstützen. Wer sich näher mit der Position der VG Wort beschäftigen möchte, lese bitte einen Beitrag von Dr. Robert Staats, dem Geschäftsführer der VG Wort, aus dem Juli in der Politik & Kultur. Er ist meines Erachtens einer der einflussreichsten Befürworter einer neuen Regelung zum Schutz der Werke von Urheber*innen gegenüber Modellanbietern wie ChatGPT et al.

Darin stellt er fest, dass das Urheberrecht Reformbedarf hat: „Wie kann sichergestellt werden, dass Urheberinnen und Urheber oder andere Rechtsinhaber (wieder) über die Nutzung ihrer Werke im Zusammenhang mit KI frei entscheiden können? Wie kann ein rechtssicherer und maschinenlesbarer Vorbehalt gegen die Nutzung von Werken für Text und Data Mining eingelegt werden? Wie kann eine angemessene Vergütung sichergestellt werden?“ Dieser Beitrag wurde im Juli veröffentlicht, kurz nachdem die Mitgliederversammlung der VG Wort nach intensiver Debatte der Regelung zugestimmt hat.

Für wen sind die Lizenzen gedacht?

Als Mitglied des Verwaltungsrats der VG Wort kann ich zunächst sagen: die neue Regelung soll ausschließlich für das firmeninterne Training und Verwendung einer unternehmenseigenen generativen KI dienen. Zielgruppe der Lizenz ist z.B. ein Pharmaunternehmen, das anhand von wissenschaftlicher Literatur eine generative KI trainieren möchte. Firmenintern heißt auch: Nicht zur Veröffentlichung bestimmt.

Auf der anderen Seite ist es auch für mich ein seltsames Gefühl, zuzustimmen, dass die eigenen Werke zum Training für generative KI verwendet werden dürfen – aber hier sind a) und c) sowie hoffentlich d) unseres Forderungskatalogs erfüllt: wir werden um Zustimmung gebeten und es erfolgt eine Vergütung. Ich würde mir wünschen, dass die Transparenz der Trainingsdaten auch durchgeführt wird, aber das kann ich natürlich nicht bewerten. Wie hoch eine Vergütung sein wird, hängt natürlich a) vom Markt, und b) vom Wert der Lizenzen ab – also wie „gut“ die Werke und wie viele Werke es sind, die hier in die unternehmensinternen KI-Modelle eingespeist werden.

Unterstellt wird, dass Firmen ein berechtigtes Interesse an solchen juristisch einwandfrei lizensierten Werken für das Training von generativer KI besitzen. Denn dem Anspruch von ChatGPT und Co wird ja von Seiten der Rechteinhaber*innen immer vehementer widersprochen. Hier auf der richtigen Seite zu stehen und rechtssicher zu agieren, ist von Vorteil. Denn wenn das durchgeklagt wird und festgestellt wird: nein, die TDM-Ausnahme ist tatsächlich nicht anwendbar, aber alle haben sich darauf verlassen, die Werke der Urheber*innen verwenden zu können, stehen die Firmen im Regen und müssen sich auf drastische Nachzahlungen und Schadensersatzklagen einstellen. Unterstellt wird auch, dass eher wissenschaftliche Werke angefragt werden, als belletristische.

Anspruch auf Vergütung festigen

Die VG Wort versucht mit ihrem Ansatz, den Anspruch auf Vergütung von Urheber*innen und Lizenznehmer*innen mit den KI-Lizenzen zu festigen. Die VG Wort könnte hier durch das Geschäftsmodell auch belegen, *dass* uns Geld abhanden kommt, wenn KI an unseren Daten trainiert wird. Das kann helfen, einen Anspruch für Urheber*innen zu unterstützen. Das heißt, meines Erachtens haben wir ein Interesse daran, dass diese KI-Lizenzen gut funktionieren.

Ich werde also der neuen Regelung zur Verwendung meiner Werke nicht widersprechen, auch weil ich möchte, dass die VG Wort-Unternehmenslizenzen funktionieren. Damit der legitime Anspruch von Urheber*innen auf die Lizensierung und Vergütung ihrer Werke im Training von KI endlich durchgesetzt wird. Ob da eine relevante Summe Geldes fließt, kann ich natürlich genauso wenig prophezeien, wie irgendjemand sonst.

Schlussendlich aber kann und sollte jede*r selbst entscheiden, ob die eigenen Werke hier freigegeben werden. Dafür sind wir im Verwaltungsrat eingetreten. Zu bedenken ist: wenn die Werke einmal in einer generativen KI einer Firma „enthalten“ sind, kann man sie nicht wieder „herausnehmen“. Generative KI kann nach heutigem Wissenstand nicht wieder „verlernen“, was sie einmal gelernt hat. Ein folgender Widerspruch gilt dann erst für das neue Werk ab dem Widerspruchszeitpunkt.


Hierzu auch die FAQ der VG Wort lesen

nach oben

Weitere aktuelle Beiträge

Keine Auskunft zu Pegasus

Auch Onlinemedien fallen unter die vom Grundgesetz gedeckte Pressefreiheit. Das erkannte das Bundesverwaltungsgericht  erstmals an. Arne Semsrott, Chefredakteur der Transparenz- und Rechercheplattform FragDenStaat, hatte nach Presserecht vor dem Bundesverwaltungsgericht geklagt. Nun erkannte das Gericht grundsätzlich an, dass Presseauskunft Onlinemedien genau so wie Printmedien erteilt werden muss. Der Bundesnachrichtendienst (BND) ist aber nicht verpflichtet, einem Journalisten Auskünfte über den Erwerb und Einsatz der Software "Pegasus" zu erteilen.
mehr »

Aktuelles aus der Medienbranche 3/24

Im dritten Quartal des Jahres setzten sich die bisherigen Trends der Medienbranche fort: Print-Periodika schrumpfen, Online nimmt zu, die Buchbranche wächst leicht. Axel Springer wird aufgespalten. Der „Markt“ für Übernahmen und Beteiligungen im Medienbereich verengt sich. Die Quartalsberichte stützen sich auf die Auswertung von Internetseiten, Zeitungen, Fachzeitschriften, Informationsdiensten, Verbands- und Unternehmenspublikationen.
mehr »

Open Access und VG Wort: Was beachtet werden muss

Wenn wissenschaftliche Autor*innen Open Access veröffentlichen, ist ihnen häufig unklar, ob dies mit einem vorher geschlossenen Wahrnehmungsvertrag bei der VG Wort vereinbar ist. Eine Handreichung von Berlin Universities Publishing klärt die grundlegende Frage, ob und gegebenfalls welche Konflikte hierbei entstehen können. Außerdem werden Hinweise zur deren Lösung gegeben.
mehr »

Filmtipp: Der Sohn des Mullahs

Nahid Perssons Sarvestanis Dokumentation „Der Sohn des Mullahs“ zeigt, wie gefährlich – und notwendig – unabhängiger Journalismus im Iran ist. Sie begleitet Roohollah Zam, der sich  sich in Frankreich halbwegs sicher fühlt. Von hier aus betreibt er seinen Nachrichtenkanal, veröffentlicht Berichte über geheime Dokumente, die ihm aus iranischen Regierungskreisen zugespielt werden.
mehr »