Hongerige AI-tools lusten je boek rauw

Mag Big Tech jouw boeken scannen, gebruiken voor het trainen van AI-tools en jouw kennis verkopen? Natuurlijk mag dat niet. Maar het gebeurt toch.
AI-bedrijven als Anthropic en Meta hebben stiekem op grote schaal boeken gekocht, gescand en gebruikt voor het trainen van hun AI-tools. De boeken worden vernietigd, en de kennis eruit wordt schaamteloos aangeboden aan de abonnees van hun tools. In januari van dit jaar meldde The Washington Post op basis van openbare processtukken dat Anthropic al sinds 2024 in het geheim boeken opkoopt bij tweedehands boekhandels en bibliotheken. ‘Met Project Panama willen we alle boeken ter wereld destructief scannen en we willen niet dat bekend wordt dat we hieraan werken’, citeerde de krant uit een intern bedrijfsdocument. BNR meldde eind juni dat ook Nederlandse antiquariaten bestellingen ontvangen van Big Tech.
De eerste berichtgeving legde de nadruk op tweedehandsleveranciers zoals Better World Books en World of Books. Later bleek uit de processtukken dat Anthropic ook nieuwe boeken had betrokken via reguliere groothandels, waaronder Ingram en Baker & Taylor.
Heb je een boek geschreven? Zo ja, dan is er een (kleine) kans dat ook jouw boek is ingeslikt en uitgespuugd door Big Tech. Het mag niet, want daarmee wordt jouw auteursrecht geschonden, maar er is weinig dat je ertegen kunt doen. Meerdere uitgeverijen (zoals Macmillan, Hachette Book Group en Elsevier) en auteurs (zoals John Grisham, Jonathan Franzen en David Baldacci) hebben rechtszaken aangespannen. Er zijn al schikkingen getroffen met auteurs, maar duidelijke uitspraken zijn er nog niet geweest.
Het illegale gebruik van boeken en andere content is schandalig, maar tegelijkertijd profiteren we allemaal van de voordelen van tools als ChatGPT en Claude. Hoe kan dit probleem worden opgelost?
Niet blij
Als uitgeverij sluiten wij een eenvoudige deal met auteurs. Wij krijgen gedurende de loop van een overeenkomst het ‘licentierecht’ om een manuscript in de vorm van een boek, een e-book of een audioboek te verkopen. In ruil daarvoor ontvangt de auteur een royalty op basis van het verkochte aantal exemplaren. Ik denk dat auteurs niet blij zouden zijn als wij plotseling een website zouden maken waarin iedereen alles over de inhoud van deze boeken zou mogen vragen, zonder hen een vergoeding te betalen. Toch is dit wat de bedrijven achter de AI-tools doen.
In Nederland is al een oplossing voor hergebruik van boeken. Bepaalde vormen van gebruik van auteursrechtelijk beschermde werken mogen plaatsvinden zonder dat voor iedere kopie afzonderlijk toestemming moet worden gevraagd. Denk aan fotokopieën in het onderwijs, bibliotheken of bedrijven. Daar staat tegenover dat gebruikers daarvoor een wettelijke vergoeding betalen, die via organisaties als Lira en Reprorecht bij auteurs, vertalers en illustratoren terechtkomt.
Het zou de techbedrijven sieren als ze auteurs op een vergelijkbare manier zouden vergoeden. De praktische realisatie daarvan lijkt op het eerste gezicht een vrij onmogelijke opgave, maar in de muziek is dit niettemin al jaren geleden grootschalig gerealiseerd. Bij bedrijven als Spotify, Apple Music en YouTube zijn er directe deals met labels en uitgevers, plus collectieve regelingen voor auteursrechten (met partijen als Buma/Stemra). Dat systeem is heel ingewikkeld en allesbehalve perfect, maar het uitgangspunt is helder: gebruik van muziek is niet gratis; er moet worden gelicentieerd en afgerekend.
Erg optimistisch over de kansen van auteurs om gelijk te krijgen, ben ik niet. De boekenwereld telt anders dan de muziekwereld veel minder helden die de publieke opinie positief kunnen beïnvloeden en er gaat veel minder geld in om, waardoor het moeilijker is voor auteurs en uitgevers om de strijd aan te gaan met de grote techbedrijven.
Niettemin, voor iedereen die aan de haal wil gaan met de boeken van onze auteurs: doe het niet. Zoals je op de colofonpagina van onze boeken kunt lezen, verbieden we het ongevraagd gebruik expliciet: ‘All rights are reserved, including those for text and data mining, AI training and similar technologies.’ Doe je het toch, dan krijg je met mij te maken. Ik heb de witte band in judo, het is maar dat je het weet.

Geerhard Bolte is uitgever van Uitgeverij Haystack en auteur van Waarom schrijf je geen boek?
Ben je bezig met het schrijven van een non-fictieboek en wil je weten wat er allemaal komt kijken bij het publiceren van je eigen boek? Meld je dan aan voor de masterclass Het geheim van een succesvol non-fictieboek.
Heb je een voorstel voor een boek? Stuur hem een mail of maak contact via LinkedIn. Wil je zijn blog elke week automatisch ontvangen in je mailbox? Schrijf je hier in.





