Sabíamos que ocurría pero la dimensión del robo de libros para nutrir la IA que ha quedado al descubierto resulta escalofriante. ¿Ha habido algún tipo de compensación económica, o siquiera una mención honorífica? No. Nada en absoluto. Puro saqueo
Si eres autor es muy probable que te sientas amenazado por las consecuencias de la Inteligencia Artificial (IA). Pues bien, tienes motivos para sentirte amenazado también por los orígenes. Me explico. La fabricación de aplicaciones de IA que realizan trabajos creativos está en pleno auge. La IA necesita entrenamiento para llevar a cabo esos trabajos que hacemos los autores porque nos apasionan, por contribuir al legado cultural de nuestra lengua y nuestra historia… Lo hacemos por eso y porque creemos que la cultura tiene un valor humano, estético y vital. Lo hacemos porque da sentido a nuestras vidas. No lo hacemos por dinero. Yo, al menos, no lo hago por dinero. Si mi objetivo vital hubiera sido el dinero, me habría dedicado a otros negocios. Eso no significa que nos guste ser atracados a plena luz del día. Y ha ocurrido. Es repugnante.
The Atlantic ha publicado una herramienta con la que los autores pueden buscarse en LibGen (Library Genesis), la biblioteca pirata que Meta está utilizando para entrenar su IA, Llama3. La herramienta se puede consultar aquí. Yo lo he hecho y he descubierto que cinco de mis libros forman parte de ese corpus de decenas de millones de textos piratas, con los que se está nutriendo Llama3, y quién sabe cuántas empresas más. Sabíamos que ocurría, pero la dimensión del robo de libros para nutrir la IA que ha quedado al descubierto resulta escalofriante. ¿Ha habido algún tipo de compensación económica, o siquiera una mención honorífica? No. Nada en absoluto. Puro saqueo. El resumen sencillo de la historia es este: se están fabricando inteligencias artificiales que suplantan el trabajo de los escritores y para desarrollarlas se está robando el trabajo de los escritores. Robando, sí. No tiene otro nombre.
Atlantic1
Atlantic2
En Meta se plantearon en cierto momento retribuir por el uso de los millones de libros de LibGen. Pero lo descartaron. Lo hemos sabido porque la compañía ha sido demandada, como muchas otras, y está saliendo a la luz mucha información. En uno de los chats de la compañía que también publica The Atlantic, se afirma que pagar por los libros era una opción “irrazonablemente cara”, además de “increíblemente lenta”. Siendo así, podían haber prescindido de los libros para entrenar sus IA, pero no. Se dan cuenta de que si no usan libros para entrenar su IA, no vale nada: “Los libros son de hecho más importantes que los datos de internet (…) Es realmente importante que consigamos libros tan pronto como sea posible”, se afirma en documentos internos. Es una hermosa forma de justicia poética: reconocen el valor de los libros, pero no el precio.
Los autores nos sentimos muy honrados con esa reivindicación de nuestro trabajo: juzgaron nuestros textos una materia prima imprescindible, y decidieron apropiársela. No se sabe en qué grado, LibGen es una base caótica, y resulta imposible comprobar todos y cada uno de los títulos que Meta ha empleado. Las dudas éticas llegaron hasta el mismísimo Mark Zuckerberg. Y él lo autorizó. Me pregunto qué pensaría Zuckerberg si cuando yo fuera a comprarme una casa dijera: buf, es irrazonablemente cara. Y construirme una, buf, es increíblemente lento. Mejor me quedo con la de Zuckerberg. Pues más o menos eso es lo que él ha hecho con millones de libros que a los autores nos ha costado años de nuestra vida escribir.
Me viene a la memoria aquel lema de Facebook: “Muévete rápido y rompe cosas”. Si no rompes nada es que no estás moviéndote lo suficientemente rápido, era su lógica. Meta ya no rompe cosas, ahora rompe personas, en concreto por el espinazo de sus ingresos. Robar está mal, pero robar a millones de autores, cuyos ingresos son en su mayoría precarios, da una idea del tipo de personas que integran la tecnocasta extractiva: sociópatas guiados por el beneficio y, cada vez más, por el afán de poder. Sabemos que, además de ganar dinero, quieren reescribir las leyes por una razón: hubiera sido sencillo recurrir a obras de dominio público para entrenar la IA. Pero no, no les basta con fagocitar el legado de 25 siglos de cultura occidental. Lo quieren todo. Quieren la última gota de tinta que hemos escrito anteayer. Y tienen la inmensa suerte de encontrarse enfrente con gente civilizada que los lleva a los tribunales.