Mark Zuckerberg, CEO de Meta, supuestamente aprobó el uso de versiones pirateadas de libros protegidos por derechos de autor para entrenar los modelos de inteligencia artificial de su empresa, según alegaciones presentadas por un grupo de autores en un tribunal de Estados Unidos. La demanda, encabezada por autores como Ta-Nehisi Coates y Sarah Silverman, señala que Meta utilizó indebidamente sus libros para entrenar a Llama, el modelo de lenguaje grande que impulsa sus chatbots.
En una presentación judicial, los demandantes citan comunicaciones internas de Meta que sugieren que Zuckerberg respaldó el uso del conjunto de datos de LibGen, un vasto archivo en línea de libros, a pesar de las advertencias del equipo ejecutivo de IA de la compañía sobre la naturaleza pirata de esos datos. Un mensaje interno de Meta advierte que el uso de una base de datos con material pirateado podría debilitar las negociaciones de la empresa con los reguladores y socavar su posición pública.
Library Genesis, conocido como LibGen, es una "biblioteca" en línea que se originó en Rusia y afirma contener millones de novelas, libros de no ficción y artículos de revistas científicas. En 2022, un tribunal federal de Nueva York ordenó a los operadores anónimos de LibGen pagar 30 millones de dólares en daños por infracción de derechos de autor, mostrando el peso legal y financiero que puede tener el uso indebido de esta recopilación de contenidos protegidos.
El uso de contenido protegido por derechos de autor en el entrenamiento de modelos de IA se ha convertido en un campo de batalla legal, especialmente con la proliferación de herramientas de IA generativa como ChatGPT. Profesionales creativos y editores advierten que el uso sin permiso de su trabajo amenaza sus medios de vida y modelos de negocio.
La presentación judicial reciente incluye un memorando que hace referencia a Mark Zuckerberg, indicando que "después de la escalada a MZ", el equipo de IA de Meta "ha sido aprobado para usar LibGen". También se menciona que ingenieros de Meta discutieron el acceso y revisión de datos de LibGen, pero dudaron en comenzar el proceso debido a que "torrentear" desde una computadora portátil corporativa de Meta "no se siente bien".
El juez de distrito de EE. UU., Vince Chhabria, desestimó anteriormente las afirmaciones sobre que el texto generado por los modelos de IA de Meta infringía derechos de autor, pero permitió a los demandantes enmendar sus reclamaciones. Los autores argumentaron esta semana que la nueva evidencia refuerza sus reclamaciones de infracción y justifica la reactivación de su caso sobre la eliminación ilegal de la información de gestión de derechos de autor (CMI) y la adición de una nueva acusación de fraude informático.
El juez Chhabria, durante una audiencia el jueves, expresó escepticismo sobre los méritos de las reclamaciones de fraude y CMI, pero indicó que permitiría a los escritores presentar una queja enmendada, estableciendo las bases para una batalla legal prolongada. La empresa Meta ha sido contactada para realizar comentarios, pero aún no ha respondido públicamente sobre estas alegaciones.