![]()
Salesforce es demandada por dos autoras que la acusan de usar miles de libros sin permiso para entrenar su IA XGen
Las novelistas E. Molly Tanzer y Jennifer Gilmore presentaron una demanda colectiva en un tribunal federal de San Francisco, en la que acusan a la empresa Salesforce Inc. de infringir sus derechos de autor al utilizar cientos de miles de libros protegidos para entrenar sus modelos de inteligencia artificial bajo la marca “XGen”.
El escrito afirma que Salesforce empleó para tal fin bases de datos como RedPajama Books y The Pile —que incluyen el corpus denominado “Books3”, compuesto por más de 196.000 libros copiados del rastreador privado Bibliotik— sin autorización de los autores.
Según la demanda, tras lanzar el producto XGen en junio de 2023, Salesforce listó inicialmente “RedPajama-Books” como origen de los datos de entrenamiento, pero luego, en septiembre del mismo año, retiró esas referencias de su web, reemplazándolas por descripciones genéricas como “datos de lenguaje natural” procedentes de “fuentes públicas”.
Las autoras solicitan la certificación como acción colectiva para todos los titulares de derechos de autor en Estados Unidos cuyas obras hayan sido utilizadas desde octubre de 2022, y piden sanciones legales por infracción intencionada, restitución de beneficios, destrucción de copias infractoras y pago de honorarios.
Este caso se suma a una ola creciente de litigios contra empresas tecnológicas que desarrollan IA —como Anthropic, OpenAI y Meta Platforms— al usar obras protegidas sin compensación a los autores.

