La controversia nace en Hungría, donde la editorial Like Company —especializada en contenidos SEO y noticias regionales sobre el lago Balatón— demandó a Google por una presunta infracción de sus derechos de autor.
El conflicto surgió a raíz de un artículo publicado en su página web balatonkornyeke.hu, en el que se relataban detalles sobre el cantante húngaro Kozso y su peculiar propuesta de introducir delfines en el lago. Este contenido fue posteriormente resumido por el chatbot Gemini, a petición de un usuario que solicitó un resumen en húngaro de dicho artículo.
La editorial consideró que la respuesta del chatbot equivalía a un acto de reproducción no autorizado, así como una puesta a disposición pública de su contenido protegido. Además, alegaron que su obra había sido empleada para entrenar al modelo de IA, lo cual supondría una nueva infracción.
Las claves del conflicto jurídico
La demanda plantea múltiples interrogantes jurídicos que ahora deberán resolverse en el TJUE mediante una cuestión prejudicial, con el fin de armonizar la interpretación del derecho de autor europeo. Las preguntas formuladas incluyen:
1. ¿El output de un chatbot constituye comunicación pública?
¿Puede considerarse que la generación de un resumen similar al texto original es un acto de comunicación al público, aunque el contenido sea creado por un modelo predictivo?
2. ¿El entrenamiento de modelos LLM infringe los derechos de autor?
¿Analizar y aprender de textos protegidos para entrenar un modelo de IA equivale a realizar una reproducción no autorizada?
3. ¿Se puede aplicar la excepción de minería de texto?
En caso de que se considere que hubo reproducción, ¿podría ampararse bajo la excepción prevista para text and data mining (TDM), si las fuentes eran de acceso lícito?
4. ¿Es el resultado del chatbot una nueva reproducción?
Cuando un modelo genera un texto que replica parte de una obra protegida, ¿se considera esta una nueva reproducción en el sentido legal del término?
El papel de la minería de datos y el modelo RAG
Este caso también pone en el centro del debate el uso de tecnologías como Retrieval Augmented Generation (RAG), que combina la búsqueda activa de información en tiempo real (por ejemplo, en Google Search) con la generación de contenido a partir de ella.
A diferencia del entrenamiento tradicional, que ocurre de forma previa y aislada, RAG permite al modelo utilizar fuentes externas en el momento de generar una respuesta. En el caso del artículo húngaro, el resumen del chatbot podría no provenir del entrenamiento, sino de una consulta en tiempo real a la página original.
Este matiz complica la atribución de responsabilidad: ¿es el chatbot un mero intermediario o actúa como un agente activo que reproduce contenido?
Lo que está en juego para la propiedad intelectual
Más allá de la resolución de este caso concreto, el TJUE se enfrenta a cuestiones fundamentales que marcarán el futuro de la propiedad intelectual en la era de la IA:
¿Debe considerarse la IA como una herramienta de reproducción?
¿Puede un modelo de lenguaje ser tratado como una base de datos?
¿Qué nivel de originalidad requieren los contenidos generados por IA?
¿Qué límites deben establecerse a la minería de datos?
La respuesta a estas preguntas impactará directamente en editoriales, plataformas tecnológicas, profesionales del derecho y, por supuesto, en la creación de contenidos digitales.
Conclusión
El caso de Hungría frente a Google no solo es un choque entre una editorial y un gigante tecnológico. Es una muestra clara del vacío normativo y de interpretación que aún persiste en Europa respecto a la Inteligencia Artificial y la propiedad intelectual.
