Varias revistas, periódicos y webs demandan a Microsoft y OpenAI por uso no autorizado de su contenido para entrenar modelos de IA

Sports News » Varias revistas, periódicos y webs demandan a Microsoft y OpenAI por uso no autorizado de su contenido para entrenar modelos de IA
Preview Varias revistas, periódicos y webs demandan a Microsoft y OpenAI por uso no autorizado de su contenido para entrenar modelos de IA

La IA se entrena utilizando todo el contenido que le proporcionan para ir creando iteraciones entre datos, reconociendo patrones, tomando decisiones y generando resultados cada vez más precisos. En cierta manera se asemeja a una persona humana estudiando una materia, solo que aquí implica muchísima información. De hecho, empresas como OpenAI ya han llegado a usar “todo el contenido de Internet” o eso dicen. Ahora resulta que tanto OpenAI como Microsoft han recibido una demanda que les acusa de haber usado el contenido de más de 400 periódicos y webs sin permiso para sus IA sin pagar nada.

Fue el año pasado cuando surgieron noticias de que OpenAI había llegado a usar la totalidad del contenido de Internet, pero claro, se refería a fuentes públicas y contenido de libre acceso, no al 100% de la web. Hay que tener en cuenta que hay muchos sitios web que están detrás de un muro de pago (paywall) y toca pagar o suscribirse para acceder. Esto incluye tanto webs de noticias como medios especializados y también es habitual verlo en páginas de investigación y desarrollo, las cuales te impedirán acceder a los papers salvo que pagues o estés vinculado a alguna organización o universidad.

Microsoft y OpenAI reciben una demanda por usar contenido de cientos de periódicos y webs online sin consentimiento ni compensación

Google uso ChatGPT para entrenar a Gemini

Ya hemos visto el comportamiento de la IA y los bots que no paran de hacer “scraping” de datos, el cual es un método automatizado que extrae la información de los sitios web. Tras esto se organiza y se crea una estructura para usarlos en distintas tareas, siendo una de ellas la de emplearla como dataset para entrenamiento de IA. Estamos seguros que hay varias formas de saltarse los muros de pago y por ello podemos entender la reciente demanda hacia Microsoft y OpenAI por usar contenido bajo licencia sin pagar para sus IA.

La demanda fue presentada el 24 de junio de 2026 en el Tribunal Federal del Distrito Sur de Nueva York y acusa a ambas compañías de haber usado el contenido de los casi 400 periódicos para entrenar tanto ChatGPT por parte de OpenAI como Copilot por parte de Microsoft. Estas no solo se han encargado de rastrear y almacenar los datos, sino que han usado toda esta información sin ningún tipo de compensación económica, sin permiso y sin licencias. No solo han empleado información de webs gratuitas, sino también de las de pago, saltándose las medidas y sin dar un solo euro/dólar a dichos medios.

Ambas compañías estarían cometiendo una infracción de la ley DMCA y piden indemnizaciones

Un-usuario-le-pide-matrimonio-a-su-chatbot-con-IA-creado-con-ChatGPT

En la demanda les acusan de haber copiado los artículos, reportajes y contenidos protegidos con derechos de autor. De hecho, llegaron a eliminar los datos de gestión de derechos de autor en los documentos para así saltarse la protección y poder entrenar sus modelos de inteligencia artificial. El problema es que esto implica una posible infracción de DMCA y los medios están pidiendo una serie de indemnizaciones además de una orden judicial que evita una futura infracción de este tipo.

Matthew Platkin, el representante de los demandantes, dice que esta es la mayor acción legal contra empresas de IA multimillonarias presentada por periódicos locales y regionales. Por ahora se sabe que OpenAI ha rechazado las acusaciones y dice que el entrenamiento de sus modelos de IA está protegido por la política de uso legítimo (fair use), asegurando que usaron datos disponibles públicamente. Microsoft por su parte no ha respondido ante las acusaciones.

La entrada Varias revistas, periódicos y webs demandan a Microsoft y OpenAI por uso no autorizado de su contenido para entrenar modelos de IA aparece primero en El Chapuzas Informático.