Wikipedia revela múltiples acuerdos con gigantes de la IA para usar su contenido

2026-01-17 15:26:06

En resumen

La Fundación Wikimedia ha anunciado una serie de asociaciones con empresas de inteligencia artificial para utilizar su contenido en el entrenamiento de modelos de lenguaje grande (LLMs).
Las empresas de IA se han suscrito a su producto Enterprise para la reutilización a gran escala del contenido de Wikipedia.
En octubre del año pasado, la Fundación afirmó que las visitas al sitio estaban disminuyendo debido a que las personas utilizaban resúmenes generados por IA en lugar de visitar el sitio.

La Fundación Wikimedia ha anunciado una serie de nuevas asociaciones con empresas de inteligencia artificial que les permitirán usar el contenido de Wikipedia para entrenar y potenciar sus modelos de IA, mientras la organización sin fines de lucro busca fortalecer su sostenibilidad a largo plazo en medio de cambios en el comportamiento en línea. Los acuerdos se firmaron a través de Wikimedia Enterprise, el producto comercial de la fundación diseñado para grandes reutilizadores y distribuidores de contenido de los proyectos Wikimedia. Las nuevas inscripciones incluyen a Ecosia, Microsoft, Mistral AI, Perplexity, Pleias y ProRata. Se unen a socios existentes como Amazon, Google y Meta. “En la era de la IA, Wikipedia y su conocimiento creado y curado por humanos nunca ha sido más valioso”, dijo la fundación en un comunicado. “Su poder de conocimiento[s] en chatbots de IA generativa, motores de búsqueda, asistentes de voz y más. Wikipedia es uno de los conjuntos de datos de más alta calidad utilizados en el entrenamiento de Modelos de Lenguaje Grande.”

El anuncio se realizó como parte de una actualización vinculada al 25º aniversario de Wikipedia. La enciclopedia en línea se encuentra entre los diez sitios web más visitados a nivel mundial y es la única en ese grupo operada por una organización sin fines de lucro. Sus más de 65 millones de artículos, publicados en más de 300 idiomas, son vistos casi 15 mil millones de veces cada mes, según la fundación. Sin embargo, ha advertido que los patrones de tráfico están cambiando. En octubre, afirmó que las visitas humanas a Wikipedia cayeron un 8% interanual, atribuyendo la disminución a que los usuarios confían en resúmenes generados por IA en lugar de visitar el sitio directamente. Casi el 60% de las búsquedas en Google terminan sin hacer clic, con respuestas en la página a menudo alimentadas por contenido de Wikipedia.

IA vs editores Los acuerdos llegan en medio de un debate más amplio sobre cómo las empresas de IA obtienen sus datos de entrenamiento. Los modelos de lenguaje grande suelen entrenarse con una gran cantidad de material en línea, una práctica que ha sido criticada por autores, editores y otros titulares de derechos que argumentan que el uso de obras protegidas por derechos de autor sin permiso constituye una infracción. Entre ellos, Reddit está involucrado en varias demandas contra empresas de IA por el uso de su contenido para entrenar modelos, aunque ha llegado a acuerdos de licencia con empresas como Google. El jueves, los principales editores de libros Hachette Book Group y Cengage Group presentaron una moción para unirse a una demanda colectiva existente contra Google, acusando a la compañía de llevar a cabo “infracción de derechos de autor histórica” para construir su plataforma de IA Gemini. La demanda alega que Google copió libros sin las licencias adecuadas durante sus procesos de entrenamiento de IA. El caso fue presentado originalmente en 2023 por un grupo de autores. OpenAI enfrenta un caso similar por parte de demandantes que incluyen al escritor de “Game of Thrones” George R.R. Martin. Las empresas de entretenimiento también están presionando en este asunto. A mediados de diciembre, Disney envió a Google una carta de cese y desistimiento acusándola de infracción de derechos de autor, incluso cuando Disney firmó un acuerdo de licencia separado con OpenAI que cubre cientos de personajes para videos generados por IA. Disney ha emitido avisos similares a otras empresas de IA y está involucrada en litigios junto a grandes estudios contra la empresa de generación de imágenes Midjourney. Ese mismo mes, una coalición de escritores, actores y tecnólogos lanzó un nuevo grupo de la industria destinado a impulsar estándares aplicables sobre cómo se entrena y utiliza la IA en el sector del entretenimiento. Más de 500 figuras prominentes respaldan la iniciativa, incluyendo a Natalie Portman, Cate Blanchett, Ben Affleck, Guillermo del Toro y Taika Waititi. La Comisión Europea también ha abierto una investigación antimonopolio formal para determinar si Google violó las reglas de competencia de la UE al usar contenido de editores y YouTube para potenciar sus servicios de IA sin una compensación o consentimiento justos. No está claro si los titulares de derechos de autor finalmente podrán encontrar recursos legales. Recientemente, jueces federales en EE. UU. han otorgado victorias parciales a Meta y Anthropic, dictaminando que su uso de libros protegidos por derechos de autor para entrenar modelos de IA constituye un uso justo, aunque criticaron a las empresas por mantener bibliotecas permanentes de obras piratas.

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.