Una de las consecuencias del auge de los chatbots es que el mundo ha reconocido el valor de Reddit. Google firmó un acuerdo de 60 millones de dólares para usar el contenido de la plataforma y entrenar modelos de lenguaje complejos. Y parece que todos los demás también lo quieren, aunque no estén dispuestos a pagar por ello. Reddit demandó a Anthropic este verano por entrenar sus modelos sin permiso.
Los datos de Reddit también son muy codiciados por los motores de búsqueda con IA. A principios de esta semana, la compañía presentó una demanda contra un grupo de empresas dedicadas a la extracción de datos por supuestamente robar su contenido y venderlo a Perplexity. Si el caso continúa en la fase de presentación de pruebas, la lista de demandados podría ampliarse.

Otro detalle interesante es que la demanda no alega que se haya extraído contenido de Reddit directamente. En cambio, el contenido provino de búsquedas en Google que incluían breves resúmenes de artículos de Reddit. Según la demanda, esos resúmenes luego aparecieron en los resultados de búsqueda de Perplexity. Perplexity niega haber actuado mal. Reddit debe demostrar que Perplexity eludió las protecciones de derechos de autor al comprar el contenido extraído y que Reddit sufrió daños en el proceso.
Extraer contenido web en sí no es ilegal, pero si se usa para violar la protección de derechos de autor, el responsable podría ser considerado culpable. Reddit tendrá que explicar por qué no es perjudicial que aparezcan resúmenes de su contenido en los resultados de búsqueda de Google (Google no paga por ellos), pero sí lo es que el contenido aparezca en Perplexity.
Como en todas estas demandas por derechos de autor relacionadas con la IA, mucho se reduce a la percepción general. Internet acordó normas de comportamiento. La IA ahora les está dando una paliza.

