Buenas noticias para archivistas, académicos, investigadores y periodistas: el raspado de datos de acceso público es legal, según un fallo de un tribunal de apelaciones de EE. UU.
El fallo histórico del Noveno Circuito de Apelaciones de EE. UU. es el último de una larga batalla legal iniciada por LinkedIn con el objetivo de evitar que una empresa rival extraiga información personal de los perfiles públicos de los usuarios. El caso llegó a la Corte Suprema de EE. UU. el año pasado, pero fue enviado de vuelta al Noveno Circuito para que la corte de apelaciones original volviera a revisar el caso.
En su segundo fallo del lunes, el Noveno Circuito reafirmó su decisión original y encontró que extraer datos que son de acceso público en Internet no es una violación de la Ley de Abuso y Fraude Informático, o CFAA, que rige lo que constituye piratería informática según la ley de EE. UU. .
La decisión del Noveno Circuito es una gran victoria para los archivistas, académicos, investigadores y periodistas que usan herramientas para recolectar masivamente, o raspar, información a la que se puede acceder públicamente en Internet. Sin un fallo vigente, los proyectos de larga duración para archivar sitios web que ya no están en línea y utilizar datos de acceso público para estudios académicos y de investigación han quedado en un limbo legal.
Pero ha habido casos atroces de web scraping que han generado preocupaciones sobre la privacidad y la seguridad. La startup de reconocimiento facial Clearview AI afirma haber extraído miles de millones de fotos de perfil de redes sociales, lo que llevó a varios gigantes tecnológicos a presentar demandas contra la startup. A varias empresas, incluidas Facebook, Instagram, Parler, Venmo y Clubhouse, se les han extraído los datos de los usuarios a lo largo de los años.
El caso ante el Noveno Circuito fue presentado originalmente por LinkedIn contra Hiq Labs, una empresa que utiliza datos públicos para analizar el desgaste de los empleados. LinkedIn dijo que el raspado web masivo de los perfiles de usuario de LinkedIn por parte de Hiq iba en contra de sus términos de servicio, equivalía a piratería y, por lo tanto, era una violación de la CFAA. LinkedIn perdió por primera vez el caso contra Hiq en 2019 después de que el Noveno Circuito descubriera que la CFAA no prohíbe que nadie extraiga datos de acceso público.
En su segundo paso del caso, el Noveno Circuito dijo que se basó en una decisión de la Corte Suprema en junio pasado, durante la cual el tribunal superior de los EE. UU. Echó un vistazo por primera vez a la CFAA, que tiene décadas de antigüedad. En su fallo, la Corte Suprema limitó lo que constituye una violación de la CFAA a aquellos que obtienen acceso no autorizado a un sistema informático, en lugar de una interpretación más amplia de exceder la autorización existente, que según la corte podría haber asociado sanciones penales a “una cantidad impresionante”. de la actividad informática común”. Usando una analogía de “puerta arriba, puerta abajo”, la Corte Suprema dijo que cuando las puertas de una computadora o sitio web están abiertas, y por lo tanto la información es de acceso público, no se requiere autorización.
El Noveno Circuito, al hacer referencia a la analogía de “puerta arriba, puerta abajo” de la Corte Suprema, dictaminó que “el concepto de ‘sin autorización’ no se aplica a los sitios web públicos”.
“Estamos decepcionados con la decisión de la corte. Esta es una decisión preliminar y el caso está lejos de terminar”, dijo el portavoz de LinkedIn, Greg Snapper, en un comunicado. “Seguiremos luchando para proteger la capacidad de nuestros miembros de controlar la información que ponen a disposición en LinkedIn. Cuando sus datos se toman sin permiso y se usan de maneras que usted no ha aceptado, eso no está bien. En LinkedIn, nuestros miembros confían en nosotros con su información, por lo que prohibimos el raspado no autorizado en nuestra plataforma”.