Meta ha retirado su demanda contra una empresa israelí de web scraping Datos brillantes, después de perder un reclamo clave en su caso hace unas semanas. El gigante de las redes sociales tiene un historial de guerra contra empresas que extraen datos de sus sitios web y aplicaciones, y Bright Data fue uno de los últimos en enfrentar un ataque legal. Sin embargo, el tribunal falló recientemente a favor de Bright Data en un reclamo por incumplimiento de contrato, diciendo que Meta no había presentado pruebas suficientes que demostraran que la empresa había eliminado algo más que datos públicos. En lugar de seguir luchando en este caso, Meta abandonó la demanda, según indican los documentos judiciales.
Más allá de ser simplemente otro caso de web scraping, lo que hizo que este caso fuera particularmente interesante fue que Meta era cliente de Bright Data de una sola vez. Es decir, la empresa le había proporcionado a Meta datos de sitios web de comercio electrónico para crear perfiles de marca en sus plataformas. Sin embargo, cuando Bright Data eliminó los propios datos de Meta, la empresa presentó una demanda.
El mes pasado, el tribunal falló a favor de un juicio sumario parcial sobre las reclamaciones por incumplimiento de contrato porque dijo que Meta no mostró pruebas suficientes para indicar que Bright Data había eliminado no publico datos: es decir, datos detrás de una pantalla de inicio de sesión o una página protegida con contraseña. El caso profundizó en la cantidad de datos de los usuarios que recopilan empresas de terceros como Bright Data, quienes luego venden sus colecciones de datos a otras empresas, donde pueden usarse para una variedad de propósitos, incluida la investigación de mercado, marketing, tecnología publicitaria, Entrenamiento de IA y más.
En este caso, Meta había llevado ante el tribunal un ejemplo de las actividades de web scraping de Bright Data: un conjunto de datos masivo que incluía 615 millones de registros de datos de Instagram que se vendieron por 860.000 dólares. El conjunto de datos incluía campos como nombres de usuarios, identificaciones, países, recuentos de publicaciones, biografías, hashtags, seguidores, publicaciones, imágenes de perfil, categorías comerciales, correos electrónicos y más. Pero el tribunal no creyó que Meta mostrara pruebas suficientes de que los datos sólo pudieran haber sido recopilados por una cuenta de usuario que había iniciado sesión.
En otro ejemplo, Meta intentó demostrar que Bright Data estaba en posesión de información no pública, pero el tribunal dijo que esto tampoco podía usarse para probar el scraping iniciado sesión, como afirmó Meta, ya que la información podría haber sido accesible públicamente. en un momento anterior cuando ocurrió el raspado.
El tribunal además no estuvo de acuerdo con Meta en que usar herramientas automatizadas para eludir las restricciones de acceso, como CAPTCHA, era lo mismo que acceder a un “sitio web protegido con contraseña”.
Y aunque Meta había descubierto que Bright Data anunciaba un “navegador de raspado” que automatizaba el inicio de sesión en sitios web para facilitar la recopilación de datos de inicio de sesión, el tribunal dijo que Meta no tenía pruebas que demostraran que el navegador se utilizó en este caso particular de raspado de datos de Meta. .
Finalmente, el tribunal dijo que no había evidencia de que Bright Data usara sus propias cuentas de Facebook e Instagram para realizar scraping, por lo que no podía ser considerado responsable por los términos de servicio de Meta y otras políticas legales que los usuarios aceptan. Al momento del fallo, Meta dijo que estaba evaluando los próximos pasos en el litigio en curso.
El viernes 23 de febrero de 2024, Meta solicitó desestimar el reclamo restante en su demanda contra la empresa de web scraping (un reclamo por interferencia ilícita), “sin perjuicio”, y renunció a su derecho a apelar la orden anterior que otorgó sentencia sumaria en a favor de Bright Data en la reclamación por incumplimiento de contrato.
Es una pérdida poco común por parte de Meta contra la industria de los web scrapers, contra la cual litiga regularmente para desalentar esta práctica.
En muchos otros casos, Meta ha prevalecido. incluido el acuerdo en octubre de 2022 de un caso contra otras dos empresas, BrandTotal Ltd., con sede en Israel, y Unimania Inc., constituida en Delaware, que aceptaron una orden judicial permanente que les prohibía extraer datos de Facebook e Instagram en el futuro. Ambos también tuvieron que pagar a Meta una “suma financiera significativa”, había dicho el gigante tecnológico. Antes, Meta resuelto en 2020 con el servicio de scraping Massroot8. Y en 2022, demandó un operador de sitio clonado y una empresa llamada Octopus, una filial estadounidense de una empresa nacional china de alta tecnología. que había ofrecido servicios de scraping. Meta también ganó ese caso y el tribunal emitió una orden judicial permanente para detener las operaciones de extracción de datos de la empresa.
El año pasado, Meta demandó otra empresa de scraping por contrato, Voyager Labspero ese caso está en curso.
Bright Data dice que su caso no fue desestimado porque las partes llegaron a un acuerdo, ya que no llegó a ningún acuerdo con Meta ni realizará ningún cambio en su conducta. En resumen, la compañía cree que los términos de Meta no se aplican a la extracción de información pública mientras se está desconectado de una cuenta y que este caso defiende su derecho a hacerlo. Sin embargo, también indica que Meta simplemente necesita proporcionar mejores pruebas de scraping ilegal al llevar a un web scraping a los tribunales, más allá de simplemente demostrar que tiene los datos de Meta para vender y que dirige un negocio que proporciona scraping de datos.
“Esta concesión de Meta es un momento crucial para Bright Data y la comunidad de web scraping. Estamos encantados con el resultado de este caso, solidificar la información pública es así de público”, dijo Or Lenchner, director ejecutivo de Bright Data, en un correo electrónico con TechCrunch. “Bright Data sigue comprometido a mantener el acceso gratuito a los datos web públicos para todos. Internet estaba pensado para el beneficio de todos y ninguna entidad o persona debería afirmar que es su propiedad”, añadió.
Se le pidió a Meta un comentario, pero no se proporcionó ninguno de inmediato.
La demanda de la empresa fue el caso número 3:23-cv-00077-EMC y se presentó en el Tribunal de Distrito de EE. UU. en el norte de California.