"Scrapers", los ladrones de páginas de internet
close
Recibe noticias a través de nuestro newsletter
¡Gracias! Desde ahora recibirás un correo diario con las noticias más relevantes.
sync

"Scrapers", los ladrones de páginas de internet

Es barato y fácil de hacer. "Screen scraping" es una técnica que, por medio de software, permite copiar todos los datos del sitio web de una empresa rival para usarlos en beneficio propio.¿Robo o recopilación legítima?
4 de octubre, 2013
Comparte

Algunos lo llaman robo, otros lo definen como la recopilación legítima de información relacionada con los negocios, pero al parecer todos lo están haciendo.

Screen scraping es un término acuñado en inglés que, en ese idioma, suena como a lo que se le haría a los vidrios de un auto cubiertos de escarcha en una mañana muy fría. Pero a lo que se refiere en internet es a copiar todos los datos que contiene un sitio web.

“Todas las empresas lo hacen, y si te dicen que no, están mintiendo”, dice Francis Irving, director de Scraper Wiki, una compañía que diseña herramientas que ayudan a diversas organizaciones a recabar y organizar información de sus competidores.

Para copiar algún archivo en una computadora, el texto se subraya con el ratón o con el teclado usando, por ejemplo, “Control+C”. Pero copiar un sitio web es más complicado debido a la manera en la que se disponen y almacenan los datos.

Generalmente, se trata de un mecanismo informático intensivo que implica visitar la página de internet en múltiples ocasiones para obtener todos los dígitos y caracteres que se encuentran allí.

Recursos dilapidados

Si el contenido cambia con frecuencia, los scrapers (que realizan el procedimiento descrito con anterioridad) tienen que revisar el sitio web con más regularidad para garantizar que tienen todos los datos.

“Hasta un 40% de las visitas que reciben las páginas de internet de nuestros clientes son scrapers”, explica Mathias Elvang, director de la empresa de seguridad Sentor, que elabora herramientas para impedir el trabajo de los programas informáticos que se dedican a este tema.

“Pueden invertir mucho dinero en infraestructura que ayuda a estos programas en el trabajo que hacen”, afirma Elvang.

Y ese es el problema. En vez de concentrarse en sus clientes, los recursos tecnológicos de una empresa se destinan a ayudar a programas computarizados que no tienen la menor intención de gastar dinero.

Pérdida de datos

Lo que es peor es que es muy probable que esos scrapers trabajen para tus rivales, según Mike Gaffney, exdirector de seguridad informática en Ladbrokes (una compañía británica de apuestas), quien pasó una buena parte de su tiempo en la casa de apuestas combatiendo a los scrapers.

“Ladbrokes bloqueaba alrededor de un millón de direcciones IP (la identificación de una computadora) diariamente”, cuenta, describiendo la dimensión de los ataques de los scrapers.

“Muchos -prosigue- estaban controlados por rivales inescrupulosos que estaban fuera del Reino Unido y que no querían pagar por la recopilación de datos relacionados con las apuestas que ofrece la empresa”.

Así que obtenían la información gratis a través de scrapers y luego la fusionaban con datos similares obtenidos de la misma manera para darles a sus usuarios un compendio de las apuestas que ofrecían casas dedicadas al tema.

“Es importante evitar que la competencia se entere de tus tarifas, pero es información disponible para los apostadores. La clave es bloquear a los scrapers pero permitir el acceso a quienes realmente quieren apostar”, añade Gaffney.

Los más apetitosos

Los sitios web que suelen convertirse en el blanco de los scrapers son aquellos con datos que cambian con gran rapidez, por ejemplo, empresas de apuestas a los resultados de eventos deportivos, aerolíneas y compañías de viajes.

El problema, comenta Shay Rapaport, cofundador de Fireblade, una firma que combate a quienes se dedican al screen scraping, está en saber si el visitante es una persona que busca un pasaje barato o es un programa que está tratando de copiar todos los datos del portal.

“Es una tendencia en aumento porque se hace con facilidad y hay muchas herramientas disponibles en la red. Los mejores programas son los que imitan el comportamiento humano y almacenan lo que recopilan en diferentes computadoras, lo que dificulta saber si se trata de una computadora o una persona”, dice Rapaport.

En muchos países no se trata de una actividad ilegal, por lo que empresas escrupulosas o inescrupulosas aprovechan la situación.

“Muchas firmas utilizan esta técnica. Algunas veces la información está disponible en la red con una presentación diferente y, otras, se utiliza internamente para analizar el negocio”, afirma Rapaport.

Aspectos positivos

Frances Irving, director de Scraper Wiki, indica que no todo es malo con respecto a este procedimiento. Hay usos legítimos.

Por ejemplo, según Irving, algunas de las herramientas utilizadas para hacer screen scraping pueden ayudar a entender sitios web con cantidades inmensas de información que dificultan la navegación.

Los scrapers se han utilizado para obtener datos de Hansard, una página web que documenta las votaciones de los parlamentarios británicos y transcribe lo que dicen en la sede legislativa.

“Los datos son uniformes porque utilizan un estilo estándar, pero está hecho por humanos, así que existe la posibilidad de que haya errores”, dice Irving.

Así que esta técnica permite organizar la información para que esté disponible en la red, lo que permitiría “vigilar” a los funcionarios que representan a los ciudadanos.

Scrapers de peso

Adicionalmente, indica Irving, se puede usar para “darles la vuelta” a las barreras burocráticas u organizacionales que podrían obstaculizar un proyecto de recopilación de datos.

“Es importante recordar que el desarrollo de la red ha estado impulsado por dos grandes scrapers, Google y Facebook”, afirma el especialista.

En un principio los motores de búsqueda utilizaban esta técnica para catalogar la información disponible en la red y facilitar el acceso a la misma. Y en tiempos más recientes, Facebook la empleó para ayudar a las personas a llenar su perfil en la red social.

“Ambas empresas se desarrollaron gracias al scraping. Si existieran restricciones significativas con respecto a que tipo de datos pueden someterse a este mecanismo, la red sería muy distinta a la que tenemos en la actualidad”, concluye.

Lo que hacemos en Animal Político requiere de periodistas profesionales, trabajo en equipo, mantener diálogo con los lectores y algo muy importante: independencia. Tú puedes ayudarnos a seguir. Sé parte del equipo. Suscríbete a Animal Político, recibe beneficios y apoya el periodismo libre.

#YoSoyAnimal

Canal de Suez: 3 claves de la exitosa maniobra para desencallar el Ever Given

Casi una semana después de que el Ever Given encallara en el canal de Suez, el carguero fue por fin liberado. ¿En qué consistió la operación para desatascarlo y reanudar el comercio mundial?
29 de marzo, 2021
Comparte

Casi una semana después de que el Ever Given encallara en el canal de Suez y detuviera la circulación de más de una décima parte del comercio mundial, el carguero fue por fin liberado.

Osama Rabie, jefe de la Autoridad del Canal de Suez, anunció este lunes “el éxito de la maniobra” para desatascar el barco, que se había atorado el martes pasado.

“¡Lo conseguimos!”, señaló en un comunicado la empresa holandesa Boskalis, contratada para ayudar en la operación.

“Los egipcios han logrado hoy poner fin a la crisis“, señaló el presidente del país, Abdel Fatah al-Sissi, en un comunicado este lunes.

El buque, de 200.000 toneladas y 400 metros de largo, había quedado atravesado en diagonal en el canal de no mucho más de 200 metros de ancho.

Después de una operación que involucró actividades de remolque y dragado, el barco fue completamente reflotado y está siendo remolcado hacia el norte, al Gran Lago Amargo, en Egipto, para someterse a controles de seguridad.

El bloqueo le costó al canal entre US$14-15 millones al día, alteró la cadena mundial de suministros y elevó el valor del flete de los barcos petroleros.

Te contamos en qué consistió exactamente la operación para liberar al Ever Given y reanudar el comercio mundial, en tres claves.

1. Remolque y arrastre con “luna llena”

Se desplegaron un total de 11 remolcadores portuarios y dos poderosos remolcadores marítimos, según Boskalis, empresa con sede en los Países Bajos que participó en el rescate del Ever Given, a través de su equipo especializado SMIT Salvage.

Operación de remolque

BBC

Los remolcadores trabajaron durante varios días, usando cables o colocándose directamente junto al carguero, para separarlo de los bancos de arena a ambos lados del canal.

Osama Rabie, jefe de la Autoridad del canal de Suez, detalló que los barcos remolcadores habían logrado modificar la orientación del buque en un 80% y alejarlo de la orilla del canal 102 metros.

Mientras estuvo encallado, el Ever Given se situaba apenas a cuatro metros de las orillas.

El viernes y el sábado ya había habido pequeños progresos y el barco se había movido “30 grados de izquierda a derecha”.

La luna llena propició que subiera la marea, lo que ayudó a que el barco pudiera ser arrastrado, primero desde la popa y después por la proa, detalló EFE.

Según el diario The Washigton Post, la luna llena propició la marea más alta del mes.

2. Dragado

Mientras los remolcadores luchaban por mover el barco, se trajeron dragas para excavar el barro y la arena debajo de la proa y la popa del barco.

Se dragaron aproximadamente 30.000 metros cúbicos de arena, según Boskalis.

La empresa que administra el buque, Bernhard Schulte Shipmanagement (BSM), dijo que se había incorporado una “draga de succión” especializada adicional, capaz de mover 2.000 metros cúbicos de material cada hora.

Las dragas son una vista familiar en el canal de Suez, según Sal Mercogliano, experto en historia marítima de la Universidad de Campbell, en EE.UU., ya que se usan para dragar continuamente la vía y mantenerla navegable.

“Básicamente, máquinas grandes extraen barro del fondo, que luego se puede depositar en tierra”, especificó Mercogliano.

Ilustración del dragado del canal

BBC

Si el dragado y el remolque hubieran fallado, habría existido una tercera opción: retirar la carga y el combustible del barco.

Pero hubiera requerido una operación delicada y larga, para evitar desequilibrar el peso del carguero y que pudiera volcarse.

3. Organización de los barcos

El enorme tráfico que suele acoger el canal tuvo que ser redistribuido para llevar a cabo la operación y a la espera de que ésta fuera exitosa.

Al menos 437 embarcaciones, incluidos cargueros con contenedores y tanqueros de petróleo y gas natural, estaban esperando a que se liberara el Ever Given para pasar por el canal, según Gulf Agency Company (GAC).

“Actualmente 193 embarcaciones están esperando en Port Said (en la costa mediterránea de Egipto) para viajar en dirección sur y 201 en Suez (en el Mar Rojo) para viajar en dirección norte. Otras 43 están aguardando en el Gran Lago Amargo”, en el centro del canal, aseguró GAC en un comunicado recogido por la agencia EFE.

Barcos paralizados en el Canal de Suez

Reuters
La Autoridad del Canal de Suez dijo que tomaría hasta tres días reanudar el tráfico de los barcos.

El tránsito de estos cargueros se reanudará de forma ordenada y por turnos ya que el tramo sur del canal sólo tiene un carril, detalló GAC.

La Autoridad del Canal de Suez advirtió que puede llevar hasta tres días aliviar el atraso de barcos atascados en ambos extremos de la ruta.

Pero Maersk, la principal naviera que opera en el canal de Suez, dijo que el atasco podría tardar “seis días o más” en diluirse.

Muchos barcos ya habían decidido cambiar de dirección a través del Cabo de Buena Esperanza, dando la vuelta a África, lo que prolonga por dos semanas el trayecto y eleva los costos de combustible.


Ahora puedes recibir notificaciones de BBC Mundo. Descarga la nueva versión de nuestra app y actívalas para no perderte nuestro mejor contenido.

https://www.youtube.com/watch?v=z074SRnf2lY

Lo que hacemos en Animal Político requiere de periodistas profesionales, trabajo en equipo, mantener diálogo con los lectores y algo muy importante: independencia. Tú puedes ayudarnos a seguir. Sé parte del equipo. Suscríbete a Animal Político, recibe beneficios y apoya el periodismo libre.

#YoSoyAnimal
close
¡Muchas gracias!

Estamos procesando tu membresía, por favor sé paciente, este proceso puede tomar hasta dos minutos.

No cierres esta ventana.