RASPAGEM DE DADOS

‘RASPAR O TACHO’: confira como os dados públicos viram "mina de ouro" de empresas, hackers e políticos

Em todos esses casos, o uso dos dados já era impressionante. Agora, com a raspagem de dados, chegamos a um volume muito maior e com um grau de detalhamento ainda mais assustador. É a versão 2.0, que ganhou as manchetes na eleição municipal.

 

Quando uma foto é publicada no Instagram, contendo nome, localização e algumas hashtags, ela se torna bem mais útil do que os críticos da internet imaginam. Para além de rostos filtrados, fotos de comida e cenários paradisíacos, uma postagem dessas pode ser a peça que faltava para montar um perfil de quem você é —do que gosta, onde mora, que restaurante frequenta, onde estudou, em quem vota, quem admira, para que time torce, se é gay, religioso e/ou ativista.

Até aí, você pode dizer que não tem nada a esconder ou não se importa —e, provavelmente, qualquer pessoa disposta a dar uma “stalkeada” conseguiria as mesmas informações. Mas o que chama a atenção na raspagem de dados, como essa varredura por informações é chamada, é o volume e o cruzamento de dados. E também como tudo isso pode ser usado, para o bem ou para o mal.

Na eleição passada, ficou claro como as campanhas pagaram máquinas de disparo de mensagens em massa para tentar convencer milhares de eleitores mais volúveis a votar em Fernando Haddad (PT) ou Jair Bolsonaro (sem partido).

Antes disso, o escândalo da Cambridge Analytica escancarou como os dados qualificados do Facebook (seus, dos seus amigos e dos amigos dos seus amigos) poderiam virar o jogo entre os indecisos — ou entre aqueles mais suscetíveis a acreditar em fake news e teorias da conspiração, por exemplo. Mas, se você perdeu tudo isso na época, provavelmente agora anda preocupado com o cenário pintado no filme “O Dilema das Redes”.

Em todos esses casos, o uso dos dados já era impressionante. Agora, com a raspagem de dados, chegamos a um volume muito maior e com um grau de detalhamento ainda mais assustador. É a versão 2.0, que ganhou as manchetes na eleição municipal.

Lambendo os beiços

O que os casos das máquinas de spam eleitoral e da Cambridge Analityca mostraram é que o uso invisível dos nossos dados é real e acontece o tempo todo a partir de todos os rastros que deixamos nas redes sociais —coisa que a publicidade já fazia há muito tempo e com mais precisão, vale dizer. O avanço aqui é que o spam não é mais aleatório e os dados não vem só daquilo que é postado no Facebook ou captado por testes de personalidade.

A raspagem permite chegar a um grupo significativo de pessoas, muito bem definidas, que viram alvos —de anúncios, propaganda política, controle de doenças ou até monitoramento estatal.

A varredura usa softwares especiais para colher, na internet, dados pessoais de muita gente ao mesmo tempo. Sabe quando vazaram dados do Yahoo, Netflix, Zoom, Twitter, Google e muitos outros serviços que guardam tantas das nossas informações? Para você ter uma ideia, já são mais de 9 bilhões de senhas expostas em diversos casos de hackeamentos pelo mundo, que viram dinheiro no comércio ilegal da dark web (pacotes de dados valem até US$ 10 mil no submundo da internet e identidades de bebês custam centenas de dólares).

Mas, a coleta não para por aí. As maiores fontes são as postagens nas redes sociais —o programa consegue ler até os Stories (post efêmero) do Instagram com marcação em um restaurante, por exemplo. Também entram dados públicos de uma lista de aprovados num concurso ou faculdade, de quem ganhou um sorteio na internet, de PDFs, de uma reclamação ou comentário numa página, de um processo judicial ou de cadastros de CNPJs… Além disso, os robôs conseguem acessar informações escondidas (mas acessíveis) no código-fonte de uma página.

A partir de um nome se chega ao CPF e, com ele, ao título de eleitor. Ou seja, ao colégio eleitoral e à zona de votação.

Junta uma informação aqui, outra ali, soma com a geolocalização enviada pelo GPS do seu celular, multiplica por todas as pessoas do seu bairro ou da sua cidade e associa ao seu WhatsApp. Está feito o perfil de um grupo significativo de pessoas, que viram alvos de anúncios, propaganda política, controle de doenças ou até monitoramento estatal.

É isso que as já conhecidas máquinas de spam, que usam o WhatsApp como tática de busca de votos (e muitas vezes de divulgação de desinformação), passaram a oferecer na municipal: pacotes de informações muito valiosas sobre moradores de todo um colégio eleitoral, divididos por espectro político.

Segundo reportagem recente da Folha de S. Paulo, a BomBrasil.net, por exemplo, ofereceu a candidatos a vereadores um banco de dados de celulares com nome, endereço, bairro, renda, data de nascimento, com filtro de WhatsApp (20 mil números de celular por R$ 1.800, cada envio de WhatsApp sai por R$ 0,15, e o de SMS, R$ 0,09).

“Cadastramos na agenda de seu celular os contatos de WhatsApp de eleitores de sua cidade”, dizia a oferta encontrada pela apuração, que também podia incluir dados dos usuários do Instagram e do Facebook. A prática é proibida pela lei eleitoral e, em certos casos, é invasão de privacidade.

Ok, parece assustador. Mas os especialistas ouvidos por Tilt acham que esses bancos de dados que as empresas vendem para as campanhas eleitorais podem não ser tudo o que dizem. Não é tão simples assim obter os celulares das pessoas por raspagem de dados e os pacotes podem ser feitos com informações obtidas “no chute”.

O Instagram não deixa o telefone à disposição para raspagem de dados, a não ser nas páginas comerciais. Já o Facebook não permite API (códigos que inserem funções de um app em outro) que capture esses números, mesmo quando estão públicos. Na prática, isso teria de ser feito pessoa a pessoa, associando o dado com o perfil com ajuda de um robô.

Ingredientes enriquecidos

Capturar só uma informação não basta, é preciso enriquecer esse dado. Na raspagem, a varredura consegue associar, classificar e organizar as informações coletadas.

“É um processo automatizado de busca, cópia e classificação de dados acessíveis na internet. O programa se passa por uma pessoa ou usuário comum, acessa um site, copia e cola o dado em algum ambiente interno”, explica Hiago Kin, presidente da Associação Brasileira de Segurança Cibernética.

Existem diversos programas (ou scripts) que fazem esse trabalho e não é preciso ser um hacker para encontrar explicações detalhadas sobre como aplicar na prática, embora os códigos precisem ser atualizados com frequência para escapar das equipes de segurança das redes sociais.

“Não tem uma técnica tão incrível que descobre onde eu moro só pelo número de telefone. As pessoas podem pensar que é uma coisa supertecnológica e mirabolante, e as empresas até vendem como se fosse, mas na prática não é. É uma análise das minhas atividades”, diz Bandeira.

O grande entrave dos raspadores é simular o acesso de uma pessoa, porque o sistema é programado para detectar comportamento de máquina (quando um robô troca de página 20 vezes por segundo, por exemplo). Mas, segundo Kin, é possível construir um algoritmo de aleatoriedade, que abre páginas em diferentes intervalos de segundos e esconde a origem.

Me deixe fora dessa

Já deu para perceber que é difícil fugir, ao usar uma rede social você aumenta potencialmente as chances de ter os dados pessoais raspados.

  • Dados pessoais protegidos: qualquer coisa que te identifica (nome, número de telefone, localização)
  •  Dados sensíveis: religião ou orientação sexual, que contam com mais proteções ainda na LGPD

E aqui, cabe uma conscientização: as novas gerações já nascem no ambiente digital e imersas numa cultura de ausência de privacidade. Segundo relatório da PwC, enviado em carta aberta às empresas de tecnologia, a exploração descontrolada dos dados mina a liberdade de crianças e adolescentes, por as companhias de ad-tech (publicidade mesclada com tecnologia) coletam 72 milhões de pontos de dados sobre uma criança até ela chegar aos 13 anos.

Entretanto, uma “higiene digital” ajuda. Veja como começar:

  • Fique atento a políticas de privacidade de sites
  • Revise o máximo de opções de privacidade das redes sociais que usa
  •  Evite deixar como públicas informações pessoais, seja telefone, email, endereço ou locais visitados
  • Não exponha informações pessoais como número de telefone e documentos em comentários ou postagens
  • Aprende sobre os direitos dos seus dados, da mesma forma como é importante saber os direitos do consumidor

Fonte: UOL
Créditos: Polêmica Paraíba