O que é de-anonimização
A desanonização é uma técnica na mineração de dados que identifica novamente informações criptografadas ou generalizadas. A anonimização, também conhecida como re-identificação de dados, faz referência cruzada de informações anonimizadas com outros dados disponíveis para identificar uma pessoa, grupo ou transação.
QUEBRANDO A DESANONIZAÇÃO
A era de conhecimento de tecnologia está rapidamente interrompendo a maneira tradicional de fazer as coisas em vários setores da economia. Nos últimos anos, o setor financeiro viu muitos produtos digitais introduzidos em seu setor por empresas de fintech. Esses produtos inovadores promoveram a inclusão financeira, pela qual mais consumidores têm acesso a produtos e serviços financeiros a um custo menor do que as instituições financeiras tradicionais permitem. O aumento na implementação da tecnologia trouxe um aumento na coleta, armazenamento e uso de dados. Ferramentas de tecnologia, como plataformas de mídia social, plataformas de pagamento digital e tecnologia de telefone inteligente, revelaram uma tonelada de dados usados por várias empresas para aprimorar sua interação com os consumidores. Essa quantidade de dados é chamada big data e é motivo de preocupação entre indivíduos e autoridades reguladoras, exigindo mais leis que protejam a identidade e a privacidade dos usuários.
Como funciona o cancelamento do anonimato
Na era do big data, em que informações confidenciais sobre as atividades online de um usuário são compartilhadas instantaneamente por meio da computação em nuvem, ferramentas de anonimização de dados foram empregadas para proteger a identidade dos usuários. O anonimato mascara as informações de identificação pessoal (PII) dos usuários que realizam transações em vários campos, como serviços de saúde, plataformas de mídia social, transações de comércio eletrônico, etc. A PII inclui informações como data de nascimento, número de segurança social (SSN), código postal e IP endereço. A necessidade de mascarar as trilhas digitais deixadas para trás pelas atividades online levou à implementação de estratégias de anonimização, como criptografia, exclusão, generalização e perturbação. Embora os cientistas de dados usem essas estratégias para separar informações confidenciais dos dados compartilhados, eles ainda preservam as informações originais, abrindo portas para a possibilidade de re-identificação.
O cancelamento do anonimato reverte o processo de anonimização, combinando conjuntos de dados compartilhados, mas limitados, com conjuntos de dados facilmente acessíveis online. Os mineradores de dados podem recuperar algumas informações de cada conjunto de dados disponíveis para reunir a identidade ou transação de uma pessoa. Por exemplo, um minerador de dados pode recuperar um conjunto de dados compartilhado por uma empresa de telecomunicações, um site de mídia social, uma plataforma de comércio eletrônico e um resultado censitário disponível ao público para determinar o nome e as atividades frequentes de um usuário.
Como o cancelamento do anonimato é usado
A re-identificação pode ser bem-sucedida quando novas informações são liberadas ou quando a estratégia de anonimização implementada não é realizada corretamente. Com um vasto suprimento de dados e quantidade limitada de tempo disponível por dia, analistas e mineradores de dados estão implementando atalhos conhecidos como heurística na tomada de decisões. Embora a heurística economize tempo e recursos valiosos ao vasculhar um conjunto de dados, também pode criar lacunas que poderiam ser aproveitadas se a ferramenta heurística incorreta fosse implementada. Essas lacunas podem ser identificadas por mineradores de dados que procuram desanonizar um conjunto de dados para fins legais ou ilegais.
Informações de identificação pessoal obtidas ilegalmente a partir de técnicas de anonimização podem ser vendidas em mercados subterrâneos, que também são uma forma de plataformas de anonimização. As informações que caem em mãos erradas podem ser usadas para coerção, extorsão e intimidação, levando a preocupações com a privacidade e custos enormes para as empresas que são vítimas.
O cancelamento do anonimato também pode ser usado legalmente. Por exemplo, o site da Silk Road, um mercado subterrâneo de drogas ilegais, foi hospedado por uma rede anônima chamada Tor, que usa uma estratégia de cebola para ofuscar os endereços IP de seus usuários. A rede Tor também hospeda alguns outros mercados ilegais que comercializam armas, cartões de crédito roubados e informações corporativas confidenciais. Com o uso de ferramentas complexas de anonimato, o FBI conseguiu invadir e fechar com sucesso o Silk Road e sites que envolvem pornografia infantil.
O sucesso nos processos de re-identificação provou que o anonimato não é garantido. Mesmo que ferramentas inovadoras de anonimização fossem implementadas hoje para mascarar dados, os dados poderão ser identificados novamente em alguns anos, à medida que novas tecnologias e novos conjuntos de dados estiverem disponíveis.
