quarta-feira, 7 de novembro de 2007

Mineração de dados e culpados por associação

A AT&T Corporate Information cria programa de mineração de grandes massas de dados de chamadas telefônicas e de transações na Internet. O programa, escrito em linguagem Hancock, já foi usado no campo do marketing e agora se estende à vigilância. Um de seus atributos consiste na identificação de "comunidades de interesses", isto é, de padrões que mostrem vínculos de comunicação entre indívíuos, indicando quem fala com quem. Tais comunidades de interesses permitem, ainda, que se infira padrões de "culpa por associação", identificando, por exemplo, quais números telefônicos estão em contato com outros números que por sua vez estão em contato com "bad guys". Segue trecho do Freedom to Tinker e diagrama extraído do paper divulgado pela AT&T. Vale conferir também matéria do Threat Level.

"What is the “communities of interest” technology? It’s spelled out very clearly in a 2001 research paper from AT&T itself, entitled “Communities of Interest” (by C. Cortes, D. Pregibon, and C. Volinsky). They use high-tech data-mining algorithms to scan through the huge daily logs of every call made on the AT&T network; then they use sophisticated algorithms to analyze the connections between phone numbers: who is talking to whom? The paper literally uses the term “Guilt by Association” to describe what they’re looking for: what phone numbers are in contact with other numbers that are in contact with the bad guys?
When this research was done, back in the last century, the bad guys where people who wanted to rip off AT&T by making fraudulent credit-card calls. (Remember, back in the last century, intercontinental long-distance voice communication actually cost money!) But it’s easy to see how the FBI could use this to chase down anyone who talked to anyone who talked to a terrorist. Or even to a “terrorist.”"

"Fig. 5. Diagrama de "Culpa por associação". Os nós circulares correspondem a contas de serviços sem fio, enquanto nós retangulares são contas de linhas convencionais terrestres. Nós sombreados foram previamente identificados como fraudulentos pela rede de segurança associados" (Figura extraída do paper divulgado pela AT&T).

Nenhum comentário: