Como os dados que você compartilha involuntariamente permitem ao Facebook lhe conhecer melhor que você?
Quando falamos em privacidade e dados pessoais, logo lembramos de dados como endereço, telefone, numero do RG, CPF, estado civil, fotografias, emprego, e outros dados assim. Estes dados são concretos, cadastrais, seus usos são objetivos, seus documentos podem ser clonados, criminosos podem abrir empresas e cometer crimes com eles, suas fotos podem ser manipuladas, alguém pode lhe surpreender na porta de casa ou trabalho, mas tudo isto está bem claro no mundo material do século XX.
Não podemos continuar pensando no século XXI com a mente do século passado, estes dados pessoais são os menos relevantes, como as consequências de seu uso por terceiros são concretas e objetivas, é possível mensurar os danos estabelecer uma certa contingência e/ou reparação.
Os dados subjetivos
A maior parte dos dados que produzimos são subjetivos, e também são os dados que mais dizem sobre nos. Seu CPF ou seu RG não irão revelar seu perfil psicológico, seus gostos e interesses, por exemplo, mas seu uso diário das redes sociais sim.
Um click, um like, um love ou um share, são dados que você produz sobre a sua subjetividade, você não deve imaginar, mas são estes seus dados mais preciosos. Estes dados permitem ao Facebook ou o Google por exemplo, lhe conhecer melhor que você mesmo, e faturar bilhões de dólares com eles.
No artigo “Computer-based personality judgment are more accurate than those made by humans” a autora Wu Youyou, e os autores Michal Kosinski, e David Stillwell fizeram um estudo com mais de 80.000 voluntários, e chegaram a conclusão, descrita no gráfico acima, de que um pouco mais 10 likes permitem ao Facebook lhe conhecer melhor que seu colega de trabalho, 70 likes mais que um amigo, com 100 likes ele pode lhe conhecer melhor que a média humana, e 300 likes permitem o Facebook lhe conhecer melhor que sua ou seu parceira(o) de vida.
Talvez você ainda não tenha percebido a devida dimensão, então imagine que sua esposa ou seu marido sabem como lhe alegrar, ou lhe irritar, inclusive que tipo de estímulos podem ser mais ou menos intensos nesta empreitada, sabe como lhe persuadir, ou quando você está tentando persuadi-la. É um nível de conhecimento do outro muito profundo, em geral levamos anos de vida conjunta para desenvolve-lo. Mas para o Facebook, bastam meros 300 likes.
São dados como estes que a Cambridge Analítica teve acesso, mas não só ela, aqueles inúmeros testes do Facebook como o famoso: “Qual seria sua aparência se fosse do sexo oposto”. Alias as empresas que oferecem estes testes no Facebook podem estar vendendo seu perfil psicométrico por ai, imagine agora nas eleições.
Se você ainda não está convencido(a) então sugiro que faça o teste do Centro de Psicometria da Universidade de Cambridge, pode fazer sem medo, é um projeto acadêmico sério com uma estrita política de privacidade, e que vai lhe surpreender.
Como meus likes podem dizer tanto sobre mim?
Os dados que você produz voluntária e involuntariamente, junto com os dados produzidos da mesma forma por bilhões de outras pessoas configuram o que é conhecido por big data. Quanto mais dados produzimos, mais precisos são os perfis e avaliações que a mineração do big data produz sobre nos, em breve teremos um nível de precisão nas ciências humanas próximo ao das exatas.
Este processo de mineração de dados chama-se modelagem, diferente da estatística, a modelagem requer uma amostra no mínimo 10 vezes superior, na verdade quanto maior a amostra melhor. Como destaca a pesquisadora Fernanda Bruno, o capitalismo de dados embaralha a fronteira entre o laboratório e a vida real.
O capitalismo de dados que se impõe com as redes sociais embaralha as fronteiras entre o laboratório e a vida social, política e subjetiva. (Fernanda BRUNO, 2018)
A modelagem se dá inicialmente por testes e mapeamento de dados conhecidos, até mesmo por testes com papel e caneta. Explicando de maneira bem simplificada, o pesquisador realiza o teste dos cinco fatores (neuroticismo ou instabilidade emocional, extroversão, agradabilidade, conscienciosidade e abertura para a experiência) com milhares de voluntários.
Estes cinco elementos permitem definir os traços de personalidade do indivíduo com grande precisão, ainda que com foco em estereótipos. Uma vez obtido o resultado de milhares de testes feitos diretamente com os voluntários, é a hora do machine learning (aprendizado de máquina). Através de um conjunto de algoritmos (programas de computador) executam inúmeras análises dos dados, no nosso exemplo do Facebook, em busca de padrões para cada traço e fator de personalidade, comparando os padrões encontrados na rede com os resultados do teste de cinco fatores.
Ao contrário do que se costuma imaginar os padrões não seguem à nenhuma lógica humana previsível, engana-se quem pensa que uma pessoa que curtiu a página do candidato de direita ou de esquerda possui a mesma tendência, muitas vezes um like em uma página que não tem nenhuma relação com política pode dizer muito mais. Foi o que descobriu a cientista da computação Jennifer Golbeck, que demonstra nesta palestra do TED, você não faz ideia do que estas batatas enroladinhas podem revelar…
Uma vez que os padrões são descobertos e confirmados, o processo inverso é possível, ou seja, ao conectar-se a sua conta do Facebook, o algoritmo em questões de segundos analisa seu padrão de “likes” compara com os padrões que ele possui, e obtem seu perfil psicométrico.
Mas a questão não acaba aqui, este assunto é mais profundo e complexo, minha pesquisa atualmente vai muito além do que foi dito, e tenho certeza de que nem cheguei na metade do caminho.
Espero que tenha sido esclarecedor para você, mais textos como este serão publicados aqui, faça a sua parte, divulgue, avise às pessoas como a privacidade delas pode ser invadida com tanta facilidade.
Bibliografia
ADALI, S.; GOLBECK, Jennifer. Predicting personality with social behavior: a comparative study. Social Network Analysis and Mining, [s.l.], v. 4, no 1, p. 159, 2014. ISSN: 1869-5450, DOI: 10.1007/s13278-014-0159-7. Disponível em: http://link.springer.com/10.1007/s13278-014-0159-7
BRUNO, F. A economia psíquica dos algoritmos: quando o laboratório é o mundo – Nexo Jornal. Nexo Jornal. 2018. Disponível em: https://www.nexojornal.com.br/ensaio/2018/A-economia-psíquica-dos-algoritmos-quando-o-laboratório-é-o-mundo. Acesso em: 12/jun./18.
WU, Youyou; KOSINSKI, Michal; STILLWELL,David. Computer-based personality judgments are more accurate than those made by humans. PNAS, 112 N4: 1036–1040, 2015. doi: doi/10.1073/pnas.1418680112. Disponível em: http://www.pnas.org/content/112/4/1036/tab-article-info
13 comentários