segunda-feira, 24 de março de 2014

IBM Boffins sei onde você mora, graças ao Twitter


4 razões para terceirizar seu DNS


Se você pensou que abster-se de geotagging seus Tweets ou fotos foi o suficiente para manter seus segredos para o mundo em geral, pense novamente: pesquisadores da IBM dizem local principal de um usuário do Twitter pode ser inferida a partir de seu comportamento, com uma precisão tão alta quanto 68 por cento.


Neste papel em Arxiv, Jalal Mahmud, Jeffrey Nichols e Clemens Drews da IBM Research em Almaden dizem que podem, pelo menos, obter previsões de nível da cidade de locais "home" dos usuários do Twitter (por que eles querem dizer o local do qual um indivíduo geralmente primário tweets), mesmo que o usuário não está usando os recursos de localização do Twitter.







Para fazer isso, os pesquisadores produziram dois algoritmos. O primeiro usa comportamentos, como o volume de tweets de um usuário, e informações externas (um dicionário de nomes e serviços de localização, como o Foursquare). Eles dizem que, enquanto este algoritmo funciona melhor quando os usuários fazem "referências explícitas" de locais em tweets, ele "ainda funciona com precisão reduzida qual não há referências explícitas".


O segundo algoritmo prevê locais "hierarquicamente utilizando fuso horário, estado ou região geográfica como o primeiro nível e cidade no segundo nível".


Com um conjunto de dados de cerca de 1,5 milhões de tweets a partir de 9.551 usuários, os pesquisadores extraíram então classificadores incluindo:




  • Todas as palavras nos tweets;

  • Todas as hashtags nos tweets, e

  • Todos municipais e estaduais nomes de locais no tweets.



Armado com estes dados, os pesquisadores então notar, eles também podem fazer algumas suposições sobre localização - por exemplo, dado fusos horários dos Estados Unidos, um usuário em Nova York é mais provável que seja em casa às 7:00 pm Hora do Leste, enquanto ao mesmo tempo , um usuário californiano é, provavelmente, ainda no trabalho. Isso significa que o volume de um usuário de tweets ajuda a tornar-se uma dica para a sua localização.


O estudo observa que "geo-tags não são usados ​​em qualquer um dos nossos algoritmos de previsão, embora cerca de 65 por cento dos tweets em nosso conjunto de dados são marcadas-geo".


Mas não se preocupe, os pesquisadores só pretende que seu trabalho seja usado para o bem: "um jornalista acompanhamento de um evento no Twitter pode querer saber o que os tweets são provenientes de usuários que são susceptíveis de estar em um local desse evento, versus os tweets vem de usuários que são susceptíveis de ser muito longe. Como outro exemplo, um varejista ou um fornecedor de produtos de consumo podem rastrear tendências opiniões sobre seus produtos e serviços e analisar as diferenças entre as regiões.


"Em segundo lugar, o exame das características discriminativos utilizados pelos nossos algoritmos sugere estratégias para que os usuários empregam se desejarem micro-blog publicamente, mas não sem querer revelar a sua localização", observa o estudo. ®



Nenhum comentário:

Postar um comentário