Fingerprinting:
Fingerprinting (também conhecido como impressão digital do navegador) é um termo associado ao processo de coleta de uma ampla variedade de informações do computador e do navegador, feita através do navegador da web de um usuário, para identificar um usuário ou dispositivo específico. Fingerprints (impressões digitais) são usados para identificar um dispositivo quando outros identificadores persistentes, como os cookies, não podem ser lidos ou registrados por um site. Um fingerprint é criado através da combinação de diversos pontos de dados do seu dispositivo e/ou navegador, que são acessíveis a qualquer site quando você visita a página de seu domínio. Isso pode incluir a versão do navegador, extensões e plugins instalados no navegador (incluindo suas versões), propriedades de hardware, lista de fontes, canvas e WebGL, benchmarking de HW, idioma, fusos horários, versão do sistema operacional, configurações da tela e barras de menu.Estatisticamente, ainda há uma chance muito pequena de que dois ou mais dispositivos tenham instalações e configurações idênticas. Você pode ver o quão únicas suas configurações e instalação são aqui. Fingerprints são especialmente fortes, pois podem detectar um dispositivo por um longo período, mesmo se certos parâmetros de fingerptint forem alterados, com endereços de IP alternativos, ou mesmo pelo uso de VPN.
Embora as técnicas de fingerprinting tenham sido criadas inicialmente como uma maneira para bancos detectarem a fraude e prevenirem o roubo de identidade, hoje esse método é usado para rastrear usuários entre sites a fim de compilar registros de longo prazo dos históricos de navegação de indivíduos, possibilitando a exibição de anúncios ou exploits direcionados aos usuários; assim, ele levanta sérias questões de privacidade. Por esse motivo, recentemente os navegadores (dentre eles Safari, Chrome e Firefox) começaram a fazer alterações com o objetivo de limitar a quantidade de dados que eles expõem aos sites e tornar os usuários mais parecidos, criando um tipo de “imunidade de rebanho”. A boa notícia é que os navegadores mobile disponibilizam muito menos dados e já oferecem a mencionada “imunidade de rebanho” contra o tipo de fingerprinting comum em desktops. Os dispositivos iOS, em especial, são muito menos fragmentados, o que os torna bastante imunes ao fingerprinting.
O Modelo Probabilístico da AppsFlyer:
O modelo probabilístico é uma técnica estatística para estimar a performance da campanha e não pode ser usado para identificar exclusivamente um usuário e/ou dispositivo. Ele usa machine learning para estimar a performance da campanha sem comprometer a privacidade. Ao contrário do fingerprinting, que visa maximizar os pontos de dados coletados de cada usuário para criar um identificador único que pode ser usado para rastrear usuários por um período prolongado entre sites, o modelo probabilístico da AppsFlyer busca fazer exatamente o oposto; minimizar os pontos de dados coletados e evitar a capacidade de criar um identificador único persistente ou permanente que pode ser usado para identificar um usuário e/ou dispositivo.
Onde os fingerprints são usados para criar perfis detalhados de usuários para permitir uma segmentação precisa (em qualquer ponto no tempo e em qualquer site), o modelo probabilístico é usado com o único propósito de estimar a performance das campanhas de mídia paga e própria (como sites, plataformas de mídias sociais, e-mails e recomendações de usuários). O modelo probabilístico mensura os detalhes dos criativos e campanhas próprios dos desenvolvedores de aplicativos, não os dados dos aplicativos nos quais os anúncios são exibidos. Além disso, na maioria dos casos, o aplicativo no qual o anúncio foi exibido é desconhecido.
O modelo probabilístico utiliza muitos poucos pontos de dados que mudam com frequência. Por esse motivo, técnicas de machine learning e de estimativa estatística são usadas (ao contrário da criação e da correspondência de IDs únicas), porque as janelas de lookback não podem ser definidas.
Como explicamos acima, o modelo probabilístico é um método centrado na privacidade, utilizado para estimar a performance das campanhas de anúncios. É muito diferente do fingerprinting. Ele não gera uma ID única que é persistente ou permanente ou que tem a capacidade de identificar exclusivamente qualquer dispositivo entre sites ou aplicativos durante um longo período de tempo. Ele não é usado para rastreamento ou para criar perfis. Na realidade, o modelo probabilístico é uma das maneiras mais favoráveis à privacidade para a atribuição e a estimativa da performance de campanhas.
A tabela abaixo mostra uma maneira fácil de visualizar as diferenças significativas entre o fingerprinting do navegador tradicional e o modelo probabilístico:
| Fingerprinting | Modelo Probabilístico da AppsFlyer |
---|
Equivalente a ID única e/ou persistente | Sim | Não |
Pode ser usado para identificar exclusivamente um dispositivo | Sim | Não |
Pode ser usado para rastrear usuários entre sites/apps (rastreamento entre sites) | Sim | Não |
Depende de uma grande quantidade de dados do dispositivo do usuário e do navegador | Sim | Não |
Pode ser usado para criar perfis | Sim | Não |
Pode ser usado para direcionar usuários | Sim | Não |
Pode identificar um dispositivo mesmo quando o usuário usa VPN ou IP alternativa | Sim | Não |
Determinístico | Sim | Não |
Privacidade | Pode ser usada de maneira invasiva | Favorável |