Comment les statistiques web sont en réalité faussées
Je me méfie depuis longtemps de certaines statistiques que certaines entreprises et certains blogueurs mettent en avant. Nous savons tous maintenant que l’outil de statistiques de l’industrie alexa.com doit être pris avec des pincettes, mais jusqu’à aujourd’hui, je n’avais pas réalisé l’ampleur de la façon dont le trafic mesuré par un site lui-même peut être exagéré. Vous voyez, récemment, j’ai utilisé Urchin (propriété de Google) Web Stats, ainsi que statcounter.com que j’utilise depuis des années. J’ai remarqué que les statistiques de consultation des pages d’Urchin sont bien plus élevées que celles de statcounter.com, en réalité cinq fois plus élevées ! Cette différence me dérangeait et je voulais savoir pourquoi.
L’explication
Aujourd’hui, je suis tombé sur ce fil de discussion intéressant qui explique tout : « Au niveau brut et basique, Urchin compte à peu près les mêmes chiffres que n’importe quel programme d’analyse des journaux des serveurs web (en beaucoup plus joli). Chaque page lue par un navigateur est comptée comme une page vue ; différentes adresses IP signifient qu’il s’agit de visiteurs individuels. Ce n’est pas très précis, car les robots » lisent » aussi les pages et apparaissent dans le compte (visiteurs et pages) par différents programmes d’analyse du journal du serveur web, y compris Urchin. Les robots ne lisent pas Javascript. » Des produits comme statcounter.com, en comparaison, ne comptent que les pages vues à partir de navigateurs avec JavaScript activé, ce qui permet de se débarrasser des occurrences de robots. En un mot, les statistiques d’Urchin peuvent être très trompeuses. Bien qu’il faille souligner qu’il existe une version avancée d’Urchin qui utilise UTM, autrement dit la version d’Urchin activée par Javascript. D’après le fil de discussion ci-dessus, Urchin avec UTM signifie que “ … les visiteurs sont cookés, tagués, etc. Ensuite, les données du journal et les données JS sont combinées dans les rapports d’Urchin. Sans UTM, Urchin ne fait que compter les statistiques du journal du serveur. ”
Les conséquences
Je voulais soulever cette question parce que j’ai toujours utilisé statcounter.com lorsque je dis aux gens mes pages vues, lorsque je cherche de la publicité ou que j’essaie d’entrer dans un réseau, etc. J’ai cependant l’impression que d’autres personnes utilisent Urchin ou des statistiques de logs similaires lorsqu’elles font leur promotion. Ce qui signifierait que mes stats ne se comparent pas bien aux leurs. J’ai certainement entendu certains blogueurs citer des stats extraordinaires à mon époque et j’ai été sceptique sans trop savoir pourquoi. Eh bien maintenant, je le sais et je pense que les autres devraient aussi le savoir : parfois, les gens font la promotion de leurs sites avec des statistiques qui sont grossièrement exagérées. Si vous voulez de vraies statistiques, vous devez obtenir leurs données sur statcounter.com ou les stats avancées Urchin avec UTM.