Historique de navigation web — Wikipédia

Illustrations liées à l'historique du navigateur

L'historique de navigation Web fait référence à la liste des pages web qu'un utilisateur a visitées, ainsi qu'aux métadonnées associées telles que le titre de la page et l'heure de la visite. Il est généralement stocké localement par les navigateurs web[1],[2] afin de fournir à l'utilisateur une liste d'historique pour revenir aux pages précédemment visitées. Il peut refléter les intérêts, les besoins et les habitudes de navigation de l'utilisateur[3].

Tous les principaux navigateurs ont un mode de navigation privée dans lequel l'historique de navigation n'est pas enregistré. Il s'agit de se protéger contre la collecte de l'historique de navigation par des tiers à des fins de publicité ciblée ou à d'autres fins.

Applications

[modifier | modifier le code]

Histoire locale

[modifier | modifier le code]

L'historique de navigation stocké localement peut faciliter la redécouverte des pages web perdues précédemment visitées dont on n'a qu'un vague souvenir à l'esprit ou des pages difficiles à trouver en raison de leur localisation dans le web profond. Les navigateurs l'utilisent également pour activer la saisie semi-automatique dans leur barre d'adresse pour une navigation plus rapide et plus pratique vers les pages fréquemment visitées[4].

La durée de conservation de l'historique de navigation varie selon le navigateur Web. Mozilla Firefox (version de bureau) enregistre l'historique indéfiniment par défaut dans un fichier nommé places.sqlite, mais efface automatiquement l'historique le plus ancien lorsque l'espace disque est épuisé[1], tandis que Google Chrome (version de bureau) stocke l'historique pendant dix semaines par défaut, en élaguant automatiquement entrées antérieures. Un fichier d'historique indéfini nommé Archived History a déjà été enregistré, mais a été supprimé et automatiquement supprimé dans la version 37, publiée en septembre 2014[5],[6].

Les extensions de navigateur telles que History Trends Unlimited pour Google Chrome (version de bureau) permettent le stockage local indéfini de l'historique de navigation, l'exportation dans un fichier portable et l'auto-analyse des habitudes de navigation et des statistiques[7].

L'historique de navigation n'est pas enregistré lors de l'utilisation du mode de navigation privée fourni par la plupart des navigateurs.

Publicité ciblée

[modifier | modifier le code]

La publicité ciblée consiste à présenter à l'utilisateur des publicités plus pertinentes en fonction de son historique de navigation[8]. Un exemple typique est un utilisateur recevant des publicités sur des chaussures lorsqu'il navigue sur d'autres sites web après avoir recherché des chaussures sur des sites web d'achat. Une étude montre que la publicité ciblée double le taux de conversion de la publicité en ligne classique[9].

Les enchères en temps réel sont la méthode utilisée derrière la publicité ciblée. Il s'agit d'un système qui enchérit automatiquement le prix pour présenter des publicités sur certains sites web[10]. Les annonceurs décident combien ils sont prêts à payer en fonction du public cible des sites web. Par conséquent, plus d'informations sur les utilisateurs pourraient inciter les annonceurs à payer des prix plus élevés[10]. Les informations des utilisateurs, telles que l'historique de navigation, sont fournies à toutes les entreprises impliquées dans l'appel d'offres[11]. Comme il s'agit d'un processus en temps réel, les informations sont généralement collectées sans le consentement de l'utilisateur et transférées sous forme non cryptée[12]. L'utilisateur a une connaissance très limitée de la manière dont ses informations sont collectées, stockées et utilisées[13],[14].

La réponse de l'utilisateur à la publicité ciblée dépend de la connaissance ou non des informations collectées. Si l'utilisateur sait déjà que les informations sont collectées à l'avance, une publicité ciblée pourrait potentiellement créer un effet positif, conduisant à une intention plus élevée de cliquer sur le lien[11]. Cependant, si l'utilisateur n'est pas informé de la collecte d'informations, on serait plus préoccupé par la confidentialité. Cela diminuera son intention de cliquer sur le lien[11]. En attendant, lorsque l'utilisateur considère le site Web comme fiable, il lui est plus possible de cliquer sur le lien et d'accepter le service de personnalisation[11],[15].

Pour résoudre les conflits entre la vie privée et les profits, un système nouvellement proposé est le paiement par suivi. Un courtier existe entre les utilisateurs et les annonceurs. Les utilisateurs pourraient décider de fournir ou non leurs informations personnelles au courtier, puis le courtier enverrait les informations personnelles fournies par les utilisateurs aux annonceurs. Pendant ce temps, les utilisateurs pourraient recevoir des récompenses monétaires pour avoir partagé leurs informations personnelles. Cela pourrait aider à protéger la confidentialité et l'efficacité du suivi, mais entraînerait des coûts supplémentaires[16].

Tarification personnalisée

[modifier | modifier le code]

  La tarification personnalisée est basée sur l'idée que si un utilisateur achète fréquemment un certain produit ou paie un prix plus élevé pour ce produit, l'utilisateur pourrait se voir facturer un prix plus élevé pour ce produit. L'historique de navigation web pourrait donner des prédictions fiables sur les comportements d'achat des utilisateurs. Lors de l'utilisation d'une tarification personnalisée, le bénéfice des entreprises pourrait augmenter de 12,99 % par rapport aux cas du statu quo[17].

L'historique de navigation Web pourrait être utilisé pour faciliter la recherche, par exemple en révélant le comportement de navigation des personnes. Lorsqu'un internaute navigue intensivement sur un site, la probabilité de demander une page supplémentaire diminue. Lorsqu'un utilisateur visite plus de sites, la probabilité de demander des pages supplémentaires diminue[18].

L'historique de navigation web peut également être utilisé pour créer des bibliothèques web personnelles. La bibliothèque web personnelle est créée en collectant et en analysant l'historique de navigation web de l'utilisateur. Cela pourrait aider l'utilisateur à remarquer les tendances de navigation, la distribution du temps et les sites web les plus fréquemment utilisés. Certains utilisateurs considèrent cette fonction comme utile[3].

Vie privée

[modifier | modifier le code]

Préoccupations

[modifier | modifier le code]

L'historique de navigation web stocké localement n'est publié nulle part publiquement par défaut. Cependant, presque tous les sites web sont suivis par des logiciels publicitaires et des programmes potentiellement indésirables qui collectent les informations des utilisateurs sans leur consentement[19]. Ces méthodes de suivi sont généralement autorisées par les plateformes par défaut[12]. L'historique de navigation web est également collecté par les cookies sur les sites web, qui peuvent être divisés en deux types, les cookies propriétaires et les cookies tiers. Les cookies tiers sont généralement intégrés sur des sites web propriétaires et collectent des informations à partir de ceux-ci[10]. Les cookies tiers ont une efficacité et une capacité d'agrégation de données supérieures à celles des cookies propriétaires. Alors que les cookies propriétaires n'ont accès aux données de l'utilisateur que sur un seul site web, les cookies tiers peuvent combiner des données collectées à partir de différents sites web pour rendre l'image de l'utilisateur plus complète[10]. Pendant ce temps, plusieurs cookies tiers peuvent exister sur le même site web[10].

Avec suffisamment d'informations disponibles, les utilisateurs pourraient être identifiés sans se connecter à leur compte[20].

Lorsque les cookies tiers collectent l'historique de navigation web des utilisateurs à partir de plusieurs sites web, plus d'informations entraînent davantage de problèmes de confidentialité. Par exemple, un utilisateur parcourt les actualités sur un site web et recherche des informations médicales sur l'autre site web. Lorsque l'historique de navigation de ces deux sites Internet est combiné, l'utilisateur peut être considéré comme intéressé par les actualités liées à des sujets médicaux[10]. Lorsque l'historique de navigation de différents sites web est combiné, cela peut refléter une image plus précise de la personne.

Controverses

[modifier | modifier le code]

Fuite de données de recherche AOL

[modifier | modifier le code]

En 2006, AOL a publié une grande quantité de données sur ses utilisateurs, y compris l'historique de recherche. Bien qu'aucun identifiant ou nom d'utilisateur n'ait été inclus, les utilisateurs ont pu être identifiés sur la base de l'historique de navigation publié[21]. Par exemple, l'utilisateur no 4417749 a été identifié avec son historique de recherche sur trois mois[22].

Collecter des données précises d'Avast

[modifier | modifier le code]
Logo d'Avast

En 2020, Avast, un logiciel antivirus populaire, est accusé de vendre l'historique de navigation à des tiers. Il fait l'objet d'une enquête préliminaire sur cette accusation par des fonctionnaires de la République tchèque. Le rapport démontre qu'Avast a vendu les données des utilisateurs via Jumpshot, un outil d'analyse marketing. Avast affirme que les informations personnelles des utilisateurs n'étaient pas incluses dans la fuite. Cependant, l'historique de navigation pourrait être utilisé pour identifier les utilisateurs. Avast ferme Jumpshot en réponse à ce problème[23].

Lorsque l'utilisateur estime qu'il existe un risque pour sa vie privée, son intention de divulguer des informations personnelles sera moindre, mais ses actions ne seront pas affectées[24]. Cependant, certaines études révèlent qu'il n'y a pas de différence significative entre l'intention et les actions de divulgation d'informations sur la confidentialité, ce qui signifie que l'utilisateur réduira les actions de partage d'informations personnelles et prendra davantage de mesures de protection lorsqu'il se sentira concerné par la confidentialité[25]. Lorsque les utilisateurs ont des problèmes de confidentialité, ils utilisent moins les services en ligne[25]. Ils prendraient également plus de mesures de protection telles que refuser de fournir leurs informations, offrir de fausses informations, supprimer leurs informations en ligne et se plaindre aux personnes qui les entourent ou aux organisations concernées[26].

Cependant, il est difficile pour les utilisateurs de protéger leur vie privée pour plusieurs raisons. Premièrement, les utilisateurs ne sont pas suffisamment conscients de la confidentialité. Ils ne craignent pas d'être pister en ligne à moins qu'il n'y ait des impacts substantiels sur eux. Ils ne savent pas non plus en quoi leurs données personnelles contiennent des valeurs commerciales[12]. Il est généralement difficile pour les utilisateurs de remarquer les liens de politique de confidentialité sur tous les types de sites web, les utilisatrices et les utilisateurs plus âgés étant plus susceptibles d'ignorer ces avis. Même lorsque les utilisateurs remarquent des liens de confidentialité, leur divulgation d'informations peut ne pas être affectée[27]. De plus, les utilisateurs ne disposent pas non plus de connaissances techniques suffisantes pour se protéger même lorsqu'ils remarquent une fuite de confidentialité. Ils sont placés du côté passif avec peu de place pour changer la situation[12].

La plupart des utilisateurs utilisent des bloqueurs de publicités, suppriment les cookies, évitent les sites web qui collectent des informations personnelles pour essayer de protéger leur historique de navigation Web contre la collecte[13],[28]. Cependant, la plupart des bloqueurs de publicités n'offrent pas suffisamment de conseils aux utilisateurs pour les aider à améliorer leur sensibilisation à la confidentialité. Plus important encore, ils s'appuient sur une liste noire et une liste blanche par défaut[29]. Ces listes n'incluent généralement pas les sites web qui suivent les utilisateurs. Les bloqueurs de publicités ne peuvent être efficaces que si ces domaines de suivi sont bloqués[30].

Notes et références

[modifier | modifier le code]
  1. a et b (de) « Wiederherstellen wichtiger Daten aus einem alten Profil | Hilfe zu Firefox », support.mozilla.org
  2. « Google Chrome History Location | Chrome History Viewer », www.foxtonforensics.com
  3. a et b Du, Weidan, Zhenyu Cheryl Qian, Paul Parsons, Yingjie Victor Chen. 2018. “Personal Web Library: organizing and visualizing Web browsing history”. International Journal of Web Information Systems 14(2): 212-232.
  4. « Autocompletion in Chrome's omnibox is getting smarter », MSPoweruser,
  5. Benson, « Archived History files removed from Chrome v37 » [archive du ], Obsidian Forensics
  6. « [chrome] Revision 275159 », src.chromium.org
  7. « 3 Simple Yet Useful Extensions to Enhance Chrome's History », Make Tech Easier,
  8. Hennig, Nicole. 2018. “Privacy and security online: best practices for cybersecurity”. Library Technology Reports 54(3): 1-37.
  9. Beales, « The Value of Behavioral Targeting », Network Advertising Initiative,‎
  10. a b c d e et f Binns, Reuben, and Elettra Bietti. 2020. “Dissolving Privacy, One Merger at a Time: Competition, Data and Third Party Tracking”. Computer Law & Security Review: The International Journal of Technology Law and Practice 16(1): 1-19.
  11. a b c et d Aguirre, Elizabeth, Dominik Mahr, Dhruv Grewal, Ko de Ruyter, Martin Wetzels. 2015. “Unraveling the Personalization Paradox: The Effect of Information Collection and Trust-Building Strategies on Online Advertisement Effectiveness”. Journal of Retailing 91(1): 34-49.
  12. a b c et d Estrada-Jimenez, Jose, Javier Parra-Arnau, Ana Rodriguez-Hoyos, Jordi Forne. 2017. “Online advertising: Analysis of privacy threats and protection approaches”. Computer Communications 100(1): 32-51.
  13. a et b Evans, David S. 2009. "The Online Advertising Industry: Economics, Evolution, and Privacy". Journal of Economic Perspectives 23 (3): 37-60.
  14. Estrada-Jimenez, Jose, Javier Parra-Arnau, Ana Rodríguez-Hoyos, Jordi Forne. 2019. “On the regulation of personal data distribution in online advertising platforms”. Engineering Applications of Artificial Intelligence 82(1): 13-29.
  15. Chellap, Ramnath K., Raymond G. Sin. 2005. “Personalization versus Privacy: An Empirical Examination yes of the Online Consumer’s Dilemma”. Information Technology Management 6(1): 181-202.  
  16. Parra-Arnau, Javier. 2017. “Pay-per-tracking: A collaborative masking model for web browsing”. Information Sciences 385-386(1): 96-124.
  17. Shiller, Benjamin Reed. 2020. “Approximating purchase propensities and reservation prices from broad consumer tracking”. International Economic Review 61(2): 847-870.
  18. Bucklin, Randolph E., Catarina Sismeiro. 2003. “A Model of Web Site Browsing Behavior Estimated on Clickstream Data”. Journal of Marketing Research 40(3): 249-267.
  19. Urban, Tobias, Dennis Tatang, Thorsten Holz, Norbert Pohlmann. 2019. “Analyzing leakage of personal information by malware”. Journal of Computer Security 27(4): 459-481.
  20. Puglisi, Silvia, David Rebollo-Monedero, Jordi Forne. 2017. “On web user tracking of browsing patterns for personalised advertising”. International Journal of Parallel, Emergent & Distributed Systems 32(5): 502-521.
  21. Dawn Kawamoto, « AOL apologizes for release of user search data », CNET,‎ (lire en ligne, consulté le )
  22. Michael Barbaro, « A Face Is Exposed for AOL Searcher No. 4417749 », The New York Times,‎ (lire en ligne, consulté le )
  23. Chris Morris, « Popular antivirus software Avast under investigation for selling user browsing histories », Fortune,‎ (lire en ligne, consulté le )
  24. Norberg, Patricia A., Daniel R.Horne, and David A. Horne. 2007. “The Privacy Paradox: Personal Information Disclosure Intentions versus Behaviors”. The Journal of Consumer Affairs 41(1): 100-126.
  25. a et b Baruh, Lemi, Ekin Secinti, Zeynep Cemalcilar. 2017. “Online Privacy Concerns and Privacy Management: A Meta-Analytical Review”. Journal of Communication 67(1): 26-53.
  26. Son, Jai-Yeol, Sung S. Kim. 2008. “Internet Users' Information Privacy-Protective Responses: A Taxonomy and a Nomological Model”. MIS Quarterly 32(3): 503-529.
  27. Rodríguez-Priego, Nuria, Rene van Bavel, Shara Monteleone. 2016. “The disconnection between privacy notices and information disclosure: an online experiment”. Economia Politica: Journal of Analytical and Institutional Economics 33(3): 433-461.
  28. Wills, Craig H., Mihajlo Zeljkovic. 2011. “A personalized approach to web privacy: awareness, attitudes and actions”. Information Management & Computer Security 19(1) 53-73.
  29. Malandrino, Delfina, Vittorio Scarano. 2013. “Privacy leakage on the Web: Diffusion and countermeasures”. Computer Networks 57(14): 2833-2855.
  30. Ahmad, Bashir Muhammad, Wilson Christo. 2018. “Diffusion of User Tracking Data in the Online Advertising Ecosystem”. Proceedings on Privacy Enhancing Technologies 2018(4): 85-103.