Carte à la une : Tor, cartographier le réseau des sites .onion
Bibliographie | citer cet article
Internautes : tous tracés ?
Tous nos déplacements sur Internet laissent des traces numériques. Depuis les révélations d’Edward Snowden, il est avéré qu’une collecte massive de ces données a été mise en place grâce à la collaboration entre les plus grandes entreprises du web et les services de renseignement des États-Unis. En effet, l’analyse des informations de navigation permet un profilage très fin des internautes à des fins publicitaires ou de surveillance policière. Le projet Tor (pour The onion router) a été créé dans le but de dissimuler les activités individuelles en ligne. Outre la navigation sur le web classique, il offre également l’accès à des hidden services, très sécurisés. Il s’agit de sites dont il est impossible de remonter la trace, et qui ne sont accessibles que par Tor. Leur adresse finit en .onion plutôt qu’en .com ou .fr. Silk Road est l’un des plus célèbres de ces sites. Il a largement contribué à la réputation sulfureuse de Tor : des biens illégaux (dont notamment de la drogue et des armes) y étaient disponibles à la vente, avant sa fermeture en 2013 par le FBI. La conjonction des révélations Snowden et de la médiatisation de l’affaire Silk Road explique l’explosion du nombre d’articles de presse à son sujet cette année-là.
|
Nombre de titres de presse en anglais et en français évoquant « the onion router » par annéeSource : Factiva, 2016 |
Les hidden services sont un pan nouveau et singulier du cyberespace, qui repose sur le réseau Internet, mais se distingue du web tel que nous le connaissons. C’est pourquoi l’on parle parfois de :
- deep web, comme s’il fallait « creuser » pour y avoir accès
- voire de dark web, pour mettre l’accent sur l’illégalité d’un certain nombre de pratiques qui y ont lieu.
C’est ce que suggère la métaphore spatiale ci-dessous, fréquemment reprise pour expliquer ce que serait le deep web : utiliser Tor, c’est naviguer en sous-marin, par opposition aux navires de surface à la fois visibles de tous et restreints à l’information qu’on trouve à la surface d’Internet. La métaphore de l'oignon, elle, s'explique par les couches de protection successives sous lesquelles se cache le trafic.
Représenter Internet grâce à la métaphore spatiale de l'océan.Une représentation courante de l'internet en bloc diagramme littoral. Source inconnue. |
Cartographier un réseau masqué
Deux possibilités s’offrent à nous pour cartographier un réseau comme Tor.
- D’abord, cartographier son hardware, sa dimension matérielle, en représentant sur une carte du monde l’ensemble (ou presque) des serveurs de Tor et des flux d’informations qui circulent entre eux. C’est ce que propose la carte en ligne TorFlow reproduite ci-dessous. Pas d’inquiétude : la sécurité et la confidentialité des échanges n’est pas remise en cause à l’échelle individuelle, il s’agit de données techniques agrégées.
La circulation masquée des informations entre les serveurs de TorSource : capture d'écran du site TorFlow. |
- Ensuite, cartographier le software, à savoir les relations entre les sites .onion eux-mêmes. C’est ce que propose cette carte (ou plutôt, ce graphe) à la Une : un point représente un site .onion, une ligne représente un lien hypertexte entre deux sites.
Grâce au logiciel libre Gephi, il a été possible de répartir ces points dans l’espace en fonction du nombre de liens hypertextes les reliant, en s’appuyant sur un modèle gravitaire. Plus les relations sont nombreuses entre deux points, plus l’algorithme les rapproche dans notre visualisation. À une échelle plus large, quand un ensemble de sites entretient des interrelations nombreuses en son sein, il tend à former une grappe dense et bien différenciée du reste des sites .onion. Pour mieux rendre cet effet, un autre algorithme dit de « détection des communautés » colore les différentes régions du graphe selon leur cohésion interne. Voici le résultat en représentant la totalité des sites .onion recensés :
Le réseau des sites .onion |
La Carte à la Une présente un zoom sur la partie centrale du graphe, où sont concentrés la majeure partie des sites et le « cœur » du réseau, à savoir les sites les plus référencés par les autres. On peut également se reporter à ce lien pour naviguer de façon plus interactive dans le graphe (attention, du fait du grand nombre de données sous-jacentes, le temps de chargement est long).
Le réseau .onion a une structure très comparable à celle de l’Internet général, toutes proportions gardées. Le volume de données échangées et le nombre de sites y sont néanmoins des centaines de milliers de fois inférieures.
Une telle représentation est forcément hybride. Il s’agit d’une carte au sens où la distance géométrique entre les points révèle la plus ou moins grande « proximité » (stricto sensu, la plus ou moins grande connexité), entre deux sites, alors même que la véritable distance entre deux sites tient au nombre de « sauts » hypertextes qu’il faut faire pour aller d’un point à un autre. Par métaphore, on pourrait dire que les points y sont autant d’étapes numériques, reliés par les routes que seraient les liens hypertextes. Le nom d’un site serait l’équivalent d’un toponyme sur une carte classique.
Qu'un graphe puisse être considéré comme une carte ne fera pas forcément l'unanimité chez les géographes, attachés à représenter le monde physique. Pourtant, un graphe n'est pas que la visualisation de données a-géographiques : même s'il représente des réalités immatérielles, le graphe présenté n'en tient pas moins compte des rapports de distance (topologique) entre ces lieux d'Internet que sont les hidden services.
Cette première tentative de cartographie du réseau émergent des hidden services de Tor est une bonne illustration des possibilités de représentation :
- d’espaces immatériels numériques nouveaux, qui sont aujourd’hui un « front pionnier » d’Internet,
- des réseaux au sens large, entendus comme des espaces de métrique topologique composés de nœuds et de liens. La distance s’y mesure par le nombre de « sauts » intermédiaires entre des points plutôt que par l’écart géométrique qui prévaut dans notre espace euclidien habituel. Cela permet d’imaginer des fonds de carte originaux et évolutifs pour des espaces fondamentalement relationnels.
Ressources complémentaires
Ressources bibliographiques
- Beaude, Boris. 2012. Internet, changer l’espace, changer la société?: les logiques contemporaines de synchorisation. Collection « Société de la connaissance », Limoges, FYP
- Beaude, Boris. 2011. « Pérégrinations d’un terrain sans territoire », Carnets de géographes, n° 2, mars 2011.
- Dodge, Martin, and Rob Kitchin. 2001. Mapping cyberspace. Londres, New-York : Routledge.
- Perrat, Jean-François. 2016. Peler l'oignon. Etude géographique des services cachés du réseau Tor. Mémoire de master 2. ENS de Lyon
Ressources webographiques
- Le site du projet Tor
- TorFlow, pour visualiser les flux entre les sites .onion
- Cartographie interactive des sites .onion (nécessite une bonne connexion)
Jean-François PERRAT,
doctorant en géographie à l'ENS de Lyon
Mise en web : Jean-Benoît Bouron
Pour citer cet article :Jean-François Perrat, « Carte à la une : peut-on cartographier le dark web ? », Géoconfluences, janvier 2017. |
Pour citer cet article :
Jean-François Perrat, « Carte à la une : Tor, cartographier le réseau des sites .onion », Géoconfluences, janvier 2017.
https://geoconfluences.ens-lyon.fr/informations-scientifiques/a-la-une/carte-a-la-une/carte-a-la-une-perrat