Lorsqu’on demande de décrire internet, une personne ordinaire est susceptible de mentionner son navigateur web préféré, les moteurs de recherche comme Google, les réseaux sociaux, forums, ainsi que les sites d’actualités et de divertissement qu’il privilégie.
Ces sites web ne représentent qu’une infime partie du surface web. Cette partie de l’internet présente les caractéristiques suivantes :
Elle a été indexée et rendue consultable par des moteurs de recherche publics comme Google et Bing, et peut être visitée à l’aide de navigateurs traditionnels comme Safari et Chrome.
Bien que les sites web publics de sociétés connues soient situés sur le web de surface, qui est de loin la partie la plus reconnaissable et la plus facilement accessible de l’internet, elle ne comprend que 0,03 % de la quantité totale d’informations sur le web.
Où se trouve donc le reste du contenu en ligne ? Il réside sur le Deep Web et le Dark Web, qui représentent ensemble 99,97 % des actifs, des contenus et des données du Web et sont inaccessibles par Google et les autres moteurs de recherche traditionnels.
Dans cet article, nous verrons en quoi ces deux zones du web diffèrent l’une de l’autre, comment on peut y accéder et quels types de données et de ressources elles contiennent.
Qu’est-ce que le Deep Web ?
Le secteur de l’Internet qui ne peut pas faire l’objet de recherches est appelé le Deep Web, parfois connu sous le nom de Web caché ou Web invisible.
Le Deep Web est composé de sites Web et de pages qui ne peuvent pas être recherchés ou trouvés rapidement par le grand public car ils ne sont pas indexés par les moteurs de recherche. Certaines de ces pages ne sont pas indexées parce que les moteurs de recherche ne les ont pas encore découvertes, mais la majeure partie du Deep Web est volontairement dissimulée par les développeurs pour éviter que des informations sensibles ne deviennent publiques.
Qu’y a-t-il sur le Deep Web ?
Tous les sites web que les moteurs de recherche n’indexent pas sont appelés le “Deep Web”. On trouve fréquemment les catégories de ressources suivantes sur le Deep Web :
- Des pages web dont le contenu varie en fonction de l’environnement dans lequel elles ont été consultées.
- Les pages dont le contenu est produit de manière dynamique à la suite de la soumission de formulaires ou de requêtes de recherche.
- Les pages qui utilisent des mesures techniques pour empêcher les robots d’indexation des moteurs de recherche de les indexer entrent dans la catégorie des contenus à accès limité.
- Tous les sites internet qui exigent la connexion et l’enregistrement des membres entrent dans la vaste catégorie des sites espaces privés.
- Les données d’entreprise, y compris les bases de données et les fichiers privés, sont intégrées dans le cloud public.
- Les contenus qui ne sont accessibles que par des liens créés par Javascript entrent dans la catégorie des contenus scriptés.
- les pages protégées par des logiciels, qui ne sont accessibles qu’au moyen de progiciels spécialisés et ne peuvent être consultées par une application de navigateur standard.
- Le contenu non lié est un terme utilisé pour décrire les sites en ligne que les moteurs de recherche n’ont pas été en mesure de trouver car aucune autre page n’y renvoie.
- Dans la catégorie des archives web, un service d’archivage en ligne permet aux utilisateurs d’examiner les anciennes versions de sites web qui ne sont plus accessibles.
L’ampleur de cette liste illustre toute la profondeur du Deep Web.
Le Deep Web héberge divers services, notamment des intranets d’entreprise, des déploiements de clouds publics, des sites web et des forums réservés aux membres, des boîtes de réception d’email et de chat privées, des comptes de services web, des contenus de médias sociaux privés, des comptes bancaires électroniques, des dossiers médicaux électroniques et d’énormes quantités de données d’entreprise. Il est crucial de se rappeler que toutes les informations du Deep Web ne sont pas malveillantes car elles servent avant tout à protéger les données.
Qu’est-ce que le Dark Web ?
Le Dark Web comprend tout le contenu de l’internet qui existe sur les darknets, des réseaux superposés qui utilisent l’internet mais auxquels on ne peut accéder qu’en utilisant des logiciels de navigation, des autorisations et un cryptage spécifiques. Les petits réseaux peer-to-peer (P2P) constituent la majorité des darknets, mais il existe aussi des darknets plus étendus et bien connus comme Tor, Freenet et I2P.
Le réseau Tor, sur lequel se trouvait Silk Road et auquel on ne peut accéder qu’en utilisant le navigateur crypté Tor, a été qualifié de “Dark Web” par les publications médiatiques lors de la chute de la place de marché Silk Road en 2013. En conséquence, beaucoup de gens pensent à tort que le Dark Web est le navigateur Tor, même si ce n’est qu’une partie de celui-ci.
Que trouve-t-on sur le Dark Web ?
Seuls les navigateurs Web spécialisés comme Tor, qui cryptent le trafic Web en masquant les adresses IP des utilisateurs et des sites Web pour garantir l’anonymat, permettent aux utilisateurs d’accéder au Dark Web. L’anonymat du Dark Web en a fait un sanctuaire pour les activités illégales, y compris celles des criminels de bas étage et des criminels organisés qui souhaitent mener des activités en ligne sans avoir à répondre de leurs actes devant les autorités judiciaires.
Les types de contenus suivants sont hébergés sur le Dark Web :
- Logiciels malveillants : Les cybercriminels peuvent acheter ou télécharger des logiciels malveillants sur le Dark Web pour les utiliser dans leurs attaques, notamment des virus, des rootkits et des exploits logiciels.
- Places de marché illégales : Les places de marché illégales sur le Dark Web permettent aux criminels d’échanger librement des substances illégales, des marchandises volées et des données volées qui peuvent être achetées et utilisées par les cybercriminels pour commettre des fraudes et des vols d’identité.
- Services de piratage : Pour un prix raisonnable, les pirates du Dark Web peuvent être engagés pour lancer des cyberattaques contre une cible particulière.
- Fraude, contrefaçon et vol d’identité : Les fraudeurs se rassemblent sur le Dark Web pour partager leurs connaissances et leurs ressources ainsi que pour acheter et revendre de faux actifs, notamment des comptes bancaires et des comptes email contenant des informations volées.
- Services Bitcoin : Sur le Dark Web, les criminels prennent fréquemment des bitcoins en échange de biens et de services.
- L’accessibilité du bitcoin et l’anonymat qu’il offre en ont fait la monnaie numérique privilégiée pour les transferts d’argent en ligne et l’échange de produits et services illégaux.
- Contenus volés : Le Dark Web est largement utilisé pour la vente d’informations d’identification personnelle (PII) et d’autres données sensibles qui ont été volées à des entreprises.
Les ressources du Dark Web ne sont pas seulement accessibles par le biais de logiciels spécialisés, mais sont également dissimulées aux moteurs de recherche. Par conséquent, le Dark Web est officiellement une division du Deep Web qui fait partie des pages protégées par des logiciels.
Les principales différences entre le Deep Web et le Dark Web
Deep Web | Dark Web |
Le Deep Web est la partie de l’Internet qui est cachée et n’apparaît pas dans les moteurs de recherche conventionnels. |
Le Dark Web est un sous-ensemble du deep web qui est intentionnellement caché.
|
Pour y accéder, il faut un mot de passe, un cryptage ou un logiciel spécialisé. |
Pour y accéder, vous avez besoin du projet Tor ou d’un navigateur similaire.
|
Il est plus vaste que le Surface web. |
Il s’agit d’un sous-ensemble du Deep Web, mais sa taille n’est pas mesurable.
|
Il est généralement utilisé à des fins légitimes qui nécessitent l’anonymat. |
Le Dark Web est parfois utilisé pour des activités illégales.
|
Il comprend toutes les pages web non indexées. |
Il ne comprend qu’un sous-ensemble de pages web non indexées à l’intérieur du Deep Web.
|
Vous pouvez y accéder avec un VPN. |
Il faut beaucoup de précautions pour accéder à ces données.
|
L’utilisation du Deep Web ou du Dark Web est-elle illégale ?
Compte tenu de notre explication du Deep Web, il devrait être évident que l’accès à bon nombre de ses composantes, comme votre boîte aux lettres électronique, les fichiers de votre compte Dropbox, l’intranet de votre entreprise et les sites Web privés dont vous êtes membre, est tout à fait légal.
En revanche, il est interdit d’utiliser la fraude pour accéder à des données et des ressources privées sur le Deep Web qui ne sont pas les vôtres (par exemple, en piratant l’intranet ou le cloud public d’une entreprise concurrente, en exécutant une attaque par prise de contrôle d’un compte email, etc.)
En ce qui concerne le Dark Web, l’utilisation de logiciels spécialisés comme le navigateur Tor pour accéder aux darknets est tout à fait légale aux États-Unis.
Malgré cela, les utilisateurs peuvent être tenus pour responsables des délits qu’ils commettent en ligne, comme l’achat de stupéfiants illégaux, l’accès à des contenus interdits, le piratage ou la fraude.