Le DeepWeb, l’internet de tous les possibles 8

Comme beaucoup de geeks, j’ai vite trouvé les limites aux recherches du célèbre moteur Google (ainsi que tous les autres, Yahoo etc.). En effet, où passent donc tous ces documents « privés », comme certains sites inaccessibles sans URL communiquée personnellement, les vidéos à diffusion limitée de YouTube, les forums à accès restreint, et toutes ces données auxquelles il est impossible d’accéder via un moteur de recherche « lambda » ? Réponse : dans le DeepWeb, dit aussi web caché ou web profond.
Il existe pour ainsi dire plusieurs catégories de contenu dans le DeepWeb, et ce du seul point de vue technique. Parmi celles-ci, le contenu dynamique, contenu géré le plus souvent par des formulaires ; également les pages dont les URLs sont inconnues et non liées à d’autres pages (contenu non lié) ; viennent ensuite les contenus à accès limité (par demande de login par exemple) ; ainsi que les contenus de scripts, résultants de liens exécutables JavaScript ou flash entre autres ; et enfin le contenu non indexé, où les formats de données ne sont pas supportés par les moteurs de recherches cités plus haut.

Un moyen simple de rendre son site non indexable est de paramétrer le fichier robot.txt afin qu’il n’accepte pas la visite de robots :
####################
# robots.txt
User-agent: *
Disallow: /
####################
#User-agent: * ==> signifie que nous spécifions tous les types de bots.
#Disallow: / ==> indique quelles parties de votre site ne seront pas indexées. #==>Ici, tout le répertoire racine.

Autant dire que le DeepWeb est une source de renseignements, pour ainsi dire, quasi-inépuisable. Selon certaines sources, le web indexé (le web « normal ») ne représenterait qu’environ 3 à 25% du web total (les études divergent à ce sujet, mais selon l’avis général le DeepWeb est de loin le plus important en terme de données). L’entreprise BrightPlanet estimerait que le web caché contiendrait 500 fois plus de contenu que le web dit de « surface ».
Pour reprendre le schéma le plus connu à ce sujet, le DeepWeb serait comme le côté immergé d’un iceberg géant, où le web indexé ne serait que la surface visible de l’iceberg (voir photo).

Mais il ne faut pas se voiler la face : le web profond possède un nombre très importants de données sans intérêt aucun (ce qui mène en général à leur non-indexation). Cependant, les contenus mis en ligne volontairement sur le DeepWeb peuvent se révéler extrêmement intéressants : le contenu intégral du défunt Wikileaks, par exemple, y est entièrement référencé. Des forums d’informatique de pointe également, ainsi que des sites de passionnés de bidouillages en tout genre (ondes radios par exemple).  Des documents jugés « sensibles » par certains gouvernements (attention cependant aux fakes, ainsi qu’à ne pas trop télécharger de contenu un peu trop « chelou »). Il s’agit également d’une zone très appréciée des Anonymous, grâce à ses nombreuses boards anonymes.
Ce qu’il faut garder à l’esprit, lorsque l’on surfe sur le DeepWeb, est que l’on surfe sur une vague incontrôlable, et que l’on peut également trouver des contenus carrément illégaux : des forums de revente d’armes, des sites pédophiles, des trafiquants d’humains (!), des dealers (du crime organisé, pas des truands à la petite semaine comme on en trouve en bas de l’immeuble), du matériel technologique illégal, comme les skimmers, ou bien des snuff-movies. Attention donc…

Bon, maintenant que vous savez ce qu’est le DeepWeb et ce qu’il contient, et comme je vous ai prévenu que vous pouviez y trouver du contenu pas forcément très légal, je cesse de vous bassiner de théorie et vous présente donc les différentes manières d’y accéder :
Pour commencer, disons qu’il existe plusieurs moteurs de recherches spécialisés dans ce domaine, mais je ne vous citerais que http://www.base-search.net/ pour ce qui est des recherches http. Il a été développé par une université Allemande.
Pour ce qui est des requêtes ftp, il y a http://www.ftpsearch.net/ .
On peut également utiliser certaines commandes de Google, comme «filetype:rdp» ou bien «filetype:passwd» (sans les guillemets). Le contenu se révèle parfois impressionnant…
On peut également utiliser Goolag, du CdC, si celui-ci est toujours en circulation…
Sinon, c’est vers des programmes comme Freenet (principe du F2F, utilisable en darknet), TOR ou bien l’I2P qu’il faudra se tourner.
Prenons exemple de TOR : celui-ci prend en charge des adresses bien particulières, donnant par exemple accès à l’HiddenWiki : kpvz7ki2v5agwt35.onion . Oui, pas de http, pas de *.com, juste une adresse bizarre se terminant par un *.onion.

Voilà, vous savez maintenant qu’est-ce que le DeepWeb et comment y accéder.  Il est de votre plein droit de surfer sur le DeepWeb si l’envie vous en vient, mais bien entendu, vous êtes responsables de vos actes et rien de ce que vous ferez ne pourra incriminer Geek Source et l’auteur de cet article, en l’occurrence moi-même.
Sur ce, bon surf !

Mr. Linhex

Pour être informé lorsque un nouvel article est publié, abonnez vous !

8 commentaires sur “Le DeepWeb, l’internet de tous les possibles

  1. Répondre trinit@ Le 24 / 02 / 2012 à 17 h 07 min

    Effectivement le DeepWeb est enorme. Un peu trop peut être :)
    Dans ton aticle, tu as oublié de préciser deux ou trois trucs :

    1. Le DeepWeb, c’est bourré de virus et de scripts pas cool.
    –> Sous Mozilla, installez l’extension NOSCRIPT et HTTPSFinder

    2. Le DeepWeb, c’est bourré de fakes, peut-être encore plus que le web normal

    3. Sortez couverts ! VPN Power !

  2. Répondre Mr.Linhex Le 24 / 02 / 2012 à 22 h 35 min

    C’est vrai oui, le deepweb est bourré de fakes… mais bon, comme on dit, on ne fait pas d’omelette sans casser d’oeufs. Alors oui, il va falloir trier pour y trouver quelque chose d’intéressant. Étant moi même un véritable fouineur, cela ne me dérange pas, et démêler le vrai du faux, après tout, c’est amusant :) !
    Je suis entièrement d’accord avec toi pour ce qui est de la présence de virus: j’ai oublié de la [[[désolé, j'ai chargé mon commentaire sans le faire exprès...]]] donc oui, j’ai oublié de le préciser car je tourne en permanence sous GNU/Linux, et que les malwares ont pour ainsi dire disparu de ma vie. Cela me perdra sans doute un jour…
    Pour ce qui est du VPN, c’est en effet un plus, mais il est tout de même bon de rappeler qu’il est inutile d’être anonyme sur le DeepWeb si ce que l’on y fait est légal :)

  3. Répondre ElFenomenoo Le 14 / 03 / 2012 à 1 h 13 min

    Je n’arrive pas à naviguer sur le deepweb je cherche un site pour telecharger des films mais je trouve pas :(

  4. Répondre Mr.Linhex Le 16 / 03 / 2012 à 22 h 55 min

    L’HiddenWiki a récemment été mis hors service, en partie à cause des Anonymous, Google te donnera plus de détails que moi. Essaye l’I2P, ou FreeNet, eux sont toujours accessibles. Il faudra attendre un peu pour qu’un autre annuaire d’adresses en .onion voit le jour… Le DeepWeb est cependant fondamentalement toujours accessible, comme expliqué plus haut :) Pour ce qui est du téléchargement de films, illégal aussi je suppose, je te renvoie à google, qui devrai te sortir tout ça en quelques millièmes de secondes, car je ne sortirai pas d’adresses url de ce type sur geeksource :) De nouvelles plateformes autres que Megaupload ont vu le jour, comme uploaded, wupload et autres…

  5. Répondre rosarie Le 4 / 04 / 2012 à 0 h 12 min

    salut a toi Mr.linhex deja j’ai aimé ton article, mais je voudrais me perfectionné sur pc..(en fait je suis une quiche).En gros je voudrais savoir comment me servir du deepweb par exemple, effectuer de bonnes recherche dessus et surtout comment on fait ! J’ai essayé mais en vain! voila.

  6. Répondre Mr.Linhex Le 7 / 04 / 2012 à 23 h 02 min

    Suite aux évènements dont j’ai fait part dans mon post précédent, je vous livre ici la nouvelle adresse de l’HiddenWiki: kpvz7ki2v5agwt35.onion.to
    En effet, le domaine de premier niveau est maintenant *.onion.to, et non plus *.onion. Pas de grande nouveauté à part ça, sauf le fait que TOR affiche désormais un (ou des) disclaimer lorsque l’on surfe sur l’un de ces sites. Car c’est vrai, il est possible de TOUT trouver…
    Merci rosarie pour ton commentaire ! Pour ce qui est du recherche sur le DeepWeb, cela s’apparente plus à de la fouine et à un travail de brocanteur qu’à une véritable rigueur informatique. Il faut chercher un peu partout et avoir une bonne connaissance de « l’anglais de cuisine ». En partie afin d’éviter les sites un peu trop chelou. L’HiddenWiki consitue cependant un bon point de départ, et à partir de ces pages, tu pourra sûrement trouver des liens divers et variés qui pourront te mener à ce que tu recherche :)
    Cependant, si je puis me permettre un conseil, si comme tu le dit, tu es une « quiche » en informatique, essaye plutôt, pour commencer, d’exploiter les outils cachés de Google, on y trouve parfois de vrais perles ;) Et cela t’évitera aussi, peut être, de mauvaises expériences :) Je ne saurai que trop te recommander l’utilisation d’un OS type GNU/Linux ou *BSD, car s’ils ne sont pas infaillibles, ils sont largement plus sécurisés face aux saloperies que l’on peut trouver sur le Web et le DeepWeb en particulier !
    Bon surf :)

  7. Répondre DDK Le 3 / 07 / 2012 à 16 h 11 min

    Vous n’avez pas idée de ce qui se trame dans l’Hidden Wiki !
    N’y allez pas, un conseil d’ami.

  8. Répondre kragator Le 21 / 08 / 2013 à 10 h 34 min

    Plus aucun site ne fonctionne sur l’hidden wiki depuis que le FBI à fait tomber Freedom hosting pour sois disant faire tomber une branche de pédopornographie et pédoprostitution…. Résultat: des centaines d’adresses Tor en moins et toute les adresses Tormail fermées définitivement….

Laisser un commentaire