Rechercher l'information
Cours

Les informations du web invisible

Aussi appelé web caché ou web profond, le web invisible est l'ensemble des documents diffusés par l'intermédiaire du web et qui ne sont ni lus, ni indexés par les moteurs de recherche traditionnels.

Les informations composant le web invisible sont :

  • Les sites accessibles par mot de passe

  • Les sites comportant des cadres (frame)

  • Les formats de fichiers différents du HTML, format natif du web reconnu par tous les robots des moteurs de recherche

  • Les pages HTML dynamiques (structure des bases de données)

  • Les sites d'informations quotidiennes : presse, radio, télévision...qui diffusent des informations presque en temps réel. Les outils classiques ne peuvent suivre ce rythme.

Pour faire des recherches dans le Web invisible, il faut utiliser des outils spécifiques comme : Dadi (DataBase Directory) Completeplanet, BublLink, Turbo10, Ez2find, Search.com, signets.bnf.fr, news.google.fr/

De plus en plus d'outils de recherche indexent d'autres formats que le html :

pdf, excel (xls), powerpoint (ppt), word (doc), documents sonores, images, vidéo...

Les recherches portant sur ces formats :

  • peuvent être accessibles directement sur la page d'accueil de l'outil,

  • ou se font en recherche avancée,

  • ou en sachant écrire la syntaxe spécifique de la requête.

Les informations hors du web (page suivante)Les informations présentes sur le web (page Précédente)
AccueilRéalisé avec SCENARI