Recherche d'information et veille sur Internet
les services de CyberVigie le magazine de CyberVigie téléchargement
information économique et communiqués de presse en région rhône-alpes

LE WEB INVISIBLE | 15-01-2001

Lancé dans vos recherches sur Internet et ses quatre milliards de pages web, vous êtes résigné à ne pas trouver ce que vous cherchez. Mais il existe le web invisible.

Votre moteur de recherche ou annuaire favori ne peut rien pour vous ?! Non seulement les moteurs de recherche ne couvrent pas la totalité du web, mais, de plus, ils sont incapables d'atteindre certaines données qui vous seraient bien utiles. Récemment nous parlions de la recherche inversée sur Internet et notamment du reverse lookup pour retrouver des numéros de téléphone.

Avez vous déjà cherché un numéro de téléphone sur un moteur de recherche ? Pourtant Internet permet de retrouver des numéros de téléphone ! La plupart des données que vous cherchez : numéros de téléphone, annonces d'emploi, articles de presse, données financières, sont logées dans des grandes bases de données que les moteurs de recherche traditionnels ne peuvent indexer. Cette partie de l'Internet que l'on nomme "web invisible" se développe beaucoup plus vite que le web traditionnel et est bien supérieure en taille au web classique. Ces données sont invisibles, elles ne sont accessibles qu'à partir de leur source et de catalogues de base de données ou de certains outils de recherche.

Pour commencer à découvrir ce que vous connaissez déjà peut-être en partie, les répertoires recensant les bases de données sur le web sont une bonne introduction. Voici celles que nous vous conseillons :

- Base de données de l'URFIST : urfist.univ-lyon1.fr/gratuits.html
Jean pierre Lardy de l'URFIST de Lyon recense les bases de données gratuites sur l'internet. Une première et bonne ressource francophone, mise à jour régulièrement.
- Direct Search
Gary Price, de l'université de Washington, recense un nombre important de ressources anglo-saxonnes de ce que l'on nomme "the invisible web".
- Invisibleweb.com
Invisibleweb est un catalogue qui recense un dizaine de milliers de bases de données classées en 17 rubriques thématiques. Ce catalogue donne lui aussi une définition du web invisible. C'est une ressource anglo-saxonne.

Il existe de nombreux autres catalogues ou répertoires de ce genre. A titre d'information, en voici quelques-uns :
- www.search.com
- www.isleuth.com
- www.webdata.com


Bon nombre de bases de données en ligne sont payantes, notamment les bases de données commerciales délivrant de l'information financière ou sur les bilans des entreprises. Parmi les plus connues :
- Dialogweb : www.dialogweb.com
Dialogweb permet de consulter par abonnement des bases de données financières, business et techniques.
- Questel Orbit : www.questel.orbit.com
Questel Orbit est une base de données payante du groupe France Télécom.
- Elibrary : www.elibrary.com
The Elibrary propose des dizaines de milliers d'articles en ligne ainsi que différents types de documents multimédia : retranscription d'émissions, cartes, images... Tout cela étant payant et anglo-saxon.

Peut-être avez-vous reperé les bases de données qui vous intéressent ou les interfaces qui permettent une interrogation simultanée de plusieurs bases. Comment faire pour les interroger ensemble sans passer par la connexion manuelle à tous ces sites ? Plusieurs agents intelligents permettent d'interroger le web invisible. L'un d'entre eux est facilement personnalisable et bien utile :
- DigOut4U, de la société Arisem : www.arisem.com
DigOut4U permet de créer des groupes de sources à interroger. Vous sélectionnez les sites qui contiennent des bases de données utiles à vos recherches ; l'agent intelligent se connecte ensuite à ces sites dans lesquels vous lancez une requête standard de paramétrage, et le groupe est créé. Il vous suffit alors de lancer votre requête sur le groupe de sites de votre choix et l'agent récupère les réponses les plus pertinentes. La personnalisation de cet outil est très simple.

D'autres outils permettent d'interroger des bases de données comme Strategic Finder (www.strategicfinder.com) mais la création de groupe de sources est moins aisée qu'avec le précédent. Cependant certains groupes préconçus : energy, legal, ministères,… sont bien utiles pour des recherches très ciblées.

Le web invisible n'est plus un secret pour vous. Il vous faut maintenant l'exploiter et en prendre toute la mesure. En effet, les presque quatre milliards de pages web ne sont qu'une partie du web, la partie invisible est au moins dix fois plus grande, un vaste champ d'expérimentation pour le surfeur, la "cybervigie"...

Jean François Longy | CyberCité


Mots-clés :  deep web, web invisible, base de données, profondeur, agents intelligents, Strategicfinder, Digout4u

 
29 articles disponibles


INNOVATION CONCENTRATION PAUVRETE DU WEB
2002-04-08 - Jean François Longy

RECHERCHE SIREN SIRET NAF SUR INTERNET
4/02/02 - JFL

COMMENT DETECTER LE PLAGIAT SUR LE NET ?
3/12/01 - Jean François Longy

GOOGLE REVELATEUR D'INCONSCIENCES
8/11/01 - Jean François Longy

RESSOURCES JURIDIQUES EN LIGNE
11-10-01 - Jean François Longy

RECHERCHE BREVETS EN LIGNE
28/09/01 - Jean François Longy

RECHERCHE ETUDES STRATEGIQUES ...
05/09/01 - Jean François Longy

RECHERCHE IMAGE AVEC ... PICSEARCH
14/08/01 - Jean François Longy

page 1 - 2 - 3 - 4
 
  Agence de référencement - Référencement mobile - Stratégie référencement - Diffusion communiques de presse