RTFlash

Le moteur avance, les utilisateurs rament

On l'a dit et répété : Internet est une immense bibliothèque qui abrite des images, des sons, de la vidéo, des pages en format HTML et des documents en format PDF. Inventé par Adobe, le format PDF (Portable Document Format) s'avère être une méthode très pratique pour enregistrer des documents dans leur mise en forme originale et les diffuser auprès de n'importe quel utilisateur disposant du logiciel gratuit Acrobat Reader qui permet de les lire. Utilisé régulièrement par les administrations, les entreprises ou encore les universités pour présenter des textes volumineux ou des contenus illustrés, le PDF permet ainsi de faire l'économie de pages HTML aux gestionnaires de sites. Il rend également service à l'internaute qui peut conserver l'intégralité du document dans sa mise en page originale, la notion de bibliothèque virtuelle prenant alors tout son sens. Malheureusement, les documents en format PDF disponibles sur la Toile étaient souvent difficiles à trouver, faute d'être indexés par les moteurs de recherche. Mais cela n'est plus vrai depuis que Google, l'outil de recherche le plus en vogue du moment, a décidé de procéder à l'indexation du contenu des fichiers PDF présents sur le Net. L'entreprise a ainsi ajouté 13 millions de documents au quelque 1,3 milliard de pages HTML qu'il a déjà répertoriées, soit 70 % de l'ensemble des fichiers enregistrés en ce format. Il s'agit d'une avancée considérable pour bon nombre d'utilisateurs qui pourront accéder à des milliers de documents dont ils ignoraient le contenu jusqu'à maintenant. Compte tenu du fait que la plupart des chercheurs, des universitaires ou des administrations ont adopté ce format pour présenter leurs travaux, l'initiative de Google arrive à point nommé. Pour la mener à bien, l'entreprise n'a pas lésiné sur les moyens, tant financiers qu'informatiques. Il lui a fallu développer un logiciel capable de lire le texte contenu dans les pages en PDF et allouer davantage d'espace de stockage aux informations recueillies, dans la mesure où celles-ci prennent cent fois plus de place que des données extraites de pages HTML, expliquait récemment le “New York Times”. Nul doute que cela va contribuer à renforcer la place de leader occupée par Google dans le monde des moteurs de recherche. Distingué en janvier par le Search Engine Watch comme étant le meilleur site de recherche, Google entend bien poursuivre son développement en indexant dans sa formidable base le contenu des pages en format WML et HDML utilisé en téléphonie mobile. Les internautes que nous sommes disposent donc d'un puissant outil de recherche. Reste à apprendre à l'utiliser, ce qui est loin d'être facile. Toujours pressés, nous ne prenons pas le temps de le faire, préférant taper un ou deux mots clés dans l'espoir que ceux-ci nous apportent un résultat satisfaisant. Et ce n'est malheureusement pas toujours le cas.

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

    Recommander cet article :

    back-to-top