RTFlash

Vers un espéranto des documents informatiques

On compare souvent la recherche d'une information au sein d'un réseau à celle d'une aiguille dans une botte de foin. Manque de pertinence des moteurs de recherche, syntaxe complexe et utilisant des opérateurs booléens pas forcément faciles à manier, les raisons de ce relatif manque d'efficacité sont nombreuses. Pour y remédier la société Autonomy, filiale de Neurodynamics, une firme créée par des chercheurs de l'université de Cambridge en 1991, propose une solution complète de gestion de document appelée Autonomy Knowledge Management. Constitué de plusieurs programmes agents dépendants les uns des autres, cet ensemble permet de trouver une information ou un document au sein d'une base de données indépendamment de son format de fichier ou même de la langue dans lequel il a été créé. Pour arriver à des résultats pertinents, Autonomy se base sur trois technologies complémentaires. Première d'entre elle, le moteur DRE (Dynamic Reasoning Engine) analyse les documents à la fois sur les mots mais surtout à partir du contexte duquel ils ont été extraits. Autonomy en tire donc des concepts, des "idées", qu'il mettra en rapport avec la question posée par l'utilisateur en langage naturel. On est loin de la simple recherche du nombre d'occurrence d'un mot au sein d'un corpus de textes. Du fait de sa technologie tenant plus compte du contexte que du mot en lui même, cette solution accepterait même des requêtes formulées en langage familier ou en argot, dès l'instant qu'elles ne comportent pas de fautes d'orthographe. Le moteur existe déjà dans douze langues (dont le français, le japonais et le chinois). Deuxième partie de la technologie Autonomy, la création de profils utilisateurs. Le programme analyse les pages Web et les documents visionnés par l'utilisateur et en déduit ses centres d'intérêts ainsi que ses préférences particulières. De là, il crée un fichier profil par utilisateur, dont il se servira pour affiner encore ses recherches. Troisième module clé d'Autonomy, la fonction Update qui analyse les données incluses dans le fichier de préférence et interroge périodiquement les serveurs de l'éditeur pour se mettre à jour. Celle-ci touche autant les formats de documents (si une nouvelle version de Word est installée sur la machine de l'utilisateur par exemple) que les préférences de l'utilisateur si celles-ci ont changé au cours du temps. Du Push intelligent et réellement sélectif, en quelque sorte. Si elle n'en est plus à ses balbutiements, la technologie Autonomy n'est pas pourtant implantée sur tous les Intranet et portails d'entreprise, loin de là. Mais des sites comme celui de BBC News Online, le site d'information en ligne de la vénérable institution britannique, utilise déjà le procédé avec une certaine efficacité. Ainsi, ce site propose au visiteur d'effectuer une recherche d'un seul coup sur toutes les pages du sites, rédigées pourtant en plusieurs langues.

Vunet : http://www.vnunet.fr/VNU2/index.htm

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

Recommander cet article :

back-to-top