RTFlash

L'ADN contre le spam !

Les chercheurs en bioinformatique d'IBM ont peut-être marqué un point décisif dans la lutte contre les spam, un fléau qui menace le développement du Net. Ils ont développé un algorithme, baptisé Teiresias, destiné à parcourir des séquences d'acides aminés et des fragments d'ADN pour y chercher des motifs récurrents, avec l'objectif d'isoler les rôles de certaines structures génétiques.Cette technique, modifiée au sein d'un nouvel algorithme baptisé Chung-Kwei (du non d'un Taliman feng-shui censé protégé le foyer des mauvais esprits), et appliquée non plus à des séquences de matière organique, mais à des chaînes de caractères, permettrait de lutter très efficacement contre le spam en décelant, là encore, les motifs récurrents qui caractérisent les pourriels. Cette méthode issue de la biologie permet de détecter 96,5% des spams. Sur quelque 65 000 messages préalablement identifiés comme des pourriels, Teiresias/Chung-Kwei a permis d'extraire environ 6 millions de motifs récurrents. Ces motifs doivent ensuite être comparés à ceux naturellement présents dans une collection de messages légitimes, ce qui permet de les retrancher les motifs non "suspects".Une fois collectés les motifs caractérisant bien les spams, il est alors possible d'attribuer aux e-mails entrants une pondération en fonction du nombre de ces motifs qu'il comprend. Résultat obtenu par l'algorithme : 96,56% des spams qui lui ont été soumis ont été effectivement libellés comme du spam. A l'inverse, la caractérisation d'un message légitime comme du spam (effet pervers de nombreuses technologies antispam) est survenue rarement, à raison d'1 pour 6000. Fort de ces résultats, IBM envisage d'inclure cette technologie dans son offre antispam, SpamGuru. L'avantage de cet algorithme dérivé des recherches en bioinformatique par rapport aux filtres bayesiens est décisif car il permet, avec de très bonne performance, de détecter les nombreuses astuces que déploient les spammeurs pour contourner ces filtres (changement de lettre, insertion de texte sans queue ni tête, etc.).

NS :http://www.newscientist.com/news/news.jsp?id=ns99996292

Noter cet article :

 

Vous serez certainement intéressé par ces articles :

Recommander cet article :

back-to-top