Quelles sont les caractéristiques du SPAM contemporain ?

Initialement, le SPAM était un message en format de texte, ce qui le rendait facilement détectable par les logiciels de messagerie et les serveurs repérant des mots-clés caractéristiques (Viagra, Cialis, etc...).

Les SPAMMEURS contemporains ont des capacités de distribution de plus en plus élevées (chaque envoi est aujourd’hui distribué à des millions d’adresses électroniques) et utilisent des techniques qui permettent à leurs messages d’échapper aux analyses textuelles, notamment :

Le fichier texte brouillé, où les mots suspects sont découpés, déformés ou entrelardés de caractères de ponctuation qui les dénaturent :


We have everything you need: Phenterm1ne, Cial1s
S0ft T4bs, V1agra S0ft T4bs, Cial1s, V1agra, Lev1tra, Propec1a,
Val1um, Xan4x, Amb1en, Zyb4n, Atar4x, At1van, Car1soma, Ultr4m,
Glucoph4ge, Lip1tor, Mer1dia, Zoc0r, N0rvasc,
Prov1gil/Modaf1nil, Zol0ft, V1agra Oral Gel.


Les courriers images, où le texte est intégré dans un fichier jpg ou gif, ce qui le rend impossible à repérer :


Spam sample


Les fichiers PDF, que même les logiciels anti-spam les plus performants peinent à détecter.


Parallèlement, à mesure que les logiciels anti-spam ont multiplié les critères de sélection, le nombre de "faux positifs", c'est-à-dire de messages légitimes mais considérés comme du SPAM par les logiciels, a considérablement augmenté.