Pas simple de trouver une analogie lorsque l’on parle de filtres anti-spam. La meilleure qui me soit venue à l’esprit est un processus de recrutement dans une entreprise. Vous savez, ces recrutements qui prennent parfois plusieurs mois, avec de nombreuses étapes, de tests psychologiques, de entretiens avec la hiérarchies, … C’est un peu la même chose avec un email. Pour que celui-ci arrive à destination, qu’il soit engagé par la boîte email du destinataire, il doit passer de nombreux entretiens d’embauche !
Les différentes techniques de filtrage
Comme dans un recrutement, il n’existe pas de procédure standardisée pour filtrer un email. Chaque recruteur peut appliquer ses propres méthode et surtout en combiner plusieurs différentes. Parfois, un simple rendez-vous ou une lecture de CV suffira à vous faire engager. Dans d’autres cas, vous devrez subir des tests psychologiques, fournir de nombreux documents et rencontrer une demi-douzaine de directeurs avant de voir votre candidature rejettée.
Challenge-response
Lorsque vous envoyez votre CV à une enterprise, vous attendez une réponse de la part de celle-ci, soit c’est un refus d’entrée de jeu, soit c’est une proposition de rendez-vous à laquelle vous devez répondre. La simple fait de répondre rapidement à cette proposition de rendez-vous prouvera que vous êtes un candidat motivé.
La technique du « Challenge-reponse » en emailing, c’est un peu la même chose, si le serveur vers lequel vous essayez d’envoyer un email ne vous connaît pas, il va vous envoyez un « Challenge ». Un challenge, c’est un message demandant une intervention manuelle qui servira de preuve de votre bonne foi. Suite à cette intervention, votre email pourra être envoyé et vous n’aurez plus à réaliser cette action dans le futur.
Les filtres sur le contenu
Lorsqu’un service de recrutement reçoit votre CV… il le lit. Mais attention, si le nombre de CV est trop important, il est fort probable que la première lecture soit seulement superficielle. Est-ce que le CV est bien présenté, est-ce qu’il comporte les sections classiques, est-ce qu’il ne comporte pas de fautes d’orthographes, …
Pour les filtres anti-spam analysant le contenu des emails, le processus est similaire :
- Est-ce que votre email est rédigé avec une orthographe correcte (pour ne pas dissimuler par exemple le mot V14gr4 en utilisant certains subterfuges) ?
- Est-ce que les liens pointent vers de sites respectables ?
- Est-ce que certains groupes de mots ne sont pas « listés » ?
- Est-ce que le ratio texte/image est correcte ?
- …
Par contre, le désavantage est le nombre de « faux-positifs » que ce type de filtre peut occasionner. Ce n’est pas parce qu’un candidat n’est pas bon en orthographe qui ne se révèlera pas être un graphiste de génie.
Les black lists ou listes noires
Difficile de trouver un équivalent dans le monde du recrutement. En tout cas, si ce service existe, je n’en ai jamais entendu parler. Mais faisons comme si ça existait. Une liste noire dans le monde de la recherche d’emploi voudrait dire que vous avez la possibilité de confronter les candidatures reçues à une liste noire publié par une autre entreprise ou organise ayant pour objectif de référencer tous les mauvais employés… ça fait froid dans le dos !
En emailing, de telles listes existent. Il y en a d’ailleurs beaucoup ! Ces listes proposent de référence les adresses IP ou les noms de domaine expédiant du spam. Elles permettent aux administrateurs système de bloquer de manière préventive tous les emails provenant d’une source référencées dans ces listes.
Les critères des listes noires sont tous différents, certaines utilisent des plaintes spontanées d’utilisateurs, d’autres créent des « spamtraps » (boîtes email créées afin d’attirer les spammeurs), …
Le Grey Listing
Pour tester votre motivation, un recruteur peut vous laisser languir ! Plusieurs jours (ou semaines) après avoir envoyé votre CV, vous n’avez reçu aucune réponse, ni positive, ni négative. Vu qu’il s’agit du job de vos rêves, vous prenez en main votre téléphone afin de vérifier si votre CV est bien arrivé à destination !
Le greylisting est une méthode qui part du postulat qu’un spammeur ne va jamais faire une seconde tentative d’envoi de son email si la première a échoué (cela couterait beaucoup trop en ressources). Le serveur email, lorsqu’il ne connait pas un expéditeur, va donc systématiquement envoyer une erreur temporaire à la réception d’un email. Dans ce cas, un expéditeur légitime réessayera en général quelque temps plus tard. Ce qui prouvera au serveur qu’il n’est probablement pas un spammeur.
La réputation
On tombe ici, dans une grande tendance des pratiques de recrutement. Comment fait un recruteur pour vérifier votre « réputation » ? Un petit coup dans Google et un autre sur Facebook. Et hop, votre condamnation à six mois de prison pour vol ou vos soirées un peu trop arrosées refont surface. Difficile d’effacer ce type de trace.
Le monde de l’email adore lui aussi vérifier votre réputation. Par contre, ce sera fait de manière plus automatisée. La réputation en email consiste en un ou plusieurs scores évoluant au fil de vos campagnes email. L’évolution de ce score est lié aux réactions des destinataires de vos emails, au contenu de ceux-ci, … Mais un élément important de la réputation email est lié à l’identification. Votre score sera lié soit à votre nom de domaine d’expédition (mais aussi au nom de domaine de vos liens) soit à votre adresse IP.
Filtres bayésiens
Besoin d’aide ?
Lire du contenu ne fait pas tout. Le mieux, c’est d’en parler avec nous.
Le filtre bayésien en recrutement, c’est l’expérience du recruteur ! Au fil des années, celui-ci a appris à reconnaître un CV de qualité en un seul coup d’oeil. Là où il lui fallait plusieurs heures pour faire le tri d’une centaine de CV, il ne lui en faut aujourd’hui que la moitié.
Pour filtrer les emails, les filtres bayésiens utilisent eux aussi l’expérience ! Plus l’utilisateur va signaler de spam, plus le filtre va apprendre quels mots ou quels groupes de mots doivent être considérés comme étant du spam. C’est donc un filtre basé exclusivement sur des calculs de probabilité. Les filtres bayésiens fonctionnent donc sur base d’un seuil. En dessous de ce seuil un email n’est pas considéré comme spam, au delà, il sera filtré.
Vérification du respect du standard SMTP
Ok, ici, il va être compliqué de faire le parallèle avec un CV, une lettre de motivation ou un processus de recrutement… donc on va s’en passer 😉
Le protocole SMTP est l’ensemble des règles techniques qui décrivent comment un email doit être envoyé (et reçu). Pas vraiment le genre de texte que l’on veut avoir sur sa table de chevet. Par contre, si c’est un document très précis, tout le monde n’applique pas les règles décrites au pied de la lettre. Pour cette raison, certains n’hésitent pas à filtrer les emails en fonction de la qualité du dialogue SMTP. Mais on va en rester là, je ne suis pas un spécialise des réseaux informatiques et il faudrait de nombreuses pages pour parler de ce qu’est un dialogue SMTP de qualité.
Et d’autre méthodes purement techniques
Il y a encore de nombreuses techniques de filtrage, comme le Nolisting, qui consiste à référencer plusieurs serveurs email dans les enregistrements DNS dont certains ne fonctionnent délibérément pas. Ou encore la vérification du « Reverse DNS » qui consiste à vérifier le nom de domaine associé à une adresse IP.
Une combinaison des différents filtres
Vous trouvez que c’est complexe ? Moi aussi ! Mais le pire est à venir. Aucune de ces technologies de filtrage n’est utilisée seule. Chaque FAI, chaque webmail, chaque entreprise utilise un mélange de toutes ces techniques, avec des réglages différents, des seuils de tolérance différents, des implémentations différentes, …
C’est pour cette raison que la délivrabilité est plus proche de l’équilibrisme que de la science exacte. On peut dire que là où un spammeur tente de contourner les filtres, un expéditeur légitime doit tenter de remplir tous leurs critères (mais cela fera l’objet d’un autre article).
Où se trouvent les filtres ?
C’est bien beau de parler de filtres pendant des heures, mais encore faut il comprendre où ils se trouvent. Quelques réponses rapides.
Filtres du côté de l’utilisateur
On peut citer deux types de filtres du côté de l’utilisateur :
- Le filtre anti-spam du client email : Comme dans Outlook, Apple Mail ou Thunderbird, ce sont principalement des filtres bayésiens. Qui fonctionnent sur base des classements en spam effectués précédemment par l’utilisateur.
- Les règles créées par l’utilisateur : Certainement le filtre le plus difficile à contrer par les expéditeurs d’emails. Si l’utilisateur à décidé de filtrer tous les emails provenant de votre nom de domaine afin de les placer dans sa poubelle, il sera presque impossible d’y échapper.
Filtres du côté serveur (webmails, FAI et entreprises)
- Les filtres maison : Certaines organisations ont décidé de créer leurs propres systèmes de filtrage d’email. Dans ce cas, très peu d’informations seront disponible afin de connaître les règles utilisées par ce type d’acteur.
- Utilisation de technologies disponibles sur le marché : Qu’elles soient commerciales ou libres (comme le célèbre spamassassin), ces technologies sont utilisées en combinaison avec d’autres afin de créer une solution anti-spam sur mesure.
- Les appliances : Principalement utilisées en entreprise (mais pas uniquement), les appliances sont des serveurs « prêt à l’emploi » qui vont filtrer les emails entrant. Il suffit de les brancher en amont du serveur email de l’entreprise, et l’administrateur système n’a plus qu’à leur faire confiance.
Mais aussi des filtres du côté du routeur
N’allez pas croire qu’il n’y a que du côté du destinataire que des technologies de filtrage du spam sont utilisées. Afin de se prémunir de l’usage par les spammeurs de leurs plateformes, les solutions de routage d’email sont obligées de créer des filtres préventifs. Mais en plus des solutions précédemment exposées, il auront aussi recours à d’autres techniques :
- Limitation de la vitesse d’envoi pour les comptes récents;
- Vérification des taux de plainte reçues depuis les feedback loops;
- Analyse de l’identité des nouveaux clients;
- …
Des techniques en constante évolution
N’allez pas croire que tout ce qui est écrit ici est gravé dans le marbre. Comme dans le monde du dopage, les spammeurs ont toujours une longueur d’avance. Les techniques de filtrage sont donc obligées d’évoluer en permanence, notamment afin de contrer de nouveaux fléaux comme, par exemple, la montée en puissance des attaques de phishing.
Laisser un commentaire