Spam filtrarea în lilieci! Versiunea 3

Spam filtrarea în The Bat! versiunea 3.x

După lansarea versiunii Bata 3.0, toate articolele mele despre filtrele anti-spam în versiunea unică sunt depășite. Motivul este că bat-ul 3.x bat a schimbat sortarea, în urma căruia multe filtre vechi au încetat să mai funcționeze. Dorința mea de a scuta și de a scrie un articol nou a dat peste un flux continuu de e-mailuri de la utilizatori despre cum să adapteze filtrele vechi vechi care au funcționat corect pe versiunea 2.x la un nou sorter. Prin urmare, nevoia a apărut, deși cu mare întârziere, pentru a umple acest gol, din cauza puterii sorterului Bat nu are încă egal.







Modelele de filtrare nu au suferit modificări.

Esența lui poate fi descrisă prin următorul algoritm:

Avem: cutie de [email protected] zaspamlennye (suna-l de bază) pe neprotejat și negestionată prin intermediul server de mail furnizor de web-interfață fără a avea o protecție AntiSpam.

Sarcina: să eliminați această cutie de tot felul de hemoroizi fără hemoroizi.

Pe serverul protejat are loc filtrarea necesară. Spamotbora Yandex sau Spamtest Mail.ru taie tot spam-ul, iar literele folositoare rămân în plus. caseta, de unde le luăm și pe Batom.

Spamboron detectează spamul ca o corespondență în masă. Literele personale folositoare nu sunt o listă de corespondență, astfel încât acestea nu vor fi eliminate de sistemul anti-spam al serverului de e-mail și vă vor contacta.

În The Bat! pe cutia [email protected] trebuie să puneți doar 2 filtre:

Filtru № 3.1. Redirecționarea necunoscută

Filtrul nr. 3.2. Ștergerea duplicatelor

O schemă atât de elegantă! Eficiența sa este aproape de 100%.

Dacă doriți să reduceți debitul printr-o suplimentare. o cutie de spam, combinați această schemă cu Schema II. La locul de muncă, unde am vydelenka, am acționat și mai radical: între caseta zapamlenym și clientul de corespondență a pus programul Spampal. Scrisori filet Spampal'om pavilion marcată ** SPAM ** tocat imediat după descărcarea din cutia de bază (care este de 85-90% din spam-ul), literele rămase sunt conduse prin intermediul de la ext nefamiliare. unde Yandex termină resturile de spam. SpamPal dar nu poate funcționa bine lent dial-up, în cazul în care conexiunea la internet este în mod constant rupt, astfel încât, în aceste cazuri, cel mai bine este să pachet „diagrama de circuit III + II“.

Schema II. Filtrarea e-mailului pe baza câmpurilor antetului mesajului

Filtrarea soft se bazează pe procesarea mesajului în antetul său. Se mai numește și un plic tehnic. În The Bat! titlul poate fi văzut dacă, după evidențierea literei, apăsați F9.

Antetul literei este parțial format din programul de poștă pe computerul utilizatorului (câmpuri: de la, la, subiect, dată, mesaj-Id, X-mailer, conținut-tip etc.). Apoi, fiecare server prin care trece litera, adaugă cel puțin o înregistrare la plicul tehnic (câmpuri: Received, Delivered, etc.). Câmpurile de antet sunt definite de standardul RFC-822.

Esența filtrării moi este identificarea e-mailurilor atipice, deoarece Roboții spam nu respectă întotdeauna setul minim de câmpuri obligatorii și regulile de completare a acestora.

Eficiența filtrelor "moi" nu este foarte mare. spammerii încearcă să maximizeze modelul de mesaje spam către e-mailurile obișnuite. Prin urmare, o "schemă soft", ca regulă, este utilizată în combinație cu alte metode.

Primul filtru al acestui circuit elimină literele nu corespund standardului RFC-822 și care nu conțin unul dintre câmpurile obligatorii în antetul mesajului (la, la, Subiect, Data, ID mesaj), iar în cazul în care abordarea din greu și unele câmpuri opționale (X-Mailer și și colab.).

Filtru № 2.1. Nu există câmpuri în antetul RFC-822

  1. Sortare, regulă [Descărcare selectivă]
  2. Butonul [Nou]
  3. Fila [Generală]
  4. Nume: "Nu există câmpuri în antetul RFC-822"
  5. Stare: [Câmpul antetului] [Data] [nu se potrivește]. Butonul [Adăugare] SAU [Câmpul antet] [De la] [nu se potrivește]. Butonul [Add] SAU [Câmpul antet] [To] [nu se potrivește]. Butonul [Adăugare] SAU [Câmpul antet] [Subiect] [nu se potrivește].
  6. [Acțiuni] fila
  7. Acțiune: [+] Ștergeți butonul [OK]
  8. Butonul [OK] - salvați filtrul






Punctul "". "Simbol în expresii regulate înseamnă orice caracter, cu excepția rupturii liniei

Mai greu acest filtru va funcționa (și mai mult spam va ucide pe server), dacă adăugați câmpurile "Message-ID:" și "X-Mailer:". Dar trebuie să rețineți că va șterge și mesajele MAILER-DAEMON care nu conțin cel puțin unul din aceste câmpuri în antet.

Câmpul ID-mesaj trebuie să fie prezent în antetul mesajului și aproape toate programele de poștă și serviciile de poștă electronică respectă această regulă. Excepția este cea specială. mesaje, de exemplu, aceleași servere de mail MAILER-DAEMON.

Câmpul „X-Mailler:“ a pus aproape toți clienții de e-mail și știu de servicii de web-mail, deși nu este necesar, în ceea ce privește standardul RFC-822 (prefixat cu X). Unele servere de mail străine în loc de câmpul X-Mailer scriu X-Sender sau X-SenderIP, deci există puține șanse de blocare a literelor utile.

Înainte de a decide dacă să includeți sau nu câmpurile Message-ID și X-Mailer, trebuie să studiați anteturile mesajelor primite. Este necesar să fiți ghidați de principiile "Nu faceți rău", "Măsurați de șapte ori și tăiați odată", dar este mai bine să fiți în siguranță decât să pierdeți cel puțin o scrisoare utilă.

Filtru nr. 2.2. Fără expeditor

  1. Sortare, regulă [Descărcare selectivă]
  2. Butonul [Nou]
  3. Fila [Generală]
  4. Nume: "Fără expeditor"
  5. Condiție: [Câmpul antetului] [De] [nu se potrivește] \ w + [- \ w] * @ \ w + [- \ w]
  6. [Acțiuni] fila
  7. Acțiune: [+] Ștergeți butonul [OK]
  8. Butonul [OK] - salvați filtrul

Filtru № 2.3. De la mine

  1. Sortare, regulă [Descărcare selectivă]
  2. Butonul [Nou]
  3. Fila [Generală]
  4. Nume: "De la mine"
  5. Stare: [Câmpul antet] [Din] [conținute] [email protected]
  6. [Acțiuni] fila
  7. Acțiune: [+] Ștergeți butonul [OK]
  8. Butonul [OK] - salvați filtrul

Filtru nr. 2.4. Nu pentru mine

  1. Sortare, regulă [Descărcare selectivă]
  2. Butonul [Nou]
  3. Fila [Generală]
  4. Nume: "Nu pentru mine"
  5. Stare: [Câmpul antet] [Pentru] [nu este conținut] [email protected]
  6. [Acțiuni] fila
  7. Acțiune: [+] Ștergeți butonul [OK]
  8. Butonul [OK] - salvați filtrul

5. Condiții: [Antet Câmp] [Pentru a] [nu conține] [email protected] [Add] SAU [Câmp Antet] [Pentru a] [nu conține] [email protected] [Add] SAU [Câmp header] [Pentru] [nu conține] [email protected]

În anteturile celor mai multe mesaje spam puteți vedea această linie:

Către: pupkin

Prietenul sau cunoștința dvs. va scrie un astfel de nume? Cu greu. Cel mai probabil, el va scrie astfel:

Către: Vasya Pupkin

Șirul "pupkin" "Următoarele expresii regulate se potrivesc:

Filtru nr. 2.5. "Paranoia" este doar pentru un astfel de caz:

  1. Sortare, regulă [Descărcare selectivă]
  2. Butonul [Nou]
  3. Fila [Generală]
  4. Nume: "Paranoia"
  5. Stare: [Câmpul antet] [La] [meciuri] ^ pupkin \ s
  6. [Acțiuni] fila
  7. Acțiune: [+] Ștergeți butonul [OK]
  8. Butonul [OK] - salvați filtrul

Filtru nr. 2.6. Adăugarea la lista de opriri

Filtru nr. 2.7. Eliminarea spamului dintr-o listă de oprire

  1. Sortare, regulă [Descărcare selectivă]
  2. Butonul [Nou]
  3. Fila [Generală]
  4. Nume: "Eliminarea spamului din lista de oprire"
  5. Stare: [Expeditor] [disponibil]
  6. [Acțiuni] fila
  7. Acțiune [+] Ștergeți [+] Încărcați linii de semnal din fișier: spam.txt
  8. Butonul [OK] - salvați filtrul și închideți sortarea

Am făcut un mic experiment pentru a afla eficacitatea filtrării de spam pe baza câmpurilor de antet. Am o capcană, la care există doar spam și nimic mai mult. În această cutie, am pus un alt program anti-spam Spampal. pentru a testa diferite combinații. Iată ce statistici s-au dovedit:

Total spam primit:

Din tabel se poate observa că filtrarea numai pe anteturile literelor dă aproximativ 50%. Eficacitatea programului Spampal este de aproximativ 88%. Iar efectul cumulat al filtrelor asupra titlurilor și a programului Spampal este de 96%.

Evident, filtrele care nu funcționează pot fi excluse din circuit, ceea ce simplifică foarte mult (dar este mai bine să le încercați în prealabil).

Să luăm în considerare combinațiile schemei III (transfer prin intermediul unei casete suplimentare) cu alte scheme.

Spamul va fi ucis pe mașina dvs.

Spamul va trece prin altele. și va fi ucis pe un server securizat

Schema I. Filtrarea corespondenței prin confirmarea corespondenței
(schema rigidă)

Cele mai grele dezavantaje critice ale acestei metode de filtrare sunt următoarele:

După ce am cântărit toate avantajele și dezavantajele, am decis să nu traduc Schema I în limba variantei 3.x. Cei care au nevoie de acest lucru o vor face fără probleme, urmând exemplul filtrelor enumerate în acest articol.







Articole similare

Trimiteți-le prietenilor: