Wojna ze spamem: jak to robią polskie portale?

Nikomu, kto na co dzień korzysta z Internetu, nie trzeba uświadamiać, jak dokuczliwe może być zjawisko spamu. Normą stały się poranki, spędzane na czyszczeniu skrzynek pocztowych z zalewu niechcianych wiadomości. Na szczęście, ostatnie statystyki firmy Message Labs wskazują na to, iż coraz większa ilość spamu jest przechwytywana, jeszcze zanim dotrze do adresata. W obliczu takich informacji postanowiliśmy zatem dowiedzieć się, jak największe, polskie portale internetowe oferujące konta e-mail, zabezpieczają swoich użytkowników przed codziennym atakiem 'nieproszonych gości'.

Według szacunków Brightmail's Probe Network, spam w 2004 roku stanowić ma ok. 65% całej korespondencji elektronicznej. Same statystyki z ubiegłego miesiąca są zatrważające: na 93 miliardy przefiltrowanych przez Brightmail's Probe Network wiadomości, 58,6 miliarda zostało zaklasyfikowanych jako spam. Wszystkie te niechciane wiadomości, według Yankee Group, rocznie pociągają za sobą straty w wysokości 4 miliardów USD, wynikające z utraty produktywności. Wydaje się, iż w obliczu takich liczb, niezwykle ważne jest zapewnienie możliwie jak najwyższej skuteczności zabezpieczeń antyspamowych portali internetowych oferujących konta pocztowe (w szczególności darmowe, które przyciągają najszerszą rzeszę użytkowników). Przepytaliśmy zatem przedstawicieli największych polskich portali internetowych, co mają do zaoferowania użytkownikom swoich kont pocztowych w zakresie ochrony przed zalewem niechcianych wiadomości. Oto co nam powiedzieli:

Piotr Tchórzewski (ONET.PL): "W użyciu są trzy poziomy zabezpieczeń:

1. Pewnego rodzaju czarna/biała lista na poziomie całego systemu OnetPoczty, tworzona zarówno ręcznie, jak i automatycznie. Jej działanie polega na blokowaniu domen/hostów uznanych przez nas za źródła spamu;

2. Onet AntySpam - czyli pierwszy na taką skalę zastosowany system segregacji poczty na dobrą i złą, wykorzystujący technologię bayesiańską; decyzje konkretnych użytkowników służą jako źródło zasilania bazy tego oprogramowania, choć OnetAS działa globalnie dla wszystkich, którzy włączyli sobie ten system.

3. Czarne i białe listy definiowane przez konkretnych użytkowników dla ich własnych skrzynek.

Dla użytkownika przede wszystkim liczy się skutek końcowy - czyli skuteczność działania oprogramowania: ile spamu przecieka, a ile jest wadliwych rozpoznań (false positives = list dobry, oznaczony jako spam). Pod tym względem OnetAS działa podobnie dla każdego konta. Jednak technologia użyta do osiągnięcia efektu różni się zależnie od klasy konta pocztowego - dlatego możemy mówić o czymś takim jak "OnetAS MAX/Biznes". Kryją się za tym nieco odmienne infrastruktury i sposoby działania oprogramowania. I wreszcie naprawdę bardzo dużo zależy od aktywności indywidualnego użytkownika. Jeśli pracowicie wskazuje systemowi to, co spamem jest (klawisz 'to JEST spam' w interfejsie http://poczta.onet.pl ) tym szybciej OnetAS zostanie nauczony nowego rodzaju spamu i jego skuteczność będzie wzrastać."

Andrzej Butkiewicz (WP.PL): "Administratorzy Poczty Wirtualnej Polski stosują kilka poziomów zabezpieczeń. Każdy e-mail adresowany do użytkownika WP zanim dotrze do skrzynki pocztowej poddawany jest serii analiz. Sprawdzamy wiarygodność adresów IP oraz 'from', z których został wysłany. Następnie specjalne oprogramowanie wykorzystujące algorytmy heurystyczne analizuje całą wiadomość w poszukiwaniu cech charakterystycznych dla przesyłek spamowych. Dzięki wykorzystaniu rozproszonych baz danych cech spamu mamy pewność, że wiadomość sklasyfikowana 'przed chwilą' przez inny system pocztowy (np. za granicą) jako spam nie zostanie wpuszczona na konta użytkowników poczty WP. Dodatkowo, jako uzupełnienie powyższych mechanizmów mogę polecić użytkownikom stosowanie indywidualnych, samouczących się, systemów antyspamowych wbudowanych w popularne programy pocztowe."

Krzysztof Sierota (O2.PL): "Mechanizmy antyspamowe starego typu polegały na tworzeniu czarnych list adresów IP lub domen, z których często rozsyłany był spam i blokowania tych adresów. Niestety powodowało to dużą ilość tzw. false positives - listów, które były listami "niewinnych użytkowników", a były odrzucane. Dodatkowo, w ostatnim okresie spamerzy zaczęli korzystać z rozprzestrzeniających się wirusów, które umożliwiały przejęcie kontroli nad zawirusowanymi komputerami. Osoby rozsyłające spam korzystają wiec obecnie często z tysięcy komputerów nieświadomych niczego użytkowników. Z tego powodu, prowadzenie listy adresów IP komputerów rozsyłających spam stało się praktycznie bezcelowe. Inna grupa systemów, które przy filtrowaniu spamu używały konkretnych fraz z listów spamowych przypominały praktycznie walkę z wiatrakami (należało ręcznie dodawać zakazane słowa do listy) i również powodowały dużą liczbę false positives.

Rozwiązaniem, które od kilku miesięcy podbija rynek i wydaje się funkcjonować najlepiej, są samouczące się systemy oparte na statystycznej analizie treści listów. Tzw. filtry Bayesowskie (bayesian filters). Szacują one prawdopodobieństwo tego, że list jest spamem na podstawie znajdujących się w nim słów. Przystosowują się dodatkowo do listów danego użytkownika i uczą na bieżąco na podstawie nadchodzącej korespondencji, przez co same się dostosowują do zmieniających się listów spamerskich (same się uczą). Charakteryzują się przy tym bardzo wysoką skutecznością i jednocześnie bardzo małą ilością tzw. false positives. Skrzynki pocztowe o2.pl / tlen.pl są chronione przez filtr tego typu, co gwarantuje jego wysoka skuteczność. Filtry tego typu są obecnie najbardziej zaawansowanym i najskuteczniejszym sposobem na walkę ze spamem. Opcja ta jest darmowa dla wszystkich osób korzystających ze skrzynek pocztowych w naszym portalu."

Mariusz Kuziak (INTERIA.PL): "Już od dłuższego czasu najbardziej skuteczną metodą ochrony przed spamem wydaje się być prewencja - stosowanie się przez użytkownika do kilku zasad, dotyczących ujawniania swojego adresu e-mail i zamieszczania go w ogólnodostępnych miejscach. Wszystkie inne techniki antyspamowe są tak naprawdę próbami 'leczenia' istniejącej już choroby, a to - jak wiadomo - bywa uciążliwe i w przypadku spamu rzadko kiedy prowadzi do całkowitego ozdrowienia. Z metod 'leczniczych' ochrony przed spamem najbardziej skuteczne obecnie są różnego rodzaju rozwiązania oparte o zaawansowane techniki filtrowania, działające zarówno na poziomie serwera, jak i klienta pocztowego.

Zabezpieczenia antyspamowe kont pocztowych w portalu INTERIA.PL to autorskie rozwiązanie naszych pracowników, powstałe w części w oparciu o filtry bayesiańskie. System zapewnia trójstopniową ochronę antyspamową: odrzuca przesyłki nadchodzące z domen i adresów IP często wykorzystywanych do rozsyłania niechcianej korespondencji oraz selekcjonuje pocztę na dwóch niezależnych poziomach filtrowania. Filtr Globalny to dostępny dla wszystkich użytkowników mechanizm selekcji poczty, którego struktura logiczna zasilana jest różnymi przykładami spamu na bieżąco, centralnie dla całego systemu. Filtr Prywatny z kolei, dostępny tylko dla użytkowników kont płatnych, to z kolei inteligentny system, który może być 'uczony' rozpoznawania spamu bezpośrednio przez użytkownika. Nasze kilkumiesięczne doświadczenia z obecnym systemem, który zastąpił poprzednio istniejące zabezpieczenia antyspamowe, przekonują że mechanizm bardzo dobrze radzi sobie nawet z ostatnimi trikami spamerów. Konstrukcja systemu może też przyczynić się do wypisywania naszych użytkowników ze spamerskich list adresowych."

Rafał Stefanowski (HOGA.PL): "Do ochrony przed spamem HOGA.PL używa na swoich serwerach poczty mechanizmów opartych o listy RBL oraz system skanowania listów pod względem zawartych w nich słów kluczowych. Listy serwerów RBL są aktualizowane na bieżąco i tym samym mechanizm oparty o nie jest wysoce skuteczny. Skanowanie treści listu pod względem występującym w nim słów jest bardzo przydatne, szczególnie w przypadku powtarzających się zwrotów i wyrażeń. Jako mechanizm antyspamowy sprawdza się bardzo dobrze. HOGA.PL posiada również filtry antyspamowe, oparte o funkcje statystyczne opracowane przez Thomasa Bayesa zwane filtrami Bayesa, niemniej jednak ten sposób ochrony jest w chwili obecnej w fazie testów i nie wszystkie konta są przez niego chronione. Aby uniknąć zbędnego obciążenia serwera przychodząca, poczta filtrowana jest już na poziomie dialogu SMTP, jednakże każdy użytkownik może we własnym zakresie włączać i wyłączać poszczególne filtry na swoim koncie, tym samym może otrzymywać listy nie filtrowane."

Artur Niewrzędowski (GAZETA.PL): "Obecnie stosujemy kilka zabezpieczeń - dotyczą one naszej bezpłatnej poczty: SPAM KILLER - prosty filtr, który po otwarciu skrzynki pocztowej (przez interfejs WWW) przegląda pocztę pod kątem adresu nadawcy. Jeśli adres nadawcy jest zgodny z tym co wpisał użytkownik - podejmowana jest akcja na jaką użytkownik sie zdecydował (np: przeniesienie do wyspecyfikowanego folderu lub skasowanie poczty). Mamy dodatkowo nową usługę: ANTYSPAM - każda nadchodząca przesyłka jest odpowiednio oznaczana w zależności od tego jak mocne jest podejrzenie o spam (dokładany jest dodatkowy nagłówek). Funkcja dostępna jest zarówno z interfejsu WWW jak i klienta pocztowego. Mechanizm oparty jest na sygnaturach spamu (podobnie jak w przypadku serwerów antywirusowych). Sygnatury są periodycznie updatowane."

Z powyższych wypowiedzi można wywnioskować jednoznacznie, iż sukces walki ze spamem zależy w głównej mierze od połączonego wysiłku kilku rozwiązań (systemy ochrony antyspamowej na serwerach kont pocztowych, zintegrowane mechanizmy antyspamowe popularnych klientów pocztowych). Duży wpływ ma też działanie samego użytkownika - rodzaj posiadanego oprogramowania antyspamowego, klienta pocztowego, a także niefrasobliwość w otwieraniu przesyłek nieznanego pochodzenia. Warto przy tej okazji wspomnieć, iż licho nie śpi, a dobitnym tego przykładem mogą być ostatnie doniesienia o wyprowadzaniu w pole mechanizmów antyspamowych zaimplementowanych w najnowszej odsłonie klienta pocztowego Microsoftu - Outlooku 2003 (pisaliśmy o tym szerzej w artykule "Spamerzy przechytrzają Outlooka 2003" - http://www.pcworld.pl/news/65368.html ). Mechanizm ten oparty jest również o wspomniane wyżej filtry Bayesowskie. To daje wiele do myślenia. A jaka jest Wasza opinia na temat skuteczności zabezpieczeń antyspamowych kont pocztowych? Czekamy na opinie i komentarze.


Zobacz również