nro 3/2003

Etusivulle /
Första sidan


Keskustele aiheesta

Diskutera
temat

Hyviä kokemuksia roskapostin suodatuksesta

Petri Ruokolainen, Oulun yliopisto

Roskapostista - spämmistä - on tullut todellinen ongelma viime aikoina. Oulun yliopiston postipalvelimissa on jo jonkin aikaa ollut mahdollista käyttää SpamAssassin - ohjelmistoa suodattamaan roskapostia. Yleisesti ottaen kokemukset ovat olleet erittäin positiivisia!

Koska lainsäädännön mahdollisuudet vaikuttavat vähintäänkin toivottomilta (roskapostin ja kaiken muun ei-toivotun sähköpostin lähettämisen rangaistavuus), on yksittäisen käyttäjän itse poistettava mahdolliset ei- toivotut viestit. Käsin tehtynä tämä aiheuttaa joka aamuisen ärsytyksen ja vihan, kun pahimmillaan postistaan joutuu seulomaan pois yli puolet, joskus jopa suurimman osan, että pääsee lukemaan asiallista postia!

Eräässä ennusteessa arvioitiin roskapostin määrän ylittävän muun sähköpostiliikenteen tänä vuonna. Viime vuoden joulukuussa määrä oli jo 30 prosenttia.

Yksi mahdollisuus on säätää postin lukuohjelmaa siten, että erilaisten sääntöjen perusteella posti luokitellaan ei-toivotuksi ja tuhotaan tai mahdollisesti siirretään ns. roskakoriin. Tämä lähestymistapa on mielestäni huono, erityisesti hitaampien yhteyksien päässä postejaan lukevalle, sillä kaiken postin joutuu hakemaan koneeseen, minkä jälkeen postiohjelma aloittaa seulonnan. (Kehittyneempiäkin versioita varmasti on olemassa.)

Esimerkiksi jos postiohjelman roskapostisuodatuksessa ei ole mitään automatiikkaa, voit joutua lisäilemään ei-toivottuja osoitteita, otsikoita yms. loputtomiin asti. Mielestäni tämä on turhaa, kun postin lajittelun voi tehdä jo postipalvelimella.

Postin suodatus postipalvelimella

Oulun yliopiston postipalvelimilla postin suodatus on toteutettu siten, että kukin saa itse asettaa suodattimen päälle helppokäyttöisen www-liittymän kautta (palvelimet eivät siis automaattisesti poista roskapostia. Tästä lisää myöhemmin.). Kun suodatin on asennettu, siirretään epäilyttävä posti omaan kansioonsa. Jo tällä perusasennuksella on päästy tilanteisiin, jolloin lähes kaikki roskaposti on saatu seulottua ilman että oikeaa postia on vahingossa tulkittu roskapostiksi. Tämän jälkeen käyttäjän tarvitsee vain ajoittain käydä tarkistamassa talteen kerätyt roskapostit omasta erillisestä kansiostaan. Tarkistaminen on tarpeellista koska mikään automaatti ei ole 100% varma ja oikeaakin postia saattaa joutua roskakoriin.

AOL - America On-Line - verkkopalvelu suodattaa käyttäjiltään jo yli miljardi roskapostia päivässä. Tämä vastaa noin 28 roskapostia käyttäjää kohden päivässä. Mutta heilläkin myönnetään, että äärimmäisen pieni osuus suodatetusta materiaalista on kuitenkin oikeaa postia.

Edellä mainittujen seikkojen takia ei roskapostia mielestäni kannata käyttäjiltä poistaa palvelintasolla. Jos yksittäisen käyttäjän postilaatikon seulonta on turhauttavaa, on usean tuhannen käyttäjän postin seulonta varmasti hirvittävä tehtävä. Myöskään kaikkien postien tarkistamista roskapostin varalta en kannata, sillä on myös monia käyttäjiä, joiden tunnuksille ei roskapostia tule. Tällöin tarkistukset kuormittaisivat postipalvelinta turhaan. Kädenväännön tältä osalta jätän muiden tehtäväksi. Pitäisikö konetehoa vain kasvattaa sitä mukaa kun liikennemäärät kasvavat roskapostin määrän lisääntymisen myötä?

SpamAssassin

SpamAssassin (SA) tutkii saapuneen viestin muutamalla eri tavalla, joista Oulun yliopiston postipalvelimilla käytössä on kaksi: otsikkokentän ja itse tekstin sisällön tutkiminen. SA pisteyttää kunkin osan tiettyjen kriteerien perusteella, kuten esimerkiksi otsikkokentästä puuttuvien ja/tai siihen väärennettyjen osien sekä sisältötekstin tiettyjen fraasien ja sanojen perusteella. Myös html-koodi tutkitaan ja pisteytetään. SA tunnistaa myös erilaisia ketjukirjeitä automaattisesti. Erilaisten postituslistojen mainosrivit myös voivat altistaa postin hylkäykselle. Mikään yksittäinen sana sinällään ei riitä postin hylkäämiseen vaan viestissä on oltava useampi epäkohta ennen kuin se hylätään.

Esimerkkinä: viestissä oli SA:n mielestä epäilyttävä sana: ennusTEEN, joten teinipornoahan siinä tietenkin oltiin levittämässä Yksinään tämä sana ei riitä postin hylkäykseen, mutta jos samassa viestissä on muitakin epäkohtia, voi tuo yksi sana riittää nostamaan viestin pisteytyksen yli hylkäysrajan.

Postituslistapalvelimet ovat oma joukkonsa, niiden tapauksessa kannatan kaikkien postien tarkistamista. Postimäärät ovat yleensä pienempiä ja jos suodatusta ei ole, monistaa listapalvelin yhden roskapostin pahimmillaan usealle tuhannelle henkilölle!

Suosittelen roskapostien suodatusta

Tilanteeseen sopivalla tavalla tehtynä se helpottaa loppukäyttäjän päivittäistä postin lukua huomattavasti. Lainsäädännön mahdollisuuksiin roskapostin vähentämisen suhteen olen hyvin skeptinen, joten ainakin toistaiseksi on vain käytettävä hyväksi havaittuja keinoja tämän ongelman kanssa selviytymiseen.


Etusivulle / Första sidan