Roskaamisen torjunta MediaWikissä

Linux.fista
Versio hetkellä 23. heinäkuuta 2009 kello 23.58 – tehnyt Heikki (keskustelu | muokkaukset) (→‎SpamBlacklist-lisäosa: linkki meidän spam-blacklist-sivulle)
Siirry navigaatioon Siirry hakuun

Wikien periaatteeseen kuuluu se, että kuka tahansa voi muokata wikin sisältöä. Tämä kuitenkin aiheuttaa joskus ongelmia, kun roskaajat yrittävät esimerkiksi parantaa sivujen sijoittumista hakukoneissa lisäämällä wikin sivuille linkkejä eri sivustoille. Erilaiset mainostajabotit aiheuttavatkin helposti paljon työtä wikien ylläpitäjille.

MediaWiki, yksi suosituimmista wiki-ohjelmistoista, sisältää monipuoliset roskaamisen torjuntaominaisuudet. Tässä artikkelissa käydään läpi tapoja, joilla roskaajabottien toimintaa voidaan estää. Suurin osa ohjeista perustuu tällä hetkellä Linux.fin ylläpitäjien käytännön kokemuksiin. Näillä toimenpiteillä on päästy tilanteeseen, jossa botit eivät käytännössä lainkaan roskaa Linux.fitä.

Anonyymien muokkausten esto

Yksi helppo tapa rajoittaa muokkaajabottien toimintaa on estää muokkaaminen sisäänkirjautumattomilta käyttäjiltä. Tämä onnistuu lisäämällä LocalSettings.php-tiedostoon rivi

$wgGroupPermissions['*']['edit'] = false;

Lisätietoja löytyy MediaWikin ohjeista.

Joissain wikeissä (kuten Linux.fissä ja Wikipediassa) tätä ei kuitenkaan ole otettu käyttöön, sillä monet asialliset käyttäjät haluavat muokata sivuja anonyymisti. Lisäksi jotkut botit osaavat rekisteröityä, jolloin anonyymien muokkausten esto ei niitä haittaa.

$wgSpamRegex

MediaWiki sisältää sisäänrakennetun roskantunnistajan, joka ei hyväksy muokkausta, jos se toteuttaa muuttujassa $wgSpamRegex-määritellyn säännöllisen lausekkeen. Säännöllisiä lausekkeita voi helposti lisätä muokkaamalla tiedostoa LocalSettings.php. Linux.fissä käytössä oleva määritelmä löytyy täältä.

Lisätietoja löytyy MediaWikin ohjeista.

SpamBlacklist-lisäosa

SpamBlacklist-lisäosa tarkistaa muokkaukset säännöllisillä lausekkeilla roskaa sisältävien URL-osoitteiden varalta. Jos jokin osoite toteuttaa roskaa määrittelevän lausekkeen, ei muokkausta hyväksytä.

Lisäosa asennetaan kuten muutkin MediaWikin lisäosat (katso lisätietoja artikkelista MediaWiki ja lisäosan kotisivulta). Säännöllisiä lausekkeita haetaan oletuksena Wikimedian yleisestä listasta sekä wikin sivuilta Järjestelmäviesti:Spam-blacklist‎ ja Järjestelmäviesti:Spam-whitelist‎ ("valkoinen lista", muualla määriteltyjen lausekkeiden kumoaminen). Wiki-sivut ovat kenen tahansa ylläpitäjän oikeudet omaavan käyttäjän muokattavissa. Muita lähteitä voi määritellä LocalSettings.php-tiedostoon lisättävässä $wgSpamBlacklistFiles-muuttujassa [1].

SpamBlacklist-lisäosa on käytössä Linux.fissä. Listalla olevat osoitteet löytyvät sivulta Järjestelmäviesti:Spam-blacklist.

Captcha

Captchalla tarkoitetaan menetelmää, jossa käyttäjän on vahvistettava olevansa ihminen kirjoittamalla generoidussa kuvassa olevat kirjaimet tekstikenttään tai suorittamalla määritelty laskutoimitus. Kuvasta tehdään yleensä sellainen, että kirjainten tunnistaminen siitä koneellisesti on hyvin haastavaa.

MediaWikiin on mahdollista lisätä Captcha-järjestelmä helposti esimerkiksi ConfirmEdit- tai reCAPTCHA-lisäosilla. Sen asetuksista voi säätää, millaiset muokkaukset edellyttävät tunnistautumista ihmiseksi. Usein tällaisiksi määritellään esimerkiksi anonyymit tai URL-osoitteita sisältävät muokkaukset.

Captcha ei ole käytössä esimerkiksi Linux.fissä eikä Wikipediassa, sillä se hankaloittaa joidenkin käyttäjien toimintaa.

SimpleAntiSpam-lisäosa

SimpleAntiSpam-lisäosa lisää muokkaussivuille tavalliselle käyttäjälle näkymättömän laatikon, jonka jotkut yksinkertaisimmat mainostusbotit täyttävät. Jos tämä laatikko on täytetty, muokkausta ei hyväksytä.

Tämä lisäosa on käytössä Linux.fissä.

Aiheesta muualla