Statistiline andmeteadus ja visualiseerimine MTMS.01.100     Praktikumid     Projektid

Kas seadused on läinud aina keerulisemaks?

Ville Sokk

Projekti eesmärk oli uurida kas Eesti seaduste tekst on aastate jooksul keerulisemaks läinud. Seaduste loetavus on oluline, sest seaduste järgimiseks peab kodanikel olema võimalik seadusi lugeda ja neist aru saada. Eriti puudutab see neid, kelle jaoks eesti keel pole emakeel.

Analüüs

Vaatleme alustuseks mõningaid näiteid seadustes toimunud muudatustest. Näiteks karistusseadustiku esimese kahe redaktsiooni (jõustunud 01.09.2002 ja 24.10.2002) vahel muutus § 44 lõik 8 järgnevalt.

Vana:

Juriidilisele isikule võib kohus mõista rahalise karistuse viiskümmend tuhat kuni kakskümmend viis miljonit krooni. Rahalise karistuse võib juriidilisele isikule mõista ka lisakaristusena koos sundlõpetamisega.

Uus:

Juriidilisele isikule võib kohus mõista rahalise karistuse viiskümmend tuhat kuni kakssada viiskümmend miljonit krooni. Rahalise karistuse võib juriidilisele isikule mõista ka lisakaristusena koos sundlõpetamisega.

Ehk siis muutus seaduse sisu (karistuse määr). Karistusseadustiku 01.01.2006 ja 01.02.2007 redaktsioonide vahel muutus § 53 järgnevalt.

Vana:

Mõistes isiku süüdi kuriteos ja karistades teda üle kolmeaastase või eluaegse vangistusega, võib kohus seaduses sätestatud juhtudel mõista lisakaristusena tasumiseks summa, mille suurus võib ulatuda süüdimõistetu kogu vara väärtuseni.

Uus:

(1) Mõistes isiku süüdi kuriteos ja karistades teda üle kolmeaastase või eluaegse vangistusega, võib kohus seaduses sätestatud juhtudel mõista lisakaristusena tasumiseks summa, mille suurus võib ulatuda süüdimõistetu kogu vara väärtuseni.

(2) Varalist karistust võib mõista lisakaristusena kuritegude eest, mis on toime pandud enne 2007. aasta 1. veebruari.

Ehk siis seadust täiendati. Mõnikord võib esineda ka seadustes mingite lõikude lihtsustamist. Näiteks töötuskindlustuse seaduse 01.05.2009 ja 01.07.2009 redaktsioonide vahel muutus § 9 lõik 7 järgnevalt.

Vana:

Töötuskindlustushüvitise suurust kalendriaasta vahetumisel ega töötutoetuse päevamäära muutumisel ümber ei arvutata.

Uus:

Töötuskindlustushüvitise suurust kalendriaasta vahetumisel ümber ei arvutata.

Edaspidi kasutame keerukuse hindamiseks Automated Readability Index meetodit, mille alusel peetakse halvasti loetavaks tekste, milles on palju lauseid või pikad sõnad. Mida kõrgem on indeks, seda raskemini loetav on tekst. Keerukuse valem on:

Tekstide lauseteks segmenteerimiseks kasutati Kristian Kankaineni loodud tarkvara Lausestaja.

Vaatame Riigi Teataja veebilehel kuue erineva valdkonna seaduse loetavuse muutumist läbi aja. Tulemused on kajastatud järgneval joonisel.

Jooniselt on näha, et üldiselt seaduste keerukus ei tõuse. Huvitavamad on põhiseadus ja liiklusseadus. Põhiseadus on teistest seadustest loetavam. Liiklusseadus on vahepeal ümber kirjutatud, millest on tingitud järsk tõus. Näiteks võib võrrelda 2010 septembris jõustunud versiooni 2011 juulis jõustunud versiooniga. Käibemaksuseadus on eriti keeruline. Kui me võrdleme põhiseaduse ja käibemaksuseaduse kehtivate redaktsioonide suhteid sümbolite/sõnad ja sõnad/laused, siis on need näitajad vastavalt 7.0, 11.0 ja 7.6, 32.1, mis tähendab, et käibemaksuseaduses on eriti pikad laused. Nende tulemuste põhjal pigem ei järeldaks, et seadused muutuvad aja jooksul keerulisemaks kuigi võib esineda ka erandeid nagu liiklusseadus.

Selleks, et paremini tajuda Automated Readability Indexi hindeid, on järgneval joonisel võrreldud seaduste hinnete jaotust muud tüüpi tekstide hinnete jaotustega. Ajakirjanduse kategooria tekstide seas on 24 maikuus Postimehe veebikeskkonnas ilmunud artiklit, doktoritööde kategoorias on 66 doktoritööd ja ilukirjanduse kategoorias 80 ilukirjanduslikku teost. Doktoritööd ja ilukirjanduslikud teosed pärinevad Tartu Ülikooli arvutilingvistika uurimisrühma doktoritööde ja ilukirjanduse korpustest.

Ilukirjanduslikud tekstid on kõige loetavamad. Neile järgnevad doktoritööd, Postimehe artiklid ja seadused. Seaduste ja Postimehe artiklite keskmiste hinnete (23 ja 20) erinevus on suhteliselt väike. See erinevus on küll statistiliselt oluline, aga kas see annab põhjust seaduste keerukuse üle muretsemiseks?

Puudused

Automated Readability Indexi täpsuse üle on vaieldud. Alternatiivsed meetodid loetavuse hindamiseks, näiteks Flesch-Kincaid Grade Level, kasutavad silpide ja sõnade arvu suhet, mitte sümbolite ja sõnade arvu suhet. Sellise meetrika kasutamiseks on aga vaja eestikeelsete sõnade silbitamise tarkvara.

Seaduste puhul on oluline ka nendest aru saamine. Pole usutav, et loetavus seda väga hästi hindaks. Teksti arusaadavuse masinlik hindamine on ilmselt mittetriviaalne probleem, aga võimaldaks julgemaid järeldusi teha.

Allikad