Eesti infoühiskonna aastaraamat 2011/2012. Karin Kastehein
Чтение книги онлайн.
Читать онлайн книгу Eesti infoühiskonna aastaraamat 2011/2012 - Karin Kastehein страница 4
• meteoroloogia, keskkonnainfo,
• ruumiandmed.
Avalikustatav andmehulk võib tehnilises mõttes olla nii kogumik inimloetavaid tekstifaile (näiteks seaduste või määruste, ametlike teadete või lepingute kogu) kui ka masinloetavaid andmeid (näiteks csv- või xml-vormingus failideks eksporditud andmebaas või veebiteenus, mis võimaldab otsida ja alla laadida kõiki andmeid näiteks json- või xml-vormingus).
Andmehulk on tehnilises mõttes inimloetavate tekstifailide kogumik
Kasutaja peab saama:
• sirvida ja otsida avalike andmehulkade seast endale huvipakkuvat kogu;
• laadida leitud andmehulk tervikuna või teenuste pakutud otsisüsteemi kaudu osadena kohe alla, ilma et ta peaks selleks läbirääkimisi pidama või paroole hankima. Erandina võib andmehulga laadimine olla tasuline;
• kasutada andmekogu edaspidi vabalt, õigusega see tervikuna enda arvutisse laadida ja kasutada oma rakendustes (nii tasuta kui ka tasulistes), ilma et ta peaks selle eest (täiendavalt) maksma või et tal oleks selleks vaja luba.
Kusjuures andmehulka looval ja avalikustaval avaliku sektori asutusel pole kohustust pakkuda andmete kasutajatele lisamugavusi, näiteks talle sobivasse vormingusse konverteerimist, spetsiaalsete võrguteenuste ehitamist, tõlkimist vms. Samuti ei ole ametkonnal kohustust tagada andmete korrektsust ega ajakohasust. Selle asemel peab avalikustaja selgitama lühidalt andmete olemust ja panema kirja nende oodatava ajakohastamise sageduse.
Andmehulga litsents ja tasu. Avaandmete hulgal peab olema litsents, mis võimaldab seda vabalt ja piiranguteta kasutada, töödelda ja levitada, kusjuures kasutaja valikul nii tasuta kui ka tasu eest. Konkreetselt soovitame litsentsiks valida creative commons’i litsentsi11. Seal loetletud litsentsidest soovitame eeskätt CC by 3.0 litsentsi12. See tähendab, et oma teost litsentsides on litsentsiandjaks autor või autoriõiguste omaja, litsentsisaajaks aga üldsus. Teil on õigus teost kopeerida (reprodutseerida), levitada, esitada ja üldsusele suunata ning teha sellest kohandusi (adaptsioone), arranžeeringuid ja teisi töötlusi, sh tuletatud teoseid tingimusel, et viitate autorile.
Avaandmed avalikustatakse soovituslikult tasuta allalaadimiseks, kuid selleks seadusega ettenähtud juhtudel on avalikustajal õigus nõuda andmete laadimise eest tasu.
Andmehulga avalikustamise põhimõtted. Andmehulga avalikustamise juures tuleb otsida kompromissi kahe eesmärgi vahel:
• andmete mugav kasutatavus ja arusaadavus andmete otsijale ja allalaadijale,
• andmete avalikustamise lihtsus ja avalikustaja töökulu minimeerimine.
Selleks tuleb esimese asjana leida kõige lihtsam, odavam ja kiirem viis olemasolevaid andmeid sellisena avalikustada ja alles seejärel uurida viise, kuidas luua mugavusi nii otsijale kui ka allalaadijale. Teisisõnu, andmete täiustamine, konverteerimine jms tööd tuleb ette võtta alles siis, kui andmehulk on juba esialgsel kujul avalikustatud.
Andmeid võib täiustada ja konvertida ka kolmas osapool, kes omakorda saab neid andmeid kas tasuta või tasu eest edasi jagada. Avatud andmehulk vastab järgmistele nõuetele13.
Tim Berners-Lee formaaditasemete soovitus kruusil
http://www.cafepress.com/w3c_shop
1. Terviklus. Kõik avalikud andmed tehakse kättesaadavaks. Selle alla loetakse kõik andmed, millele ei kehti isikuandmete jm piirangud.
2. Pärit algallikast. Andmed on töötluseta kogutud algallikast, säilitades oma originaalkuju ja detailsuse. Nagu andmekogudegi puhul, pole lubatud andmete võtmine teisesest andmekogust.
3. Ajakohasus. Andmehulk on avaldatud võimalikult kiirelt, et säilitada selle asjakohasus.
4. Kättesaadavus. Andmed on saadavad võimalikult laiale kasutajateringile võimalikult laia kasutuseesmärgiga.
5. Masinloetavus. Andmed on mõistetava struktuuriga ja automaatselt töödeldavad.
6. Diskrimineerimise vältimine. Andmed on esitatud avalikult, kättesaamiseks pole vaja registreeruda ega taotleda juurdepääsu.
7. Avatud standardite kasutamine. Andmed on esitatud avatud vormingus, mis ei ole ühegi ettevõtte ega isiku ainuomand.
8. Vaba litsents. Andmed ei ole kaitstud autoriõiguse, patendi, kaubamärgi ega ärisaladuse seadustega. Mõistlikud privaatsus- ja turvalisuspiirangud on lubatud.
Kuidas avalikustada?
Mis vormingus? Peamise põhimõttena arvestame, et palju parem on avaldada andmed ebamugavas kodeeringus, kui jätta need esialgu avaldamata põhjusel, et millalgi on plaanis võtta ette kodeeringu täiustamine. Teiseks, avaldatud andmehulka saab edaspidi avaldada uues, paremas kodeeringus.
Soovitame lähtuda vormingute ja kodeeringute kasutajasõbralikkuse hindamisel Tim Berners- Lee viie tärni süsteemist14, kus suurem tärnide arv tähendab kasutajale paremat vormingut/kodeeringut. Eesti oludes võiks vormingute jaotus olla järgmine:
* andmed on veebist kättesaadavad mis tahes vormingus (nt .jpg, pdf, doc, docx, xls). Andmeid pole võimalik failist eraldada või on esitatud omanduslikele tarkvaradele orienteeritud vormingutes;
** andmed on veebisaidil avatud vormingus (nt .txt, html, odt), kuid struktureerimata kujul;
*** andmed on veebisaidil esitatud avatud ja vabas struktuurset esitust tagavas vormingus (nt .csv, xml, ods);
**** andmetes olevaid objekte identifitseeritakse URIdega15;
***** andmed on URIde abil lingitud teiste andmetega.
Andmehulga avaldamiseks sobivad eeskätt vormingud, mida on võimalik avada ja töödelda vabavaraliste rakendustega. Selliselt on töödeldavad näiteks odt-vormingus dokumendifailid, samuti struktuursete andmete levinuimad vormingud .csv, json, xml.
Olukord Eestis
Eestiski on tekkinud arvestatav poliitiline tahe muuta avaliku sektori teave enam taaskasutatavaks. Nii on valitsusprogrammi16 jaotises „E-riigist I-riigiks“ alalõik „Riigi e-varade andmine kodanike ja ettevõtete teenistusse“ pühendatud avaandmetele. Valitsusprogramm lubab sõnaselgelt:
• teeme riigi ruumiandmed töödeldaval kujul avalikuks – see annab kodanikele ja ettevõtetele võimaluse ise luua riigi andmete põhjal otstarbekaid teenuseid;
• läbipaistvuse ja kaasatuse suurendamiseks ning erasektori ergutamiseks uute rakenduste loomisele muudame avalikud ehk riigi ja kohalike omavalitsuste andmed masinloetavaks (machine-readable public data);
• seame sihiks, et era- ja avaliku sektori koostöös loodud andmekogud oleksid ettevõtetele ja eraisikutele arendamiseks kättesaadavad.
Eestis tegutseb avatud
11
http://creativecommons.org
12
http://creativecommons.org/licenses/by/3.0
13
http://www.opengovdata.org/home/8principles
14
http://lab.linkeddata.deri.ie/2010/star-scheme-by-example
15
http://en.wikipedia.org/wiki/Uniform_resource_identifier
16
https://valitsus.ee/UserFiles/valitsus/et/valitsus/tegevusprogramm/valitsuse-tegevusprogramm/Valitsusliidu_programm_2011-2015.pdf