esmaspäev, 19. oktoober 2020

ANDMETE VISUALISEERIMISEST

 SISSEKANNE # 133


Andmete visualiseerimine on infoühiskonna  kommunikatsioonipraktika üks komponente, mille eesmärgiks on muuta statistilised või muud algandmed arusaadavaks ja seeläbi kasutatavaks. Andmete põhiaspektide esiletoomine toimub nende visuaalse kujutamise abil, kasutades ära inimese nägemistaju võimekust (www.wikipedia.org).

Põhimõtteliselt tähendavad visualiseeritud andmed andmetöötlusprotsessi lõppresultaati. See algab teatavasti tohutu amorfse andmemassiiviga kuskil repositooriumis, millel iseenesest ei ole mingit tähendust, peale selle, et nad on olemas. Seejärel toimub nende sisestamine andmebaasidesse, mis siinkirjutaja arvates on esimene eesmärgistatud etapp andmete mõtestamiseks; sisuliselt on see andmekaeve – kui paralleele otsida päriskaevandusest, siis ka see on üsna must, raske, koormav töö. Andmebaasidest muudetakse andmed informatsiooniks, mis avaldub tabelite, skeemide, diagrammidena.  Nende kaudu joonistuvad välja mustrid ja mallid, saame hakata tegema andmepõhiseid järeldusi, neid klassifitseerides ja kategooriatesse jagades.  Siin on juba suur kvalitatiivne hüpe andmete väärtusloomes. Sellest üks samm edasi ongi andmete visualiseerimine, mis annab andmete kasutajale selge pildi. Ja mitte ainult – ka esteetilise naudingu (vt. Pullannagari, 2008).

Nii nagu andmekaeve kui protsess pole uus nähtus, ei ole seda ka andmete visualiseerimine, ehkki tänapäeva konteksti ülekantuna on need moodsad tehnoloogiad ja meetodid. Kui Galileo Galilei vaatles Jupiteri kuid, siis tegi ta märkmeid - esialgu käsikirjaliselt otse vaatluspaigal, seejärel visandas ta nende vaatlusandmete põhjal joonised, ehk visualiseeris nähtu, s.t. muutis oma andmed arusaadavaks teistele. See on näide varasest andmete visualiseerimisest (Goodman et al, 2018). Digitehnoloogiline areng aga võimaldab meil andmeid maksimumi lähedaselt kasutada; õigupoolest loob see lausa kohustuse murda välja andmerägastikust, mille lahtikodeerimine nõuab spetsiifilist taipu, ning muuta need n-ö. glamuurseks, et nendega silmitsisattumine ei tekitaks tavainimeses tõuke-, vaid just nimelt tõmbeefekti.

Meenutan siinkohal ühte seika omaenda elust, mille üle olen ma korduvalt mõtisklenud. Kunagi vaidlesin ühe statistikatudengiga, kes tõsimeeli väitis, et lähimas tulevikus ei ole enam ajaloolasi vaja, sest kõik andmed sisestatakse superarvutitesse, mis analüüsivad ja töötlevad sisendit ning esitavad väljundina kokkuvõtte soovitud teemal. Arvuti ei eksi, kui andmed on õiged, ja on sooneutraalne, erapooletu, eelarvamusteta.

„Aga ajaloo tõlgendamine, kontekstuaalne lähenemine, mängu ilu – kuidas sellega jääb!“ karjatasin ma ja sain vastuseks statistikuhakatise jääkülma nendingu: „Ajaloolastele jäävad emotsioonid, aga meil on argumendid.“  Edasi arvas ta, et ajaloolased tegelevad müütide loomisega ja nende dekodeerimisega, samas kui statistikute roll on demüstifitseerimine.  Nüüd, aastaid hiljem mõtlen, et ega ta midagi valesti ei öelnudki. Digihumanitaaria flirdib kõvasti statistikaga. Võtame Voltaire’i korrespondentsi, sisestame arvutisse adressaadid ja saame valgustusajastu tippharitlase suhtevõrgustiku, mis räägib meile ainuüksi visuaalis juba nii mõndagi. Üks pilt räägib rohkem kui tuhat sõna – vana käibetõde. Kas ajaloolane ilma arvutita suutnuks jõuda samaväärse tulemuseni? Muidugi, aga ainult suure töö ja vaevaga ning tohutu ajaga. Illustratsiooniks olgu järgmine pilt, mille laenasin digihumanitaaridelt ja mis kuulub Oxfordi ülikooli juures tegutseva Electronic Enlightenment Projecti portfooliosse.

Foto 1 Voltaire kirjavahetuse võrgustik, 1775-1776 (Electronic Enlightenment Project, University of Oxford / Marek Tamm, TLÜ)

See on üks näide visualiseeritud andmetest humanitaarteaduste kontekstis. Kirjavahetusest on digitehnoloogiliste vahendite abil sündinud pilkupüüdev visuaal, mis oma autentses virtuaalkeskkonnas lisaks ka pulseeris. Vene-Ameerika kultuurianalüütik Lev Manovich on mitmes essees tähelepanu juhtinud visualiseeringute olulisusele, kuidas näiteks instagrami fotode põhjal, kasutades nende metaandmeid, sünnib midagi ägedat, elamuslikku ja seejuures ka teaduslikult analüüsitavat. See on teatud mõttes teadusliku mõtteviisi rakendumine kaasaegses, uues kunstikeeles. Aga kui küsida, kas andmete visualiseeringut võib sel juhul vaadelda moodsa kunsti vormina, siis oleks minu vastus eitav, kuna see põhineb rangelt etteantud andmetel, mis töötluse kaudu on muundatud teabeks – ja andmete visualiseering omakorda aitab seda populariseerida, üldsuse teadvusesse kanda.

Manovich oli kaastegev nn Phototraili projektis (foto 2), kus tuhandete insta-fotode abil loodi maailmalinnade visuaalsed signatuurid. Seda võib vaadelda kunstina, kuid selle taga on andmed, andmed ja veelkord andmed.

Foto 2 Maailmalinnade visuaalsed signatuurid (Manovich.net / Phototrails.net)

 

Andmete visualiseerimine on ka statistikaametite uus köitev niśs. Isegi konservatiivne Saksa Statistikaamet (Statistisches Bundesamt), millelt võib eeldada purukuiva tabelimajandust, pöörab rõhku visualiseerimisele. Visualiseerimise tööriistu populariseerib oma veebilehel näiteks Majandusliku Keerukuse Vaatluskeskus (OED, Observatory of Economical Complexity) - tõepoolest, andmed muudetakse atraktiivseks. Kõige krooniks on Euroopa Liidu institutsionaalne statistikabüroo Eurostat, kus võib leida mitmeid huvitavaid visualiseerimise tööriistu.  Tõsi, mööndakse, et kõik uued visualiseerimise meetodid ei ole veel teaduslikult aktsepteeritud, kuid need esitletakse ikkagi kui perspektiivset tulevikuvõimalust, näitamaks kogu seda võimaluste arsenali, mida andmevisuaal võimaldab.  Näiteks saame võrrelda end lihtsa visualiseeringu abil naabritega - milline on meie SKP kümne aasta jooksul. Kahtlemata saame sarnase pildi ka Eurostati andmebaasist kätte, kuid see eeldab meilt põhjalikku süübimist andmeisse, kaevumist tabelite rägastikku ja aega, mida meil alati napib. Kuid selline visualiseerimise vahend, nagu fotolt 3 nähtub,  genereerib üldpildi kiiresti ja turvaliselt. Tehnoloogia teeb meie eest ära suure töö, me saame lihtsa pildi hetkega. Selle taga on loomulikult algandmed, andmekaeve ja töötlemise protsess.



Foto 3 Andmevisualiseeringu näide Eurostatilt (ec.europa.eu/eurostat/cache/bcc/)

 

 

 Allikad

·         Goodman, A.A., Borkin, M.A., Robitaille, T.P. (2018). New Thinking on, and with, Data Visualization. arXiv e-prints, Pp. arXiv:1805.11300.

·         Pullannagari, D. (2008). Bibliography Data Mining and Data Visualization. Master’s Projects. Paper 107. Retrieved from https://www.researchgate.net/publication/221027352_Data_Mining_and_Data_Visualization.

·         Remmel, R. (2019, 9. okt). Repliik 6. Ajaloolane ja statistik. Loetud aadressilt: http://raidor75.blogspot.com/2019/10/repliik-6-ajaloolane-ja-statistik.html.

·         Eurostat. (n.d.). Vaadatud aadressilt: https://ec.europa.eu/eurostat.

·         Manovich.net. (n.d.).Vaadatud aadressilt: http://manovich.net/index.php/about.

·         Phototrails.net. (n.d). Vaadatud aadressilt: http://phototrails.net/instagram-cities/.

·         Saksamaa Statistikaamet/Statistisches Bundesamt. (n.d). Vaadatud aadressilt:  https://www.destatis.de/

·         The Observation of Economic Complexity. (n.d.). Vaadatud aadressilt  https://oec.world/en/

·         Vikipeedia (2019, 18. okt). Andmete visualiseerimine. Loetud aadressilt: https://et.wikipedia.org/wiki/Andmete_visualiseerimine.

Kommentaare ei ole:

Postita kommentaar