kolmapäev, 16. oktoober 2019

LEV MANOVICH, KULTUURIANALÜÜS JA KULTUURIANDMED

SISSEKANNE # 68

http://manovich.net/



1960. a. sündinud Moskvas sündinud ja 1981. a. Ühendriikidesse emigreerunud Lev Manovich on mitme kõrgkooli juures tegutsev väljapaistev arvutiteaduse professor ning uue meedia ja digitaalkultuuri teoreetik, kelle huviorbiidis on kaasaegne globaalkultuur läbi andmeteaduste uurimisprisma, samuti arvuti- ja sotsiaalteaduste kokkupuuteala, tehisintellekt ja -kultuur ning meediateooria. 2005. aastal võttis ta kasutusele termini „kultuurianalüüs“ (cultural analytics) ja 2007. aastast tegutseb tema juhtimisel kultuurianalüüsi labori (Cultural Analytics Lab) nime all tuntud uurimiskeskus, millelt on tellinud kultuuriartefakte koondavate andmekogude visualiseeringuid nii Google, New Yorgi avalik raamatukogu kui ka sealne moodsa kunsti muuseum MoMA (Manovich.net, kuupäev puudub).

Lev Manovich määratleb kultuurianalüüsi kui „massiliste kultuuriandmekogumite ja -voogude analüüsi arvutus- ja visualiseerimistehnikate abil“. Teaduslaboris püütakse nii teoreetiliselt kui praktiliselt vastata küsimustele, kas kultuur esitab andmeid, milliseid ainulaadseid võimalusi pakub suurte kultuuriandmete andmeanalüüs, erinevalt humanitaar- ja ühiskonnateaduses kasutatavatest kvalitatiivsetest meetoditest, kuidas kvantitatiivseid meetodeid kasutada kaasaja võtmekultuurivormi - interaktiivse meedia – uurimiseks ning kuidas ühendada andmeanalüüsi ja suurte kultuuriandmete visualiseerimist kvalitatiivsete meetoditega, sealhulgas  nende "lähilugemisega" (ehk teisiti, kuidas viia kokku n-ö. suur pilt ja detailid)?  Kuidas üldse  õigustab andmeanalüüs end kultuuriprotsesside varieeruvuse ja mitmekesisuse tingimusis, selmet mitte keskenduda üksnes "tüüpilisele" ja "kõige populaarsemale"? (Manovich, 2015).

Kultuuriandmestikele toetuvaid uurimusi on viimasel ajal avaldanud arvukalt teadlasi kümnetel tuhandetel lehekülgedel, analüüsitud on sotsiaalvõrgustikes (Facebook, Flickr, Instagram, Twitter jt) kasutajate loodud sisu, s.o. kommentaare, tviite, videoid  ja fotosid, meeldimisi ja jagamisi. Teiseks on teadlased hakanud analüüsima ka konkreetseid  kultuurivaldkondi ja ajaloolisi perioode, näiteks veebisaitide kujundamine, moefotograafia, 20. sajandi popmuusika, 19. sajandi kirjandus jne. See on kahe uue teadusvaldkonna – sotsiaalse andmeteaduse (social computing)  ja digihumanitaaria (digital humanities) pärusmaa. Manovichi arvates on kultuurianalüüsi rolliks olla nende kahe haru neutraalne, kuid vajalik ühenduslüli, kuna mõlemad käsitlevad kultuuriandmeid valdkonnasiseselt, ent kultuurianalüüs ei sea piiranguid. Siin ei olda huvitatud mitte niivõrd humanitaar- või reaalteaduse eesmärkidest ja metoodika valimisest ega mingist subordinatsioonist, vaid nende ühendamisest kultuuriuuringutes, keskendudes  humanitaarteaduste lähenemisviisidele minevikusündmuste tõlgendamisel ning  formaalloogika ja mudelite kasutamisele (Manovich, 2015). 

Kui humanitaarteadlastele on arvuti abivahendiks ajalooliste artefaktide uurimisel ja andmeteadlased uurivad inimese-arvuti interaktsiooni, siis kultuurianalüütikutel on veendumus, et mahukate kultuuriandmetega töötatakse kummaltki poolt liiga vähe. Arvutiteadlaste põhiline motiiv suuri andmemassiive analüüsida tuleneb tööstuslikest eesmärkidest – muuta tehnoloogia veel töökindlamaks ja sujuvamaks. Ajalooliste esemete analüüs ei kuulu selle eesmärgi alla ning  ajalooliste andmetega tegeleb murdosa arvutiteadlasi (digipärandi valdkond on üks erand) (Manovich, 2015). 

On siiski mõned näited, kus ilmnevad kokkupuutepunktid. Ühes uuringus analüüsiti veebisaidi kujunduse eelistusi kogu maailmas, võttes aluseks 2,4 miljonit reitingut 40 000 inimeselt 179 riigist. Ilmselgelt kuuluvad esteetika ja disainiuuringud humanitaarteadlaste huviorbiiti. Teises uuringus analüüsiti Instagrami fotode temaatikat, mida võiks iseenesest võrrelda näiteks 17. sajandi Madalmaade kunstižanrite kunstiajaloolise analüüsiga. Ja veel üks näide: 2010. a.  viidi läbi Twitteri sotsiaalvõrgustiku suuremahuline analüüs, mis toetus 41,7 miljonile kasutaja 106 miljonile säutsule (tviidile) ja keskendus trendidele, s.o. kuidas populaarsed teemad liigituvad, kui kaua nad kestavad ja palju kasutajaid neis kaasa räägib. Arvestades, et Twitteri-laadne mikroblogindus on niisamuti uus meediaväljund nagu omal ajal õlimaal, trükitud raamat või fotograafia, kuulub selle eripära mõistmine ja lahtimõtestamine loomulikult humanitaarteadlaste ülesannete hulka (Manovich, 2015).
 
Avaandmete hulk on pidevalt kasvamas. Näiteks tegi New Yorgi linnavalitsuse arhiiv  2012. a. avalikult kättesaadavaks  870 000 digiteeritud ajaloolist linna fotot,  2015. a. avalikustas HathiTrust kättesaadavaks 4 801 237 köidet (1,8 miljardit lehekülge) uurimisandmeid ning Associated Press ja British Movietone laadisid YouTube'i üles 550 000 digiteeritud uudislugu alates 1895. aastast. Võib küsida, mis on nii suurte andmemassiivide/-baaside mõte, kas meile ei piisaks representatiivsest valimist väiksemas mastaabis?  Õnnestuda uurimistöös saab sel juhul, kui meil on kasutada  suurandmeid valdkonniti. Manovich toob näiteks filmiandme-baasi IMDB, mis sisaldab teavet miljonite filmide ja telesaadete kohta üle kogu maailma - 20. sajandi filmikunsti uurimiseks on seega olemas juba küllalt esinduslik andmebaas. Kuid paljudes kultuurivaldkondades midagi sellist veel ei eksisteeri. Teisalt: eeldusel, et suudame konstrueerida ühes kultuurivaldkonnas mingi representatiivse valimi, saame selle põhjal leida ka üldisi suundumusi ja mustreid. Näiteks eelpool mainitud Instagrami fotoanalüüsis valiti tohutust pildipangast juhuvaliku alusel  uurimisobjektiks 1000 Instagrami fotot, mis jaotati kaheksasse populaarsemasse kategooriasse (selfie, sõbrad, mood, toit, vidinad, tegevus, lemmikloom, pealkirjadega fotod). Võimalik, et need kategooriad olid kõige populaarsemad ka kõigi ülejäänud Instagrami fotode seas, mida kogu maailmas jagati uuringu läbiviimise hetkel. Samas teine uuring, mis vaatles Insta-fotosid erinevates linnades ja linnajagudes (näiteks Kiievi kesklinnas 2014. a. Maidani-sündmuste ajal),  näitas, et inimesed jagavad ka teist laadi pilte – olenevalt ajast ja olukorrast. Seega võimaldab väike valim leida "tüüpilise" või "kõige populaarsema", ent jätab tähelepanuta segmendi, mida Manovich nimetab "sisusaarteks" - koherentse sisu tüübid, millel on mõõdukate numbrite korral erilised semantilised ja/või esteetilised omadused (Manovich, 2015).  

Kui Manovich esmakordselt 2005. a. kultuurianalüüsi mõtestama asus, astusid digihumanitaaria ja sotsiaalandmeteadus teadusvaldkonnana alles esimesi samme. Kultuurianalüüs kui termin pidi viitama millelegi enamale.  Kultuurianalüütikud on ühevõrra  huvitatud nii ajaloolisest materjalist kui uuest meediast (nt Instagram),  huvisfääri kuulub nii professionaalne kultuur kui tavakasutajate loodud artefaktid,  kunstnikud väljaspool kunstimaailma ning juhuslikud loojad (inimesed, kes laadivad aeg-ajalt oma fotod sotsiaalmeediavõrkudesse). Nagu andmeteadlased, on ka kultuurianalüütikud huvitatud ühiskonnauuringutest, mis baseeruvad sotsiaalmeedial ja suhtlusvõrgustikel ja analüüsivad  spetsiifilisi nähtusi. Aga erinevalt sotsiaalteadusest, mis keskendub sotsiaalsele aspektile, huvituvad kultuurianalüütikud ennekõike kultuurist, mistõttu on nende jaoks sotsiaalteaduste relevantsem osa kultuuri sotsioloogia, alles seejärel sotsioloogia ja majandus (Manovich, 2015). 

Manovichi veendumuse kohaselt annavad veebi- ja suhtlusvõrgustike sisu ja kasutus-võimalused kultuurianalüütikutele enneolematu võimaluse kirjeldada, modelleerida ja jäljendada ülemaailmset kultuuriuniversumit, pannes küsimärgi alla ja ümber mõeldes humanitaarteaduste põhimõisteid ja töövahendeid, mis töötati välja “väikeste kultuuri-andmete” (s.t. väga selektiivsete kultuurinäidiste) põhjal. Kultuurianalüütikute huviprintsiip on kõik, mis on loodud kõigi ehk igaühe poolt (everything created by everybody). See tähendab kultuurile lähenemist meetodil, kuidas keeleteadlased uurivad keeli või bioloogid lähenevad biosfäärile. Ideaalne oleks valikuliste proovide asemel süvitsi vaadelda igat kultuurilist manifestatsiooni (nagu teevad kultuurantropoloogid) (Manovich, 2015).

Huvipakkuv on üldise ja erilise küsimus. Kultuurianalüüs võib ühendada ühiskonnateaduste (ja üldiselt reaalteadlaste) huvid üldistamise suunal ning humanitaarteaduste huvi individuaalse ja erilise suunal. Kui sotsioloogiline traditsioon on seotud inimeste üldiste käitumimustrite leidmise ja kirjeldamisega, selmet läheneda individuaalselt ja konkreetsete isikute kaudu, siis kultuurianalüütikut huvitavad ka mustrid, mis joonistuvad välja suurtest kultuuriandmekogumitest. Ideaalis võiksid suurandmed avada ka konkreetsete üksik-juhtumite, s.o. üksikute loojate loomingu või kultuurilise käitumise tagamaid. Näiteks võib ühe fotograafi karjääri kestel tehtud fotode andmeanalüüs välja selekteerida tema karjääri kõige erilisemad fotod (Manovich, 2015).

2017. a. ilmunud artiklis pühendub Manovich võimalustele ja piirangutele, mida kultuuri-andmestik pakub. Ta toob isiklike kogemuste põhjal näitena 2009. a. infootsingu teemal, mida inimesed kogu maailmas maalisid 1930. aastail, jättes kõrvale kõik „ismid“. Uurides Artstori veebiplatvormi, kuhu on koondatud miljoniga mõõdetavas suurusjärgus digiteeritud kunsti USA raamatukogude, ülikoolide ja kunstimuuseumide kogudest, sai selgeks, et valik on küll suur kuid ebaühtlane: kui päringust välistati Põhja-Ameerika ja Lääne Euroopa, kahanes tulemuste hulk mõnekümnele – seda terve ülejäänud maailma peale kokku. See pole muidugi platvormi süü, sest ta teeb kättesaadavaks pildid, mida on digiteerinud ülikoolid-muuseumid-raamatukogud ise. Ja ikkagi vaid mõned pildid Aasiast ajal, mil USA ülikoolides on 45% tudengitest Aasia päritolu. Seevastu Picasso päring tõi 700 pilti. Siit ka Manovichi mure:  see, mis on digiteeritud, on ainult „saar” ja massiline kultuuriline „ookean” võib jääda kvantitatiivseks analüüsiks kättesaamatuks (Manovich, Cultural Data. Possibilities and limitations of the digital data universe, 2017).

Õnneks pole sedasorti kartused teoks saanud, hämmastab hoopis digiteeritud materjali mitmekülgsus ja rikkalisus, mida Manovich põhjendab teistlaadse paradigmaga, millest suured andmebaasid (Europeana, DPLA, Kongressi Raamatukogu, New Yorgi avalik raamatukogu, Interneti-arhiiv, Google Arts & Cultures) lähtuvad: nad ei paku meile pilte üksnes kõrgest kunstist kunstimuuseumide varakambritest, vaid töötavad pigem traditsioo-niliste raamatukogude laiendina, võttes vastu inimeste ja organisatsioonide annetusi. Kui neid arhiive hakati digiteerima, hakkas veebis ilmnema hämmastavalt rikkalik ja mitmekesine ajalooline kultuurimaastik (Manovich, Cultural Data. Possibilities and limitations of the digital data universe, 2017).

Kunstiajalugu on loonud kõrgelt kontrollitud süsteemi, mis jagab meie visuaalse pärandi kunstiks ja kõigeks muuks  ning süstematiseerib neid kindlate tunnuste alusel. Ka kunstimuuseumide digitaalsed kollektsioonid näevad tänapäeval välja korrastatud ja süstemaatilised. See-eest Europeana, DPLA jt metakollektsioonid näivad otsekui  „kurioosumite kabinetina“, kust leiame palju triviaalset ja efemeerset – võrrelduna suurte muuseumidega, mis paradeerivad oma kogusid militaarse korrapärasusega. Lõputuisse metakollektsioonidesse võibki ära eksida ja minevik näib selles perspektiivis laialivalguva ja süsteemituna. Inimeste lõputud kultuurilised "hoiused" on jõudnud raamatukogudesse ja digiteeritud ning muudetud metaandmestandardite, veebiprotokollide, Javascripti koodi, API-de jms tehnoloogia abil avaandmeteks. Kuidas selles labürindis navigeerida? Manovichi hinnangul töötab näiteks Europeana, mille eesmärgiks on ühendada tuhandete Euroopa muuseumide ja piirkondlike arhiivide digiteeritud esemed,  tehniliselt ja kontseptuaalselt suurepäraselt, kuid omamoodi soovimatute tagajärgedega: „ühendatud Euroopa” - ühtse üleeuroopalise kultuuripärandi ruumi - loomise asemel võib Europeana selle hoopis killustada, kuna tekitab mulje juhuslikult säilinud ja omavahel segunenud eripalgeliste tsivilisatsioonide failide sulamist (Manovich, Cultural Data. Possibilities and limitations of the digital data universe, 2017).

Digiteeritud ajaloolise sisuga saarte arv kasvab pidevalt. Kuid kas need on kunagi piisavalt suured, et võimaldada meil „ookeanist” aru saada – s.t. luua detailne kaart visuaalsest inimajaloost viimase 200 aasta jooksul? Rikkus ja mitmekesisus ei tähenda kõikehõlmavust. Teisisõnu: kuigi Europeana, DPLA ja muude projektide digiteerimine ja digiteeritud üksuste korraldamine jätkub, jääb kultuuriloolise kvantitatiivse uurimise kõige põhilisem küsimus lahendamata. Ehk: kuidas saaksime koostada representatiivsed valimid, mis hõlmavad süstemaatiliselt kõike ühel konkreetsel ajaperioodil, geograafilises piirkonnas ja meedias loodut?   (Manovich, Cultural Data. Possibilities and limitations of the digital data universe, 2017).

Manovich peatub põhjalikult ka nn „tasakaalustatud kultuuriproovi“ võtmise probleemil, mida saab määratleda mitmel viisil – võib keskenduda toodetele  kindla ajaperioodi, koha- või meediumipõhiselt, kuid võib luubi alla võtta vaid selle, mida tegelikult loetakse, vaadatakse või kuulatakse; võib lisada valikusse teatud tunnustuse pälvinud teosed (võrdluseks: meeldimiste ja lemmikute arv sotsiaalmeedias) või jätta see aspekt tähelepanuta. Kuid igal juhul on vajalik süstemaatiline protseduur, mitte lihtsalt maitseotsus. Statistilisi meetodeid tuleks kasutada ka ajalooliste kultuuriliste esemete analüüsimiseks, kus meid huvitab eranditult kogu tervik, mitte ainult “meistriteosed”. Representatiivsete, hästikorraldatud kultuuriandmestike loomise idee on huvitav, kuigi tekitab hulga uusi küsimusi. Kuna õpikud, muuseumid, kultuuriportaalid jms käsitlevad kultuuri alati valitud näidete põhjal, siis on kultuuriandmete valimi küsimused üldiselt olulised ka siis, kui ei viida läbi kvantitatiivset analüüsi. Kõik see on seotud küsimustega, kuidas me mõistame, representeerime ja õpetame kultuurilugu, kuidas mõtestame kultuurilist olevikku kaasosaliste, koostoime ja kogemuste kaudu (Manovich, Cultural Data. Possibilities and limitations of the digital data universe, 2017).

Ühes artiklis analüüsib Manovich põhjalikult uut meediat – veebi- ja suhtlusvõrgustike platvorme - ning kasutab terminit „meediaanalüüs“,  mille keskmes pole mitte niivõrd loomingu, avaldamise ja levikuprotsess (kuigi ka need on olulised), vaid algoritmidel baseeruv, automaatselt genereeritav andmesisuanalüüs, mis vaatleb inimeste veebikäitumist nii individuaalsel kui grupitasandil. Vajadus selle järele tuleneb digikultuuri plahvatuslikust kasvust 21. sajandil, kui veebis ringleb 14 miljardit veebilehte, igapäevaselt jagatakse 2 miljardit fotot, Spotify kaudu voogedastatakse 30 miljonit lugu jne. Meil on tegemist miljardite aktiivsete suhtlusvõrgustike ja veebikasutajatega, kes moodustavad tänuväärse uurimismaterjali. Ampluaa on lai, hõlmates kasutajate veebikäitumist (nn digitaalne jalajälg: veebisaitide külastamine, linkide jälgimine, postituste jagamine ja reklaamide vaatamine ning neile klõpsamine) ja füüsilisi parameetreid (postituste geograafiline asukoht, kuupäev ja kellaaeg), samuti meediaettevõtete loodud/vahendatud meediasisu ( laulud, videod, raamatud ja filmid) ning kasutajate endi loodud meediasisu (postitused, vestlused, fotod ja videod) (Manovich, 100 Billion Data Rows per Second: Media Analytics in the Early 21st Century , 2018).

Selline automaatne (ja pidev) andmesisu analüüs teenib mõistagi parema teenuse kujundamise eesmärki, mille ülesanne omakorda on teenida ärilisi huve ehk siduda kasutajaid enda külge, pakkudes neile isikupärastatud teenust. Kasutaja veebikäitumise põhjal kuvatakse talle ainuomast soovituslikku sisu (playlistid) ja huvi pakkuda võivat reklaami (mistõttu pole imestada, et inimesed elavad täiesti erinevates, paralleelsetes inforuumides – R.R.).  Meediaanalüüsil põhineb ka Google’i tõlketeenus või Facebooki algoritm, mis kuvab suhtlusringkonna postituste trende analüüsides igale kontole ainuomaseid värskendusi. Sealjuures põhinevad paljud meediaanalüüsi tehnoloogiad avatud allikatel (Manovich, 100 Billion Data Rows per Second: Media Analytics in the Early 21st Century , 2018).

Meediaanalüüsil kui meediatehnoloogia uusimal etapil on kaks tahku, millest üks - kasutajate digitaalne jälg – on pakkunud palju kõneainet poliitilisteks ja sotsiaalseteks aruteludeks  privaatsuse, jälgimise, juurdepääsuõigusted, diskrimineerimise või  eelarvamuste teemal, kuid teine tahk - igat tüüpi veebimeediasisu algoritmianalüüs tootjate poolelt - on vähem tähelepanu saanud. Nende kahe osa koosvaates (kasutaja ja andmete interaktsiooni ning meediasisu analüüs) ilmneb ajavahemikul 1995–2010 toimunud nihke ulatus – esimestest veebiotsingumootoritest kuni Facebooki 500 miljoni kasutaja teetähiseni (Manovich, 100 Billion Data Rows per Second: Media Analytics in the Early 21st Century , 2018).

*          *          *

Viidatud allikad


Manovich.net. (kuupäev puudub). Loetud aadressilt : http://manovich.net/index.php/about (13.10.2019)
Manovich, L. (2015). The Science of Culture? Social Computing, Digital Humanities and Cultural Analytics . Loetud aadressilt: http://manovich.net/content/04-projects/089-cultural-analytics-social-computing/cultural_analytics_article_final.pdf (10.10.2019)
Manovich, L. (2017). Cultural Data. Possibilities and limitations of the digital data universe. Loetud aadressilt: http://manovich.net/content/04-projects/103-cultural-data/cultural_data_article.pdf (11.10.2019)
Manovich, L. (2018). 100 Billion Data Rows per Second: Media Analytics in the Early 21st Century . Loetud aadressilt: http://manovich.net/content/04-projects/096-media-analytics/100_billion_data_rows.pdf (13.10.2019).





Kommentaare ei ole:

Postita kommentaar