Dobra vizualizacija je ključan način kako da savladamo “neljudskost” podataka

15. May 2019.

Vizualizacija analize kombinacije instrumenata i njihovog uticaja na energičnost pesama na Spotify platformi, iz projekta What's That Sound Again?

Da li vam se dogodilo da se osećate zbunjeno ili nezainteresovano kada se nađete ispred xls tabele ili json dokumenta sa dugačkim nizom slova i brojeva? Vama su potrebni jasni zaključci i parametri koji ilustruju situaciju, a otvoreni podaci dolaze u formatu zanimljivom za mašine, ali ne i za ljude. Jedna od glavnih prepreka u praktičnoj upotrebi informacija koji su nam na raspolaganju u formi otvorenih podataka najlakše se rešava - vizualizacijom podataka.

“Ako podatke prikažemo na način koji je razumljiv, zanimljiv, uzbudljiv ili provokativan, otvoreni podaci dobijaju dimenziju koja može da promeni naše shvatanje sveta i pojava u njemu. “

Jovan Leković je dugo vremena proveo u centru u kojem podaci i njihova obrada utiču na stavove i odluke čitalaca širom sveta. Radeći u BBC timu u Londonu bavio se ne samo vizualizacijom podataka već i definisanjem internih standarda, koje su objavili kao BBC Audiences Tableau Style Guide. Jovan je često bio pred izazovom kako da što jasnije prenese rezultate obrade podataka najrazličitijim ciljnim publikama.

Praktična obrada i atraktivno predstavljanje podataka su i naši veliki izazovi i zato smo razgovarali sa njim o važnosti vizualizacije podataka, ulozi otvorenih podataka u medijima, o izazovima vizualizacije i percepcije podataka u javnosti, kao i o dobrim primerima iz prakse.

Zašto je važna vizualizacija podataka?

Ne bi me iznenadilo kada bi istoričari (u budućnosti) sadašnji period opisivali kao trenutak revolucije podataka. Trenutno nam podaci pomažu da donesemo odluke u svakodnevnom životu, u poslu, i u društvenim odnosima. U suštini, vizualizacija je način da pretvorimo apstraktnost brojki u nešto vidljivo, sažeto i razumljivo. Recimo, da pretočimo ogromnu bazu podataka u prikaz koji svako može da razume. Možemo da svedemo pojave koje traju decenijama u animaciju koja traje nekoliko sekundi. Ili da dozvolimo korisniku da nađe bitan detalj u složenoj hijerarhiji.

Kako vizualizacija pomaže u korišćenju otvorenih podataka i zaključivanju na osnovu njih?

Pristrasan sam naravno, ali po meni prikaz podataka igra veliku, ako ne i ključnu ulogu u radu sa otvorenim podacima. Ako je svrha otvorenih podataka da omoguće transparentnije društvo i uvid u stanje sveta, vizualizacija je jedan od najbitnijih načina komunikacije tih uvida.

Otvoreni podaci su imali ogroman uticaj na vizualizaciju kao struku. Pre pojave otvorenih podataka, pronaći podatke za vizualizacije je bilo veoma teško, skupo i sporo. Sa jedne strane, postojanje otvorenih podataka omogućava da se bavimo zanimljivijim prikazom tih podataka. Ali, sa druge strane, omogućava da te podatke koristimo kao podlogu i kontekst za neke sasvim nove ideje.

Za projekat What's That Sound Again?, koristeći Spotify api obradio sam 200 hiljada pesama, 28 hiljada plejlisti na kojima se pojavljuje 57 hiljada različitih umetnika.

Koja je uloga podataka i otvorenih podataka u (online) medijima?

Jedan od meni najzanimljivijih fenomena u poslednje dve godine u otvorenim podacima u Britaniji jeste izveštavanje na temu razlike u platama zavisno od pola. Ranije, ovo bi možda bila tema koja bi bila više vezana za akademske institucije i ograničena na akademsku publiku. Time što se čitavi skupovi podataka objavljuju svake godine stvorilo je ozbiljnu diskusiju na godišnjem nivou u kojoj učestvuju mediji, kompanije i britanska javnost. I to je samo jedan od skorijih primera. Otvoreni podaci menjaju način na koji pričamo o zdravstvenim ustanovama, o nejednakosti u posedovanju nekretnina i političkim fenomenima. Ono što je posebno interesantno je jedan manje vidljiv aspekt primene otvorenih podataka:

Otvoreni podaci omogućavaju pružanje informativnog konteksta. Ako neko predstavlja podatke o beskućništvu u određenom regionu, sa otvorenim podacima je veoma lako prikazati i istorijat nezaposlenosti koji je sigurno bitan za tu temu. Dobra vizualizacija podataka omogućava sveobuhvatnije shvatanje društvenih prilika.

Kako se vizualizacija podataka radi u BBC timu?

Moja uloga u BBC-ju je bila unutar tima od preko 100 ljudi (što dodatno govori o važnosti analize parametara u jednoj medijskoj kući) koji se bavio razumevanjem odnosa BBC-a i britanske javnosti. Da bismo razumeli taj odnos, tim je koristio različite istraživačke metode. Od gledanosti TV kanala, do složenih upitnika o kvalitetu sadržaja, fokus grupa, do višegodišnjih posmatračkih studija. Od izveštavanja o tome kako se menja slušanost radija, do temeljnih analiza o ulozi društvenih mreža u životima mladih ljudi. I sve te tehnike na jedan ili drugi način proizvode more podataka koji treba da doprinesu boljem shvatanju gledaoca, slušaoca i čitaoca BBCa. Zatim, sve te podatke treba srediti i jasno preneti novinarima, urednicima, režiserima, producentima, komentatorima, kompjuterskim programerima i menadžmentu BBC-a.

Ja sam imao sreću da iniciram stvaranje radnog mesta specijalizovanog za vizualizaciju podataka. Konkretno, to je podrazumevalo da obučim tim kako da korisiti tehnike vizualizacije, postavim standard kvaliteta vizualizacije unutar tima, i da razvijam vizualizacije i aplikacije koje su od značaja za BBC. Dobar primer projekta koji sam razvijao sa timom, jeste aplikacija koja pomaže urednicima da shvate kakav efekat ima korišćenje društvenih mreža. Ovo je podrazumevalo saradnju sa nekoliko različitih timova, skupljanje i automatizaciju podataka, definisanje mera koje su od značaja, dizajn aplikacije i obuku korisnika.

Iz projekta BBC Audiences Tableau Style Guide

Sada kada vizualizaciju radiš u svom studiju, kako izgleda tvoj posao?

Kao frilenser imam slobodu da koristim vreme na meni tri bitna načina: istraživanje za lične projekte, predavanja, i razvoj projekata za klijente. Glavna razlika jeste što ovakav rad podrazumeva mnogo fleksibilniji pristup projektima, jer zahteva sposobnost da se svaki put savlada oblast kojom se klijenti bave, razume sistematizacija njihovih podataka i njihova pitanja, programi i kultura podataka. Što znači da je svaki projekat drugačiji i da predstavlja nove zanimljive izazove, teme i metode.

Kako si se odlučio da se vizualizacijom podataka baviš puno radno vreme?

Bavim se vizualizacijom podataka na jedan ili drugi način preko deset godina. Veći deo karijere je to bila neka vrsta radnog hobija, koji su kolege zapažali i cenili. U BBC-ju sam dobio priliku da taj “radni hobi” ozvaničim radnim mestom, koje se samo time bavi. Prošle godine sam odlučio da otvorim The Synthesis Bureau da bih mogao skroz da se posvetim vizualizaciji.

Ne mogu da zamislim zanimljiviju struku u zanimljivijem periodu za ovu struku. Vizualizacija spaja nekoliko disciplina koje do sada nismo smatrali srodnim. Statistiku i dizajn, programiranje i teoriju umetnosti, žurnalistiku i matematiku. Što znači da stalno imam nešto novo da učim, pružaju mi se mogućnosti da koristim svakakve tehnike i da pokušam da isprobam nove koncepte i ideje.

Sa kojim se problemima susrećeš u procesu odabira podataka i vizualizacije?

Kliše je, ali i često istina, da je 80% procesa vizualizacije priprema podataka. Podaci su često u komplikovanim formatima ili nisu prilagođeni mašinskom čitanju, što je tehnički izazov. Meni su zanimljivi i konceptualni izazovi. Kako se do tih podataka došlo? Da li su to podaci koje smo ranije videli? Da li postoji novi način da se podaci prikažu? Šta nedostaje u podacima i kako to prikazati? Da li podaci oslikavaju nešto što ne očekujem? Koliko imam poverenja u izvor podataka? Da li su podaci vezani za temu koja je na neki način aktuelna?

Koji su problemi u procesu percepcije i/ili nedovoljno stručne analize i vizualizacije koja može da navede na pogrešne zaključke?

Vizualizacija podataka deluje kao jednostavan proces, međutim veoma je lako napraviti greške. Klasičan primer jeste tvrdnja Edvarda Tafta kako su NASA inženjeri mogli da spreče eksploziju svemirskog šatla Čelendžer boljim prikazom podataka (tema koja je dosta diskutovana unutar zajednice). U svakodnevnoj vizualizaciji je bitno shvatiti podatke, naći najbolji način da se ti podaci predstave i naročito - voditi računa o tome kako će čitaoci vizualizacije da interpretiraju te podatke. U sva tri koraka moguće je napraviti greške. U shvatanju podataka moguće je da postoje greške u metodu prikupljanja koje treba razumeti i preneti čitaocu. U prikazu podataka može se, na primer, neprimereno koristiti grafikon sa 3D efektima koji mogu da smanje čitljivost. I konačno, treba razumeti korisnike vizualizacije. Na primer, upotreba boja u prikazu može da bude nejasna korisnicima koji pate od daltonizma. Ima slučajeva da čitaoci ne razumeju terminologiju, skraćenice i prikazane mere, ili može nam se desiti da se sapletemo o dizajn korisničkog iskustva - na primer da čitaoci ne razumeju kako da koriste interaktivne komponente.

I vredi reći da svi mi o vizualizaciji još uvek imamo dosta toga da naučimo. U časopisu Economist, koji ima dugu tradiciju inovativnog prikaza podataka, objavili su spisak primera gde smatraju da su pogrešili. U poslednjih desetak godina viđamo i fantastične radove u akademskoj javnosti i struci koji pokušavaju da uspostave standarde, koje je relativno lako primeniti. Na primer, vredi pratiti Multiple Views koji objavljuju principe koje istražuje akademska javnost ili Data Visualisation Society koji je pokrenuo odličnu diskusiju o standardima u struci.

Kako popularizovati korišćenje otvorenih podataka?

Imajte u vidu da zajednica koja se bavi vizualizacijom podataka obožava dobar izazov. Makeover Monday i Storytelling With Data Challenge su odlični primeri inicijativa koje koriste podatke u javnosti da prikažu zanimljive priče koristeći vizualizaciju. Lično su mi inspirativni projekti koji povezuju stručnjake za podatke sa dobrotvornim organizacijama koje pokušavaju da dobiju odgovor na spečificno pitanje ili reše konkretan problem. Na ovaj način upotreba otvorenih podataka dobija veoma pragmatičnu dimenziju. Ima nekoliko organizacija koje se bave upravo ovom temom. DATA4CHANGE i DataKind su odlični primeri. Konačno, otvoreni podaci koji su pristupačni i laki za obradu će uvek biti zanimljiviji kandidati za vizualizaciju. Imati kvalitetne meta-podatke, dobru strukturu podataka, komentare stručnjaka, jasna obeležja i standardizovane tabele su izuzetno bitni u razvoju projekata.

Kako su uspešne primene najbolji pokretači, da li možeš da podeliš sa nama nekoliko primera gde je vizualizacija napravila razliku?

Klasičan, i meni omiljeni primer, jeste grafikon koji je razvila Florence Nightingale tokom krimskih ratova. Da bi ubedila zakonodavce da ulože u bolje uslove u bolnicama, proizvela je grafikon koji pokazuje uzroke smrti u krimskim ratovima u tri kategorije: smrt na bojnom polju, smrt koje su moguće sprečiti i smrt od drugih uzroka. U grafikonu je jasno da je smrt od uzroka koje bilo moguće sprečiti najveća kategorija i nešto što bi britanske vlasti mogle da promene. Ovo je bio trenutak koji je transformisao shvatanje zdravstva i sanitarnih uslova u zdravstvu.

Savremeniji primer jeste rad Hansa Roslinga, koji je bio vodeći glas u želji da preobrazi shvatanja sveta na makro nivou. Roslingove metode su genijalne. Za vizualizaciju je koristio sve što mu je pri ruci da bi promenio zastarele percepcije. Od Lego kocki, preko rolni toalet papira, animiranih vizualizacija, do gutanja sablji na sceni. Ali ključno, koristeći sve te tehnike stvorio je jednu značajno drugačiju sliku o savremenom dobu, bilo da je pričao o trećem svetu, prenaseljenosti planete ili izazovima tokom epidemije ebole.

Da li vizualizacija može da promeni svet (što može da zvuči optimistično) u oblastima zelene energije, ekologije, zaštite privatnosti podataka, prevencije širenja lažnih vesti?

Zanimljivo je da većina problema kojima se danas bavimo ima kvantitativnu dimenziju.

Bilo da pričamo o klimatskim promenama, ugroženosti životinjskih vrsta, jednakosti polova, ili političkoj nestabilinosti, postoje podaci pomoću kojih možemo bolje da razumemo te probleme. I srećom struka vizualizacije se već bavi tim problemima na mnogo načina. Bilo da govorimo o novinarstvu koje predstavlja podatke da skrene pažnju na ključne probleme, akademskim institucijama koje vizualizuju kako će svet izgledati, ili institucijama koji prave dashborad-e koji će pomoći da se razumeju oblasti u koje najviše treba investirati.

Kolko god bih hteo, teško bi mi bilo da kažem da vizualizacija sama po sebi može da promeni svet. Ali svakako može da nam prikaže svet na jedan novi način. I u tom procesu prikazivanja može da nam izoštri sliku koju imamo o svetu. Može da nam ukaže gde su problemi. Može da nam prikaže koja rešenja su najbolja. I definitivno može da nam omogući informisaniju diskusiju o stanju sveta i mogućnostima promena.

Intervju pripremila Katarina Popović za Nacionalni portal otvorenih podataka, maj 2019.