Datavisualisering: Nøkkelen til å forstå dine data?

God datavisualisering er engasjerende. God datavisualisering er informativ. God datavisualisering svarer på et spørsmål, men kan også generere nye spørsmål man ikke engang har tenkt på før.

«For many companies data visualization is still a hygiene factor; necessary but not crucial»

Sitatet over er hentet fra en artikkel som omhandler hvorfor det stadig er færre som spesialiserer seg innen datavisualisering, men heller blir data-scientist eller frontend-utvikler. Etter hvert har mange virksomheter forstått gevinstene man får av å forstå og bli gode på å utnytte dataene de har tilgang på – og mange har allerede kommet langt i denne prosessen. Det er derfor synd å se at det er såpass lite fokus på gode datavisualiseringer.

Hva handler egentlig datavisualisering om? God datavisualisering handler om kommunikasjon. Data i seg selv er svært kompleks: Et menneske klarer ikke å få mye ut av millioner på millioner av datapunkter. Selv noen hundre datapunkter blir for mange til å få noe ut av om de ligger i en tabell. Derfor er datavisualisering et av de sterkeste virkemidlene man har for å la dine data fortelle deg sin historie. «Et bilde sier mer enn tusen ord», og det samme gjelder datavisualisering, om ikke i enda større grad.

Hjernen er god på å sammenlikne

Hjernen vår er dårlig til å lese tall. Den er lat og sliter med å holde mange tall i minnet av gangen, så det å sammenlikne tall mot hverandre kan være en vanskelig operasjon. Hjernen vår er derimot, er veldig god på å sammenlikne lengde på to elementer som står ved siden av hverandre. Ta for eksempel tallene 873 og 3492. Hva er forholdet mellom de to? Man må regne litt, hjernen blir sliten, og du blir lett distrahert: «Hey! jeg fikk en like på Facebook!», sjekke om det har kommet noe nytt på VG siden sist, og så har man glemt hva man så etter. Ta en titt på grafen under, hvor fort får du et inntrykk av forholdet mellom de to tallene?

Figur 1: Visuell sammenlikning av to tall

Fortere enn når du bare fikk presentert tallene, ikke sant? Ved å regne litt vil man finne ut at 873 er nøyaktig en fjerdedel av 3492, men de færreste av oss oppdager dette bare ved å se tallene. En visualisering vil raskere gi oss en indikasjon på forholdet mellom dem, og for mange er det dette forholdet som betyr noe.

Ikke nedprioriter kommunikasjonen

For å bli en datadreven virksomhet må ledelsen beslutte å satse på data som beslutningsgrunnlag fremfor å bruke magefølelsen. For å gjøre datavisualisering til en prioritet, må noen beslutte at dette er en prioritet. På samme måte som at data skal være viktig, må datavisualiseringer, kommunikasjon av data, være viktig. De ansatte må læres opp til å benytte seg av visualiseringene som eksisterer, og man må lære de opp til å kunne lese mer avanserte grafer enn kake- og søylediagram, og linjegrafer.

God datavisualisering er engasjerende. God datavisualisering er informativ. God datavisualisering svarer på et spørsmål, men kan også generere nye spørsmål man ikke engang har tenkt på før. Ikke bruk masse tid på å samle data, vaske den og slå den sammen med annen spennende data, for så å bruke minimalt med tid på å lage en graf! Datavisualisering handler om kommunikasjon, og kommunikasjon er det sjeldent lurt å nedprioritere.

Bonus: En av de mer interessante datavisualiseringene jeg har kommet over i det siste, er vist under. Denne visualiseringen av Andrew Elliott viser hvordan søvnsyklusen, vist med blå farge, til et nyfødt barn utvikler seg over tid. Den innerste sirkelen representerer dagen barnet ble født. Hver sirkel er en hel dag der midnatt er på toppen, slik at grafen kan leses som en klokke. Man kan tydelig se at barnet stadig sover mer og mer om natten etter hvert som det blir eldre.

Denne utviklingen ville vært svært vanskelig å vise med mer «vanlige» grafer som en linjegraf. Visualiseringen kan benyttes for å vise utvikling over tid, for eksempel fra dag til dag i en måned med den første i en måned som innerste sirkel og siste dag i måneden ytterst. Andre interessante eksempler der en slik graf kan brukes kan være press på strømnettet, vannforbruk eller passasjerer på kollektiv transport, med mange flere.

 

Figur 2: Utvikling av et nyfødt barns søvnsyklus, graf laget av Andrew Elliott 

Martin Keseler Barland er consultant i Business Analytics og har fokus på data og analyse i Sopra Steria. Han har sin bakgrunn fra teknisk kybernetikk og har utviklet og designet løsninger innen data management, rapportering og analyse for kunder i flere forskjellige industrier. I sine prosjekter innehar Martin ofte en rolle som brobygger mellom IT og forretning.

Legg inn en kommentar