Statistikk som grafikk
Oppgavetekst: «Skriv et fortellende resymé av ‘The Visual Display of Quantitative Information’, og presenter så en syntese av Tuftes budskap. Gi for øvrig uttrykk for din egen vurdering av boka og hvilket inntrykk den har gjort på deg.»
Statistikk som grafikk
Informasjonsgrafikk er i dag et populært begrep innenfor grafisk design. Dette er en type grafikk innenfor grafisk design som vi i stadig større grad ser rundt oss og må forholde oss til. Konkrete eksempler på informasjonsgrafikk er tidtabeller for kollektivtransport – som tog, buss, trikk, undergrunn – , tabeller i idrettsverden som fotballtabeller og bruksanvisninger til produkter vi kjøper. Essensen i informasjonsgrafikk handler om å visualisere data. Informasjonsgrafikk drar i mange tilfeller fordeler av at ett bilde kan si mer enn tusen ord og dermed er en effektiv måte å formidle kompleks informasjon til mottaker på.
Som innenfor de fleste fag og emner er det alltid noen personer og verk som er mer sentrale enn andre og det er i denne sammenhengen at amerikaneren med det norskklingende navnet Edward Rolf Tufte (1942–) kommer inn i bildet. Tufte, opprinnelig fra Kansas City, er professor i statistikk og politisk vitenskap ved Yale University i USA og i 1983 ga han ut boken The visual display of quantitative information som er grunnlaget for dette essayet. Boken er blitt en bestselger innenfor emnet og har kommet ut i flere opplag og utgaver siden den gang.
Bokens innhold og oppbygging
Tufte deler inn boken sin i to deler og ni kapitler. Av de ni kapitlene utgjør de tre første del en som er viet en praktisk-historisk vinkling av faget hvor han tar for seg utviklingen av informasjonsdesign. Her gir han eksempler på det han anser som godt utførte verk innenfor faget. Tufte starter med å gi oss kjennskap til en av de viktigste pioneerene, den skotske ingeniøren William Playfair (1759–1823). Playfair sitt arbeid innenfor politisk økonomi førte til at han på slutten av 1700- og tidlig 1800-tallet utviklet en rekke forskjellige typer diagrammer for å kunne visualisere data på andre måter enn bare ved å bruke tekst i eksempelvis tabeller. Playfair får i dag æren for å blant annet ha oppfunnet stolpe- og kakediagrammet samt bruken av tidsakser langs horisontale linjer i diagrammer (Tufte 2001, s. 32). Dette er diagrammer som i dag er velkjente for de fleste.
Kapitlene fire til ni utgjør del to av boken og her tar han for seg flere forskjellige momenter rundt de teoretiske grunnlagene som trengs for å jobbe med informasjonsgrafikk. Mye av dette handler om hva som gjør en grafikk god eller dårlig, og han diskuterer og argumenterer for hvorfor noen er bedre enn andre, og hva som er grunnen til dette.
Grafisk fortreffelighet
Tufte legger vekt på noe han kaller grafisk fortreffelighet og i den forbindelse kommer vi ikke unna franskmannen Charles Joseph Minard (1781–1870) som i 1869 laget et kart over Napoleons felttog inn i Russland fra europeisk side i 1812. Kartet inneholder en stor mengde komplekse data om både antall soldater, tid, avstander og geografi med mer. Dette kartet er i følge Tufte et eksempel på grafisk fortreffelighet hvor mange historier blir fortalt i en og samme grafikk. Skulle alle disse dataene mot formodning blitt presentert som ren tekst eller i forskjellige tabeller er det store muligheter for at informasjonen hadde blitt vanskeligere å forstå, og sammenhenger ville forsvunnet eller blitt mindre framtredende. Dette eksemplet er altså i følge Tufte et godt eksempel på grafisk fortreffelighet hvor det har lyktes avsender å kommunisere komplekse data i en grafisk framstilling.
Når det gjelder grafisk fortreffelighet så lister Tufte opp en del punkter som må være tilstede for at grafikken skal lykkes i å kommunisere godt. Dette er punkter som handler om at den må lages på en måte som gjør at mottakeren kan fokusere på innholdet av dataene og ikke henge seg opp i hvordan den visuelt sett ser ut. Den skal presentere en større mengde data på et lite område, unngå visuelt rot som forstyrrer mottakerens evne til å ta til seg budskapet, legge til rette for at mottaker kan sammenligne flere typer data (jmf. Minards Napoleonskart), og evne å sette dataene sammen slik at de forteller en korrekt historie.
Ett viktig poeng for å lykkes med informasjonsgrafikk er i følge Tufte å maksimere bruken av det han kaller for statistikkblekk. Dette er altså å bruke mest mulig blekk på å fortelle data, og fjerne unødig bruk av tilleggselementer som ikke bidrar til historien på noen måte (Tufte 2001, s. 96). Eksempler på unødige bruk av blekk kan være bruken av skillestreker, rutenett og tredimensjonale skyggeeffekter i tabeller.
Tufte viser også til en annen informasjonsgrafikk som han anser som fortreffelig ut i fra de punktene han definerer. På 1800-tallet tegnet Étienne-Jules Marey (1830–1904) en togtabell som viste togruten mellom Paris og Lyon (Tufte 2001, s. 31). Her er det i stor grad lagt vekt på bruk av statistikkblekk. Avgang og ankomst mellom stasjonene sees på den horisontale linjen hvor lengden gjenspeiler den faktiske geografiske avstanden mellom stasjonene. Retningen på linjen reflekterer togets hastighet. Desto brattere linjen er desto raskere kjører toget, og der hvor linjene krysser hverandre i tid og sted vil det komme ett møtende tog.
Grafisk fortreffelighet handler om å kommunisere komplekse ideer tydelig, presist og effektivt for mottakeren (Tufte 2001, s. 13) sier Tufte. Ved å ha disse nøkkelpunktene i bakhodet skal det være fullt mulig å kunne lage god informasjonsgrafikk som formidler en god og riktig historie slik som eksemplet med togruten til Marey. Likevel er ikke dette alltid tilfelle. Statistikk er grunnlaget for dataene i informasjonsgrafikk, og statistikk er det veldig lett å lyve med for å presentere den virkeligheten du selv vil. Bevisst eller ubevisst.
Grafisk integritet
Det er altså mulig å lyve med statistikk og det er flere måter dette kan gjøres på. Innsamling av data kan foregå på feil premisser, eller utvelgelse av data som ikke er gjort på en god nok måte kan resultere i skjevheter i datasettet. Dette kan være bevisst eller ubevisst fra de som gjør dette sin side, men framstillingen av data blir ikke mer riktige enn det svakeste leddet vil jeg hevde. I ytterste konsekvens så kan statistikk brukes i rent propagandistiske sammenhenger for å presentere mottaker for den historien avsender vil fortelle, sann eller usann.
Faktorer som kan føre til løgn er mange, men Tufte peker blant annet på tilfeller hvor data blir tatt ut av kontekst, hvor det presenteres for lite data til å gi en god oversikt over hvordan situasjonen ser ut over tid, feil proporsjoner i den grafiske gjengivelsen eller de å gjengi todimensjonale data i tredimensjonal grafikk. I denne sammenhengen presenterer han oss for en formel som hvor man kan regne ut det han kaller for løgnfaktoren, altså i hvor stor grad lyver grafikken. Formelen baserer seg på at desto større realitetsavstand det er mellom de visuelle forskjellene i grafikken og den reelle forskjellen på dataene, desto større er løgnen. Han kommer med flere eksempler på dette, men etter prisen på råolje fra 1972 til 1979 (Tufte 2001, s. 63). Grafen er feil i den forstand at selv om intervallene på Y-aksen er riktig i pris så har de ikke grafisk lik avstand, noe som forvrenger prishoppenes reelle økning. X-aksen har en jevn intervall på to år bortsett fra helt til høyre hvor det er ett år i mellom. Problemene med denne grafen er blant flere ting manglende visuelle forhold mellom intervallene på Y-aksen og mangel på en jevn intervall langs X-aksen. Konsekvensen er at grafen gir et inntrykk av en enorm prisstigning i venstre del selv om det i realiteten ikke er slik når dataene sees under riktige forutsetninger.
Et vesentlig problem når det lyves med statistikk i dag – enten det skjer bevisst eller ubevisst – er at store opplag i blant annet aviser, magasiner, på internett og på TV gjør at løgnen sprer seg raskt og gjør potensielt stor skade hvis de blir til sannheter. Tufte mener at i mange tilfeller gjøres dette helt bevisst fra avsender sin side ved å lage villedende framstillinger av alt fra økning i matpriser, til tilfeller av forskjellige typer kreft basert på stater i USA (Tufte 2001, s. 16). Blant de mange unnskyldningene som oftest går igjen når disse forholdene blir påpekt er i følge Tufte at avsender mente å vise til en tendens, men han sier også at det må finnes tilstrekkelige data for å kunne vise en utvikling over tid. Den grafiske integriteten ifølge Tufte skal være basert på blant annet følgende punkter: • Vise variasjon i data og ikke i design • Data må ikke tas ut av kontekst • Tall må representeres direkte proporsjonalt med de forholdene som foreligger
For Tufte blir det viktig å påpeke viktigheten av at informasjonsgrafikk handler om å formidle data og ikke være en lekeplass for designere med mange gode ideer som går på bekostning av den grafiske integriteten, selv om gode visuelle løsninger ikke er et minus så lenge de spiller på lag med datagrunnlaget.
Grafisk middelmåldighet
Det er i følge Tufte en utbredt holdning blant illustratører og designere at statistikk er kjedelig (Tufte 2001, s. 79), og følgene av dette er derfor at de ikke evner å sette seg godt nok inn i og forstå dataene. Dette kan føre til mistolkninger og misoppfatninger om hva som egentlig er den virkelige essensen i budskapet allerede fra produksjonshold. Følgene av dette kan da ofte bli at den grafiske integriteten ender opp som skadelidende og løgnen blir stor. For å kunne jobbe suksessfullt med informasjonsgrafikk er det viktig å kunne forstå statistikk og ha gode artistiske evner som bidrar til å fremme det riktige og objektive budskapet som grafikken er ment å formidle. Tufte sier at den visuelle framstillingen har en sterk kommuniserende kraft og derfor er disse egenskapene såpass viktige hos dem som jobber med det. At statistikk er tørr og kjedelig går ikke Tufte med på og hevder at hvis så er tilfellet så kan de like gjerne la være å presentere den.
Essensen i Tuftes budskap
Med denne boken vil Tufte vise at statistikk er nyttig og interessant, men også farlig å misbruke i den grad grafikken ender opp med å lyve. Viktige momenter er at dataene skal kunne kommuniseres raskt og effektivt. Dette skal helst gjøres ved å maksimere bruken av statistikkblekk og fjerne alle forsøk på unødig visuelt dilldall. Han påpeker også viktigheten av at avsender har en forståelse for de dataene som ligger til grunn for å kunne velge den korrekte metoden å fremstille dem best mulig på. Han legger også vekt på at mest mulig informasjon bør presenteres uten at det skal gå utover tydeligheten i grafikken, og det å kunne sette flere typer data sammen og skape sammenhenger som ikke nødvendigvis er opplagte eller lett tilgjengelige på noen annen måte.
Egen vurdering
Personlig synes jeg boken er lettlest, men merkelig nok finner jeg den både lite konkluderende og tidvis dogmatisk. Mye av det Tufte sier er absolutt fornuftig, og han har en mengder av eksempler som underbygger teoriene sine. Likevel føler jeg han har tatt et standpunkt og du kan bare glemme å diskutere det
Det har vært nevnt at ISOtype ikke nevnes av Tufte i boken. Jeg er usikker på hvor relevant det i grunn er. Tufte bruker for det meste bare amerikanske eksempler i boken, og jeg tror ikke han har tenkt på å ha et veldig internasjonal vinkling over eksemplene i den. De eksemplene han har er gode nok, og de som ikke er amerikanske er de tidligste. Hadde de vært fra derfra så tror jeg han hadde hoppet bukk over alt annet enn eksempler fra USA.
Kilder
Edward R.Tufte (1983) 2001. The Visual Display of Quantitative Information. 2. utgave. Cheshire, Connecticut: Graphics Press