Een van de
eenvoudigste manipulaties is het weglaten van data of het weglaten van context. Tegelijkertijd ook het meest lastig en tijdrovend om te checken.
Rond kerst zag ik onderstaande scatterplot voorbij komen op twitter, gemaakt door Flourish. Het geeft weer hoe vaak mensen in een bepaald land op Spotify luisterden naar 'All I Want For Christmas Is You' van Mariah Carey. Zweden is een duidelijke uitschieter. Zegt dat iets over de Zweedse voorliefde voor zoetsappige kerstliedjes, zoals de makers hier suggereren? Of is er iets anders aan de hand?
Op de horizontale as kan je lezen dat het gaat om het aantal streams per 10.000 mensen. Daarbij is het inwoneraantal van het land als uitgangspunt genomen. Maar in het ene land zal je meer Spotify gebruikers hebben dan in het andere land. En wat blijkt, Spotify is een Zweeds bedrijf. Waarschijnlijker dus dat de Zweedse uitschieter een gevolg is hiervan. Nu is het over-analyseren van een grappig bedoelde scatterplot natuurlijk dodelijk, maar ook meer serieuze onderwerpen worden niet altijd goed in de context geplaatst.
Een mooi voorbeeld daarvan is een grafiek uit 2009 van de Amerikaanse Democratische politicus Nancy Pelosi.
Zij wilde aantonen dat de recessie destijds ernstige gevolgen had voor de werkloosheid, zeker vergeleken met andere recessies.
Toch laat ze een paar belangrijke dingen niet zien.
Allereerst zie je op de verticale as dat het om absolute aantallen gaat. Omdat de beroepsbevolking gegroeid of gedaald kan zijn ten opzicht van de andere recessies, is dat geen goede vergelijking. Daarnaast zijn er meer recessies geweest dan ze hier toont. Waarom laat ze die weg?
Onderstaande grafiek neemt die data wel mee, en dan lijkt het eigenlijk nogal mee te vallen met de werkeloosheid.
Deze grafiek werd weer een jaar later gepubliceerd.
Nu blijkt de recessie toch weer ernstig voor de werkloosheid. Kortom, wat je laat zien, wat je weglaat en welke selectie je maakt, het kan een totaal ander beeld geven. Kijk dus altijd kritisch want met een beetje boerenverstand kan je vaak al nagaan of de weergave klopt.
Rond kerst zag ik onderstaande scatterplot voorbij komen op twitter, gemaakt door Flourish. Het geeft weer hoe vaak mensen in een bepaald land op Spotify luisterden naar 'All I Want For Christmas Is You' van Mariah Carey. Zweden is een duidelijke uitschieter. Zegt dat iets over de Zweedse voorliefde voor zoetsappige kerstliedjes, zoals de makers hier suggereren? Of is er iets anders aan de hand?
Op de horizontale as kan je lezen dat het gaat om het aantal streams per 10.000 mensen. Daarbij is het inwoneraantal van het land als uitgangspunt genomen. Maar in het ene land zal je meer Spotify gebruikers hebben dan in het andere land. En wat blijkt, Spotify is een Zweeds bedrijf. Waarschijnlijker dus dat de Zweedse uitschieter een gevolg is hiervan. Nu is het over-analyseren van een grappig bedoelde scatterplot natuurlijk dodelijk, maar ook meer serieuze onderwerpen worden niet altijd goed in de context geplaatst.
Een mooi voorbeeld daarvan is een grafiek uit 2009 van de Amerikaanse Democratische politicus Nancy Pelosi.
Zij wilde aantonen dat de recessie destijds ernstige gevolgen had voor de werkloosheid, zeker vergeleken met andere recessies.
Toch laat ze een paar belangrijke dingen niet zien.
Allereerst zie je op de verticale as dat het om absolute aantallen gaat. Omdat de beroepsbevolking gegroeid of gedaald kan zijn ten opzicht van de andere recessies, is dat geen goede vergelijking. Daarnaast zijn er meer recessies geweest dan ze hier toont. Waarom laat ze die weg?
Onderstaande grafiek neemt die data wel mee, en dan lijkt het eigenlijk nogal mee te vallen met de werkeloosheid.
Nu blijkt de recessie toch weer ernstig voor de werkloosheid. Kortom, wat je laat zien, wat je weglaat en welke selectie je maakt, het kan een totaal ander beeld geven. Kijk dus altijd kritisch want met een beetje boerenverstand kan je vaak al nagaan of de weergave klopt.
Reacties