Lie-factor

Onlangs heb ik me verdiept in de lie-factor, een begrip uit het boek The Visual Display of Quantitative Information van de statisticus Edward Tufte. Met deze factor kan je van een grafiek berekenen hoe misleidend die is. Je berekent het verschil tussen het visuele effect in de grafiek en het effect in de data. In een formule:

Idealiter ligt de uitkomst tussen de 0,95 en de 1,05, dan is het effect in de data ongeveer even groot als het effect in de grafiek.

Laten we deze berekening eens loslaten op een veel bekritiseerde grafiek van Forum voor Democratie:



Zo te zien krijgt deze partij veel meer likes dan andere partijen en volgens het twitterbericht is FVD de meest actieve partij op Facebook. Omdat ze niet alleen de lengte van de staven hebben aangepast, maar ook de breedte, bereken ik eerst de oppervlaktes van FvD en van D66 ter vergelijking. Voor het gemak neem ik de cirkels onderaan niet mee.

De berekening voor de lie-factor ziet er dan als volgt uit:
Met een lie-factor van 13,1 is het effect in de grafiek dus sterk overdreven. Dit komt door twee dingen: ze hebben de verticale as afgesneden (lees ook mijn blog hierover) en ze hebben in de breedte geschaald, dat geeft ook een vertekend beeld. Niet direct zichtbaar; ze zijn ook nog eens selectief geweest in welke data ze laten zien want een paar grote partijen ontbreken in dit overzicht, zoals de PVV en de VVD, ook hier heb ik ooit een blog aan gewijd. Hans Wisbrun maakte ooit een complete nette versie van deze grafiek, die kan je hier vinden.

Reacties