Mark Twain zei ooit: " Er zijn leugens, verdomde leugens en statistieken. "Het punt is dat statistieken kunnen worden gebruikt om iets te bewijzen, of ze nu ter plekke worden verzonnen of door echte gegevens worden gegenereerd.
U hoeft mij ook niet te geloven, want een website genaamd Spurious Correlations laat perfect zien hoe statistieken kunnen worden gebogen en gevormd om aan een bepaalde vooringenomenheid te voldoen. Het blijkt dat statistieken eigenlijk nogal nutteloos zijn.
De website
Spurious Correlations is het geesteskind van Tyler Vigen, een student criminologie aan de Harvard Law School. Vigen is gefascineerd door empirisch onderzoek, dus creëerde hij een eenvoudige website gewijd aan het vergelijken van variabelen, en hoe nauw ze correleren met elkaar.
Er is een nieuwe versie van deze valse correlaties op de site geplaatst, met meer dan 24.000 geposte tot op heden. Naast die automatisch worden gegenereerd, kunnen bezoekers hun eigen ontdekken door twee verschillende datasets te selecteren om met elkaar te vergelijken.
Probeer het, je zult versteld staan hoe verslavend het allemaal is.
De voorbeelden
Wat volgt zijn vijf voorbeelden van valse correlaties die enigszins willekeurig zijn gekozen, hoewel Nicolas Cage altijd voorbestemd was om te verschijnen. Omdat hij Nicolas Cage is.
Bedenk dat geen van deze voorbeelden een ander bewijs is dan het feit dat statistieken kunnen worden gebruikt om conclusies te trekken die niet bestaan. Maar het is heel leuk om je de redenen voor te stellen waarom deze statistieken overeenkomen.
Het geld besteed aan huisdieren in de VS komt overeen met het aantal advocaten in Californië. Zijn verwende huisdieren 6 Apps die je iPad veranderen in een te duur maar geweldig kattenspeeltje 6 apps waarmee je je iPad verandert in een te duur en toch geweldig kattenspeelgoed Katten zijn geweldig. Daar zijn we het allemaal over eens. Ik moet echter wel toegeven dat zelfs voor een kattenliefhebber zoals ik, het idee om mijn katten met mijn kostbare iPad te laten spelen een beetje gek leek ... Lees meer tegen hun rijke eigenaars? Of is dit gewoon puur toeval?
Het aantal mensen dat verdronk door in een zwembad te vallen, hangt samen met het aantal films waarin Nicolas Cage is verschenen. Cage heeft een aantal gekke acteervaardigheden, maar ze leiden zeker niet tot verdrinkingen.
De totale opbrengst gegenereerd door arcades in de VS komt overeen met het aantal computerwetenschappen Open For All: 6 computerwetenschapsprojecten van MIT Media Lab dat u vandaag nog voor iedereen kunt proberen: 6 computerwetenschapsprojecten van MIT Media Lab dat u vandaag kunt proberen Elke grote onderwijsinstelling heeft één gemeenschappelijke kwaliteit - innovatie. MIT Media Labs is een centre of excellence dat veelzijdig denken bevordert, en haar "hoofdrichtlijn" is om zich te concentreren op ontwikkelingen die zich ... Lees meer doctoraten uitgereikt in de VS Er zou een link kunnen zijn, maar het is waarschijnlijker dat deze twee dingen groeiden gewoon samen in populariteit.
Het aantal Duitse personenauto's dat in de VS wordt verkocht, hangt samen met het aantal zelfmoorden door het neerstorten van motorvoertuigen in de VS. Het besturen van een Duitse auto leidde tot depressiviteit en zelfdoding 7 Onlinebronnen om hen te helpen die depressief en suïcidaal zijn 7 Online bronnen Om degenen die depressief en suïcidaal zijn te helpen Hoewel ik de hoofdredacteur van MakeUseOf ben, heb ik een enorme handicap in mijn leven, die een klinische depressie is. Het begon in 2002, als een depressie gerelateerd aan stress in mijn werk, ... Lees meer? We vermoeden het niet.
De echtscheidingsgraad in Maine correleert met de consumptie per hoofd van de margarine in de Verenigde Staten. Misschien moet de persoon die verantwoordelijk is voor het boodschappen doen in plaats daarvan boter kopen.
De les
Spurious Correlations is, op het eerste gezicht, een leuke kleine website die je een paar minuten kan afleiden. Maar het is meer dan dat. Het is ook een herinnering dat statistieken niet op basis van nominale waarde moeten worden geaccepteerd. In plaats daarvan moeten ze nauwkeuriger worden onderzocht om er zeker van te zijn dat ze daadwerkelijk worden opgestapeld.
We hebben waarschijnlijk allemaal krantenkoppen gezien over kranten die een verband legden tussen de ene willekeurige trend en de andere. Journalisten en redacteuren in de tabloid houden van deze dingen, omdat ze een goedkope gimmick zijn die gegarandeerd kranten verkoopt. Maar ze zijn vaak ofwel onschuldig misleidend ofwel volledig en opzettelijk nep. Bulls ** t, met andere woorden.
En nu weten we, dankzij Spurious Correlations, waarom dit het geval is.
conclusies
Besteed wat tijd aan valse correlaties en zie welke twee volledig niet-verbonden datasets u kunt matchen. En kom dan hier terug en vertel ons wat je hebt gevonden. Voel je niet schuldig over het verspreiden van verkeerde informatie; tabloid kranten doen het elke dag van de week.
Image Credits: Simon Cunningham via Flickr, Ken Teegardin via Flickr, Ben Brown via Flickr