7 måder at ligge med statistik og komme væk med det

Vildledning med statistik er ikke noget nyt. Statistik bruges til at sælge produkter, fremkalde støtte til en kandidat eller få os til at 'like' ting. Vær forsigtig med disse syv almindelige taktikker, der bruges til at ælte statistiske data til dej.

7 måder at ligge med statistik og komme væk med det

Hvad har overdreven brug af e -mail at gøre med lave IQ -score? Intet overhovedet, men det betyder ikke nogen
gjorde ikke skabe en forbindelse at gøre et punkt.



Jeg ved ikke om dig, men jeg er træt af det forkerte,
vildledende eller simpelthen falsk statistik, der bruges til at sælge mig et produkt, fremkalde
støtte til en kandidat, eller få mig til at 'like' en eller anden ny trend. Jeg er gal som helvede, og jeg vil ikke tage det
længere ... og det skal du heller ikke.

Vildledning med statistik kaldes 'statistik' og
det er ikke noget nyt. I 1954 blev tidligere Bedre hjem og haver redaktør Darrell
Huff skrev en lille bog kaldet, Hvordan
At ligge med statistik
, som er den bedst sælgende statistikbog i
sidste 60 år, iflg J.
Michael Steele
, professor i statistik og drift og informationsstyring ved Wharton.

Det, der var sandt i 1954, er
lige så sandt i dag. Ifølge Huff, her
er syv almindelige taktikker, der bruges til at ælte statistiske data til dej.

  • Partisk prøveudtagning: Dette indebærer afstemning
    en ikke-repræsentativ gruppe. For eksempel en undersøgelse, der finder 41% af detailhandlen
    bankkunder ville bruge mobilbank, hvis det var tilgængeligt, bliver
    meningsløst, når du finder ud af, at undersøgelsen kun undersøgte folk på deres mobil
    enheder.
  • Små prøve størrelser: Plukker
    en tilstrækkelig prøvestørrelse er delvidenskab og delkunst, men fejende udsagn,
    ligesom 14% af virksomhederne planlægger at implementere cloud-baseret e-mail i år bliver
    mistanke, når stikprøvestørrelsen er 24 virksomheder. Et andet eksempel på denne slags 'statistik
    gone wild ’fænomen var et undersøgelse udført af HP, der fandt overdreven brug af e -mail, reducerer en persons IQ med 10 point.
  • Dårligt udvalgte gennemsnit: Dette ofte
    involverer gennemsnitsværdier på tværs af ikke-ensartede populationer. For eksempel så jeg for nylig en artikel, der
    identificerede et kvarter som et af de rigeste i byen. Artiklen gik
    videre for at oplyse, at beboere i kvarteret havde en gennemsnitlig årlig indkomst på omkring $ 100.000.
    Hvad artiklen ikke kunne påpege er, at kvarteret er i gang
    af gentrifikation; den ene del af kvarteret er meget velhavende, og den anden
    deles indkomstniveau er under landsgennemsnittet. At give et enkelt gennemsnit
    værdi for to populationer er forkert og vildledende. (Medianværdien for
    indkomst ville være en bedre indikation af naboskabsindkomsten.) Et andet klassisk eksempel på dette er historien
    om manden, der druknede i en vandpulje, hvis gennemsnitlige dybde var 1 tommer.
  • Resultater, der falder inden for standardfejlen: Ingen prøveudtagning eller måleteknik er perfekt; alle iboende inkorporere
    en grad af fejl. Det betyder, at en undersøgelse kun kan være lige så præcis som dens
    standard fejl. Uden at blive teknisk er det tilstrækkeligt at sige, at overskriften,
    E-bøger foretrukket frem for papir af mænd mere end af kvinder lyder bemærkelsesværdigt
    indtil du finder ud af, at de faktiske afstemningsresultater fandt, at 52% af mændene
    foretrukne e-bøger kontra 49% for kvinder, og fejlen i undersøgelsen var +/- 5%.
  • Brug af grafer til at skabe et indtryk: Begge nedenstående diagrammer indeholder nøjagtig de samme oplysninger, men hvilke
    en mere præcist viser stigningen i venturekapitalinvesteringer i mobil
    teknologier mellem årene 2006-2007? Den eneste forskel mellem graferne er
    vægt. Grafisk skabelse af data giver meget plads
    for at skabe falske indtryk. Det
    det samme gælder piktogrammer og infografik.
  • Den semi-vedhæftede figur: Det betyder
    angiver en ting som bevis for noget andet. For eksempel, hvis en annonce siger, at 15% af administrerende direktører kører
    en Buick; mere end noget andet mærke - hvad beviser det? Implikationen er
    at administrerende direktører er en slags autoriteter på biler. Dette er en almindelig taktik. Husk
    de gamle Certs -reklamer, hvor fortælleren siger, Certs. Nu med Retsyn! Gjorde
    nogen, der overhovedet ved, hvad Retsyn er, eller hvorfor skal vi bekymre os?
  • Post-hoc fejlslutning: Dette er forkert at hævde, at der er en direkte sammenhæng mellem to fund. Dette er især
    uhyggeligt, men det er ofte sværere at fange end de andre taktikker. Til
    eksempel, hvis en undersøgelse viser, at vegetarer har en højere gennemsnitsindkomst end
    kødspisere, ville det være absurd at konkludere, at du kan øge din indkomst ved at undlade at stemme
    fra kød. Men det er præcis, hvad nogle ’forskere’ gør.
  • Huff præsenterer en helhed
    kapitel om, hvordan man identificerer plettet statistik, som jeg vil besøge dem igen i fremtiden
    stolpe. I mellemtiden er det bedste råd som altid at være skeptisk. Advarsel
    tømmer!

    Jeg samler historier om falske, vildledende eller
    unøjagtige marketingstatistikker; send mig historier til dlavenda1@hotmail.com eller tweet mig @dlavenda .

    Forfatter David
    Lavenda er en højteknologisk marketing- og produktstrategichef, der også gør det
    akademisk forskning om virkningerne af informationsoverbelastning på organisationer. Han
    er en international forsker for Society for Technology History.

    [ Billede: Flickr -bruger MervC ]