Hvem (eller hvad er) bedst til at forudsige vinderne af March Madness?

Hvem ved bedst, når det kommer til at forudsige vinderne af March Madness: eksperter, algoritmer eller mængden?

Hvem (eller hvad er) bedst til at forudsige vinderne af March Madness?

Et anslået 45% af amerikanerne vil udfylde en NCAA -turneringsramme i år. Det er mere end antallet af mennesker, der stemte i Midtvejsvalg i 2010 . Og indtil klokken slår 12:15. den 15. marts, og faktiske bolde begynder at blive kastet efter de faktiske kurve, hver og en af ​​os kan foregive at være den smarteste fyr eller gal i rummet, når det kommer til at forudsige March Madness forudsigelser.



Men hvem (eller hvad) ved egentlig bedst? I sidste måned kiggede vi på algoritmiske, sociale og ekspertmetoder til at forudsige Oscar -vindere og fastslog, at en kombination af ekspertudtalelse og algoritmisk analyse var den mest vellykkede taktik. Nu, på tærsklen til Amerikas foretrukne forudsigelsesorgie, March Madness, stiller vi spørgsmålet igen: Er de bedste forudsigere robotter, forfattere eller mængden i det store hele?

De mennesker, der er betalt for at se college basketball for at leve, ved sikkert, hvad de laver, ikke? Men mens alle på nær en af ​​CBS Sports ’ekspertanalytikere forventer, at Kentucky vinder det hele , forudsigelserne varierer voldsomt ud over mesterskabsspillet. Desuden er det mere sandsynligt, at eksperterne vælger forstyrrelser, fordi de hej bliver betalt for at vide noget, resten af ​​verden ikke ved. Og hvilken bedre måde at bevise det på end at kaste mærkelige forstyrrelser på væggen og se, hvad der hænger fast?
Problemet er, at mens forstyrrelser sandsynligvis vil ske, er de normalt ikke de forstyrrelser, vi forudsiger. Ifølge en undersøgelse foretaget af Indiana University (det fjerde frø i regionen Syd forresten), har du en lige eller bedre succesrate ved at stole på udvælgelseskomiteens såning og vælge nul forstyrrelser, uanset din sportskompetence. Men da det ikke er sjovt, lad os se på et par andre tilgange.



En anden mulighed er at sætte din lid til mængden af ​​visdom. Bloggerne kl Hoopisme har samlet data fra væddemålsoplysningstjenesten Sportsindsigt for at vise procentdelen af ​​rigtige væddemål placeret for eller imod hvert hold. Men da dataene er baseret på faktiske indsatser, indeholder webstedet kun forudsigelser for tidlige spil, hvor holdene allerede er afgjort.



Det efterlader os med den algoritmiske tilgang, og få har set flere computerbaserede forudsigelsesmodeller end Danny Tarlow og Lee-Ming Zen. Som mange driver Tarlow og Zen en årlig NCAA -turneringspulje. Men det, der gør deres unikke, er, at hver post skal udarbejdes af en maskine uden hensyn til menneskelig vurdering.

For tre år siden havde jeg to ting i tankerne, sagde Tarlow, en ph.d. -studerende i datalogi ved University of Toronto. Først arbejdede jeg på at opbygge et anbefalingssystem, der lignede dem, der blev brugt i Netflix -udfordringen. For det andet havde jeg ikke været opmærksom på college -basketball det år, men jeg havde brug for at udfylde mit beslag til en pulje med nogle venner. På et tidspunkt slog det mig, at jeg kunne bruge den nøjagtig samme anbefalingsalgoritme, som jeg havde kodet op til at lave mine parentesforudsigelser.

Tarlow forklarede videre, hvordan computerne klarede sig mod deres menneskelige modstykker i sidste års konkurrence. Vi inkluderede tre menneskelige basislinjer: altid at vælge det højere frø, beslaget forudsagt af Nate Silver og Lees personlige beslag. Mod det felt vandt maskinerne. (For de uindviede er New York Times 'Nate Silver skaber en beslag hvert år, der kombinerer menneskelige og computerbaserede systemer.)



Tarlow og Zen er begge enige om, at selvom succesraten for hver algoritmisk tilgang kan variere meget, bliver computerne bedre for hvert år. Tilgange og opsætninger bliver helt sikkert mere sofistikerede, sagde Zen. Men selv da ridser vi kun i overfladen.

Tarlow var enig i, at de stadig har en lang vej at gå. Jeg vil bare sige, at jeg ikke har taget min bankkonto og tog til Vegas endnu, sagde han.

Du behøver ikke oprette din egen algoritme for at få lidt robothjælp til dit beslag. Der er masser af gratis computerbaserede forudsigelsesmodeller derude, fra nummerBrand til Power Rang (som viser sine forudsigelser i en attraktiv visualisering). Men hvis der er en ting, de fleste forudsigere er enige i, menneskelige eller på anden måde, er det, at de smarte penge er på nummer 1 samlet seed Kentucky til at tage mesterskabstrofæet med hjem. Så igen, ESPN er hurtig til at påpege, at nr. 1 samlede frø har vandt kun én gang siden udvalget begyndte at uddele denne sondring for otte år siden.



Alt dette afslører, hvad vi allerede i hemmelighed vidste, selvom vores ego før turneringen forsøger at fortælle os noget andet: Der er ingen idiotsikker metode til at forudsige sport, uanset hvor vidende mennesket eller hvor avanceret algoritmen er. Så Amerika, stop med at kvalme over din beslag og gå tilbage til arbejdet.

[ Billede: Flickr -bruger Erik Charlton ]