Sånn bruker du spor-statistikkene | Galoppanalyse.no
Previous
CLOSE
Next

Sånn bruker du spor-statistikkene

juni 30, 2021

Hva visualiserer sporstatistikken?

Sporstatistikk er det første lille verktøyet vi har utstyrt dere med. Den finnes under fanen Galoppinfo i menylinjen øverst på siden.

Sporstatistikken gir en enkel, visuell fremstilling. Fargene indikerer hva man statistisk sett kan forvente av lengder tapt ved vide svinger, mens høyden på grafene tar utgangspunkt i antall seire, eller seiersprosent, avhengig av hvilken startspor-statistikk man ser på. I begge versjonene finnes dessuten all informasjonen i tooltip, som man får opp ved å holde musepeker over eller trykke på et av sporene.

En liten ekstra forklaring av fargene og hva de indikerer er nok på sin plass.

Helt konkret er det en skala i bakkant som farger innside-reiser (rail trip) helt grønne – og motsatt visualiseres reiser langt ute i sporene helt røde (wide trip). Det du ser i tabellen er til enhver tid gjennomsnittet av disse beregningene for hvert spor – med utgangspunkt i data fra de filterinnstillingene du har stilt den inn på. Filtrene bestemmer med andre ord datautvalget som brukes for å beregne. 

Dataen som viser lengder tapt i sving er samlet inn ved videoanalyse av alle løp som løpes i Skandinavia og på Meydan. Der følger vi alle hester gjennom svingen, leser av svingene på flere punkter, og gjør en gjennomsnittsberegning av hvor langt ute fra inner-rail hver enkelt hest har løpt gjennom svingen (hester holder ikke nødvendigvis samme “bane” hele veien!). 

Datagrunnlaget i akkurat denne visualiseringen blir kun oppdatert av og til, og tar for øyeblikket utgangspunkt i resultater fra 2017-2020. 

Eksempel på startspor-statistikk sortert etter antall seiere:

Her vises antall seiere og gjennomsnittlige lengder tapt ved vide svinger på alle baner, distanser og underlag sett under ett. Dette ser enda voldsommere ut enn det egentlig er, fordi den ikke tar hensyn til at det er mange flere startere på spor 1-6 enn de utvendigste sporene, fordi det er relativt sjeldent med helt stappfulle felt. Vi anbefaler derfor å alltid bruke visualiseringen som tar utgangspunkt i seiers-prosent i tillegg.

Hvordan kan man bruke visualiseringene?

For å unngå å bli lurt av statistikken er det viktig å være bevisst at en rå-opptelling av antall seire på hvert spor vil bli skjevfordelt, da det er mange flere starter på lavere startspor enn på høye. Ganske enkelt fordi gjennomsnittlig “field size” i Skandinavia ikke er mer enn 7-8 hester.

Av denne grunn foretrekker vi ofte selv å bruke en statistikk som tar utgangspunkt i seiersprosent,  fremfor antall seire.

Tar man utgangspunkt i de samme datafiltrene som bildet over viser, vil  seiersprosent-statistikken se slik ut:

Eksempel på den samme statistikken, sortert etter seiersprosent:

Her vises seiersprosent og gjennomsnittlige lengder tapt ved vide svinger på alle baner, distanser og underlag sett under ett. Her ser man at de samme tendensene fortsatt er veldig klare, men ikke like ekstreme som i eksempel 1.

Filtrene kan stilles inn slik at den viser det du ønsker deg. Her kan du velge den banen, det underlaget, den distansen, og den tidsperioden du selv ønsker å studere. Visualiseringen vil alltid aggregere på de filtrene man til en hver tid har aktivert.

Her må man være litt obs på størrelsen av utvalget etter man har justert filtrene. Enkelte distanser løpes for eksempel sjelden og vil derfor ha et lite utvalg, og statistikken være sårbar for tilfeldigheter.

Kombiner statistikkene med bruk av sunn fornuft!

Jo mer data en spesifikk visualisering baserer seg på, jo tryggere kan man være på at tendensene man ser gir en god representasjon av virkeligheten. 

Pro tip! Helt øverst på hver søyle står det i grå skrift hvor mange starter den beregner ut i fra for hvert av sporene.   

Et ferskt eksempel på et godt spill funnet med sporstatistikk

La meg vise dere et ferskt eksempel på en konstruktiv bruk av startspor-statistikken.

Vi skal til lunsjgaloppen 2. juni 2021 på Bro Park, bare et par dager etter at vi laget og publiserte denne visualiseringen for første gang.

Det var duket for 1000 m dirtløp på Bro Park, og det var ikke så enkelt å finne hester å like. Det luktet skrellmuligheter. En god vane når man starter med å handicappe et løp, er selvfølgelig å sjekke startspor-statistikken på de aktuelle betingelsene. Det er vanskelig å huske alt i hodet. 

For å få opp startsporstatistikken til 1000 m dirtbane på Bro må man velge følgende innstillinger:

BANE = BRO PARK

UNDERLAG = DIRT

DISTANSE = 1000

ÅR = ALL

Da får man opp det viewet vi ser over, der man har sortering etter antall seire på den ene, og etter seiersprosent på den andre. 

De viser jo akkurat den samme tendensen, at det ser ut til å være en helt usedvanlig stor fordel å ha startspor 1 på akkurat denne distansen med 1000 m dirtbane på Bro. 

Her ser man samtidig at datagrunnlaget er dårlig, så da må man bruke sin vurderingsevne til å vurdere om dette er tilfeldigheter, eller en reell tendens. Kun 11 starter som datagrunnlag her er, er selvsagt i minste laget til å være sikker, men samtidig er 5 av 11 seire en så voldsom uttelling at det er fristende å tenke at det ikke kan være helt tilfeldig. 

Har man i tillegg sett noen løp så får man jo lett noen hypoteser. Det er fristende å tenke at det vi egentlig ser her, er at den som klarer å svare opp innersporet/ta teten på akkurat denne distansen vil ha svært gode kort på hånda. 

Etter å ha gjort oss opp disse tankene tittet vi på formen igjen.

Samara Bay var ikke en hest vi ved første øyekast levnet mye sjanse. Den hadde definitivt ikke vist noen prestasjonstall som egentlig var konkurransedyktig i dette selskapet, i et løp der Hypochondriac og Moojim var favoritter. Vi erindret så vidt at den hadde vist noen glimt av “speed”, og ettersom vi ikke likte noen andre veldig godt heller så tok vi den med på ren mistanke i v4-spillet. Som visualisert på bildene under så ser man en Samara Bay som spretter til tet, og holdt unna enkelt til en sikker seier. Vinneroddsen var 18,92 i odds. 

Dette er bare ett eksempel selvsagt, og det blir jo et nok så anekdotisk bevis, men tanken var bare å illustrere hvordan startspor-statistikken kan hjelpe i idéarbeidet. 

Det er jo dette som er “The Art of Handicapping” ! 

Hadde Samara Bay vært 4 i odds kunne man selvsagt ikke ha tillat seg å spekulere i et tynt datagrunnlag på denne måten, men når det er 19 i odds, ja da kan man gi seg selv litt “creative license”. Det handler om prosenter.  

Pro tip nr 2! Det var Archers Ignite som ble nr 2 i dette løpet, den startet i spor 3 som var 0 fra 10. Akkurat det kan sikkert være litt tilfeldig, men det ser jo unektelig ut som den hadde veldig vanskelige arbeidsbetingelser når oppgaven var å ta igjen en tethest fra spor 1 på denne distansen. Det er jo sånt man kan legge seg på minnet til Archers Ignite skal ut igjen, og kanskje “oppgradere” prestasjonen litt basert på den hypotesen. Det hadde man i såfall gjort rett i, akkurat i dette tilfellet, for Archers Ignite har vunnet begge sine to løp siden og det i veldig god stil. 

Vi er i det generøse hjørnet og klinker like fullt til med:

Pro tip nr 3! Avstand fra startgate til første sving er en faktor som har mye å si for hvor fordelaktig det vil være med innerspor på spesifikke distanser. Jo kortere tid til svingen, jo vanskeligere vil det være å unngå vide svinger med et høyt startnummer. Det er rett og slett kortere tid til å sikre en god posisjon. 

Da gjenstår det bare å si god fornøyelse,

– og hvis man snubler over sånne klare tendenser som i dette eksempelet så vil det jo kunne utgjøre et ypperlig diskusjonsemne på forumet vårt

Leave a Reply

Your feedback is valuable for us. Your email will not be published.

Please Wait...