Im Jahr 2014 wurden zum ersten Mal die Startnummern bei einem Bewerb (Gmunden Triathlon) über die prozentuellen Rückstände beim Triathlonranking Austria, gerechnet über das 24-Monatsranking, vergeben. Die statistische Auswertung dieses Bewerbs ergab damals eine Korrelation zwischen Endrang und Startnummer von 0,93 (Ein Ergebnis von 1 würde bedeuten, dass die Startnummern exakt der Endplatzierung entsprechen) – in der Statistik spricht man dabei von einem sehr hohen Zusammenhang. Die genaue Analyse könnt ihr hier nachlesen.
Die Analyse von Sportwissenschafter Thomas Doblhammer und Mathematiker Andreas Stöckl
Im Jahr 2015 konnten wir den Traun Triathlon für dieses System gewinnen. Allen angemeldeten Teilnehmer/innen bis zum Nennschluss wurden daher Startnummern aufgrund der Reihung im Triathlonranking zugeteilt. Für die Reihung wurden die Werte des 24-Monatsrankings zum Zeitpunkt sieben Tage vor dem Wettkampf herangezogen.
Die Zahl der Anmeldungen belief sich auf insgesamt 142 Herren und 27 Damen, die auch im Ranking zu finden waren, plus 37 Herren und 6 Damen für die noch keine Daten im Ranking vorhanden waren.
Den 169 Teilnehmer/innen, die eben bereits im Ranking vertreten waren, wurden Basis der prozentuellen Werte somit die Startnummern zugewiesen.
Stellt man nun die Ergebnisliste nach dem Bewerb der Startnummernreihenfolge gegenüber, so ergibt sich dabei bereits eine Korrelation zwischen Endrang und Startnummer von 0,5 bei den Männern und 0,26 bei den Damen. In Gmunden 2014 lag dieser unbereinigte Wert bereits bei 0,77 (Herren). Der Grund dafür ist leicht erklärt, Gmunden 2014 war ausverkauft, sprich die vollständige Teilnehmerliste stand bereits eine Woche vor dem Bewerb fest. Beim Traun Triathlon 2015 gab es noch freie Plätze bei Online-Anmeldeschluss und dadurch einige Nachnennungen. Diese wurden natürlich nicht nach Leistungsniveau eingereiht und lassen die Korrelation bzw. den Zusammenhang zwischen Startnummer und Endplatzierung sinken.
Um nun aber unsere Verteilung zu testen, müssen wir vor der Korrelationsberechnung die Ergebnisliste „bereinigen“.
Folgende Schritte haben wir dazu sowohl bei Damen und Herren durchgeführt:
- Es wurden alle Ergebnisse der Teilnehmer/innen entfernt, die keine Startnummer durch das Triathlonranking erhalten haben.
- Es wurden alle gemeldeten Teilnehmer/innen entfernt, die nicht beim Bewerb angetreten sind oder nicht ins Ziel kamen.
- Die verbliebenen Ergebnisse wurden nach Startnummern sortiert und beginnend mit 1 fortlaufend nummeriert.
- Danach wurden die Ergebnisse nach erreichter Endzeit sortiert und ebenfalls mit 1 beginnend nummeriert.
Dadurch haben wir nun eine bereinigte Ergebnisliste erhalten.
Es verblieben zur Analyse 121 Herren und 25 Damen. Diese Daten wurden nun erneut auf den Zusammenhang (Korrelation) zwischen Startnummer und Endrang überprüft. Dabei ergab sich bei den Herren ein bereinigter Korrelationskoeffizient Rang / Startnummer von 0,89 und bei den Damen von 0,97. Eine Korrelation von 0,97 bedeutet, dass der Zusammenhang zwischen zugewiesener Startnummer und erreichter Endplatzierung sehr hoch ist.
Bei den Herren ist sehr auffällig, dass besonders ein Punkt extrem weit außerhalb der Punktewolke liegt. Dieser entstand durch einen bereinigten Endrang von 116 bei einer bereinigten Startnummer von 23. Solch ein Unterschied ist rein durch eine „schlechte Tagesleistung“ nicht zu erklären. Bei einer Nachbetrachtung im Ranking ergab sich, dass es von dieser Person zwei mit gleichem Namen gibt. Wobei eine Person ein deutlich höheres Leistungsniveau aufweist. Hier kam es bei der Vergabe der Startnummern zu einer Verwechslung. Würde man dieses Ergebnis löschen, so ergibt sich eine Korrelation bei den Herren von 0,92 – dies würde einem ähnlichen Wert wie beim Gmundentriathlon 2014 (0,93) entsprechen.
Dies beweist nun bereits ein zweites Mal, dass die Werte aus dem Triathlonranking zumindest eine Korrelation mit einem realen Wettkampfergebnis von ca. 0,9 ergeben. Wir sind mit diesem Ergebnis sehr zufrieden!
Der Hauptgrund, warum die Korrelation nicht noch höher ist, liegt an der Mischung aller Bewerbsdistanzen im Ranking (Spezialisten für Sprint/Kurzdistanzbewerbe oder Mittel/Langdistanzbewerbe) und an den unvorhersehbaren Ereignissen während eines Wettkampfes (Zeitstrafen, Defekte, und ähnliches) aber wir arbeiten weiter an Verbesserungen!