«La follia sta nel fare sempre la stessa cosa aspettandosi risultati diversi». Così, forse, si espresse il grande Albert Einstein nella definizione dell’insania. Ebbene, non sappiamo quali siano le ragioni che hanno portato gli organizzatori a non ripetere gli errori degli anni scorsi, ma di certo al Passatore qualcosa è cambiato, a giudicare dalle statistiche. L’anno scorso avevamo parlato degli atleti della domenica, facilmente tentati da comportamenti «immorali» in gara. Sarà stato così anche quest’anno?
Ecco come la fredda statistica a volte fornisce risposte che l’intuizione non permette di valutare! La risposta è decisamente negativa, per chi non avesse voglia di leggere l’articolo, sappia che ci sono stati almeno il 35% di tagli in meno rispetto al 2018. Come al solito, consigliamo di spegnere le notifiche del cellulare e dedicare 10 minuti alla lettura di quanto segue. Buon divertimento.
Passatore 2019, imbrogliare è più difficile ma non impossibile
Anche quest’anno abbiamo voluto analizzare uno strano fenomeno conosciuto nel mondo delle Ultramaratone come il taglio del percorso. Gli anglosassoni definiscono questo comportamento cheating, «imbroglio». In Italia preferiamo il termine “furbetti” per denotare il comportamento di chi per scelta decide di non correre tutti i chilometri di una gara.
Come usare i dati per identificare «strani» fenomeni
Ancora una volta, vorremmo anticipare una premessa prima di spiegare i risultati del nostro studio, che è stato possibile grazie al supporto di una serie di amici podisti. Ringraziamo anche Cosimo Bertotto, l’ultra-maratoneta tarantino che ha migliorato il suo risultato di 2 ore quest’anno, per averci dato preziose indicazioni sulla gara e sui possibili tagli.
La nostra analisi è fatta tutta a livello aggregato, per evitare di creare polemiche inutili. L’obiettivo di quest’articolo è sensibilizzare gli organizzatori di gare di media e lunga distanza ad utilizzare la tecnologia per garantire una classifica più attendibile.
Ancora una volta per stabilire eventuali incongruenze nei dati, siamo partiti dai sette intermedi individuali e dal risultato finale. Abbiamo confrontato il tempo in secondi di ogni podista, con tutti gli intermedi, valutato chi ha saltato qualche cancello, calcolato un rapporto per quantificare la variazione del tempo tra la prima e la seconda parte. La novità di quest’anno è stata l’aggiunta di una media normalizzata di ogni intermedio, che consente ulteriormente di cercare i furbetti.
Così come l’anno scorso, soltanto 1 dei primi trenta ha ottenuto uno split negativo, ecco il solito grafico di confronto tra la prima e la seconda parte per i più forti podisti.
Si noti che nella lista degli oltre 2600 arrivati al traguardo di Faenza, 170 passaggi intermedi non sono stati rilevati, comunque che la classifica definitiva non è ancora stata redatta. Potremmo pensare che sia un caso, ma forse non lo è proprio. E’ strano che il numero di passaggi non rilevati aumenti nella seconda parte. Ad ogni modo, questa è la suddivisione:
Passatore 2019: molto meglio dell’anno scorso
Diamo un’occhiata alla distribuzione statistica del rapporto tra la seconda e la prima parte di gara. La prima cosa da notare è che circa il 18% dei podisti ha corso la seconda parte almeno il 30% più lentamente della prima e che in media si è corso più lentamente di oltre il 19% la seconda parte. Rispetto all’anno scorso siamo passati dal 13% al 18% per i più lenti e dal 15% al 19% come media tra le due frazioni virtuali. Prendendo i dati del 2017, abbiamo notato che invece non c’erano differenze con il 2018. Cosa dimostrano questi dati? Delle due, l’una: a) che i controlli hanno funzionato b) che i podisti di quest’anno sono stati più lenti rispetto al solito.
Anche per lo split negativo, siamo rimasti esterrefatti. Come al solito solo una piccola percentuale dei partecipanti ottiene uno split negativo, delimitato nel grafico dalla linea verde continua. Quest’anno la percentuale è diventata molto inferiore, solo il 4.6% ha fatto un’exploit del genere, contro il 7.7% dell’anno scorso. Ricordiamo ovviamente che il percorso è negli Appennini, e che la misurazione avviene al km 48 ed al 100-esimo. E’ possibile correre più velocemente la seconda parte, ma non è da tutti! E quest’anno solo la metà dei podisti dell’anno scorso ci è riuscita!
Per quanto riguarda il rapporto tra tempo di conclusione della gara e il negative split, anche quest’anno i più allenati, i più veloci, hanno ottenuto una maggiore percentuale di negative split. Confrontando la distribuzione dei veloci (sotto le 11 ore) e dei “lenti” (sopra le 11 ore) si vede che, come la teoria prevederebbe, i più veloci hanno uno split negativo più probabile ed i più lenti uno più alto. Per chi non è avvezzo alla statistica, si noti che la densità è pari a 100 per entrambe le distribuzioni, ma i più lenti sono molto di più.
Ma analizzando tutti i partecipanti, con un’ottica diversa, si evince che forse qualche furbetto c’è stato ancora. Qualche numero del grafico qui sotto grida vendetta. Oppure ci sbagliamo?
La domanda sorge spontanea: come identificarli allora?
Casi Estremi: una nuova tecnica d’analisi
In effetti per sapere chi ha veramente barato, bisognerebbe analizzare la distribuzione degli estremi. In statistica si analizzano gli outliers, ossia le più probabili incoerenze per stabilire se il modello analizzato è sensato. Quest’anno abbiamo confrontato ogni podista, contro se stesso, in ogni intermedio:
- abbiamo normalizzato il passo medio dei primi 16 chilometri (qualunque sia stata la media, abbiamo utilizzato 100 come valore);
- confrontato il passo medio degli altri intermedi (95= si è corso il 5% più velocemente, 105 = si è corso il 5% più lentamente nel particolare intermedio);
- abbiamo preso tutti i tempi sospetti.
E per dimostrare che qualche furbetto c’è ancora, ma pur sempre meno dell’anno scorso, abbiamo confrontato il passo medio Normalizzato tra la prima discesa, tra vetta le Croci e San Lorenzo, e quella tra Marradi e San Cassano. Fatto 100 il tempo dei primi 16 chilometri, non è sorprendente che si sia corso più velocemente nella prima discesa, sebbene solo pochi l’abbiano fatto. Quello che è più sorprendente è che ci sono alcuni podisti che abbiano corso fortissimo dopo 65 km, rispetto alla loro media iniziale. Preferiamo non fare nomi, ma di sicuro alcuni pallini rossi del grafico gridano vendetta!
Conclusioni
Nonostante qualche incongruenza, siamo davvero molto contenti di quanto abbiamo visto analizzando i dati. Forse i podisti italiani sono diventati più lenti, oppure forse il numero dei furbetti è proprio diminuito quest’anno. Chi ha partecipato ha sottolineato le seguenti situazioni:
- i controlli sono aumentati significativamente;
- il passaggio intermedio a Casaglia ha ridotto le possibilità di taglio;
- le auto al seguito si sono ridotte sensibilmente.
In sintesi, stimiamo che quest’anno il numero dei furbetti sia diminuito del 35%, rispetto all’anno scorso. Ma purtroppo vedendo i dati, anche se con il beneficio del dubbio, vi assicuriamo che c’è una probabilità non nulla che qualche furbetto abbia corso il Passatore 2019 e appaia ancora in classifica. Ma meno dell’anno scorso!
Infine, sottolineiamo l’ottimo lavoro da parte dell’organizzazione del Passatore! Ma per sradicare completamente il fenomeno, suggeriamo nuovamente agli organizzatori di dotarsi di strumenti tecnologici per effettuare maggiori controlli.
Per approfondimenti
Per chi volesse approfondire alcuni argomenti discussi, alleghiamo alcuni links:
- L’analisi statistica dei maratoneti in Italia
- Il racconto del Passatore 2018 di Cosimo Bertotto
- Le analisi Statistiche della Comrades Marathon (in inglese)
- L’analisi Statistica del Passatore 2018