È opinione comune che il tennis sia uno degli sport in cui la componente psicologica ha più peso nell’andamento dei match. Ne è prova, ad esempio, il fatto che Timothy Gallwey, uno dei padri delle procedure di Business Coaching e Life Coaching, si sia ispirato alla sua esperienza di allenatore di tennis per la stesura del suo best seller “The inner game of tennis”, datato 1974 e per certi versi ancora molto attuale. In tempi più recenti, anche Agassi e Panatta hanno insistito molto questo su aspetto nelle loro autobiografie, con il tennista romano che ha calcato la mano addirittura nel titolo del suo libro, affermando senza mezze misure che “il tennis l’ha inventato il diavolo”.
Tale stretta connessione tra ciò che succede in campo e ciò che succede nella mente dei giocatori conduce spesso a proverbiali affermazioni che, si può dire, vengono ritenute di conventional wisdom. Ad esempio, si ritiene che, proprio per ragioni psicologiche, il settimo game, per un set che si trova sul 3-3, sia particolarmente importante, perché rompe l’equilibrio proprio nel momento in cui il parziale entra nella sua seconda metà. O, ancora, si ritiene comunemente che, in particolare in una partita che va al quinto set, sia un vantaggio servire per primi, nel set decisivo, così imponendo all’avversario (a meno, naturalmente, di non subire un break in apertura di parziale) la sgradevole sensazione di inseguire proprio nella fase in cui la partita si avvia alla conclusione.
La crescente disponibilità di dati strutturati relativi ai match ATP ci consente ora di mettere tali affermazioni alla prova dei fatti, e di verificarne la rispondenza alla realtà. Considereremo nel seguito, a tale scopo, tutti i match di singolare maschile di prove del Grande Slam (Australian Open, Roland Garros, Wimbledon, US Open) dell’ultima decade, dal 2011 al 2021. Potendo contare su questa corposa base dati, cominciamo questo nostro percorso chiedendoci: ma davvero chi vince il settimo game sul 3-3 si aggiudica il set?
IL SETTIMO GAME
A prima vista, si sarebbe tentati di rispondere in modo affermativo. In effetti, nel 54,3% dei casi (più della metà quindi) chi si porta sul 4-3 in proprio favore vincendo il settimo game finisce per aggiudicarsi la partita. Ma per attestare la validità di questa prima superficiale osservazione sembra opportuno chiedersi, più specificamente, se rompere la parità in quel particolare momento è più significativo rispetto a farlo leggermente prima, o leggermente dopo. In altre parole: vincere il settimo game sul 3-3 ha un peso maggiore rispetto a vincere il nono game sul 4-4, o il quinto game sul 2-2?
Il set viene vinto da chi si aggiudica il nono game sul 4 pari nel 53,6% dei casi. Percentuale comparabile, ma leggermente inferiore rispetto al 54,3% registrato per il settimo game, sempre nel caso di un set in equilibrio. Osservando che, per il nono game, si è ancora più vicini alla conclusione della partita, quindi la vittoria di un game comunque “pesa” di più, si sarebbe tentati di identificare una correlazione, sia pur non particolarmente forte, tra la vittoria del settimo game sul 3-3 e la vittoria del set. Prima di concludere però, ripetiamo l’analisi, esaminando questa volta il quinto game, sul punteggio di 2-2.
Forse un po’ sorprendentemente, ci troviamo a constatare che il set, se ci si trova sul 2-2, viene vinto, nel 56,7% dei casi, da chi si aggiudica il quinto game. Nonostante tale game avvenga in un momento più lontano dalla conclusione del set, quindi, numeri alla mano sembra avere un effetto maggiore sull’esito finale del parziale.
Pur non essendo sufficiente a pronunciare una parola definitiva sul mito del settimo game, tale semplice analisi ha forse il pregio di suscitare qualche dubbio e qualche curiosità in più, portando un’ipotesi che viene dall’esperienza a più diretto contatto coi dati e, potremmo dire, con l’esperimento.
Proviamo ad applicare tale logica anche a un’altra affermazione cult: conviene servire per primi nel set decisivo.
SERVIRE PER PRIMI NEL SET DECISIVO
Concentriamoci sui 728 match del Grande Slam che nel corso degli ultimi dieci anni sono arrivati al quinto set. Effettivamente, la percentuale di casi in cui chi ha servito per primo in queste 728 occasioni ha vinto il set (e, di conseguenza, la partita) è maggiore del 50%: per la precisione, si tratta di 380 casi (52,2% del totale). Riflettendo, possiamo considerare che, se davvero tale vantaggio esiste, è ragionevole attendersi che sia maggiore nel caso di Australian Open, Roland Garros e Wimbledon, i quali, per larga parte del periodo considerato, non prevedevano tie-break o super tie-break, ma un long set nel caso di una partita sul due set pari, con (possibile) prolungamento della pressione psicologica su chi si trova a servire per secondo.
Effettivamente, 310 dei 576 match di Australian Open, Roland Garros e Wimbledon degli ultimi 10 anni arrivati al quinto set sono stati vinti dal giocatore che serviva per primo: il 53,8% del totale. Una percentuale maggiore, quindi, rispetto a quella osservata considerando anche lo US Open.
Possiamo quindi dire che, in questo caso, almeno a un primo sguardo, e concentrandoci sui match di livello più elevato (tornei del Grande Slam) sembra esserci un accordo tra conventional wisdom e dati. Passiamo allora all’analisi critica di una terza considerazione, spontanea ma non per questo necessariamente suffragata dai dati: in una partita combattuta, vince chi vince i game più tirati, quelli che finiscono ai vantaggi.
CHI VINCE I GAME AI VANTAGGI VINCE LA PARTITA?
Per l’analisi di tale affermazione, e per misurarne l’aderenza rispetto all’andamento dei match di singolare maschile di tornei del Grande Slam degli ultimi dieci anni, concentriamoci innanzitutto sui match con almeno dieci game ai vantaggi. Ciò ci permetterà di focalizzarci sulle partite dall’andamento meno scontato e al contempo sui dati statisticamente più significativi. Vincere dieci game su dieci ai vantaggi (100%), ad esempio, ha un peso diverso rispetto a vincere l’unico game ai vantaggi disputato (ma il risultato puramente numerico sarebbe del 100% anche in questo caso).
Preparando il dataset per l’analisi, osserviamo che negli ultimi dieci anni 2050 match di singolare maschile sono stati caratterizzati da almeno dieci game ai vantaggi. Per valutare se, effettivamente, a partire da questo sottoinsieme di partite, la vittoria dei game ai vantaggi sia significativamente correlata alla vittoria della partita, proviamo a servirci di una diversa rappresentazione grafica: il box-plot. Il box-plot rappresenta la distribuzione statistica di una variabile, in questo caso la percentuale di game ai vantaggi vinti dal vincitore del match, per i 2050 match considerati.
Un concetto comunemente utilizzato, nell’analisi di distribuzioni statistiche, è quello di percentile. Si tratta di questo: immaginiamo di ordinare le percentuali di game ai vantaggi vinti dai vincitori dei 2050 match considerati in ordine crescente. Il match numero 205 di questa lista ordinata corrisponderebbe al decimo percentile della distribuzione (dato che 205/2050 = 0,1 = 10%). Nel box plot vediamo una sottile barra di colore giallo a identificare il cinquantesimo percentile, detto anche mediana della distribuzione. In caso la percentuale di game ai vantaggi vinti fosse particolarmente significativa, ci aspetteremmo un valore mediano, per i vincitori dei match, maggiore del 50%, a testimoniare questa correlazione: invece non è così.
Non soltanto: la zona del box-plot colorata in verde definisce l’intervallo all’interno del quale si ritrova il 50% “centrale” della distribuzione. L’estremo inferiore della zona colorata in verde coincide cioè con il venticinquesimo percentile della distribuzione, l’estremo superiore con il settantacinquesimo. Osserviamo che la fascia centrale della distribuzione presenta la stessa escursione verso l’estremo inferiore (50%-36,4% = 13,6%) rispetto a quello superiore (63,6%-50% = 13,6%).
Come ulteriore verifica, poniamo ancora una volta la domanda ai dati, servendoci di un diverso strumento di indagine: la curva ROC.
Ci chiederemo, questa volta, se esistano soglie (non necessariamente il 50%) di game ai vantaggi vinti che possano rivelarsi decisive per la vittoria della partita. Ancora una volta, per le ragioni già citate, ci concentreremo sui match con almeno dieci game finiti ai vantaggi. Per condurre questo tipo di analisi, ci si può servire della curva ROC. Per tracciarla, si procede in questo modo:
- si considera ogni possibile valore di soglia in termini di percentuale di game vinti ai vantaggi, a partire dallo 0% fino al 100%
- per ciascuno di questi valori (prendiamo ad esempio il 10%) ci si domanda: quanto sarebbe preciso dire che chi vince più del 10% di game ai vantaggi vince la partita?
- la risposta a questa domanda si caratterizza di due componenti: sensitivity (ovvero la quota di vittorie correttamente identificate) e specificity (ovvero la quota di sconfitte correttamente identificate)
- ciascuna soglia può quindi essere rappresentata come un punto, con l’asse verticale rappresentato dalla dicitura “Sensitivity” e l’asse orizzontale rappresentato da “1-Specificity”
- connettendo questi punti, si può tracciare una curva, detta curva ROC (Receiver Operating Curve)
- si dimostra che l’area compresa sotto tale curva, detta AUC (Area Under the Curve) corrisponde alla probabilità che, data una coppia di match (match 1 e match 2), la percentuale di game ai vantaggi vinti dal vincitore del match 1 sia maggiore della percentuale di game ai vantaggi vinti dallo sconfitto del match 2
Quanto più l’AUC si avvicina a 1, tanto più l’elemento considerato (in questo caso la percentuale di game ai vantaggi vinti) è rilevante rispetto al target (la vittoria della partita). Osserviamo che, in questo caso, l’AUC è uguale a 0.504, appena superiore al 50%. La scarsa rilevanza della vittoria nei game ai vantaggi sembra quindi confermata.
Proviamo ora a chiederci se, effettivamente, come spesso si suppone, la vittoria del primo set sia spesso decisiva, in particolare per il giocatore sfavorito dal pronostico.
IL PRIMO SET È DECISIVO, SOPRATTUTTO PER IL GIOCATORE PIÙ DEBOLE
Chiediamoci quindi se, specie in un torneo del Grande Slam, sempre a livello di singolare maschile quindi in un match a tre set su cinque, la vittoria del primo set risulti molto rilevante per indirizzare la partita e, più nello specifico, cerchiamo di capire se tale considerazione sia valida in misura ancora più netta per i giocatori che affrontano un avversario di maggiore blasone, ovvero con una migliore classifica ATP.
In primo luogo, osserviamo che 2271 dei 2902 match considerati si concludono con la vittoria del giocatore che si aggiudica il primo parziale: in altre parole, nel 78,2% dei casi chi vince il primo set vince anche la partita. Si tratta di gran lunga del pattern più forte tra quelli esplorati in questo articolo. Ad esempio, se consideriamo l’effetto del ranking sull’esito della partita, osserviamo che in 2238 casi su 2902 (ovvero nel 77,1% dei casi) il match viene vinto da quel giocatore che, a fine stagione, occuperà una miglior posizione nella classifica ATP. In altre parole, la vittoria del primo set sembra “pesare” addirittura leggermente più della classifica rispetto all’esito del match.
E, come la conventional wisdom insegna, la combinazione dei due fattori risulta ancora più predittiva rispetto al nome del vincitore del match. Se il primo set è vinto dal giocatore di ranking inferiore, infatti, l’avversario riuscirà a cavarsela nel 30% dei casi (196 match su 664). Se a portare a casa il primo parziale è invece il giocatore sulla carta più forte, allo sfidante, dati alla mano, sembra rimanere meno del 20% di possibilità di ribaltare la situazione (435 casi su 2238).
Questo ci raccontano i dati, che, come sempre, cerchiamo di approcciare con occhio critico, come uno degli strumenti per rispondere, con concretezza e precisione, alle nostre curiosità. Tenendo cioè sempre a mente la massima di Henri Poincarè, secondo cui “la scienza è fatta di dati come una casa è fatta di pietre. Ma un ammasso di dati non è scienza più di quanto un mucchio di pietre sia una vera casa”.
Nota: i grafici inseriti nell’articolo sono realizzati per mezzo del software Rulex
Genovese, classe 1985, Damiano Verda è ingegnere informatico e data scientist ma anche appassionato di scrittura. “There’s four and twenty million doors on life’s endless corridor” (ci sono milioni di porte lungo l’infinito corridoio della vita), cantavano gli Oasis. Convinto che anche scrivere, divertendosi, possa essere un modo per cercare di socchiudere qualcuna di quelle porte, lungo quel corridoio senza fine. Per leggere i suoi articoli visitate www.damianoverda.it