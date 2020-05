Se volessimo semplificare al massimo le dinamiche di una partita di tennis, diremmo che un giocatore A con elevata probabilità di tenere il servizio e strapparlo all’avversario batte un giocatore B con meno probabilità di tenere il servizio e strapparlo al suo avversario. Sappiamo bene che non sarà mai così semplice descrivere uno sport che può essere deciso da una manciata di punti, e che in un match e – più in generale in un torneo – entrano in gioco altre centinaia di variabili che potrebbero influenzare negativamente o positivamente l’uno o l’altro atleta. Dunque non osserviamo così spesso un rapporto causale così netto tra probabilità di vincere game di servizio e risposta e probabilità di vincere una partita, descritto nell’ipotesi “minima” con cui abbiamo iniziato quest’analisi.

È comunque interessante testare la sua veridicità, o almeno studiare i dati che ci portano a tenerla in considerazione. Se n’è occupato il blogger Martin Ingram, che ha sviluppato un’idea di due matematici (evidentemente appassionati di tennis) della Swinburne University in Australia, Tristan Barnett e Stephen R. Clarke. I due hanno pubblicato a metà degli anni Duemila un paper che spiega come analizzare i dati statistici di un match per predire come andrà a finire, tramite l’utilizzo di funzioni e grafici. Ingram ha preso in considerazione l’idea che le caratteristiche di ogni giocatore si possano dividere in “serve skill” e “return skill“, efficienza al servizio e in risposta.

La funzione dalla quale si parte per costruire una tavola di regressione logistica è p(punto-vinto-al-servizio) = abilità del servitore – abilità del ribattitore + intercetta. Se non vi piace la matematica (non la ama nemmeno chi ne sta scrivendo), non è un problema, come specifica Ingram. Basta sapere che questo lavoro preliminare è utile per categorizzare i giocatori. Infatti nel circuito può esserci un John Isner che grazie alla sua altezza ha un’altissima probabilità di tenere il servizio, ma è carente nei turni di risposta. Al contrario un atleta come David Ferrer, non avendo un servizio straordinario, si trovava molto più a suo agio nei turni di risposta che nei suoi turni battuta. È quindi interessante capire cosa viene fuori combinando le due probabilità.

Lo studio di Ingram è stato possibile grazie alla mole di dati presenti sul sito Tennis Abstract, che permette di risalire fino al 1991 e quindi includere nel modello anche giocatori che hanno ormai appeso la racchetta al chiodo. Come si legge il grafico? Innanzitutto i valori ottenuti sono stati modulati per variare su una scala da 0 a 1. Sull’asse orizzontale si ha la probabilità di vincere un punto al servizio contro un giocatore medio, mentre sull’asse verticale la probabilità di vincere un punto in risposta contro un giocatore medio. Ingram spiega inoltre che per ottenere una più facile lettura del grafico il “giocatore medio” ha probabilità di vincere un punto alla battuta e in risposta uguale a zero. Giocatori che si collocano in alto a destra nel piano avranno la più elevata probabilità di vincere le partite, che diminuirà man mano che ci si avvicina all’origine degli assi (in basso a sinistra).

Probabilità di vincere un punto al servizio e in risposta contro un giocatore medio

(grafico a cura di Martin Ingram)

Combinando le due probabilità otteniamo una ‘nuvola’ di punti più o meno omogenea. Sono presi in considerazione i migliori 50 giocatori considerando entrambe le componenti. Analizzando i singoli casi emergono considerazioni già anticipate in precedenza, ovvero la presenza di casi “estremi”. Milos Raonic, in basso a destra, vince quasi il 75% dei punti al servizio, ma ha meno del 40% in risposta. Discorso simile per Andy Roddick. All’altro estremo ci sono giocatori come Coria e Ferrer, che hanno probabilità di vincere appena due punti su tre al servizio, ma quasi il 50% in ribattuta.

Tra i migliori ribattitori troviamo anche Andy Murray, che assieme ad altri dieci atleti costituisce un gruppo di casi che si discostano dai valori medi. Murray si posiziona sulla stessa linea di Agassi e Sampras, subito dietro troviamo del Potro e più un basso Roddick. Nonostante questa similitudine statistica, il palmares parla chiaro, poiché Agassi e Sampras contano assieme ventidue titoli Slam, mentre Roddick, Murray e delPo solo cinque. Ma lo sappiamo, nel tennis i punti non sono tutti uguali. All’interno della nuvola dei punti si collocano tanti vincitori Slam, come Wawrinka, Cilic, Courier, Chang, Becker ed Edberg (ma i dati di tanti giocatori degli anni ’90 sono incompleti).

Infine, ben lontani dagli altri colleghi, tanto che potremmo definirli statisticamente casi “anomali” o outliers, troviamo i Big Three. I dati confermano la sensibile distanza che esiste tra Federer, Nadal e Djokovic e il resto dei tennisti delle ultime due o tre generazioni. E qui non parliamo solo dei trofei vinti. Nadal e Djokovic sono praticamente sullo stesso punto del grafico: la loro probabilità di vincere un punto in risposta è la più elevata, 50%. D’altro canto, nonostante non abbiano il servizio di Sampras o Roddick, superano il 70% dei punti vinti al servizio. Federer, pur avendo dati al servizio secondi solo a Roddick e Raonic rimane leggermente indietro.

Il grafico di Ingram ci dimostra principalmente una cosa: è quasi impossibile nel tennis essere sia un servitore infallibile che un ribattitore straordinario. C’è una sorta di relazione negativa tra le due parti del gioco, che presuppone che una grande abilità da un lato sia compensata da qualche lacuna sull’altro. Senza dimenticare però i limiti del modello, che l’autore stesso sottolinea. Oltre a non possedere i dati pre-1991, lo studio dà un’immagine statica del giocatore, ma sarebbe interessante (per quanto complicatissimo) isolare e confrontare “versioni” diverse dello stesso atleta (il Federer del 2013 è diverso dal Federer del 2005 o del 2020, ad esempio), poiché il tennista si evolve, acquisisce esperienza e invecchia. Inoltre i dati racchiudono in un’unico calderone tutti i tornei, senza distinzione di superficie, una variabile che sicuramente darebbe risultati diversi, ma soprattutto permetterebbe alla nostra analisi di essere molto più accurata.