Come i nostri lettori sanno, Ubitennis ha lanciato una serie di articoli sulle statistiche nel tennis, che potete leggere qui. Questo ci ha portato a contattare alcuni dei migliori esperti nel settore, ed Edoardo Salvati è certamente fra loro: romano di nascita e milanese di adozione, 43 anni, laurea in economia aziendale, nel 2016 ha fondato settesei.it, dove si occupa di tradurre pezzi scritti su Tennis Abstract, il principale sito web pubblico per quanto riguarda il tennis e le statistiche, e su altri blog di settore.
Il suo tentativo è di coniugare la formazione in campo economico con una passione per l’“uguaglianza di simmetria” del gioco: “L’alternanza al servizio, la sequenza di punteggio, la geometria delle linee, la disposizione dei giocatori in campo, il trattare i due impostori Successo e Sconfitta allo stesso modo, monito di Rudyard Kipling che incombe sui duellanti in procinto di sfidarsi sul centrale di Wimbledon. È per questo che amo il tennis”. E in effetti quella che definisce la sua “prima stranezza statistica” riguarda una delle partite più equilibrate nella storia del gioco, vale a dire la semifinale di Wimbledon ‘91 fra Edberg e Stich, di cui lo svedese oggi afferma che, senza tie-break, sarebbe ancora in corso. Da allora, Edoardo ha raggiunto “la beatitudine alla Rod Laver Arena nella finale degli Australian Open 2017”, prima di concludere “lo Slam dello spettatore” a Londra.
Con interessi come i suoi, il richiamo verso Tennis Abstract è stato naturale, e da lì è nata una collaborazione con uno scopo ben preciso: “Documentandomi su varie fonti di giornalismo anglosassone, mi sono imbattuto nel lavoro di Jeff Sackmann, precursore dei molteplici impegni finalizzati a rendere disponibili a tutti dati di tennis quantitativamente e qualitativamente migliori. Contribuire allo sforzo di raccolta di dati punto per punto delle partite professionistiche da lui avviato, con il nome di Match Charting Project, ha consolidato la conoscenza reciproca. Il suo appoggio è stato fondamentale per creare settesei.it, la cui idea di base è convogliare in lingua italiana la grande ricchezza analitica sul tennis prodotta in inglese da cultori della materia”.
Di seguito la prima parte della nostra intervista con lui (la seconda uscirà nei prossimi giorni). Oggi ci concentreremo sul ruolo delle statistiche nel tennis e su quali siano o meno le chiavi per vincere un match, mentre nella prossima puntata Edoardo parlerà di chi ipotizza potrà vincere molto nei prossimi anni e di come quantificare fattori come la fatica e la tensione all’interno di un match.
Ubi: Iniziamo da una domanda di ampio respiro, nel senso che potrebbe voler dire tutto e niente: che direzione stanno prendendo le statistiche nel tennis, e qual è il loro impatto?
Edoardo Salvati (ES): Proviamo a invertire la domanda, chiedendoci cioè che traguardo hanno raggiunto le statistiche nel tennis. Se si considera che l’attuale struttura del circuito è frutto di lente modifiche per cui fino a prima dell’era Open il tennis era fondamentalmente uno sport dilettantistico, che non più tardi degli anni ’80 molti giocatori saltavano l’Australian Open per via della distanza o che il database storico dell’ATP è ancora soggetto a frequenti revisioni sul numero o sui risultati delle partite dei decenni scorsi, direi che l’enorme quantitativo di dati grezzi che girano oggi intorno al tennis è un sostanziale passo avanti. La tecnologia, soprattutto con la diffusione del sistema Hawk-Eye, ha certamente fornito uno strumento preziosissimo di raccolta della massa di informazioni che ciascuna partita è in grado di generare.
Non si è ancora verificato però quel salto incrementale che si auspica da tempo, vale a dire lo sviluppo dei dati in termini di aggregazione e pubblica disponibilità che consentirebbe una vera rivoluzione analitica. Si potrebbe muovere così verso quella che Sackmann definisce statistica granulare, un grado di dettaglio più efficace perché capace di descrivere situazioni di gioco più direttamente controllabili dal giocatore stesso e propedeutico all’elaborazione di strategie dedicate. In presenza di un livello competitivo ormai spinto al limite per preparazione tecnica, fisica e nutrizionale, e per tecnologia dei materiali, avere benefici addizionali può fare la differenza. Difficile ipotizzare se e quando questo accadrà.
La proprietà e la raccolta dei dati nel tennis sono però estremamente frammentarie – è questo uno dei motivi per cui il gioco è così indietro rispetto agli sport americani da questo punto di vista?
ES: È senza dubbio una grande barriera allo sviluppo dell’analisi nel tennis. In un articolo che ho tradotto tempo fa s’indagava il tema della proprietà dei dati generati da Hawk-Eye. Il tentativo dell’autore di risalire a chi appartenessero e come si potesse fare per ottenerli era lastricato di peripezie degne di Indiana Jones, al punto che anche una richiesta ufficiale da parte del torneo di Basilea a Tennis Properties (la società di management dell’ATP, ora ATP Media) era rimasta inevasa. Un torneo del circuito maggiore non riusciva ad avere dati sulle sue stesse partite! Di fatto, non è prevista la concessione in licenza a terze parti e non c’è chiarezza su chi ne è davvero proprietario: gli organizzatori, ATP Media, le Federazioni, i giocatori?
- Leggi anche: tennis e dati, un problema di paternità
In un ambiente super protetto e poco trasparente, solitamente non c’è spazio affinché una diffusione su larga scala dei dati o di una parte di essi sblocchi l’enorme potenziale innovativo derivante dall’attività di sviluppatori esterni (appassionati, ricercatori, aziende, analisti, ecc), che si porrebbe come circolo virtuoso con ricadute positive per la collettività tennistica, senza che il valore commerciale loro intrinseco ne venga ridotto. Questa disposizione così conservativa non è più giustificata e contribuisce in buona sostanza a far sì che il tennis sia indietro rispetto agli altri sport, soprattutto quelli americani. L’esempio più clamoroso arriva dalla Major League Baseball, in cui i dati prodotti dal sistema pitch f/x, l’equivalente di Hawk-Eye, sono resi pubblici a fine partita e poi raccolti in un singolo database facilmente accessibile. Non è così paradossale quindi che, pur in un’attività da svariati miliardi di dollari, a dare il via alla rivoluzione analitica magistralmente raccontata da Michael Lewis in Moneyball, (da cui l’omonimo film con Brad Pitt), sono stati dei personaggi esterni, fra tutti Bill James con la sabermetrica, e dei ricercatori indipendenti. Purtroppo, non sembra che questo possa diventare realtà anche nel tennis, pure in un futuro più lontano.
Ubi: Come si pongono in quest’ottica gli accordi con partner commerciali come quello appena siglato fra WTA e Stats Perform?
ES: Onestamente dà più idea di essere un’operazione di marketing o di PR che un veicolo di avanzamento nell’approfondimento legato al tennis. Così si è verificato in passato quando IBM era sponsor dell’ATP e adesso con Infosys. In più occasioni le analisi fornite da queste organizzazioni hanno evidenziato valore statistico ridotto, facilmente superato dai risultati di modelli molto più semplici e soprattutto non sbandierati come l’ultimo ritrovato tecnologico. Lo stesso comunicato di Stats Perform mette gli appassionati per ultimi nell’elenco dei possibili fruitori. È notizia poi recente che dal 2021 l’App congiunta WTA/ATP per seguire il punteggio in diretta delle partite non sarà più in funzione. Non credo serva aggiungere altro. L’analisi probabilistica del tennis risale quasi al periodo della teoria delle probabilità stessa, per merito del matematico svizzero Giacomo Bernoulli, nato e vissuto a Basilea, forse non a caso. È un peccato aver perso questo vantaggio.
A pagina 2, parliamo di quali statistiche siano più importanti per vincere e dell’importanza dei media nella promozione del tema statistiche