Tennis e dati: un problema di paternità. WTA meglio dell'ATP. Pochi possono fare come Federer

Rubriche

Tennis e dati: un problema di paternità. WTA meglio dell’ATP. Pochi possono fare come Federer

Il tennis non è (ancora) uno sport data-driven perché manca la cultura dei numeri. E perché i dati vengono custoditi gelosamente da chi li possiede. Ma qualcosa sta cambiando, più tra le donne che tra gli uomini

Pubblicato

il

Halep utilizza il sistema SAP - Tennis Analytics on-court coaching
 

Vi abbiamo parlato di chi usa i dati per vincere e di quali siano, effettivamente, questi dati – da quelli più grezzi a quelli più raffinati, i dati Hawkeye. Poi vi abbiamo offerto una panoramica su come i dati si raccolgono, sia per quel che riguarda l’intero campo da tennis (dai sistemi FoxTenn e Hawk-Eye utilizzati anche nel circuito ATP fino ai congegni portatili più economici) che per i sensori indossabili e applicabili sulle racchette.

Adesso che vi abbiamo reso edotti sulle enormi potenzialità dell’utilizzo di numeri e dati nel tennis, proviamo a spiegarvi perché il tennis sia ancora molto indietro rispetto ad altri sport (basket, football e baseball soprattutto, ma anche il calcio). C’è un problema di cultura dei numeri, è vero, ma è anche un problema di paternità dei dati da cui a catena scaturiscono restrizioni e difficoltà di utilizzo a fini statistici – più o meno grandi a seconda dei contesti in cui questi dati sono raccolti. Molto banalmente: non è chiarissimo chi possieda questi dati e questo rende molto complessa la diffusione degli stessi a beneficio dei media, degli appassionati ma anche degli stessi tennisti che non hanno i mezzi economici dei Top Player.

Dati provenienti da sensori o ‘Smart Courts’

Se si tratta di dati personali provenienti da sensori o da soluzioni “Smart Courts, raccolti durante sessioni di allenamento, l’unico limite che si intravede è quello della tutela della privacy della persona così come stabilito dalla legge Europea di protezione dei dati. Questi dati sono estremamente importanti per monitorare lo stato fisico di un tennista, specialmente durante gli allenamenti. Head, ad esempio, usa come ‘limite ultimo’ per i suoi prodotti gli steccati posti dalla legge Europea di protezione dei dati; essa stabilisce che i dati raccolti dai sensori e immagazzinati in piattaforme cloud possano essere cancellati. Qualora non vi sia l’impegno del produttore di ancorarsi a una legislazione specifica, valgono le leggi in materia di tutela della privacy in vigore nel paese in cui sono ubicati i server che immagazzinano i dati. Eventuali clausole aggiuntive possono essere inserite da circoli tennistici e accademie in merito a sfruttamento e condivisione dei dati prodotti nell’ambito delle loro strutture.

C:\Users\OLYMPIA\Desktop\Personal Andrea\UBITENNIS\T Data\Data_Context.PNG
Le quattro tipologie di dati

Dati dei tornei minori (Future e Challenger)

Poi per i tornei minori, appartenenti al circuito Future e Challenger, tanto maschili quanto femminili, molto spesso non esiste nemmeno la possibilità di installare costosissime soluzioni come Hawk-Eye o FoxTenn, dati i costi abbastanza proibitivi per tornei che hanno budget limitati. Secondo Bob Kramer, ex direttore del torneo Farmer’s Classic di Los Angeles, la tecnologia utilizzata durante le partite costa dai 60.000 ai 70.000 US dollari a campo per una settimana; sono costi volti principalmente all’installazione dell’infrastruttura, necessaria per il funzionamento. Pertanto si stanno affermando altre soluzioni più a buon mercato come Eyes3, che consentono di raccogliere dati e offrono le funzionalità di arbitraggio classiche come quelle delle chiamate di linea. In questi casi si ritiene che i dati, se raccolti, sono fruibili dalla comunità tennistica.

Quanto al circuito ITF, occorre aprire una breve parentesi. Poco dopo che la federazione internazionale aumentasse la concessione di dati relativi ai tornei minori rinnovando e ampliando (nel 2018) la sua partnership con Sportradar, una piattaforma norvegese di rilevamenti statistici che lavora anche con Tennis Australia e con alcuni ATP 250, il giochino sembrava sul punto di rompersi. Un report finanziato (profumatamente: ben 20 milioni) da ATP, WTA e anche dalla stessa ITF suggeriva tra le altre cose di eliminare i livescore negli ITF da 15K e 25K, cessando di fatto la partnership con Sportradar, per combattere il fenomeno del match-fixing. Bene, al 26 dicembre 2020 questa partnership sembra ancora del tutto in essere e soprattutto i livescore non sono mai stati eliminati.

Pur su un terreno molto scivoloso qual è quello della concessione dei dati nei tornei ITF, dove le prospettive di guadagno ‘lecite’ sono spesso inferiori alle promesse di chi prova ad adescare i giocatori perché trucchino le partite, questo esempio ci serve a dimostrare quanto può essere lucrativo concedere a terzi l’utilizzo dei dati. Se l’ITF non ha cessato questi accordi nonostante il parere avverso (ma non vincolante) del report redatto da IRP, è naturale dedurre che non volesse privarsi di entrate piuttosto cospicue.

I dati Hawk-Eye

C:\Users\OLYMPIA\Desktop\Personal Andrea\UBITENNIS\T Data\Males_Tournaments.PNG
Numero di tornei maschili, montepremi e punti per i vincitori, ente governante (Fonte: Wikipedia)

Per quanto riguarda i dati generati nei più importanti tornei organizzati da ATP, WTA e i dati degli Slam (sotto egida ITF), raccolti tramite la sofisticata tecnologia Hawk-Eye, sono dati dotati di un peso specifico maggiore e dunque sottoposti a un regime particolare.

In sintesi: Hawk-Eye, controllata dal gruppo Sony, afferma di non possedere i dati che raccoglie durante le partite. Sono i tornei a farlo. Ma è proprio così?

  • M1000: Tennis Properties (ex ATP Media), la società di management che si occupa dell’ATP, è proprietaria di tutti i dati Hawk-Eye derivanti dai tornei Masters 1000 per i quali non è prevista la concessione in licenza a terze parti.
  • Slam e tornei ‘federali’: i dati raccolti invece negli Slam e in altri tornei organizzati dalle federazioni nazionali, come per esempio l’ATP Cup, appartengono alle federazioni e ugualmente non sono disponibili per uso commerciale o per attività esterne.
  • ATP 500 e 250 (e minori): per quanto concerne i tornei appartenenti alle categorie ATP 500 e 250, ma anche eventi minori, sono i singoli tornei che stringono accordi individuali con i fornitori di soluzioni tecnologiche, al fine di raccogliere dati, sempre nei limiti di vincoli di budget

Dopo aver fatto una panoramica, concentriamoci sui dati Hawk-Eye? Chi ne detiene davvero la proprietà?

Da un lato i tornei finanziano l’implementazione della tecnologia. Quelli più ricchi come Indian Wells hanno installato il sistema Hawk-Eye addirittura su più campi, a differenza di altri tornei di categoria (lo stesso Miami Open). Avendo sostenuto spese importanti, i tornei sono liberi di condividere o commercializzare i dati o questi restano di proprietà dei giocatori? In fondo i dati esistono perché ci sono tennisti che si esibiscono e li generano. Ma allo stato attuale delle cose ai tennisti è concesso l’accesso a questi dati?

A differenza del basket, del baseball e del calcio, il tennis è uno sport individuale, giocato prevalentemente in campo neutro (a eccezione della Coppa Davis). Questo cosa significa, che Novak Djokovic deve portare con sé l’attrezzatura per raccogliere i dati relativi ai suoi spostamenti sul campo o alle rotazioni dei colpi giocati? Si propende a credere di no, ma se anche (stiamo ipotizzando) un tennista incassasse la risposta negativa dell’ATP o di una Federazione all’utilizzo dei propri dati, non sarebbe difficile con la tecnologia attuale implementare forme di raccolta autonome per automatizzare il processo manuale di charting (la video-analisi della partita punto per punto).

In definitiva, e questo possiamo affermarlo con un moderato grado di certezza, l’ultima parola in merito alla concessione d’uso dei dati raccolti in Slam, Masters 1000 e ATP Finals spetta sempre all’ATP e alle federazioni nazionali (nel caso degli Slam), mentre per ATP 500 e 250 ciascun torneo stipula accordi individuali con i fornitori di soluzioni hi-tech. Per quanto concerne la WTA, chi scrive presumeva che vigesse uno status simile al circuito maschile per i “Premier Mandatory” 1000 ma vedremo che non è così: la WTA ha fatto scelte diverse.

Pro e contro della condivisione dei dati

Da una parte ci sono le preoccupazioni delle federazioni, della WTA e dell’ATP in merito al traffico di informazioni riservate al fine di individuare e rivelare tendenze di gioco di giocatori o avversari in palcoscenici tennistici altamente competitivi, che parzialmente giustificano posizioni di chiusura dei principali organi di governance tennistici.

Tuttavia, è ragionevole ritenere – esiste l’esempio degli sport che già lo fanno – che la liberalizzazione dei dati con la concessione dello sfruttamento anche a terze parti, come ad esempio appassionati o media sportivi, contribuirebbe a generare nuova linfa per il tennis proiettandolo direttamente verso il futuro, dal quale ci aspettiamo che la maggior parte delle decisioni diverranno data-driven (ossia guidate dai dati). I dati potrebbero essere incorporati in prodotti ad uso commerciale e la relativa facilità nell’analisi di dataset pubblici sposterebbe la competizione in altro piano, creando un maggior coinvolgimento da parte di appassionati e media – con infografiche più dettagliate che consentirebbero una maggior comprensione delle dinamiche del gioco. Qui subentra il limite culturale, che porta molti appassionati (ma anche molti addetti ai lavori) a guardare i numeri come si guarda un inquilino rompiscatole e non come un valido alleato.

La liberalizzazione dei dati consentirebbe ai direttori dei tornei di provare ad ammortizzare il costo vivo dell’installazione della soluzione tecnologica vendendo o concedendo in licenza i dati Hawk-Eye a terze parti, al fine di attutire l’impatto sul bilancio del torneo stesso.

D’altro canto, se i principali organi amministrativi del tennis dovessero persistere nell’adozione di posizioni oltremodo conservatrici non si vede come soluzioni “fai da te” per la raccolta dei dati, basate sul semplice utilizzo della videocamera dei telefoni cellullari, possano essere vietate sul lungo periodo. Come vi abbiamo già illustrato, nel mercato attuale esistono tecnologie portatili che consentono rapidamente di raccogliere dati di una partita, garantendo anche una buona accuratezza nelle rilevazioni. Si presume che in futuro le soluzioni “Do it by yourself” saranno poi ulteriormente migliorate al fine di completare e rimpiazzare i processi di raccolta manuale.

Elizabeth O’Brien di IBM, direttrice del programma per le collaborazioni sportive, ha recentemente affermato: “Le registrazioni di video non sono nuove come strumenti di miglioramento dei rendimenti individuali, ma è nuovo il loro trattamento come una fonte di dati“.

Qualche spiraglio?

Tuttavia, a scongiurare questa tendenza si è osservato negli ultimi cinque anni come SAP e Infosys (le società che raccolgono i dati rispettivamente per WTA e ATP) possano vantare contratti di concessione d’uso dei dati raccolti. Ci sono però differenti strategie, con differenti gradi di apertura, a seconda che gli enti governanti i vari eventi siano le federazioni nazionali, l’ATP o la WTA. 

Nel caso delle federazioni nazionali i dati vengono concessi per scopi di ricerca, come nel caso di un recente paper sui modelli generativi basati su reti neurali con memoria aumentata per ottimizzare la previsione della posizione dei colpi successivi di un tennista durante un’ incontro, apparso nel gennaio 2019, che si avvale dei dati raccolti durante l’edizione 2012 dell’Australian Open. Nei ringraziamenti finali, infatti, gli autori non mancano di ringraziare Tennis Australia: “Gli autori intendono ringraziare Tennis Australia per aver consentito l’accesso al database Hawk-Eye per questa analisi“.

Altri accordi sono stati siglati tra IBM e la USTA, laddove IBM concretamente raccoglie i dati posizionali dal sistema di tracciamento Hawk-Eye, generati durante lo US Open, per quantificare la velocità con cui un giocatore cambia direzione. La nuova metrica escogitata da IBM si chiama “redirect steps”, o abbreviato “red steps”. Queste informazioni possono guidare sia le tattiche che le decisioni di allenamento e, in futuro, potranno crescere fino a includere i dati di allenamento da dispositivi indossabili come le solette intelligenti che USTA offre ai giocatori (fondamentalmente, plantari con piastra in una scarpa da ginnastica).

Madison Keys rivede i dati raccolti da IBM (ph. Courtesy of IBM)

ATP e Infosys

Nel caso dell’ATP, una visione della situazione in merito all’utilizzo dei dati è fornita nella sezione “Platform Tech: Analytics Game Changer” del report “Tennis Radar”, scaricabile a questo link. Qui si ripercorre la storia della collaborazione tra Infosys e l’ATP, iniziata nel 2015, che finora ha fruttato:

  • La costruzione della piattaforma ITP (Infosys Tennis Platform), capace di fornire a giocatori e allenatori utili analisi sui loro rendimenti e su quelli dei loro avversari, per mezzo di statistiche numeriche e video-clip. ITP colleziona dati rilevati da Hawk-Eye, da elaborazioni statistiche indipendenti e dai giudici di sedia, centralizzandoli in un unico dataset.
  • L’accesso per certi tornei al servizio online “Second Screen”, che senza dubbio offre statistiche e analisi accurate anche al grande pubblico. L’articolo di Ubitennis sul piazzamento in risposta di Medvedev nel corso delle sue cinque partite alle ATP Finals 2020 è stato costruito utilizzando dati raccolti e elaborati per mezzo di questo prodotto digitale

Nonostante l’ATP abbia ben chiara la situazione attuale delle concessioni d’uso dei dati, riteniamo che in questo 2020 le azioni concrete per incentivare un approccio “data driven” al gioco siano state piuttosto modeste. Non sembrano aver aiutato il cambio della guardia ai vertici e il tentativo d’opposizione di Djokovic e Pospisil; né sull’agenda di Gaudenzi né all’interno dei documenti programmatici della PTPA abbiamo letto particolari riferimenti a un utilizzo più proficuo dei dati.

La situazione della WTA

Il caso della WTA è emblematico di quanto si possa fare meglio. Ripercorriamo le tappe dei principali accordi stipulati dalla WTA con giganti dell’IT.

  • 2013: la WTA annuncia in pompa magna un accordo pluriennale con SAP, colosso IT specializzato in soluzioni software modulari per aziende. 
  • 2015: dopo il cambio di regole dei tornei WTA, che consente agli allenatori di poter usare sul campo dispositivi mobili approvati dalla WTA, nell’agosto dello stesso anno viene creato il sistema SAP Analytics for coaches, poi integrato e arricchito con il nuovo modulo patterns of play nel 2019.
  • Ottobre 2017: viene lanciato SAP Tennis Analytics per media allo scopo di fornire metriche interpretative (insights) e contenuti per i media e i giornalisti che seguono i tornei WTA. Questa soluzione tecnologica usa le capacità di SAP Leonardo Machine Learning e il software SAP Predictive Analytics per fornire analisi e approfondimenti basati su dati storici e in tempo reale.
  • Novembre 2020: la WTA stringe un accordo con Stats Perform, il gruppo che possiede anche la divisione Opta Sports, proponendosi di raggiungere determinati obiettivi.

Cosa vuole fare la WTA con i dati raccolti da Perform:

  1. Le funzionalità avanzate di AI di Stats Perform verranno sfruttate per avvicinare gli appassionati al tennis femminile attraverso approfondimenti e storie coinvolgenti basati sui dati. Attraverso questi approfondimenti unici, gli appassionati potranno conoscere le giocatrici e il gioco a un livello molto più profondo.
  2. Le ampie capacità di distribuzione di contenuti sportivi di Stats Perform miglioreranno la disponibilità dei dati ufficiali WTA per renderli più accessibili a bookmaker autorizzati, emittenti e canali OTT, media, sponsor, giochi tecnologici e fantasy, offrendo a fan e scommettitori dati sul tennis veloci, dettagliati e accurati.
  3. L’accordo si propone poi anche di migliorare l’esperienza delle scommesse attraverso la fornitura di metriche più significative e precise, al tempo stesso promuovendo l’integrità nel tennis.

Gli altri attori nel sistema d’elaborazione di dati

D’altro canto, negli ultimi cinque anni abbiamo assistito alla fiorente nascita di boutique impresariali di elaborazione statistica che rispondono ai nomi di Golden Set Analytics, Tennis Stat, Tennis Analytics, Data Driven Sports Analytics, tutte specializzate nella fine analisi statistica delle prestazioni tennistiche. Viene da sé che queste realtà imprenditoriali debbano prendere i dati grezzi da qualche fonte, al fine di proporre i loro servizi ai tennisti dietro lauti compensi (sembra che Federer dia 200.000 dollari ogni anno a Golden Set Analytics).

Thanasi Kokkinakis, professionista australiano del tour, sottolinea che oltre a coprire le spese di viaggio il finanziamento degli sponsor è fondamentale per accedere all’analisi delle prestazioni e alle interpretazioni degli allenatori. “Più in alto sei“, dice, “più soldi devi avere per portare qualcuno nella tua squadra specializzato per le analisi statistiche”. I giocatori dei circuiti Challenger e Future, tuttavia, “probabilmente spendono i loro soldi cercando di cavarsela con voli e alloggi, piuttosto che esaminare statistiche e metriche analitiche”. Quindi il vincolo di bilancio esiste tanto per i tornei minori (nel predisporre soluzioni tecnologiche) quanto per i giocatori che devono comunque pagare esperti di statistica per i loro servizi. Un data analyst probabilmente non costa meno di un coach, tanto per fare un raffronto concreto: portali di ricerca lavoro come Glassdoor e Ziprecruiter (che fanno stime basate su salari reali) confermano questa supposizione.

Flusso della raccolta dei dati nel tennis maschile

Conclusioni

Quello che dovrebbe risultare chiaro è che ad oggi, salvo eccezioni di fine anno, al pubblico appassionato di tennis arrivano gratuitamente solo statistiche sintetiche, per lo più relative ai punti giocati, che costituiscono dei distillati statistici talora poco utili per elaborazioni più profonde.

Pertanto si ritiene che la strada migliore tra quelle imboccate dagli organi di governo del tennis con riferimento alla concessione d’uso dei dati sia quella tracciata dalla WTA, attenta non solamente a mettere a disposizione servizi digitali per giocatrici, allenatori e media, per mezzo della sua partnership con SAP, ma anche alle esigenze degli appassionati – strizzando l’occhio alle scommesse legali e alla diffusione di dinamiche ludiche (la cosiddetta gamification, ovvero l’utilizzo di tecniche tipiche del gioco al di fuori di contesti ludici) che potrebbero generare ulteriori fonti di ricavi per il circus femminile, come testimonia il recente accordo con Stats Perform.

Sono stati fatti decisi passi in avanti fatti rispetto alla foto scattata nel 2015 da Ubitennis, nel segno di una chiara consapevolezza del tesoro numerico generato dai tornei tennistici. Siamo adesso più vicini a raggiungere la tanto auspicata liberalizzazione dello sfruttamento dei dati, con la finalità ultima di consentire al più ampio pubblico una maggior comprensione del gioco e coinvolgimento. E questa è senz’altro una buona notizia.


Continua a leggere
Commenti
Advertisement

⚠️ Warning, la newsletter di Ubitennis

Iscriviti a WARNING ⚠️

La nostra newsletter, divertente, arriva ogni venerdì ed è scritta con tanta competenza ed ironia. Privacy Policy.

 

Advertisement
Advertisement
Advertisement