Big data nel tennis 1: la rivoluzione nascosta

Statistiche

Big data nel tennis 1: la rivoluzione nascosta

Torniamo all’analisi dei Big Data. Potrebbero essere utili agli spettatori? E lo sono davvero? E ai giocatori?

Pubblicato

il

 

Se ne parla da tempo – lo abbiamo fatto varie volte anche noi – ma la realtà della rivoluzione ‘big data’ nel tennis è lenta e complessa.
Con ‘big data’, terminologia diventata di moda in tempi recenti, si intende un database relativo ad un particolare argomento che sia talmente grande da non poter essere analizzato con metodi tradizionali. L’idea è che ci siano informazioni importanti nascoste in grandi quantità di dati. Schemi e comportamenti che non emergono quando il numero di casi considerato è piccolo ma che possono influenzare l’evoluzione del sistema (pensate ai mercati finanziari o alle previsioni del tempo, ad esempio).

Quando si pensa a ‘big data’ applicato al tennis ci sono due possibili scenari in cui l’analisi di enormi quantità di dati può rivelarsi preziosa:

1- Per i fan. Nell’analisi dei match, sia in corso sia a partita finita, per avere una migliore comprensione delle dinamiche che portano ad un certo risultato.
2- Per gli atleti. Nell’allenamento, nello studio delle strategie di gioco e nella preparazione dei match.

In questo articolo ci concentreremo sul punto (1) e l’impatto del big data per gli atleti verrà lasciato ad un articolo futuro. Qui ci interessa analizzare la situazione attuale riguardo alla disponibilità dei dati a vantaggio degli spettatori ed il loro effettivo e potenziale utilizzo. Per evitare confusione chiariamo subito che la tesi proposta qui è che l’enorme potenziale esistente per gli spettatori di fatto non viene sfruttato e che big data nel tennis per ora si riduce a tante parole e pochi dati disponibili.

Abbiamo tutti familiarità con la scheda statistica che l’ATP o la WTA o l’ITF forniscono a fine match. Percentuale di prime palle, break point sfruttati e via dicendo. Queste schede sono sostanzialmente invariate dagli anni novanta, nonostante il fatto che la quantità di dati raccolta oggi sia superiore. Chiaramente per lo spettatore medio la scheda statistica standard è più che sufficiente per soddisfare la curiosità. Ma perchè non rendere disponibili tutti i dati a quegli appassionati che vorrebbero vederli e studiarli?

A titolo di esempio consideriamo il noto caso delle palle break sfruttate. In tutte le schede vediamo la percentuale di palle break andate a segno, che dovrebbe darci un’idea di quanto un giocatore abbia incidenza sul servizio dell’avversario. Purtroppo il dato così come viene proposto a fine match ha un’utilità alquanto relativa. Supponiamo che un giocatore salvi 4 palle break su 5 in una partita. C’è una bella differenza tra il caso in cui tutte e cinque le palle break sono state offerte in un solo game ed il caso in cui sono state spalmate su cinque game. Nel primo caso il giocatore non è mai stato in pericolo sul proprio servizio ad eccezione di un game andato storto, possibilmente per causa sua. Nel secondo caso il giocatore è stato costantemente sotto pressione nei propri turni di servizio, possibilmente a causa dell’avversario. Questo dato, nella statistica delle palle break, non appare. Ci vorrebbe davvero tanto a mettere un numero in più indicante in quanti game sono state distribuite le palle break? La statistica apparirebbe, ad esempio, così: 1/5(3), una palla break sfruttata su cinque avute, distribuite in tre game. Difficile?

È fuori di dubbio che IBM e SAP raccolgono enormi quantità di dati negli slam e nei tornei dei rispettivi circuiti. Ma che fine fanno questi dati? Come vengono utilizzati? Chi ha accesso? Da alcuni anni durante i tornei dello slam l’IBM offre ‘Keys to the match’ come strumento di analisi statistica. L’idea è fornire analisi capaci di predire l’andamento di un incontro a partire da alcuni indicatori fondamentali.
La quantità di dati raccolta è enorme, l’utilità degli stessi è dubbia.
Nel 2013 Carl Bialik del Wall Street Journal faceva notare come ‘Keys to the match’ abbia un potere predittivo paragonabile a leggere l’aura di un giocatore prima dell’incontro.
Ma tanti dati sono comunque tanti dati. Un’analista esperto potrebbe essere capace di analizzarli in maniera più costruttiva. Il problema principale quindi non sta nel fatto che ‘Keys to the match’ ha un utilità relativa, bensì nel fatto che l’IBM non rende i database pubblici a beneficio di appassionati che potrebbero farne buon uso (e tantomeno rende pubblici i propri metodi di analisi dei dati). Lo stesso discorso vale per SAP e le statistiche della WTA. I dati da soli non forniscono informazioni. Ci vuole contesto e interpretazione per estrarre le informazioni più significative. Purtroppo al momento un simile scenario è lasciato all’iniziativa di singoli individui con abbastanza tempo e risorse. Ad esempio Jeff Sackmann, con l’aiuto di alcuni volontari, ha iniziato il ‘Match charting project’ finalizzato a raccogliere dati su incontri di singolare maschile e femminile. Purtroppo, vista la natura volontaria del lavoro, il database è ancora abbastanza limitato, sebbene le potenzialità siano indubbie.

In definitiva ad oggi all’appassionato vengono offerti dati già selezionati ed analizzati spesso in maniera approssimativa o incompleta. La ragione principale di questo stato di cose risiede nel fatto che fino ad ora nel tennis ‘big data’ è sinonimo di marketing, non di analisi dati. IBM e SAP si fanno pubblicità attraverso i servizi offerti, con slogan quali ‘data is a game changer’ o ‘more than the score’, ma non hanno interesse ad aumentare il livello di analisi e comprensione delle dinamiche del gioco. Pensate alle immense possibilità che si aprirebbero se i dati su distanze percorse, punto di impatto con la palla, posizione nella risposta al servizio, fossero disponibili a tutti. Ricercatori con le capacità necessarie potrebbero trovare metodi più efficaci per l’analisi dei match. Ed il progresso avviene anche grazie al confronto tra diversi approcci con diverse metodologie, impossibile se tutti i dati sono in possesso di una sola entità.
Il confronto con altri sport può aiutare a capire meglio la situazione. Gli Stati Uniti sono la patria delle statistiche al servizio dello sport. Nel baseball, uno degli sport più popolari negli USA, tutti i dati grezzi sono disponibili al pubblico e vengono utilizzati da analisti, blogger e ricercatori. Lo stesso vale per il basket. Lo studio dei dati disponibili pubblicamente può portare a ricerche metodologicamene di carattere scientifico che avanzano la comprensione delle dinamiche del gioco. Una simile situazione nel tennis andrebbe a beneficio di tutti. Degli appassionati, che avrebbero maggiori informazioni sulle performance dei loro beniamini. Dei giornalisti, che avrebbero maggiori spunti per comprendere le dinamiche di un incontro. Degli atleti, che avrebbero strumenti per comprendere i punti deboli, propri o degli avversari. E degli organismi di governo del tennis, per migliorare la qualità del gioco e dello spettacolo.
Per adesso dobbiamo accontentarci di sapere il numero di palle break non sfruttate nel corso di un match.

Continua a leggere
Commenti
Advertisement

⚠️ Warning, la newsletter di Ubitennis

Iscriviti a WARNING ⚠️

La nostra newsletter, divertente, arriva ogni venerdì ed è scritta con tanta competenza ed ironia. Privacy Policy.

 

Advertisement
Advertisement
Advertisement