I pro e i contro delle statistiche nel tennis: il vero patrimonio su cui puntare, gli Hawk-eye data

Rubriche

I pro e i contro delle statistiche nel tennis: il vero patrimonio su cui puntare, gli Hawk-eye data

Seconda parte del nostro viaggio all’interno del mondo degli “analytics”. In questa puntata scopriamo quali sono i progetti esistenti più interessanti per la diffusione dell’utilizzo dei “big data” nel mondo del tennis

Pubblicato

il

 

Nella prima parte di questo articolo abbiamo visto i pro (pochi) e i contro (tanti) dell’attuale approccio agli analytics nel tennis. Ma quindi, come si diceva una volta, tocca buttare il bambino con l’acqua sporca? Non necessariamente, nel medio/lungo termine qualche speranza c’è: in questa parte andremo a scoprire quali sono i progetti che potrebbero aiutare a rivitalizzare gli analytics.

Nel breve termine il progetto più interessante è il Match Charting Project dell’americano Jeff Sackmann: l’idea da cui nasce è che il tennis necessiti di migliori statistiche e queste potrebbero essere prodotte anche con l’aiuto degli utenti (una sorta di mappatura crowdsourced, ovvero attraverso il contributo di un insieme indefinito di persone non organizzate precedentemente. In un caso come questo lo sviluppo si basa sul lavoro di volontari ed appassionati, che dedicano il loro tempo libero a creare contenuti e risolvere problemi. L’esempio più classico di crowdsourcing volontario è Wikipedia). Sackmann ha avviato attraverso il suo blog un progetto di mappatura dei match ATP e WTA a partire dal 2013, il cui scopo è quello di acquisire informazioni relativamente ad ogni colpo giocato in un match e far emergere quelle che sono le correlazioni e gli esiti delle diverse situazioni di gioco. Gli utenti possono scaricare dal blog un foglio excel da compilare con l’analisi del match e inviare poi al sito per essere inserito nel database. Gli elementi presi in considerazione durante le partite sono:

  • Per ogni servizio: Direzione, errori.
  • Per ogni risposta: Tipo di colpo, direzione, profondità.
  • Per ogni colpo durante lo scambio: Tipo di colpo, direzione, approccio, posizione in campo
  • Per ogni punto: Vincente, errore forzato, errore non forzato

È ovvio che, analizzato con una tale capacità di dettaglio, un singolo match mappato potrebbe fornire enormi quantità di dati. Una volta raccolto un numero di partite significativo (giusto in questi giorni è stato tagliato il traguardo dei 1000 match, di cui potete vedere l’elenco sul sito) è possibile cominciare ad effettuare analisi interessanti, rispondendo a domande come “Quanto tempo ci mette Djokovic in media a prendere le misure al servizio del suo avversario?” Il risultato è quello di mettere a disposizione degli utenti alcune info “classiche” come % di prime di servizio, vincenti, errori non forzati, etc e altre info un po’ meno comuni come percentuali di punti vinti a seconda della lunghezza degli scambi. Uno degli output del foglio excel è questo:

Match Analysis

Fra le statistiche più interessanti che è possibile analizzare vi è quella sull’andamento degli scambi in base alla lunghezza e al loro peso relativo. In particolare se riportiamo graficamente questi risultati il colpo d’occhio è immediato

Distribuzione

La Kovinic ha vinto la partita sugli scambi brevi, in quanto la percentuale di scambi vinti è stata predominante, e il loro peso relativo pure. La Mchale invece sembra essere riuscita a fare match solo su scambi di media durata, nei quali evidentemente riusciva a non andare immediatamente in crisi in risposta e a costruirsi il punto partendo da una posizione di vantaggio relativo.

Sempre sul blog di Sackmann vi è inoltre la possibilità di accedere alle statistiche point-by-point della maggior parte dei match del Grande Slam dal 2011 ad oggi.

Questo approccio, definito dagli autori un “Hawk-eye for dummies”, consente di ottenere risultati interessanti anche senza esagerare in complessità; ad esempio nella tabella seguente abbiamo inserito i dati relativi alla distribuzione dei servizi e al risultato in termini di risposte in campo e punti vinti in campo femminile negli ultimi 12 mesi:

Serve1

Analizzando le statistiche per un giocatore singolo (ad esempio Simona Halep) emerge un dato interessante:

Serve2

Il dato evidenziato cosa significa? Che se fossi il coach di una giocatrice che domani gioca contro Halep le direi…lascia perdere il servizio esterno! Non solo è un tipo di colpo rischioso, nel quale si va a cercare le linee, ma contro Simona è anche un rischio che non paga!

Passiamo ora ad un’altra fonte di dati, quello che nel lungo termine potrebbe diventare il Santo Graal delle statistiche tennistiche: l’accesso ai dati degli Hawk-Eye.

A partire dal 2005 gli organi manageriali del tennis (ATP, WTA e ITF) hanno cominciato a collezionare i dati dell’Hawk-Eye per molti Masters 1000 e per i tornei del Grande Slam. Tale tecnologia fu introdotta inizialmente nel cricket, anche se poi si è gradualmente estesa al biliardo e al tennis.

hawkeye

Come illustrato nella figura sopra, la tecnologia Hawk-Eye consiste di un sistema di acquisizione del percorso di un oggetto (nel caso del tennis la pallina) posto in essere grazie a 10 telecamere in grado di analizzare un numero elevato di frame per secondo. Queste telecamere acquisiscono contemporaneamente il movimento della pallina da diverse angolazione e inviano i dati ad una unità di calcolo, dove i dati su velocità e traiettoria vengono calcolati e applicati ad un algoritmo di calcolo geospaziale che identifica la pallina con un margine di errore di tre millimetri.

I dati ricavati da Hawk-Eye sono molto potenti: vengono raccolte informazioni relative alla velocità, all’effetto e alla posizione della palla, nonché dati relativi alla posizione e alle distanze coperte dai giocatori, giusto per citarne alcune. La domanda da 1 milione di dollari allora è: che fine fanno questi dati, chi li conserva? L’ATP, nella veste della sua società dedita alla gestione dei diritti afferma che i dati dei Master 1000 sono di proprietà dell’ATP e non sono disponibili liberamente per il pubblico, come riportato in un interessante articolo di Damien Demaj. La cosa abbastanza assurda, soprattutto a livello di Masters 1000, è che i tornei devono impegnarsi per mettere in piedi l’infrastruttura tecnologica (il che significa un costo di circa 60-70.000 $ per campo) senza poter sfruttarne i ritorni che potrebbero derivare dall’utilizzo di tali dati, non essendone proprietari.  I dati dei tornei del Grande Slam invece sono di proprietà dei gestori delle piattaforme IT (in questo caso IBM) e non sono fruibili a terzi. Fortunatamente le iniziative di open data stanno guadagnando consenso, sia a livello governativo (ad esempio fra gli obbiettivi dichiarati del sito di riferimento per l’open data nella Pubblica Amministrazione italiana, vi sono quelli di assicurare un’uniformità dei contenuti statistici prodotti e utilizzo di formati riconosciuti come aperti e con associate licenze aperte compatibili con la definizione di open data) che a livello privato (ad esempio nel mondo bancario il caso del BBVA con l’iniziativa “Innova Challenge”, attraverso la quale l’istituto spagnolo ha reso disponibili al pubblico di sviluppatori software dati aggregati reali del proprio portafoglio trading). In generale quindi l’idea è molto semplice: rendere fruibili liberamente – secondo un approccio open data appunto – i dati dell’Hawk-eye. E i benefici sarebbero evidenti: poter usufruire di analisi post partita ricche e dettagliate; consentire agli appassionati di poter accedere a tali dati direttamente in modo da stimolare un rapporto interattivo con il pubblico; inoltre, le idee più innovative ed efficaci provenienti dal “basso” potrebbero costituire fonte di ispirazione anche per televisioni e istituzioni. Insomma si tratterebbe di passare ad un approccio open, per certi versi ad un nuovo modello di business, volto a rimuovere paletti e steccati proprietari, in cui la disponibilità dei dati potrebbe costituire un fattore propulsivo nell’aumentare l’interesse verso lo sport.

Infine una domanda di scuola: ma cosa succederebbe se Roger Federer o Serena Williams bussassero alle porte dell’ATP o della WTA per avere accesso ai dati degli Hawk-Eye? Come reagirebbe l’ATP? Glieli consegnerebbe senza colpo ferire? E con quali tempistiche? A volte bastano poche persone giuste, al posto giusto e al momento giusto, e in questo senso è positivo che top players come Nishikori e Murray abbiano cominciato ad interessarsi all’argomento. Nishikori è il protagonista di un documentario prodotto dalla tv di stato giapponese NHK, nel quale vengono analizzati alcuni match del tennista nipponico avvalendosi di dati Hawk-Eye. Murray invece è diventato un cliente regolare dei dati Hawk-Eye. Come detto, i giocatori possono richiedere in qualsiasi momento dati Hawk-Eye, in quanto da regolamento è loro diritto. E uno dei grandi vantaggi nel richiedere tali dati è anche quello di poter “spiare” i propri avversari: infatti nel richiedere i dati relativi ad un certo match giocato, vengono fornite le informazioni relative ad entrambi i giocatori, e quindi anche relativamente agli avversari di cui si vuole indagare alcuni aspetto del loro gioco. Il rovescio della medaglia, è che a differenza degli sport di squadra nei quali esiste un forte interesse da parte dei team a sfruttare tali dati, nel tennis tali iniziative di utilizzo dei dati ricadono ora sui singoli giocatori. Concludendo, almeno per il momento, i dati sono frammentati e blindati.

Infine portiamo un esempio concreto delle potenzialità del 3D mapping. Qualche tempo fa Damien Demaj, un ingegnere australiano che si occupa di Geo Data visualization, ha ricostruito autonomamente il data set dei dati relativi alla finale olimpica del 2012 fra Murray e Federer. Il risultato è stato a dir poco notevole.

Il punto di partenza di questa analisi è il servizio. L’idea è che la capacità di piazzare e rendere imprevedibile il proprio servizio è una variabile chiave per prevedere l’esito di un match. E ovviamente è fondamentale riuscire a produrre servizi efficaci nei momenti decisivi. Per mappare l’importanza relativa un buon sistema è quello proposto da Morris in un articolo ormai classico in questo settore, “The most important points in tennis”.

Point importnace

L’idea di fondo è tutto sommato abbastanza semplice: si tratta di attribuire delle ponderazioni, con una scala da 0 a 1, ad ogni incrocio di punteggio che può presentarsi all’interno di un game, assumendo che i punti più importanti sono anche quelli in un certo senso più rari: ovvero quelli che consentono ad un giocatore di giocarsi una palla break, o quanto meno di avvicinarsi a tale situazione. Di conseguenza non stupisce che proprio ad una situazione di 40-0 sia attribuito un valore quasi nullo (0.04), mentre all’opposto al 30-40 è assegnato un peso di rilievo (0.73).

Definita l’importanza relativa dei vari punti ci si può ora porre la domanda: quale giocatore ha servito con maggiori variazioni?

Per fare questo è necessario allora procedere ad una mappatura come la seguente:

Service

I servizi nella grafica riportata sono raggruppati per cluster, a seconda della direzione. In questa grafica, per consentire una migliore leggibilità le diverse tipologie sono anche evidenziate con differenti colori. In generale sono 3 le tipologie: servizi centrali, servizi al corpo, servizi esterni. Ogni zona di impatto fa riferimento ad un punto ben preciso durante il game, per cui è possibile incrociare i dati sull’importanza del punto con quelli della direzione del servizio per arrivare a rispondere alla domanda iniziale.

Service2

In altre parole, tenendo in considerazione la tabella precedente con lo schema di Morris, possiamo attribuire un peso relativo ai vari servizi, che adesso, con l’aiuto della grafica, assumono una dimensione diversa. I pallini più piccoli sono quelli che fanno riferimento a punti di scarso rilievo, mentre i cerchietti più grandi fanno riferimenti a dei break point. Inoltre, un altro aspetto interessante è il fatto di inserire un simbolo di spunta all’interno del circoletto, per indicare se a quel servizio ha corrisposto un ace. Una rappresentazione di questo genere quindi dà la possibilità con un rapido colpo d’occhio di valutare la distribuzione generale dei servizi, la distribuzione dei servizi nel caso dei punti più importanti, e dove sono arrivati i servizi vincenti.

Il risultato è che i dati evidenziano che Federer quando serviva da sinistra mostrava una notevole variabilità nella scelta del piazzamento. Nei servizi da destra invece vi è una maggiore concentrazione delle traiettorie più rischiose ovvero in prossimità della linea centrale ed esterna, come se fosse più confidente nel prendere rischi in quella situazione di servizio. Murray invece dimostrava una predilezione per un servizio più concentrato sulle direttive centrali ed esterne, anche se in generale più conservativo, con meno punti di contatto prossimi alla riga. Nei punti importanti invece Murray ha sistematicamente puntato il rovescio di Federer, il quale a sua volta nei punti importanti ha alternato servizi centrali, al corpo ed esterni. Nella figura, l’importanza dei punti è proporzionale all’area dei cerchietti.

In sostanza questo tipo di analisi – a giudizio di chi scrive – sarebbe utile per individuare linee di tendenza negli schemi di gioco dei vari tennisti; e se tali informazioni risultano accattivanti e stimolano la curiosità del telespettatore, se strutturate in database di sufficientemente numerosità possono essere utilissimi per trarre indicazioni generali sulla scelte tattiche e strategiche dei vari giocatori. Ma potranno essere sviluppate solo qualora tali dati acquistino due caratteristiche fondamentali: quella di essere liberi e robusti. Fintanto che tali dati non saranno organizzati in database ben congegnati e liberamente fruibili purtroppo tali analisi rimarranno nel libro dei sogni di chi si impegna a comprendere ed analizzare sempre meglio questo sport.

Federico Bertelli

Già pubblicati su Ubitennis
Atto I (I pro e i contro delle statistiche nel tennis: cosa sono e a cosa servono)

Continua a leggere
Commenti
Advertisement

⚠️ Warning, la newsletter di Ubitennis

Iscriviti a WARNING ⚠️

La nostra newsletter, divertente, arriva ogni venerdì ed è scritta con tanta competenza ed ironia. Privacy Policy.

 

Advertisement
Advertisement
Advertisement