Datos que cambian el deporte
En el pasado la recopilación de datos deportivos se reducía a unas exiguas estadísticas: los meros resultados y las incidencias registradas por el arbitraje. Con el paso del tiempo se han ido añadiendo datos conforme ha sido factible medirlos y/o se ha considerado oportuno hacerlo.
Actualmente es muy común que en los descansos y al final de los partidos se muestren unas estadísticas resumen bastante ilustrativas que informan sobre lo que se ha producido durante el tiempo de juego: posesión de balón, faltas, tiros, goles o anotaciones,… No obstante, la ventaja competitiva que proporciona un análisis más detallado ha sido rápidamente adoptada en múltiples disciplinas.
Estadísticas del primer cuarto del partido Alemania – España
Campeonato Europeo de Waterpolo Femenino de 2018
Fuente: RTVE
¿Por qué recoger datos en el ámbito deportivo?
Las actuaciones de deportistas se miden con muy diversos propósitos:
- Los equipos necesitan analizarse a sí mismos (eficacia de las tácticas, perfiles y rendimiento de sus jugadores,…) y analizar el mercado de fichajes con los que tratar de reforzarse.
- Los deportistas y sus preparadores necesitan evaluar su estado y progresión.
- Los medios de difusión necesitan datos con los que informar y satisfacer a los fans.
- Las casas de apuestas deportivas necesitan datos para establecer las cuotas de las apuestas en función de la probabilidad que se le asigna a que se produzca cada evento.
Además, la recopilación de estadísticas ha hecho muy populares los juegos en línea tipo deporte de fantasía (fantasy sport), donde los participantes forman equipos imaginarios con jugadores reales de un deporte profesional. Estos equipos compiten basándose en las estadísticas de rendimiento de esos jugadores en la competición real. Su rendimiento es convertido en puntos que son recopilados y sumados a cada equipo de fantasía para formar una clasificación.
De manera paralela al desarrollo del propio deporte, los clubes deportivos profesionales también utilizan todo tipo de datos para buscar la optimización de sus ingresos, aumentar la fidelidad y la satisfacción de los aficionados, e incrementar su cuota de mercado.
Un poco de historia
Cuando se explora la historia en busca de experiencias pioneras en el análisis de datos deportivos, por su popularidad suele señalarse la novela y posterior adaptación al cine, Moneyball, basada en la historia real de Billy Beane, gerente del equipo de beisbol Oakland Athletics, que efectivamente fue el primero en su deporte en la utilización avanzada de estadísticas para fichar jugadores. En la temporada de 2002, pese a las críticas iniciales por su política de fichajes, el sorprendente rendimiento del equipo llamó la atención de tal forma que el modelo fue copiado por los rivales.
No obstante, cincuenta años antes encontramos el trabajo del inglés Charles Reep, contable y militar de profesión que en marzo de 1950, durante un partido de fútbol entre Swindon Town y Bristol Rovers, se sintió frustrado durante la primera parte por el estilo de juego lento del Swindon. Sacó su bloc de notas y su bolígrafo y comenzó a registrar las acciones, posiciones de lanzamiento y secuencias de pases mezclando símbolos y notas. Terminó registrando un total de 147 jugadas de ataque del Swindon en esa segunda mitad. Fue el comienzo de una labor como analista que le llevó a asesorar con éxito a varios equipos y a reforzar la idea de juego directo y pases largos como la forma más eficaz de ganar. Hasta mediados de la década de 1990, Reep anotó y analizó un total de 2.200 partidos, llegando a conclusiones como que se necesitaban 10 tiros a portería para conseguir 1 gol o que el 80% de los goles se marcaban en 3 o menos pases. Aunque sus críticos alegan que sus análisis adolecen de sesgo por su predilección por el juego directo.
Charles Reep, pionero en el análisis de datos de fútbol
Fuente: History of performance analysis: the controversial pioneer Charles Reep
Siguiendo con el fútbol, al ucraniano Valery Lobanovsky se le considera el precursor del cuerpo técnico en el fútbol moderno. Llegó al Dínamo de Kiev en 1974. Al margen de ser el entrenador con más títulos del siglo XX, posiblemente su mayor aportación sea la codificación de las acciones de juego a partir del análisis de video. Su figura puede conocerse a través del documental Lobanovsky Forever (2016).
Por su parte, el desarrollo del análisis de datos en el fútbol americano tiene su origen en los Dallas Cowboys de finales de los años 60. Cuando el nuevo gerente, Tex Schramm, tomó el control del equipo fichó al programador indio Salam Qureishi, que desconocía el deporte y provenía de IBM. Qureishi introdujo un método computarizado para buscar jugadores. El equipo construido por este sistema lideró varias fases regulares entre 1964 y 1970, y derrotó a unos Dolphins invictos en la Super Bowl de 1972. En otra etapa de Qureishi en el equipo texano, ganaron consecutivamente la Super Bowl entre 1993 y 1995. Su historia también se cuenta en un documental: The Cowboys and the Indian (2014).
Salam Qureishi, desarrollador de un sistema informático para los Dallas Cowboys que evaluaba a los jugadores universitarios elegibles para el draft
Fuente: abcNews. The Cowboys and the Indian
En 1982, el economista Louis Guth desarrolló las primeras bases de datos de estadísticas de la NBA. Sin embargo, su consolidación como fuente de toma de decisiones se remonta a una época más reciente. Un exjugador universitario, Dean Oliver, formado en ingeniería y estadística, comenzó a publicar datos sobre la NBA a mediados de los 90. Su persistencia hizo que los Seattle SuperSonics lo contrataran en 2004 como analista de datos, el primero en la NBA. Un año antes se había publicado la novela sobre el fenómeno que había hecho dar este paso a las franquicias. Sí, enlazamos con el principio de esta pequeña historia, Moneyball.
¿Cómo se recogen los datos?
Entre todos los actores del mundo del deporte cada vez se extiende más y mejor la utilización de la inteligencia artificial, y las nuevas tecnologías de video y de gestión de contenidos digitales. La tecnología ha ido permitiendo diferentes formas de medir la posición y las acciones de los jugadores sobre el espacio de competición.
Los datos de las principales ligas de fútbol son recopilados en vivo por un equipo de tres personas que cubren cada partido. Dos de ellas, una por cada equipo, utilizan un sistema de recopilación basado en video para registrar información sobre lo que sucede cada vez que un jugador toca la pelota, marcan dónde y qué jugada se ha producido mediante el uso de ratón y teclado, respectivamente. Así, cada evento que se produce consta de cuatro variables: acción de la que se trata (pase, gol, asistencia,…), parte del campo donde sucede, momento en el que se produce y qué jugador la protagoniza. Estos datos son revisados después por un analista de control de calidad que tiene la capacidad de rebobinar la transmisión de video para asegurarse de que la información sea lo más precisa y consistente posible.
Analista registrando datos durante un partido de fútbol
Fuente: Las matemáticas del balón: así se recogen los datos durante los partidos de fútbol
Pero esta no es la única fuente de datos. Un ejemplo de tecnología integrada en los equipos es la incorporación de chalecos GPS en los entrenamientos y durante los partidos. Permiten conocer en tiempo real el ritmo cardíaco del jugador, su posición en el campo, la distancia recorrida por el futbolista y en qué dirección y a qué intensidad se ha recorrido, su velocidad, los sprints y aceleraciones o el número de impactos.
Entrenamiento del Almería C.F. con chalecos GPS
Fuente: Unión Deportiva Almería
Otra forma de recogida de datos que se está implantando en el fútbol son las espinilleras inteligentes. La empresa gaditana Humanox ha desarrollado espinilleras en fibra de carbono que permiten registrar la posición de las piernas. Su bajo coste en relación a otros sistemas hace que puedan enfocarse al fútbol base. Registran más de 40 métricas sobre rendimiento y salud que pueden analizar entrenadores, padres y los propios futbolistas. Transmiten en tiempo real: velocidad, fuerza y potencia de golpeos al balón, localización del jugador, impactos, ritmo cardíaco o temperatura. Estas espinilleras andaluzas ya son usadas en las canteras de varios clubes de España y en academias de fútbol femenino de Estados Unidos.
Tecnología andaluza de análisis con espinilleras inteligentes
Fuente: Humanox en programa TESIS. Canal Sur
En los balones de fútbol americano hay una etiqueta de identificación por radiofrecuencia que pesa 4 gramos y envía señales a las cajas receptoras instaladas en cada estadio de la National Football League (NFL). Proporciona datos sobre la altura que alcanza, velocidad o las revoluciones por minuto de cada lanzamiento. También hay etiquetas inteligentes en el equipo de los jugadores, desde la correa de la barbilla del casco hasta la máscara facial. Tan pronto como los jugadores salen del vestuario y entran en el campo, las etiquetas se activan mediante ondas de radio que envían datos a un sistema central de gestión: ubicación en tiempo real, velocidad, distancia recorrida, orientación o aceleración. Incluso los distintos elementos del campo y los árbitros trasmiten información.
Etiqueta para el seguimiento de jugadores de fútbol americano ubicada en las hombreras
Fuente: Zebra Technologies
La tecnología que llega a mayor detalle durante el desarrollo de una competición es la basada en visión artificial o seguimiento óptico mediante un sistema de cámaras que captan las acciones en el campo de juego por la extracción de las coordenadas de los jugadores y los distintos elementos. Buena muestra de ello encontramos en el tenis o el beisbol, donde el seguimiento de la pelota se hace con una gran precisión por el sistema conocido como “ojo de halcón”. Este sistema consiste en un conjunto de cámaras de alta velocidad estratégicamente colocadas alrededor de la zona de juego para seguir la pelota y generar una imagen digital de su trayectoria.
Rebotes y golpes de raqueta de cada pelota en la final olímpica de Londres 2012 entre Roger Federer y Andy Murray
Fuente: Damien Saunder. ESRI
Pero esta tecnología no se queda solo en el movimiento de la pelota o jugadores, aplicando inteligencia artificial es capaz de identificar el tipo de acción que se está produciendo mediante la aplicación de algoritmos estadísticos con una probabilidad de acierto cada vez más alta.
Tecnología de visión artificial en los Juegos Olímpicos de Londres 2012
Fuente: Simone Francia
Fuente: How Does Computer Vision Work and What It Gives Technology-Led Industries
Estimación de pose humana (Human Pose Estimation, HPE) para el seguimiento deportivo en un partido de la Major League Soccer (MLS)
Fuente: Sportlogiq Tracking player movement with AI – 2D body pose
La salud de los deportistas
Una de las aplicaciones más interesantes pero menos popular de toda la información recogida es vigilar los descansos de los deportistas y cuidar de su salud para que su carrera sea más larga y libre de lesiones.
Los equipos de la NBA recopilan datos sobre el estado de sus jugadores a través de dispositivos portátiles, monitores de sueño o muestras de saliva para evaluar su nivel de fatiga y predecir su rendimiento. Este tipo de análisis de datos aconseja descanso para evitar lesiones incluso sin causas aparentes. La justificación es que cuanto más cansado esté un jugador, más propenso será a lesionarse. Por tanto, los técnicos han tomado las difíciles decisiones de hacer descansar a jugadores clave para evitar lesiones.
Reportaje sobre el uso de la ciencia del sueño aplicada en el
equipo de beisbol de los Cubs de Chicago
Fuente: CBC News
El mayor peligro del fútbol americano son los golpes en la cabeza, y las posibles conmociones cerebrales. Los sensores del protector bucal de los jugadores de la NFL recopilan datos cinemáticos de la cabeza, como con qué rapidez y en qué dirección se mueve la cabeza dentro del casco. Se está recopilando más información que nunca sobre la duración y dirección de los impactos que experimentan los jugadores en función de sus posiciones, tanto durante los entrenamientos como en los partidos. Los datos son tan precisos que los ingenieros de la NFL pueden analizarlos posición por posición para saber exactamente qué tipos de impactos son más probables que experimenten y luego trabajar directamente con los fabricantes de cascos para compartir estos aprendizajes y diseñar equipo específico para protegerse mejor.
Hacer fichajes acertados
El análisis de datos está muy desarrollado en el deporte de Estados Unidos. La gran mayoría de franquicias de la MLB (Major League Baseball) y la NBA cuenta con equipos de analistas. Una de las principales razones es el sistema de incorporaciones de jugadores a los equipos mediante draft. El sistema de draft consiste en que los equipos de una competición se turnan para hacer selecciones entre un grupo de jugadores elegibles, de manera que cuando un equipo elige un jugador, recibe derechos exclusivos para firmarle un contrato. Este sistema, que permite limitar las nóminas de los equipos y reducir situaciones de posiciones dominantes, es utilizado en varios países y en deportes como baloncesto, beisbol, fútbol americano o hockey.
La NBA es un buen ejemplo de la carrera por conseguir más y mejores datos para hacer elecciones acertadas. El objetivo para los equipos es hacer predicciones acertadas para no dejar escapar el talento en su turno de elección. Cuando esto sucede, los equipos se esfuerzan por aumentar la cantidad de información disponible en una auténtica carrera por el conocimiento. Por ejemplo, los equipos solían contar con datos detallados del baloncesto universitario, pero algunos jugadores daban el salto en su primer año universitario, por lo que no había suficiente información sobre ellos y escapaban del radar en las primeras selecciones. La solución fue ampliar la base de datos a la etapa de baloncesto en los institutos. Además, es frecuente incorporar información personal sobre los jugadores: situación familiar, relación con sus progenitores,…
En el mercado de fichajes del fútbol europeo es, si cabe, aún más importante acertar con las incorporaciones, ya que los clubes pagan grandes cantidades que en caso de no ofrecer el rendimiento esperado pueden lastrar su situación económica y deportiva. Al margen de los datos cuantitativos, de vez en cuando trascienden informaciones de operaciones frustradas por la valoración de aspectos personales tomados como variables cualitativas a la hora de decidir una operación: carácter del jugador, estilo de vida,…
Rendimiento competitivo
Todo el conocimiento de uno mismo, como equipo o como deportista, del rival y del escenario de juego suma para tratar de conseguir el objetivo de ganar.
La onubense Carolina Marín fue de las primeras en nuestro país en usar los datos para mejorarse a sí misma y analizar a sus rivales. Su entrenador, Fernando Rivas, señala que los datos proceden principalmente del análisis de vídeo, anotando todo lo que sucede: quién saca, cómo lo hace, su posición en la pista en cada momento,… Esos datos se importan a una hoja de cálculo y buscan patrones mediante tablas dinámicas. El estudio de esos patrones mediante tablas y gráficos, le permite a la jugadora prever situaciones y adelantarse a las acciones de las rivales.
Fernando Rivas, entrenador de Carolina Marín, frente a los datos estadísticos
Fuente: Fernando Rivas
La aportación de los datos influye incluso en la forma en la que se compite. El análisis de la efectividad de los tiros a canasta en la NBA llevó a la conclusión de que se hacían muchos tiros de 2 puntos a larga distancia que eran ineficientes, de manera que se animó a los jugadores a intentar tiros de 3 puntos como la forma más eficaz de ganar partidos. La tendencia a tirar de 3 ha sido tan relevante que ha generado debate sobre la forma en la que esto ha cambiado el juego. En la actualidad los marcadores son más abultados, los técnicos sacan más rendimiento a las cualidades de sus jugadores y pueden analizar mejor a los rivales, pero los detractores argumentan que el juego se ha vuelto repetitivo, parecido a un concurso de triples.
Comparativa de las 200 posiciones de tiro más frecuentes en la NBA en 2001-02 y 2019-20
Fuente: Kirk Goldsberry
Datos para los aficionados
Para terminar, afrontamos los datos desde la óptica de los consumidores finales: los aficionados al deporte. Las organizaciones deportivas y los medios de comunicación se preocupan por ofrecerles a los seguidores datos con los que satisfacer su curiosidad e interés por los detalles del juego y que así puedan tener un mayor conocimiento del mismo.
Los organizadores de grandes competiciones mantienen bases de datos con gran cantidad de información y visualizaciones: clasificaciones de diferentes tipos, comparativas entre equipos y jugadores,… Estos son solo algunos ejemplos de los que ofrecen una información más completa:
Visualización de datos sobre el servicio del tenista Rafael Nadal
Fuente: ATP Stats
Visualización de datos de las jugadas de Home Run conseguidas por el jugador de beisbol Guerrero con trayectorias de la pelota
Fuente: MLB Advanced Media
Los espectadores estamos acostumbrados al valor añadido que supone la realidad aumentada en las retransmisiones deportivas, tanto a posteriori con los análisis detallados de las jugadas como en vivo en el momento de producirse. Esto resulta muy útil, por ejemplo, en el desarrollo de carreras de atletismo o natación. En la siguiente imagen podemos ver cómo con unos pocos elementos se informa al espectador del desarrollo de una competición de natación: posiciones en los primeros puestos, nacionalidad de las nadadoras y velocidad.
Realidad aumentada en la final de 400 metros estilos femenino. Juegos Olímpicos Tokio 2020
Fuente: Eurosport
Más allá, los datos recogidos con la tecnología de ojo de halcón en el tenis ha permitido encontrar soluciones inclusivas a través de la adaptación a espectadores con discapacidad visual. El Australian Open presentó en 2022 el sistema Action Audio que se basa en sonido 3D. Ofrece una biblioteca de sonidos que se corresponden con diferentes acciones del juego. Las variaciones de estos sonidos dependen de la característica del golpe, el lugar de la pista donde se produce y la cercanía de una pelota a la línea. La combinación de todos ellos da una idea del desarrollo del juego a quienes no pueden percibirlo con la vista.
El dato en el deporte
El dato en este ámbito ha adquirido una alta importancia y valor comercial, deportivo y social. No en vano multitud de empresas han crecido en torno a esta actividad con su recopilación y explotación. Junto con las entidades deportivas profesionales y las universidades, que realizan e impulsan investigaciones en este campo y ofrecen planes de estudios muy específicos para la formación de profesionales, han contribuido enormemente a su expansión y a un conocimiento mucho más profundo de todos los aspectos del deporte.