Datos que cambian el deporte
En el pasado la recopilación de datos deportivos se reducía a unas exiguas estadísticas: los meros resultados y las incidencias registradas por el arbitraje. Con el paso del tiempo se han ido añadiendo datos conforme ha sido factible medirlos y/o se ha considerado oportuno hacerlo.
Actualmente es muy común que en los descansos y al final de los partidos se muestren unas estadísticas resumen bastante ilustrativas que informan sobre lo que se ha producido durante el tiempo de juego: posesión de balón, faltas, tiros, goles o anotaciones,… No obstante, la ventaja competitiva que proporciona un análisis más detallado ha sido rápidamente adoptada en múltiples disciplinas.
Estadísticas del primer cuarto del partido Alemania – España
Campeonato Europeo de Waterpolo Femenino de 2018
Fuente: RTVE
Ciclos formativos en Big Data e integración de estadísticas e información geoespacial
El Instituto de Estadística y Cartografía de Andalucía (IECA) ha diseñado dos ciclos formativos enmarcados en el plan de formación 2018 y dirigidos al personal del Sistema Estadístico y Cartográfico de Andalucía:
- Ciclo formativo en Big Data y ciencia del dato para la estadística oficial
- Ciclo formativo sobre integración de estadísticas e información geoespacial
Su diseño, basado en una estructura de itinerario curricular, hace que sea especialmente recomendable para asegurar un aprovechamiento óptimo que los participantes cursen el conjunto íntegro de los módulos/cursos que los componen o, al menos, que se respete el cumplimiento de los prerrequisitos señalados en la mayor parte de los cursos programados.
Ambos ciclos formativos tienen previsto su desarrollo entre junio y noviembre de 2018 por técnicos del IECA.
La Red Andaluza de Posicionamiento como generadora de información Big Data
Hoy en día la localización de un individuo es un valor altamente cotizado en el mercado pues permite la realización de estudios de movilidad o de turismo entre otros a partir de la información que genera su dispositivo móvil. La Red Andaluza de Posicionamiento, una red activa de estaciones GNSS gestionada por el Instituto de Estadística y Cartografía de Andalucía, ofrece un servicio público para el posicionamiento preciso en tiempo real, y para ofrecer la mejor corrección posible es necesario enviar la localización del usuario. El número de conexiones, distinguiendo una por día y empresa, puede superar en 2017 los 70.000 (cifras que no se veían desde el año 2011) y la mayor parte de sus usuarios registrados son personal de empresas constructoras, agrarias o ingenierías, y por tanto su principal uso estará vinculado con la actividad de estas empresas. Esta información, generada como consecuencia de la utilización de la red para fines topográficos, es susceptible de análisis bajo el marco de Big Data.
Desde la Universidad de Sevilla se están buscando posibles usos a esta información anonimizada, es decir, empleando únicamente la fecha y coordenadas de acceso al servicio. Para ello se ha contado con los datos desde su puesta en funcionamiento en agosto de 2008 hasta diciembre de 2016.
Un primer estudio se ha publicado en la revista Geocarto (http://www.tandfonline.com/doi/abs/10.1080/10106049.2015.1120358) donde se ha vinculado el uso de este servicio con la actividad económica del sector de la construcción. El análisis de la serie temporal clasificado por uso de suelo (según los Datos Espaciales de Referencia de Andalucía, DERA) frente a variables estadísticas proporcionadas por el IECA como son la caída en el empleo en el sector de la construcción en Andalucía y de las licencias de obra ofrecen valores de correlación de 0.98 y 0.96 respectivamente en las zonas urbanas (representan el 70% de las conexiones). El análisis en zonas agrarias sin embargo mostró un incremento entendiendo que puede deberse al incremento de la agricultura de precisión con GPS. Otra conclusión que se derivó de este el estudio fue la puesta de manifiesto de un cambio del tipo de usuario de la RAP, aumentando el usuario de PYMES frente a grandes empresas. Esto puede deberse a la externalización de servicios topográficos por parte de las grandes empresas.
El 13 de Julio se presentaron dos nuevos estudios pormenorizando su uso para el control del crecimiento urbano y del control de la obra pública. Estos estudios se han presentado como trabajos Fin de Grado de la titulación de Ingeniería Civil y han sido dirigidos por la profesora Cristina Torrecillas.
El primer trabajo fue defendido por Palma Sánchez y su objetivo era validar el empleo de estos datos para mejorar el seguimiento de obra pública de trazado lineal por parte de la Administración. La metodología seguida ha tenido dos fases, en primer lugar la identificación de las localizaciones correspondientes con obras civiles de trazado lineales en Andalucía y, ante la posible desactualización del trazado de esas obras, se ha desarrollado un procedimiento de identificación de patrones lineales. Se ha consiguiendo identificar un 87,36% de los nuevos trazados de obras lineales llevados a cabo en Andalucía, así como elementos no reflejados en ninguna base cartografía pero sí en ortofotos de máxima actualidad. Las conclusiones del proyecto son que con una buena identificación del uso de las localizaciones de la RAP, se pueden llevar a cabo numerosos estudios y controles a partir de estos datos y que la metodología diseñada es útil en el seguimiento de las obras, control de incidencias y actualización cartográfica.
Identificación de patrones lineales (cuadrados azules) entre las conexiones de la RAP
El segundo trabajo fue defendido por Elena Ruíz y tenía por objetivo estudiar el posible control del crecimiento urbano empleando estas localizaciones. El estudio se ha centrado en 12 municipios andaluces donde se crearon polígonos de crecimiento a través de la comparación de ortofotos desde 2008 y con la ayuda de las bases cartográficas del DEA 100 y del DERA. Los resultados han puesto de manifiesto que se puede llevar un perfecto control de las grandes obras de urbanización con un 98% de acierto. En el caso de construcciones destinadas a servicios o equipamientos el acierto disminuye a un 73% en los municipios estudiados. Los resultados más desfavorables pertenecen a las categorías de aparcelados (22% acierto) y manzanas (49% acierto). El acierto va disminuyendo a la par que el tamaño de las obras, también unido a que las obras de nueva planta y gran envergadura son más susceptibles a necesitar un replanteo mediante GPS. Asimismo se ha puesto de manifiesto su posible uso en la actualización cartográfica al detectar muchos cambios no reflejados aún en esas bases.
Crecimiento 2008-2016 asentamiento según conexiones RAP (en azul)
Ambos proyectos tendrán sus textos completos accesibles online en la página web de la biblioteca de la Universidad de Sevilla en breve.
Ciclo formativo en Big Data y ciencia del dato para la estadística oficial
Vivimos inmersos en un diluvio de datos, una explosión de información sin precedentes en la historia de la humanidad que ha dado lugar a un nuevo paradigma que se podría etiquetar como “datificación” de la cotidianeidad: el nivel de interconexión de la sociedad actual, donde las redes sociales ponen en contacto a las personas, donde las personas están siempre conectadas a diferentes dispositivos móviles y donde las máquinas y sistemas corporativos también se conectan entre sí para interoperar o intercambiar información, ha provocado la digitalización de todos los aspectos de la actividad humana. Esta revolución digital está dando lugar a montañas de datos, no estructurados en su mayoría, en forma de registros web, videos, grabaciones de voz, fotografías, correos electrónicos, posts, etc. a la espera de poder ser explotados.
En este contexto, el término Big Data hace referencia a la capacidad para recoger y analizar a gran velocidad enormes volúmenes de datos, muy variados en su forma o estructura, para establecer relaciones que aporten conocimiento a partir de una información demasiado compleja para ser captada a simple vista. Aunque los métodos que definen las técnicas Big Data, fundamentalmente vinculados a la estadística computacional, el aprendizaje automático y la minería de datos, tienen desde hace ya tiempo un largo recorrido, su aplicación en la actualidad requiere de competencias profesionales que han dado lugar al denominado perfil multidisciplinar de científico de datos.
Presentaciones de la jornada, El valor de la información: el reto del «Big Data»
La jornada celebrada el 5 de febrero en el salón de actos del Instituto de Estadística y Cartografía de Andalucía, El valor de la información: el reto del "Big Data", superó todas las expectativas al congregar a una gran multitud de interesados de todos los sectores.