Ciclo formativo en Big Data y ciencia del dato para la estadística oficial

Vivimos inmersos en un diluvio de datos, una explosión de información sin precedentes en la historia de la humanidad que ha dado lugar a un nuevo paradigma que se podría etiquetar como “datificación” de la cotidianeidad: el nivel de interconexión de la sociedad actual, donde las redes sociales ponen en contacto a las personas, donde las personas están siempre conectadas y localizadas a través de diferentes dispositivos móviles y donde las máquinas y sistemas corporativos también se conectan entre sí para interoperar o intercambiar información, ha provocado la digitalización de todos los aspectos de la actividad humana. Esta revolución digital está dando lugar a montañas de datos, no estructurados en su mayoría, en forma de registros web, videos, grabaciones de voz, fotografías, correos electrónicos, posts, etc. a la espera de poder ser explotados.

En este contexto, el término Big Data hace referencia a la capacidad para recoger y analizar a gran velocidad enormes volúmenes de datos, muy variados en su forma o estructura, para establecer relaciones que aporten conocimiento a partir de una información demasiado compleja para ser captada a simple vista. Aunque los métodos que definen las técnicas Big Data, fundamentalmente vinculados a la estadística computacional, el aprendizaje automático y la minería de datos, tienen desde hace ya tiempo un largo recorrido, su aplicación en la actualidad requiere de competencias profesionales que han dado lugar al denominado perfil multidisciplinar de científico de datos.

La Estadística Oficial europea no es ajena a la oportunidad que puede suponer el aprovechamiento de este nuevo paradigma, tal y como lo demuestra la adopción del Plan de Acción sobre Big Data y su Hoja de Ruta 1.0 por parte del Comité del Sistema Estadístico Europeo. En dicho plan se establecen las líneas maestras a corto, medio y largo plazo para la integración de las fuentes Big Data en el modelo de producción de estadísticas oficiales del Sistema Estadístico Europeo. Entre las estrategias incluidas se contempla el impulso de programas formativos destinados a modernizar las competencias profesionales de los técnicos del SEE en materia de Big Data y Ciencia del Dato, lo cual ha dado lugar a la inclusión de cursos sobre esta materia en las últimas ediciones anuales del Programa Europeo de Formación Estadística (ESTP).

Desde el año 2016 el Programa de Formación del IECA se alinea con esta estrategia y en los programas de formación 2016 y 2017 se han incorporado ciclos específicos de formación en Ciencia del Dato y Big Data. Para este año 2018 estos ciclos ya consolidados se diversifican, incorporando cursos enfocados a necesidades específicas en el ámbito estadístico y cartográfico, como la representación y reporte de grandes volúmenes de información. Este enfoque responde no sólo al perfil de la organización y producción del Instituto de Estadística y Cartografía de Andalucía sino también a la demanda constante sobre los órganos estadísticos oficiales para generar y difundir con mayor celeridad información estadística variada, permitiendo versatilidad para su consulta y análisis descriptivo.

De esta manera en 2018 se ha diseñado un ciclo formativo, compuesto por seis cursos interrelacionados, cuya orientación viene dada por un circuito en el que se proporcionará una inmersión introductoria en los métodos de modelado y análisis propios del campo de conocimiento del Aprendizaje estadístico, junto con las herramientas informáticas para su aplicación práctica, así como herramientas para la elaboración de gráficos e informes automatizados, acompañado por una introducción al estado de las Tecnologías de la Información para el procesamiento de grandes conjuntos de datos:

Esquema del ciclo

Ciclo formativo Big Data

El ciclo formativo tiene una duración de 121 horas y se desarrollará a lo largo del año 2018. Su diseño, basado en una estructura de itinerario curricular, hace que sea especialmente recomendable para asegurar un aprovechamiento óptimo que los participantes cursen el conjunto íntegro de los seis módulos que lo componen o, al menos, que se respete el cumplimiento de los prerrequisitos señalados en la mayor parte de los cursos programados.