¿Quién es el último? Teoría de colas

Publicado el 15.septiembre.2022 por IECA y archivado en Estadística
Comentarios desactivados en ¿Quién es el último? Teoría de colas

Las colas se suelen producir cuando la cantidad de clientes que demandan un servicio excede la capacidad de dar ese servicio. El primer ejemplo que viene a la mente es una cola de clientes en una tienda en espera para ser atendidos, pero alcanza muchos más ámbitos: atención de pacientes en centros de salud, procesos industriales, logística de transporte de mercancías, el control del tráfico de vehículos o de las telecomunicaciones, procesadores informáticos,… Para optimizar la prestación del servicio se necesita conocer y predecir el ritmo de entrada de clientes y el tiempo de servicio con cada uno de ellos. Las estadísticas y el análisis de datos tienen las claves para que estos sistemas sean eficaces.

Fila de personas en aeropuerto

El objetivo de la teoría de colas es encontrar un equilibrio entre el coste de la capacidad del servicio y los tiempos de espera de los clientes, entendiendo “cliente” en un sentido muy amplio, como a cualquier elemento que entre en el sistema de cola ya sea una persona o no.

Los comienzos de la teoría de colas

El nacimiento de la teoría de colas se debe a Agner K. Erlang, matemático, estadístico e ingeniero danés. En 1908 se unió a la Compañía Telefónica de Copenhague y comenzó a aplicar la probabilidad a varios problemas que surgían en el contexto de las llamadas telefónicas de la época.

Agner K. Erlang
Agner K. Erlang

Una llamada telefónica en aquel contexto requería de la intervención manual de una operadora (muy mayoritariamente se trataba de mujeres) que hacía de intermediaria entre los interlocutores atendiendo la demanda y conectando clavijas en el lugar correspondiente de un tablero de conexiones. En función del número de abonados al servicio telefónico, se hacia necesario disponer de más operadoras para dar un servicio de calidad sin largos tiempos de espera.

Subcentral de Triana en Sevilla (1927)
Subcentral de Triana en Sevilla (1927)

Archivo histórico fotográfico de Telefónica

Erlang publicó su primer artículo sobre estos problemas en 1909, La teoría de la probabilidad y las conversaciones telefónicas, donde demostraba que si las llamadas telefónicas se hacían al azar, seguían un modelo probabilístico conocido como distribución de Poisson y daba solución parcial al problema de la demora. Este artículo es considerado el primero relativo a teoría de colas, cuyo desarrollo fue continuado por el propio Erlang y otros investigadores. Como testimonio de la contribución del danés, señalar que el Erlang (E) es una medida estadística utilizada en telefonía del volumen de tráfico.

El siguiente paso importante en la teoría de colas fue realizado por el matemático e ingeniero noruego Tore Olaus Engset, también en el ámbito de la telefonía, ya que trabajaba en la empresa de telecomunicaciones estatal. El volumen de tráfico en los sistemas telefónicos creció significativamente en Noruega a partir de 1910 provocando la saturación de las redes y el bloqueo de las llamadas. Engset desarrolló modelos de colas fundamentales para planificar correctamente la ampliación de las redes en función de los fondos disponibles. Su trabajo se publicó en un informe en 1915 y su metodología en 1918.

Tore Olaus Engset
Tore Olaus Engset

Erlang y Engset se conocieron y cabe suponer que intercambiaron ideas, sin embargo, sus trabajos tienen enfoques completamente diferentes.

La fluidez de otro tipo de tráfico, el de vehículos, es una preocupación desde la popularización del automóvil. En 1936 William F. Adams publicaba en la revista de ingenieros civiles del Reino Unido su artículo “Tráfico vial considerado como una serie aleatoria” donde analizaba los flujos de tráfico por hora recolectados manualmente.

Otra de las figuras clave es David G. Kendall, el estadístico y matemático inglés introdujo una notación de colas en 1953 muy útil para clasificar la gran variedad de modelos que se han desarrollado. La notación de Kendall consta de tres símbolos (posteriormente fueron ampliados) A/B/K, Donde:

  • A indica la distribución de probabilidades de las llegadas de clientes al sistema.
  • B indica la distribución de probabilidades de los tiempos de servicio.
  • K indica el número de servidores o canales de atención.

David G. Kendall
David G. Kendall

Precisamente desde los años 50 del siglo pasado es cuando crece muy rápidamente el interés en esta área y se extiende a una gran cantidad de aplicaciones en multitud de campos.

Objetivo y situaciones

La cuestión principal de estos sistemas es establecer el número de servidores óptimo teniendo en cuenta su coste, espacio disponible para ellos y el número de clientes o trabajos esperados, de manera que los tiempos de espera sean los menores posibles.

Varias filas de personas. Fotografía de Chris Shopland. Pexels

Para conjuntar todo eso hay que tener en cuenta todas las situaciones posibles. Cuando un cliente llega al sistema y el servidor ya está ocupado con otro cliente, se pueden dar varias situaciones:

  • El cliente se incorpora al sistema de cola hasta ser atendido.
  • El cliente se incorpora al sistema pero se cansa de esperar y se marcha, pudiendo volver a intentarlo (se conocen como clientes en órbita y colas con reintentos) o no al cabo de un tiempo. Los reintentos se dan con frecuencia en los sistemas de atención telefónica saturados.
  • El cliente que no es atendido de inmediato en el sistema, se marcha, se conoce como pérdida.

Persona esperando a ser atendida por teléfono. Fotografía de Andrea Piacquadio. Pexels

Cuestión de disciplina

El sistema de atención puede variar dependiendo de la disciplina de servicio:

  • FIFO ( First-In-First-Out), en la que el primero en llegar es el primero en ser atendido. Es la que solemos encontrar en la nuestra rutina diaria en tiendas, restaurantes,…
  • LIFO (Last in, First out), es la contraria a la FIFO, el último en entrar en el sistema es el primero en salir. Esta tiene sentido en la gestión de stock para almacenes considerando a los “clientes” como unidades de carga no perecederas.
  • RSS (Random Selection of Service), selecciona a los clientes de forma aleatoria.
  • PS (Processor Sharing), compartiendo el servidor, es decir, sirve a los clientes compartiendo la capacidad de servicio entre ellos de manera que todos experimentan el mismo retraso. Los servidores web son un buen ejemplo donde esta disciplina tiene sentido, ya que tiende a haber una gran variabilidad en los tiempos de servicio necesarios para atender solicitudes, algunos trabajos son pequeños y otros grandes.
  • Priority. Da prioridad a ciertos clientes dentro de la cola. Puede ser con o sin interrupción del trabajo en curso. El ejemplo inmediato son las urgencias de un hospital en función del triaje a los pacientes.
  • WFQ (Weighted Fair Queing), cuya traducción puede ser “Espera Equitativa Ponderada”. Los clientes se clasifican en clases y se colocan en su correspondiente cola. Se atiende a cada clase de forma circular e igualitaria. Asigna más capacidad a las colas más llenas (con más peso por la cantidad de elementos en cola) sin dejar de atender a las colas más libres. Esta es utilizada, por ejemplo, para la puesta en cola de paquetes de datos utilizada por los programadores de red.

Concentrador de interruptor blanco encendido. Fotografía de Pixabay

También hay sistemas más complejos conocidos como redes, en los que el cliente que ya ha sido servido puede necesitar volver a ser servido por ese mismo servidor u otro distinto.

Algunos ejemplos de sistemas de colas

Volviendo de nuevo a lo cotidiano, uno de los sistemas que se ha demostrado como más eficaz y equitativo, y que además es percibido así por los clientes, es el de cola única. Es decir, en este sistema aunque se disponga de varios servidores, la fila de clientes en espera es única. De esta forma se reduce el tiempo medio de espera por cliente y ningún cliente se enfrenta a la situación de que su cola es la que no avanza. Es frecuente encontrar este sistema de cola en grandes superficies, cadenas de restaurantes de comida rápida o pequeños comercios en los que hay más de un dependiente.

Una cola por servidor frente a cola única
Una cola por servidor frente a cola única

Como se citaba en la introducción histórica a la teoría de colas, de manera muy temprana se ha aplicado al estudio del flujo del tráfico de vehículos. Determina, por ejemplo, los mejores tiempos de intercambio de luces en los semáforos, el número de puntos de cobro de peaje activos en cada momento o la apertura o cierre de carriles auxiliares para evitar la congestión en las carreteras.

Señales luminosas en los carriles del Puente del V Centenario de Sevilla
Señales luminosas en los carriles del Puente del V Centenario de Sevilla

La teoría de colas está fuertemente vinculada con las telecomunicaciones, desde las primeras líneas telefónicas a los actuales servidores de internet. El estudio de diferentes modelos de sistemas de servidores ayuda a mejorar su rendimiento en condiciones de tráfico altamente dinámicas. Esto se consigue mediante el análisis de medidas de rendimiento en la planificación de la capacidad del servidor de internet utilizando diferentes modelos de colas al comparar parámetros como la longitud de la cola y los tiempos de respuesta y de espera.

Se dan situaciones tan dispares que en ocasiones lo prioritario no es tanto reducir el tiempo de espera de los clientes, sino que los servidores no se encuentren desocupados en ningún momento. Ejemplos de ello son los procesos industriales o las vacunaciones masivas experimentadas por la pandemia de COVID19. En estas últimas el objetivo era vacunar al mayor porcentaje de población en el menor tiempo posible. Para optimizar este sistema de cola se debía citar a los “clientes” teniendo en cuenta el tiempo de servicio y las ausencias a la cita, entre otros factores.

Punto de vacunación masiva contra COVID19
Punto de vacunación masiva contra COVID19

Por último, también encontramos ejemplos en los que lo psicológico se da la mano con lo matemático para mejorar el sistema. Los gestores de colas son conscientes de que el tiempo de espera de un cliente (persona, en este caso) se percibe como más corto si esta ocupado, y se emplean todo tipo de elementos de entretenimiento: revistas, pantallas de televisión, música,… Algunos parques de atracciones aumentan los tiempos de espera en las paneles informativos durante las colas en sus atracciones para que los clientes sientan que han tenido suerte de llegar antes, forman colas donde no eres consciente de su longitud, o incluso emplean otras estrategias como eliminar los espejos de los baños para que el tiempo de servicio en ellos se reduzca y las colas para usarlos sean más fluidas.

A modo de conclusión, en sistemas de colas: como servidor, aplicar la ciencia; como cliente, tener paciencia.

Comments are closed.