Analizando los subtes de Buenos Aires

Últimamente transportarse por las calles de Buenos Aires se ha convertido en un verdadero caos, manifestaciones que cortan el tránsito en cualquier punto de la ciudad, los pasajes del transporte público cada vez aumentan más sus precios, y nunca falta la típica discusión a los gritos entre pasajeros o bocinazos entre vehículos que terminan de despertarte de ese estado somnoliento en el cual nos trasladamos hacia nuestros destinos muy temprano en la mañana. Una solución para escapar de esta realidad superficial es adentrarse en los túneles donde los gusanos de fierros y tornillos, que la gente llama subtes, surcan mi hermosa ciudad de Buenos Aires.

Hace unos años el Gobierno de la Ciudad de Buenos Aires comenzó a publicar diferentes sets de datos que produce la ciudad (data buenosaires) con libre acceso para que cualquiera pueda utilizarlos y desarrollar aplicaciones, analizarlos, etc. Hay muchísimas categorías que van desde la salud, economía y finanzas, transportes, hasta la administración pública, entre otros. Con la cuestión del aumento de los pasajes en el transporte público se me ocurrió hacer un análisis de estos, específicamente de los subtes, y ver tienen para contarnos los datos al respecto.

Los datos

Los sets de datos que vamos a utilizar son un recuento de la cantidad de pasajeros que pasan por los molinetes de cada una de las estaciones de subtes de la ciudad de Buenos Aires con una frecuencia de muestreo de 15 minutos, segmentado por años.

Vamos a empezar a familiarizarnos un poco con los datos. El primer dataset completo del que dispone la web, data del año 2014:

celda1.jpg

Importamos algunas de las librerías que utilizaremos en el análisis, leemos el set de datos y mostramos las primeras 5 filas. Todos los sets mantienen la misma estructura de columnas y datos, con algunas inconsistencias leves (En el notebook podrán ver todo el proceso de limpieza y acondicionamiento). Una vez importados y estandarizados todos los sets, la primer pregunta que se nos viene a la cabeza es: ¿Cuánta gente viaja en los subtes por año, mes, semana y día? Comencemos por sacar un promedio de cuánta gente viaja en subte a diario y como fue evolucionando a lo largo de los años.

Cantidad de personas que viajan por día

prom_by_day

En 2014 el promedio diario de personas que utilizan el subte era de unas 701070 y podemos ver el crecimiento anual hasta llegar a 1046247. Continuemos por los promedios semanales, mensuales y anuales.

Cantidad de personas que viajan por semana

prom_by_week

Cantidad de personas que viajan por mes

prom_by_month.png

Cantidad de personas que viajan por año

prom_by_year

Se puede apreciar un crecimiento bastante lineal. Veamos cuales son las estaciones más concurridas y cómo evolucionaron con el paso de los años.

lineas_evolucion

La línea H registra un aumento bastante grande, arrancando con un 2.9% de la totalidad viajaron en el año 2014 que corresponde a 7.473.392 personas, y terminando con 9.4% en el 2018, correspondiente a 32.898.471 pasajeros.

A todos nos cuesta volver a la rutina después de un fin de semana de excesos de carnes asadas y algunas copas de alcohol, y esto lo podemos ver claramente en los datos: los lunes y martes se registran unos 100 mil pasajeros menos (aproximadamente) en los subtes de la ciudad:

pasajeros_promedio_por_dia.jpg

Pero ¿Cuáles son las horas pico en los subtes?

pasajeros_promedio_por_hora.jpg

Claramente tenemos que evitar viajar entre las 8 y 9 horas, y en el regreso entre las 17 y 19, si no tenés ganas de hacer un scrum para poder ingresar al vagón. No todas las líneas manejan el mismo horario de actividad, pero podríamos definir un rango entre las 5:30 hasta las 23:30.

Hasta el 2018 había unas 87 estaciones entre todas las líneas, ¿Pero cuál es la que mueve más gente según el horario?

estaciones_por_hora-1.jpg

Claramente la estación constitución se lleva todos los premios.

Una pregunta interesante es, con todos los temas de inflación en el país, el crecimiento registrado en la cantidad de pasajeros diarios, la suba de pasajes y las subvenciones del estado, ¿Se recauda más o menos dólares por año?

pesos_vs_dolar

La respuesta es un poco interesante: Se recauda prácticamente el mismo monto en dólares. El análisis del porqué se escapa de mis manos pero cada uno puede armar sus propias conclusiones.

Pueden ver el notebook con el código de mi cuenta de Github.

Deja un comentario

Crea una web o blog en WordPress.com