Kulturometer cabalga de nuevo

Gráfico de distribución presupuestaria de gasto en Cultura del Ayuntamiento de Madrid. 2009.
Gráfico de distribución presupuestaria de gasto en Cultura del Ayuntamiento de Madrid. 2009.

Como continuación del proyecto Kulturometer (2009) que desarrollé en Medialab-Prado durante las jornadas de Visualizar’09: Datos públicos, datos en público junto con otros agentes culturales de Madrid (Atravesadas por la cultura), se presenta ahora la investigación gráfica sobre visualización de los presupuestos municipales del Área de Cultura del Ayuntamiento de Madrid en 2016 que he realizado junto con Mar M. Núñez (noez.org).

Una oportunidad para volver a trabajar y pensar sobre datos en abierto y reutilizables y explorar maneas de visualizar presupuestos públicos. Hace 7 años hice el gráfico de tipo sankey prácticamente “a mano” con Freehand. Ahora he podido usar d3 y el plugin para Sankey, lo cual facilita mucho la tarea.

Merece la pena recordar, si nos remontamos a los orígenes del proyecto, que el objetivo inicial no eran ni los datos abiertos, ni la visualización de datos “per sé”, sino el entender cómo fluía el dinero -o no- desde las instituciones a los productores culturales. Seguimos teniendo eso en mente, aunque el resto de cosas que se han añadido al proyecto nos interesen igualente.

Presentación y debate en torno a Kulturometer 2.0
19.00h Lunes 7 de marzo 2016. Medialab Prado. Madrid.

En esta primera sesión se compartirá la investigación sobre el análisis de los presupuestos. Se darán las claves para poder analizar presupuestos oficiales y por otra se presentarán diferentes análisis gráficos del gasto dedicado a cultura en el Ayuntamiento de Madrid. Será una sesión abierta para que cualquiera pueda compartir sus dudas y preguntas. Todo el mundo es bienvenido.

Taller (fecha por concretar. Junio 2016)

El proyecto Kulturometer 2.0 comprenderá además la celebración de un taller de dos días en primavera (fechas por concretar) en el que se presentarán otras experiencias de visualización de presupuestos y se trabajará de manera práctica con ejemplos concretos de presupuestos de cultura en torno a las siguientes preguntas: ¿Qué herramientas tenemos y podemos usar para hacer análisis comparativos de presupuestos, tanto para uso interno de las organizaciones como para hacerlos accesibles y comprensibles para la ciudadanía? ¿Qué tipo de procesos de participación podemos poner en marcha para deliberar sobre los presupuestos públicos?

Medir los titiriteros en TVE

Va haciendo falta desde hace tiempo iniciativas y herramientas para medir a los medios de comunicación. Desde hace un tiempo he desarrollado un software para medir la superficie dedicada en portadas de prensa impresa. Existen otras herramientas para medir Twitter, las portadas de los diarios online (story tracker), modificación de noticias en periódicos online (newsdiffs), pero no hay datos accesibles sobre uno de los medios de masas más importantes: la televisión. Al menos en España, no contamos con el archivo abierto que almacena toda la TV de EE.UU. 24 horas al día.

Durante el caso Zapata hice un inicio de experimento de captura de datos de los telediarios de TVE que no llegó muy lejos. El tuit de @MatthewBennett de más arriba me recordó la necesidad de tener los datos accesibles. Ahora algunos de los telediarios de TVE están minutados, incluso algunos disponen de la transcripción completa, valía la pena probar el experimento de nuevo. Una duda ¿por qué no todos los telediarios disponen de la misma información: transcripción + minutaje? Misterio.

En un rato libre me puse manos a la obra para corroborar los datos de Matthew. Mi estudio es sobre los datos del telediario de medio día, los suyos, creo que del de las 21h:

Puedes ver los datos recopilados a partir del minutaje que ofrece la propia página del telediario de medio día del 8 de febrero de 2016.

He montado unos sencillos gráicos de barras para mostrar el tiempo dedicado a las noticias. El fútbol gana (7:49 min), aunque también es cierto que no he sumado en el gráfico el tiempo dedicado a los pactos para formar gobierno, que anda cerca de los 9 minutos (8:41). El caso de los titiriteros se lleva 5:40, la bolsa 2:42 y los casos de corrupción Taula 1:23 y Nóos 1:02.

La duración no solo es lo importante, por eso he incluido un gráfico para ver en qué orden se emitieron las noticias. Abrieron sobre el caso de los titiriteros. Más tarde fue el tema que siguió la crónica política de los pactos.

Cobertura titiriteros telediario TVE

Habría que analizar también qué y cómo se contó la noticia, se lo dejo a otros. Aquí un avance:

Post relacionados: midiendo las intervenciones en una asamblea de Occupy Boston.

 

Superficie en portada dedicada a cada partido en #elecciones20D

Recopilo en este post los diferentes análisis que voy realizando sobre la cobertura en portada de prensa de los principales periódicos generalistas en España (El País, El Mundo, ABC, La Razón y La Vanguardia) durante el periodo electoral de las elecciones generales del 20 de diciembre de 2015.

El análisis, datos y las portadas han sido realizados con el Software PageOneX.com y están disponibles en el hilo abierto y visualización interactiva Partidos en portada #elecciones20D (PageOneX). También puedes usar y descargar los datos  de esta hoja de cálculo.

 

portadas-elecciones-3-por-periodico

portadas-elecciones-4-por-periodico-negativo

portadas-elecciones-3

 

elecciones-202-161215

 

 

 

Asignar valores aleatorios a la posición vertical para ver datos pequeños o superpuestos

Posición aleatoria para poder ver cantidades pequeñas

Ya probé esta solución con las notas de Bárcenas, donde había que comparar cantidades desde 100 a casi 300.000 euros. En el caso de las tarjetas opacas o “tarjetas black” de Caja Madrid-Bankia pasa lo mismo: se combinan cantidades de 18 euros con otras de 16.000 euros.

Como las cantidades pequeñas quedan “tapadas” por las grandes, si se asigna una posición aleatoria en el eje vertical y se manteniene la posición en el eje horizontal (tiempo) permite dar visibilidad a las cantidades más pequeñas y entender la información de otra manera. Para ello he asignado la función al botón “Posición vertical aleatoria”. Puedes probarlo en numeroteca.org/tarjetasblack.

Asignar valores aleatorios a la posición vertical para ver datos pequeños o superpuestos
Asignar valores aleatorios a la posición vertical para ver datos pequeños o superpuestos.
Carmen Contreras era también previsible: cada verano Hotel Barrosa Park (Chiclana)

Hacer visualización vs Contar historias

No está reñido hacer una visualización y contar una historia. De hecho, las visualizaciones de datos deberían ayudar a contar historias o por lo menos a entender cosas que la simple observación de los datos (números, palabras) no permite. La visualización que he desarrollado para los gastos de las ‘tarjetas black’ de Caja Madrid y Bankia es un intento de ver los gastos de forma visual ordenados en el tiempo.

Según lo veo, esta visualización es una herramienta para contar historias. Para dar ejemplo he contado unas cuantas en Historias de las ‘tarjetas black’ de Caja Madrid, en un largo scroll vertical. A ver qué os parece.

En resumen: hace falta hacer el relato (texto) del relato (visualización) para llegar a la gente, o, al menos, para facilitar que empiecen a interpretar los datos por su cuenta.

Os dejo con algunas de las imágenes.:

Primera "diapositiva" del scroll de las Historias de las 'tarjetas black'
Primera “diapositiva” del scroll de las Historias de las ‘tarjetas black’.
Una historia que cuentan los datos... por ausencia de ellos
Una historia que cuentan los datos… por ausencia de ellos. En Cinco Días más infomación.
Explicación de cómo funciona el gráfico interactivo de las #tarjetasblack
Explicación de cómo funciona el gráfico interactivo de las #tarjetasblack.
Carmen Contreras era también previsible: cada verano Hotel Barrosa Park (Chiclana)
Carmen Contreras era también previsible: cada verano Hotel Barrosa Park (Chiclana).

Puedes ver el resto de historias en numeroteca.org/tarjetasblack/historias

Posdata: a riesgo de repetirme, no basta con hacer una visualización, hace falta contar las historias que emergen de esos gráficos. Es, casi siempre, un trabajo colaborativo. Hace falta recopilar los datos, limpiarlos, preparar las visualizaciones, contar las historias que esconden y, no menos importante, difundirlas. Este post viene a ser el relato del relato (histoiras de las tarjetas black) del relato (visualización de datos).

¿Os animais a contar vuestras historias a partir de estas visualizaciones en #historiastarjetasblack? ¿y a colaborar mejorando el código?

 

Visualización de gastos con las tarjetas black de Caja Madrid y Bankia

¿Por qué no hay mejores visualizaciones de datos en la prensa española? #tarjetasblack

Cuando se publicaron las notas de Bárcenas sobre la contabilidad B del Partido Popular en la prensa española, me sorprendió no ver más que listados y algún que otro gráfico no interactivo. Recopilé cuantas visualizaciones encontré sobre el tema  y desarrollé la mía propia, que todavía puede verse en: numeroteca.org/notasbarcenas

Esta vez, el volumen de datos de los gastos con las tarjetas black de los directivos y consejeros de Caja Madrid-Bankia era mucho mayor y estaba mejor estructurado. Bastaba con descargárselos haciendo copy-paste de las tablas en html de la web de El País.

Tras una rápida búsqueda, solo en El Confidencial he encontrado un análisis gráfico interactivo. El País y eldiario.es ofrecen sendas tablas de datos y algún que otro gráfico (la del diario.es no permite descargarse los datos, hecha con Taubleau). Navegar por esas tablas que suman más de 80.000 líneas no es una experiencia que ayude a procesar la información fácilmente. Antonio Delgado ha procesado en unos buenos diagramas de barra estáticos alguna información relevante.

Visualización de gastos con las tarjetas black de Caja Madrid y Bankia
Visualización de gastos con las tarjetas black de Caja Madrid y Bankia.

Por eso, una vez más, me he puesto manos a la obra a hacer una nueva visualización: numeroteca.org/tarjetasblack. He tardado 12 horas en hacer este gráfico interactivo, reutilizando buena parte del código que use para notarbárcenas. ¿Por qué el resto de medios digitales no lo han hecho antes? ¿Cómo puede ser que los grandes medios de comunicación en España no saquen más partido a toda esta cantidad de información tan relevante y de actualidad? ¿Unos diagramas de barras que luego se imprimen tal cual en la versión en papel es todo lo que se puede hacer? ¿Se puede hacer algo mejor que listar a los implicados?

El objetivo es ofrecer nuevas maneras para interpretar los datos y contar historias. De momento he incluido 16 de los 86 directivos y consejeros, suficientes para hacerse una idea de los patrones de gasto y tipo. Os invito a explorar los datos conmigo, a ver qué encontramos.

Como primera pregunta empecemos por la ausencia de información ¿por qué no hay datos de febrero de 2009 de inicios de 2012? Y antes de 2003 ¿dónde están esos datos?