Peer reviewed paper about PageOneX published at IJoC

160625_pageonex-ijoc

The paper Sasha and I have been working on for quite a long time has just been published at the International Journal of Communication PageOneX: New Approaches to Newspaper Front Page Analysis. We hope it provides an useful guide and resource to the field of the newspapers front page analysis.

PageOneX: New Approaches to Newspaper Front Page Analysis
Sasha Costanza-Chock, Pablo Rey-Mazón

Abstract

PageOneX is a Free/Libre and Open Source Software tool that we designed to aid in the coding, analysis, and visualization of newspaper front pages. Communication scholars have long analyzed newspaper front pages, using column inches as an important indicator of mass media attention. In the past, this involved obtaining physical copies of newspapers, coding and measurement by hand, and manual input of measurements into a spreadsheet or database, followed by calculation, analysis, and visualization. PageOneX automates some of these steps, simplifies others, and makes it possible for teams of investigators to conduct shared newspaper front page analysis online. We review scholarship in this area, describe our approach in depth, provide concrete examples of analysis conducted by media scholars using PageOneX, and discuss future directions for research and development.

Download article (pdf).

Una propuesta: Monitorización de medios

Cobertura de corrupción de enero 2013 a marzo 2014.
Cobertura de corrupción de enero 2013 a marzo 2014.



Monitorización de medios #jpd16 at slideshare.

Audio de la charla (.mp3).

Este sábado estaré dando una charla en las IV jornadas de periodismo de datos en Madrid para tantear el interés en desarrollar un proyecto colaborativo sobre análisis de contenidos de los medios de comunicación en España ¿te animas?

Monitorización de medios (numeroteca)
IVJornadas periodismo de datos 2016
15.30h Sábado 7 de mayo 2016.
Medialab-Prado. Madrid.

Las noticias son noticia. Lo que cuentan, cómo lo cuentan y lo que no cuentan aportan datos para entender cómo los medios de comunicación transmiten la información a los ciudadanos. Necesitamos, en una amplia primera persona del plural que incluye a periodistas y ciudadanos, encontrar formas de archivar toda esa información. Existen bibliotecas y hemerotecas pero ¿qué pasa con los periódicos online? La waybackmachine de archive.org no es suficiente al ritmo con que se actualizan los periódicos en la web.

En mi charla haré un repaso a diferentes herramientas para monitorizar los medios de comunicación. Contaré el proyecto de monitorización de cobertura de corrupción en España a través de las portadas de los diarios impresos (Color Corrupción http://numeroteca.org/colorcorrupcion) y el software que he desarrollado: pageonex.com.

Repaso de iniciativas de monitorización: newsdiff (control de cambios de noticias), Past Pages (pastpages.org), Storytracker (portadas online), PageOneX (portadas papel). Fix the media, T-hoarder (monitorización de Twitter en abierto), monitorización de noticias TV (archive.org), mediacloud…

Porcentaje por género y sección de los 3 periódicos a estudio en el UK News Gender Project.
Porcentaje por género y sección de los 3 periódicos a estudio en el UK News Gender Project.
East Timor vs Cambodia news from film Manufacturing Consent: Noam Chomsky and the Media
East Timor vs Cambodia news from film Manufacturing Consent: Noam Chomsky and the Media
East Timor vs Cambodia news from film Manufacturing Consent: Noam Chomsky and the Media
East Timor vs Cambodia news from film Manufacturing Consent: Noam Chomsky and the Media
Ads vs. News in News York Times Thursday, June 20th 2013 edition of The New York Times
Ads vs. News in News York Times
Thursday, June 20th 2013 edition of The New York Times.

 

Semana grande de la corrupción en PageOneX.com
Semana grande de la corrupción en PageOneX.com

New feature in PageOneX: Switch on and off layers in the data visualization

New feature in PageOneX.com: now you can switch topics on and off in the data visualization just by clicking on the topics in the legend.
New ways to understand your data.

Activate, deactivate layers and enjoy.

Test it here or here!

Crossposted at blog.pageonex.com

Investigar (es ir) haciendo y compartiendo: Public Lab y PageOneX

Este post es parte de la serie “Investigación colaborativa, divertida, barata, transmedia. Otras formas de entender la investigación” publicada a modo de cruce de posts entre numeroteca.org y voragine.net. Este trabajo se enmarca dentro de un estudio sobre Investigación en red coordinado por Mayo Fuster Morell parte de un proyecto más amplio sobre Juventud, Internet y Política bajo la dirección de Joan Subirats en el marco del grupo IGOPnet.cc, con la colaboración de Montera34, para la Fundación Museo Reina Sofía sobre adolescencia y juventud. #otrainvestigación

Public Laboratory: comparte y cuida a la comunidad de usuarios

The Public Laboratory for Open Technology and Science, o mejor Public Lab, desarrolla su actividad en otro campo completamente diferente al del estudio de los flujos de información: diseña y construye herramientas de software y hardware de bajo coste en torno a temas relacionados con el medio ambiente. Un tipo de ciencia ciudadana, investigación científica desarrollada por científicos no profesionales (ciudadanos), que se desarrolla en formatos abiertos en torno a una comunidad de usuarios-desarrolladores interesados.

Los orígenes del proyecto fueron cuando Jeff Warren, todavía estudiante en Media Lab empezó a experimentar a hacer fotos desde el aire con una cámara compacta normal (=barata) colgada de un globo para producir imágenes aéreas de alta resolución, lo que más tarde sería su tesina de master.  Por aquel entonces se llamaba Grassroots Mapping. Quería desarrollar técnicas y enseñárselas a comunidades de base para que pudieran producir sus propios mapas. La cámara hacía fotos en formato continuo mientras se elevaba: bastaba con unir esas fotos para poder tener el mapa de la zona mapeada.

Con el tiempo las actividades de Public Lab se han expandido a otra áreas de la ciencia, como son la espectrofotometría y la fotografía infraroja, a la vez que siguen compartiendo tanto el hardware y software que desarrollan como los datos que archivan con esas mismas herramientas.

Cuando en 2010 la plataforma petrolífera de BP estalló en el golfo de México, Jeff envió un email a la lista de correo de Grassroots Mapping, creada 6 meses antes, para preguntar cómo se podría empezar a mapear lo que el vertido de petróleo iba a destruir. Unos días después viajó a Nueva Orleans junto con Oliver Yeh y se empezaron a organizar con la Louisiana Bucket Brigade para hacer fotos de antes y de después de que llegara la marea de petróleo a la costa. Hacer las fotos cumplía una doble función: por un lado querían tener la documentación, ya que serían relevantes en un más que probable futuro juicio contra BP y no contaban con las fotografías de los satélites para apoyarles; por otro, el acto mismo de mapear servía para atraer la atención, y la colaboración, de la ciudadanía.

El proceso de hacer las fotos y enseñar a otros la técnica redundó en una mejora de las herramientas y en la creación de una comunidad de usuarios que detectaban problemas y proponía sus propias mejoras técnicas. Es un ejemplo idóneo para entender cómo hay que equilibrar el desarrollo de una herramienta y el cuidado del grupo de usuarios. Es tan importante el desarrollo de una tecnología que la gente pueda usar, porque es sencilla y asequible, como la creación de una comunidad de usuarios que la apoye y la use. En el proceso de diseño es también fundamental contar desde las primeras fases con los futuros usuarios (co-design o co-diseño). La experiencia del mapeado del vertido de petróleo del golfo de México y el trabajo en común fue el germen de Public Lab.

Public Lab como organización (hace poco consiguieron el estatus de organización sin ánimo de lucro en EE.UU.) empezó a andar gracias a el primer premio del News Challenge de la Kight Foundation. Desde entonces han buscado otras fuentes de ingresos para mantenerse, por ejemplo, sus campañas de crowdfunding para desarrollar projectos, como el caso reciente de infragram, o mediante la venta a través de su propia tienda de los productos de ciencia ciudadana que van desarrollando.

La investigación compartida se desarrolla principalmente a través de sus múltiples y abiertas listas de correo, organizadas temática y geográficamente. En su web también publican posts sobre las investigaciones y proyectos en marcha y animan a que cualquiera pueda publicar allí. Los modos de documentar se amplian haciendo que la web entera sea una wiki, esto es, que cualquiera pueda colaborar en editar, añadir y corregir cualquier parte de ella.

saugus-map-3b
Mapa del vertedero de cenizas provenientes de la incineradora de Boston, en la localidad de Saugus, realizado desde una cometa y ensamblado con Mapkintter.org.

Hacer un mapa con este método es ir recomponiendo el terreno a partir de los cientos de imágenes que la cámara tomó en modo automático. Es un proceso que permite el trabajo colaborativo en Mapknitter.org, el software que ha desarrollado para componer ese puzzle de imágenes. Cuando el año pasado hacíamos fotos desde una cometa del vertedero de Boston en Saugus, donde se dejan las cenizas de la aneja incineradora, cumplíamos el doble propósito de estudiar cómo era ese vertedero a la vez que queríamos llamar la atención sobre su existencia y sobre la incineración de residuos. Además, la excursión al vertedero, anunciada públicamente en la lista de correo de Public Lab, era también un evento para enseñar esta técnica a quien quisiera acercarse a participar. El mapa producido quedó publicado con licencia CC-BY en el archivo de mapas de publiclab.org.

Mapa de Saugus en Google Maps. El vertedero no está dibujado.
Mapa de Saugus en Google Maps. El vertedero no está dibujado.
Mapa de Saugus en OpenSteetMap. La mancha marrón es el vertedero.
Mapa de Saugus en OpenSteetMap. La mancha marrón es el vertedero.

Sin embargo, ir al lugar y mapear algo físicamente es sólo una de las formas posibles para estudiar un lugar, a la vez que llamar la atención sobre él. En Google Maps (el que muchos entienden como el mapa online por defecto), el vertedero no aparece y la incineradora es difícilmente identificable como tal. En OpenStreetMap, un mapa construido colaborativamente por usuarios de todo el mundo, algo así como la Wikipedia de los mapas, fuimos nosotros los que dibujamos el perímetro del vertedero para hacerlo visible (la zona marrón). Es un proceso análogo a cuando un usuario corrige o escribe un artículo en Wikipedia: puede estar documentando para sí mismo, pero también sirve para compartir con otros lo que ha investigado.

Algo así me ocurrió en mayo de 2011 cuando iba siguiendo desde Boston todo lo que estaba ocurriendo en Madrid al hilo del movimiento 15M. Empecé entonces mi propio archivo personal de imágenes, documentos y prensa (online, televisión, papel), quería archivar todo lo que estaba aconteciendo. Después de leer varios comentarios sobre la pobre cobertura que las movilizaciones estaban teniendo pensé que se podía enfocar la respuesta como una visualización de datos. Descargué “a mano” las diferentes portadas de los periódicos más importantes, las ordené en una matriz y dibujé unas áreas naranjas allí donde había noticias relacionadas sobre el 15M. Publiqué en Twitter el gráfico y me fui a dormir. Cuando me levanté el viernes por la mañana aquel gráfico se había difundido y republicado en varios medios. Su amplia difusión seguramente se debía a la rapidez con que se leía el gráfico: hasta el jueves 19 de mayo los periódicos no se habían volcado enteramente a cubrir las movilizaciones. Era el inicio de lo que más tarde sería PageOneX.

15m-portadas
Primer tuit sobre cobertura sobre el 15M en las portadas de los periódicos en España hasta el jueves 19 de mayo 2011.

PageOneX: del prototipo a la herramienta buscando usuarios

La buena acogida que tuvo el gráfico sobre la cobertura del 15M me llevó a continuar en el desarrollo de ese tipo de visualizaciones. Al igual que Nathan Matias, con su proyecto análisis de género en las noticias, quería automatizar el proceso de codificación de portadas lo más posible y permitir que otros lo usaran. Lo que había empezado como una respuesta al aparente blackout de los medios de comunicación, se iba a convertir en una de mis principales líneas de investigación.

Las portadas son el lugar donde los periódicos condensan la información más importante del día, y constituyen un elemento muy importante dentro del ecosistema de medios a la hora de definir la agenda mediática. La selección de noticias y su enfoque en la portada configuran su línea editorial, más casi que su línea editorial oficial. Utilizar la cantidad de espacio que ocupan en portada determinadas noticias ha resultado ser un buen atajo para estudiar a qué dedican su atención los periódicos. PageOneX, la herramienta que empecé a desarrollar entonces, automatiza y simplifica el proceso de descarga de las portadas, codificación, análisis y la visualización de los datos.

El proceso de desarrollo se ha basado en los retos y necesidades que aportaban los diferentes casos de estudio que fui haciendo: comparativa de cobertura de noticias en diferentes países; análisis cualitativo (positivo – negativo) de la cobertura sobre un tema; comparativa la cobertura en portadas, mass media, con datos de Twitter, social media;

El paso más trabajoso fue convertir la versión inicail del software, que funcionaba en mi ordenador usando diferentes programas y que requería conocimientos técnicos, en un programa online listo para ser usado por cualquiera. Proceso que llevó más de un año de desarrollo, primero con Ahmd Refat dentro del Google Summer of Code y luego apoyado por el MIT Center for Civic Media con Edward L. Platt y Rahul Bhargava. Recién llegados a una versión estable, lo que hace falta para seguir desarrollando, aprendiendo del ejemplo de Public Lab, es usuarios que la usen para sus investigaciones y que guíen hacia donde debe ir la herramienta. Por ejemplo como con el estudio sobre la cobertura de las protestas de Brasil de junio de 2013 por Débora Leal o recientemente con El Estado del periodismo, que analiza un año de portadas en México, por articulo19.

Superficie dedicada a casos de corrupción clasificado por partido/institución en El País, El Mundo, ABC, La Vanguardia y El Periódico. Del 4 de enero (izq.) al 8 de febrero (dcha.) de 2013.
Ejemplo de PageOneX en uso: Superficie dedicada a casos de corrupción clasificado por partido/institución en El País, El Mundo, ABC, La Vanguardia y El Periódico. Del 4 de enero (izq.) al 8 de febrero (dcha.) de 2013. Más sobre este tema en El Color de la corupción.

Cuando se comparten el proceso y los datos de una investigación se está facilitando la inclusión de otros investigadores e interesados en la misma, incluso antes de tener unas conclusiones o resultados terminados. El proceso de investigar se abre de este modo a la colaboración y puede nutrirse de críticas y sugerencias ajenas al mismo. Inicia así la difusión del mismo antes de haber concluido, sin necesidad de emplear recursos extra para publicitarlo. El mejor artículo publicado en una publicación especializada, aunque sea de acceso libre, puede no llegar al público u otros investigadores y no ser el motor de cambio deseado. Tener en cuenta cómo se va a difundir la investigación y convertirla en un proceso abierto aumenta las posibilidades de impacto de esta.

La respuesta a este texto llega el jueves 30 de enero a las 9.00h en el blog de voragine.net
Anteriores posts en esta serie:
1. Investigar (es ir) haciendo y compartiendo: Demo or die (numeroteca.org)
2. Investigar sin darse cuenta: #meetcommons, acción y documentación colectiva (voragine.net)

 

3 años de movilizaciones en red, 3 años de gráficos de portadas con PageOneX

globalrev-banner

He pasado los dos últimos días en el encuentro/congreso #GlobalRev, hablando de cómo investigar, entender y apoyar las movilizaciones en red: desde la primavera árabe de Túnez y Egipto a las últimas movilizaciones en Brasil, pasando por 15M, occupy y Turquía. He desvirtualizado con mucha alegría (un verbo que se usa para decir que has visto en carne y hueso a gente de la cual solamente conocías su avatar en Twitter) a muchas personas que he seguido en la distancia desde Boston y a través de las cuales he seguido, visto y entendido más el 15M: @suysulucha y sus video streamings o a casi todo el equipo de DataAnalysis15M.

El objetivo, en pocas palabras, es organizar una plataforma de investigación abierta sobre los movimientos sociales en red que estudie comparativamente los casos de los 3 últimos años. En muchos aspecto me recuerda a la red que se intentó establecer con OccupyResearch: compartir datos, herramientas, reflexiones, ideas para pensar e interconectar las diferentes luchas. ¿Qué se puede aprender de los aciertos y errores de OcccupyResearch? ¿Cómo de abierta puede ser una red de investigación? ¿Cómo mantener viva la ilusión y las ganas de trabajar juntos? OccupyResearch funcionó para poner en contacto a diferentes personas que estaban investigando occupy por separado y generar grupos de trabajo que llegaron a desarrollar proyectos como la Occupy Research General Survey o los hackathons de OccupyData. Sus datos y metodologías aún se siguen usando y, según he visto estos días, son fuentes de inspiración. OccupyResearch no fue tan efectiva a la hora de lograr una colaboración estable y de largo recorrido entre sus participantes, y su participación fue poco a poco decayendo. Actualmente la red está casi inactiva, aunque algún nodo se mantenga activo fuera de la red inicial. Habría que poner por escrito en algún momento todo lo que hemos aprendido de la experiencia.

Volvamos al encuentro #Globalrev: si quereis ver lo que se habló el primer día de presentaciones de diferentes países, podéis consultar los estupendos liveblogs en ictlogy.net o las notas que tomamos colectivamente en un etherpad. El segundo día se dedicó a pensar conjuntamente cómo debía ser esa plataforma/grupo de investigación comparativa internacional. Un proyecto ambicioso, que cuenta con Javier @Toret y @DataAnalysis15M como núcleo duro, lo cual es esperanzador a la hora de pensar en un plan de investigación que abarca tantos contextos diferentes (de momento 7 países). Esperanzador porque hará falta un motor fuerte y organizado para coordinar y dinamizar a todo aquel que se sume al proyecto, y su recientemente autopublicada investigación “Tecnopolítica y 15M, la potencia de las multitudes conectadas. El sistema red 15M, un nuevo paradigma de la política distribuida” (junio 2013) es un buen precedente que ha consiguido dar sentido a la complejidad de millones de tuits, hashtags y movilizaciones en las calles.

Pero yo escribía este post para “hablar de mi libro” y de la alegría que ha sido ver las diferentes visualizaciones de PageOneX en varias de las presentaciones. Haciendo repaso mentalmente me daba cuenta de que había al menos una visualización de portadas de prensa por cada uno de los movimientos en red estudiados, menos del #yosoy132 mexicano. La serie se completó justo cuando estaba llegando a Barcelona hace dos días y recibí un email de Benjamín Arditi contándome que había acababa de completar un primer análisis de portadas sobre #yosoy132 en la prensa mexicana.

De hecho, el origen de PageOneX fue durante la primera semana del 15M, y surgió para medir y mostrar visualmente la escasez de cobertura de los medios tadicionales sobre un movimiento social entonces recién nacido. Estos casi 3 años de movilizaciones también han sido la evolución de la herramienta de análisis de portadas: desde una imagen en un tuit hecho descargando y organizando las portadas “a mano” hasta una herramienta online que cualquiera puede usar. He pensado que sería interesante repasar estas visualizaciones, verlas juntas y recordar cómo fueron realizadas y ver cómo la prensa escrita cubrió estos movimientos sociales en red.

Justo hoy, en unos de los infinitos pads en torno a los que se organiza #globalrev y DatAnalysis15M (o GRRN), @Toret había recopilado ya estos gráficos en una única lista, bendita lógica distribuida. Sin un estilo uniforme, pero con los mismos mimbres, pongo todas las imágenes juntas.

15M: blackout de los medios y método casi artesanal

ss
Uno de los primeros gráficos: las fechas van en vertical, las áreas son opacas. Se hizo descargando a mano cada una de las portadas y reorganizándolas después en inkscape.

rtj
Reeleboración del gráfico sobre 15M y Twitter. Los datos de twitter eran pantallazos de la web de la desaparecida trendistic.indexrank.com, de ahí su pixelamiento. Elaborado en inkscape a partir del archivo generado con la primera versión de PageOneX escrita en Processing. Para medir las áreas utilizaba un plugin de inkscape y las calculaba mediante una hoja de cálculo.

 Primavera árabe. Túnez, Egipto, Libia.

svsvsvsv
A raiz de los gráficos sobre el 15M, iecah.org me encargó monitorizar la cobertura de prensa sobre la primavera árabe en la prensa española. El proceso era el mismo: Script en Processing me generaba un fichero svg, que desde Inkscape podía usar para codificar las portadas. Hice un minisite para publicar los diferentes análisis. en este caso se analiza: Egipto y Libia.

Occupy. USA.

ww
Nunca había hecho un análisis con tantas portadas: periódicos estadounidenses subriendo el movimiento Occupy.  Era demasiado para manipularlo en un único archivo de svg y tuve que dividirlo en partes. Datos de Twitter de r-shief.org, se aprecia como los tuits comienzan a aparecer en el archivo una semana después de comenzadas las movilizaciones, justo cuando la gente de r-shief empezó a recopilar los datos.

#direnGezi #OccupyGezi. Turquía

csc
Hecho a partir de 2 hilos en pageonex.com: OccupyGezi en periódicos internacionales y OcccupyGezi en periódicos turcos en colaboración con @matrushka y @bilgenkurt, datos de Twitter de Topsy. Todo ello unido en inkscape pasando por gnumeric.

Brasil protests #VemPraRua #BRevolução

protests-vandals-brazil-june2013
Protesters or Vandals? Para responder al debate de cómo los medios narraban las protestas, Débora Leall usó la ya para entonces en march versión beta de pageonex.com online. Hilo disponible en PageOnex: Violence x Protest. Los datos deTwitter son de topsy y los de las protestas de periódicos y Wikipedia. Todos ls datos se juntaron en Inkscape pasando por gnumeric.

 #YoSoy132. México

Cobertura en portadas de las movilizaciones de #yosoy132 en méxico por la prensa mexicana. Realizado por Benjamín arditi en PageOneX. Hilo disponible en PageOneX.com
Cobertura en portadas de las movilizaciones de #yosoy132 en México por la prensa mexicana. Realizado por Benjamín Arditi (politicaviral) en PageOneX. Hilo disponible en PageOneX.com

Éste listado cronológico de visualizaciones es un ejemplo de cómo a medida que PageOneX se convierte en una herramienta más fácil de utilizar más gente puede usarla autónomamente sin depender de mi. En los primeros casos era una labor en solitario: dadas las características de la herramienta. Después, cuando pageonex.com versión beta ya estaba activo, mi papel ha podido pasar a ser el de guía, apoyo o compilador para generar las imágenes finales, pero no he tenido que codificar las portadas (portadas de periódicos turcos, periódicos brasileños). En el caso de México no he tenido más que imprimir pantalla.


Actualización 4 noviembre 2013: el trabajo que queda pendiente es poner en formatos visualmente comparables las diferentes visualizaciones; completar el estudio con la prensa local en los países (primavera árabe) de los que no se ha analizado: y hacer un análisis cualitativo de cómo era la cobertura en cada caso: favorable, desfavorable, etc. Como algunas visualizaciones son previas al lanzamiento de pageonex.com habrá que recodificarlas de nuevo en la nueva plataforma. Si alguien se anima a participar que me lo haga saber, ahora PageOneX permite que varias personas codifiquen un mismo hilo.

El color de la corrupción en septiembre 2013

Desde hace un tiempo he abierto un espacio para continuar con la monitorización de la cobertura de corrupción en la prensa española, que empezara en enero de este año. Para ello he abierto un tumblr:  El color de la corrupción y espero poder ir publicando mensualmente.

El color de la corrupción en septiembre 2013

Color Corrupción Septiembre 2013

Un mes donde predomina el color rojo del caso corrupción de los ERE en Andalucía que afecta al PSOE.

A partir de la Diada (11 de septiembre) los periódicos catalanes dejaron prácticamente de cubrir ningún caso de corrupción. Parece que el efecto del debate independentista ocultó cualquier artículo sobre corrupción, salvo dos casos aislados de La Vanguardia.

El Mundo continuó con el escándalo de las facturas falsas de UGT Andalucía (rosa), solo acompañado mínimamente por ABC. También ABC y El mundo coincidieron en publicar noticias que afectan a CiU (caso de Jordi Pujol Ferrusola y por otro lado las empresas del cuñado de Mas).

Superficie acumulada de noticias dedicadas a corrupción por periódico. Septiembre 2013
Superficie acumulada de noticias dedicadas a corrupción por periódico. Septiembre 2013

El Mundo sigue siendo el que más espacio dedica en portada a corrupción con lo que equilvaldŕia a 5,6 portadas a lo largo del mes, si sumáramos todas las superficies de todos los artículos dedicados al tema. Le sigue ABC con 3,2 y El País, La Razón y Gaceta con 1,6. Los periódicos catalanes están por debajo de 1,0.

El Mundo también es el más diverso, que, salvo el caso del Tribunal Constitucional ý su presidente militante del PP (patrimonio ‘exclusivo’ de El País), cubre todos los casos.

Porcentaje de superficie en portada dedicado a corrupción. Septiembre 2013
Porcentaje de superficie en portada dedicado a corrupción. Septiembre 2013

Si analizamos por le porcentaje del total de artículos dedicados a corrupción por periódico durante est mes de septiembre vemos que predomina el color rojo PSOE, sobre todo en los periódicos conservadores y en todos los catalanes. El Mundo y El País son los únicos que casi hacen una cobertura similar del PSOE y PP.

En contra de lo que augurába a principios de mes con la declaración de las secretarias de Bárcenas y algunos otros detalles de la instrucción, septiembre no fue un mes azul PP sino rojo PSOE.

Para ver el gráfico interactivo y descargar todos los datos puedes ir a http://pageonex.com/numeroteca/corrupcion-espana-septiembre-2013/

El color de la corrupción, en periódicos españoles y catalanes

Este texto ha sido publicado en su traducción al catalán como “El color de la Corrupció” en la revista Capçalera del Col·legi de Periodistes de Catalunya de junio de 2013 en el dossier especial sobre corrupción. El artículo ha sido realizado con el estudio de portadas de prensa en PageOneX sobe el mes de enero y principios de febrero en 2013.

elcolordelacorrupcio_articulo-pablo-rey

Las portadas de la prensa de papel son el lugar donde los periódicos condensan la información más importante del día. El uso cada vez más extendido de internet, ya sea en medios de comunicación clásicos (periódicos) o mediante redes sociales en internet (Twitter y Facebook) podría llevar a pensar que han perdido notoriedad, pero las portadas siguen siendo un elemento muy importante dentro del ecosistema de medios a la hora de definir la agenda mediática. Las portadas del día siguiente están presentes en los informativos de noticias nocturnos de televisión y radio y en las conversaciones de Twitter de madrugada. Las portadas de los principales periódicos marcan de este modo las agenda de lo que será “importante” al día siguiente en otros medios, como radios y periódicos más pequeños, y programas de televisión. La selección de noticias y su enfoque en la portada configuran su línea editorial, más casi que su línea editorial oficial. De un tiempo a esta parte han vuelto a ganar importancia y ha habido incluso “secuestros de portada” para no dar pistas a los competidores de las noticias que se van a publicar.

A finales de enero necesitaba un caso de estudio para poner a prueba el software y herramienta de estudio PageOneX. Ese mismo mes El Mundo y El País habían publicado sendos scoops sobre el caso Bárcenas, lo que arrastró a todos los periódicos a tratar un caso de corrupción que afectaba al Partido Popular (PP). Estas noticias podrían haber sido las causantes del aumento de la percepción pública de la corrupción como problema generalizado, y los periódicos, facilitadores a la hora de configurar la opinión pública/dirigir la mirada hacia ese tema. Según el barómetro del CIS del mes de marzo, los españoles situaron como segundo y cuarto problemas, después del paro, a la corrupción y el fraude y a los políticos.

Por otro lado, la hipótesis y el saber popular es que los periódicos en España están en general ideológicamente alineados con un determinado partido político. Esto implica que suelen silenciar los casos de corrupción y noticias negativas del partido al que son afines e informar sobre los casos de corrupción del partido de signo político contrario. El lector suele conocer la polarización de los medios españoles y escoge la prensa más afín a su ideología.

130503_corrupcion-negro

El primer paso era seleccionar todos los artículos sobre corrupción en España. Se aprecian claramente dos grandes zonas más densas después de que El Mundo y El País publicaran sus exclusivas. Todos los periódicos retrataban casi al unísono la corrupción del país. Este análisis binario, sí o no corrupción, nos da idea de la prominencia del tema, pero necesitábamos tener más datos para saber qué casos y cómo se estaban tratando.

El listado de casos de corrupción activos es muy grande pero principalmente afecta a los tres partidos con mayor representatividad parlamentaria: PP (azul), PSOE (rojo) y CiU (naranja). Creé otra categoría para la Casa Real por el caso Nóos y Urdangarín (verde) e hice un quinto grupo para agrupar otros casos de corrupción, como los problemas de control de cajas de ahorro por el Banco de España, que integraba también otras noticias generales sobre el estado generalizado de corrupción.

Cada noticia se clasificaba en función del caso de corrupción, asignándoselo a la institución/partido principalmente implicado en él. De este modo podíamos visualizar la atención que cada medio dedicaba a la corrupción de cada partido; sin embargo, esto no bastaba para entender si la información era presentada favorable o desfavorablemente. Por ello, se añadió una capa cualitativa al análisis ¿eran las noticias neutras o desfavorables, o por el contrario favorables o defensivas?

Resultados

Superficie dedicada a casos de corrupción clasificado por partido/institución en El País, El Mundo, ABC, La Vanguardia y El Periódico. Del 4 de enero (izq.) al 8 de febrero (dcha.) de 2013.
Superficie dedicada a casos de corrupción clasificado por partido/institución en El País, El Mundo, ABC, La Vanguardia y El Periódico. Del 4 de enero (izq.) al 8 de febrero (dcha.) de 2013.
 Superficie acumulada de noticias dedicadas a corrupción por periódico. La escala vertical es en portadas (1 = una portada entera). 4 de enero al 8 de febrero de 2013.
Superficie acumulada de noticias dedicadas a corrupción por periódico. La escala vertical es en portadas (1 = una portada entera). 4 de enero al 8 de febrero de 2013.

El caso de los papeles de Bárcenas y la posible financiación ilegal del Partido Popular eran algo demasiado importante en ese periodo como para ser ignorado. Marcó la cobertura y color en todos los medios, incluso en los periódicos conservadores, habitualmente afines al PP. Para amortiguar el “daño” que una noticia así podía causar emplearon otras tácticas diferentes a silenciar el caso. ABC (aunque también La Razón y La Gaceta, que quedan fuera de este estudio) defendieron la actuación de los populares utilizando varios métodos: dar razones para situar a Bárcenas fuera del PP, declarar falsos los “papeles de Bárcenas” o apoyar los proyectos pro-transparencia de Mariano Rajoy y otros miembros del partido. En los días posteriores a la noticia de las cuentas suizas de Bárcenas, estos mismos periódicos coincidieron también en dedicar al menos una portada a la ‘corrupción’ en genérico, la corrupción como un mal generalizado que afecta a todos los partidos. Algo parecido hizo también El Periódico, mostrando la indignación de sus lectores ante la corrupción generalizada.

130121_larazon.750 130117_la_gaceta.750 130120_abc.750 130119_elperiodico
Portadas de varios periódicos tratando el tema de la corrupción como mal generalizado. La Gaceta y ABC publicaron collages con corruptos de todo signo político.

Periódico por periódico

Porcentaje de superficie que cada periódico dedica por partido/institución sobre el total de artículos de dicho periódico sobre corrupción.
Porcentaje de superficie que cada periódico dedica por partido/institución sobre el total de artículos de dicho periódico sobre corrupción durante el periodo estudiado.

El País “azul”

Media dedicada a corrupción por día 23%
El País dedica su cobertura de la corrupción fundamentalmente al azul PP (80% del total) con algunos pequeños toques verdes Urdangarín y Revenga, CiU y la supervisión de los inspectores del Banco de España. El rojo PSOE no aparece por ningún lado, congruente con su alineación política de centro-izquierda y afinidad socialista. Su cobertura de casos de corrupción es constante, en torno al 10-20% cada día. Después de publicar su exclusiva sobre papeles de Bárcenas, dedica entre un 40% y el 70% de su portada al caso en los día siguientes.

El Mundo “multicolor”

Media dedicada a corrupción por día 43%
Comienzan con naranja CiU (20% del total), luego llega el periodo azul PP (50%) con las cuentas de Bárcenas en Suiza que ellos mismos destapan, todo ello combinado con toques de rojo PSOE (13%) por el caso Amy-Mulas y verdes Urdangarín (15%). Al final vuelve a los papeles de Bárcenas empujado por la exclusiva de El País. Desde después del 6 de enero no hay día que no hable de algún caso de corrupción, dedicando habitualmente 20% y el 30%, y superando muchas veces el 60%. Es el periódico que más espacio dedica a la corrupción, con el 43% de todas sus portadas.

ABC “azul”

Media dedicada a corrupción por día 33%
Por las características de maquetación su portada, con una imagen que lo ocupa casi todo, tiene siempre mayores porcentajes que el resto de periódicos, superando a menudo el 50% de cobertura, hable del tema que hable. Después de la aparición de las cuentas en Suiza de Bárcenas le dedica dos portadas enteras seguidas: “El PP debe aclarar la verdad del caso Bárcenas” para al día siguiente “En el PP quien la hace la paga”, lo cual indica la estrategia de defensa del PP que habrá de seguir en los siguientes días. Al día siguiente “ataca” al PSOE sacando a Griñán (PSOE) y sus EREs. Días más tarde, el 22 de enero, titula “Luz y taquígrafos” para anunciar que Rajoy realizará una auditoría externa e interna para “zanjar especulaciones”. De este modo el ABC ha seguido todas las modalidades posibles de defensa: atacar al enemigo, y defender al partido afín. Cierra el periodo con unas fotocopias hechas trizas con el titular: “Las fotocopias que pusieron en jaque a España se desmoronan”.

La Vanguardia “azul”

Media dedicada a corrupción por día 18%
De todas las noticias que dedica a corrupción La Vanguardia dedica un 75% de su cobertura al PP. Puntualmente cubre la imputación del secretario de las infantas o los trámites para acusar de cohecho a Crespo (CiU), todas ellas basadas en noticias judiciales. Cabe destacar que de los 36 días a estudio, en casi la mitad (17 días – 47%) no tuvo noticia alguna sobre corrupción. Le siguen de cerca El Periódico (14 días – 38%) y ABC (12 días – 33%).

El Periódico “azul” y “naranja”

Media dedicada a corrupción por día 22%
El Periódico dedica mayoritariamente su cobertura de la corrupción al PP (50%) y a CiU (30%). Es significativo que dedique un cuarto de las noticias sobre corrupción a hablar de este tema en general, con titulares como: “Los jueces reclaman más medios contra la corrupción”, “Los partidos están obligados a mover ficha con la transparencia” o “#MásDemocracia”. Es relevante también la casi ausencia del PSOE con un 5% del total de superficie.

El análisis de este mes de enero permite comprobar el alineamiento de los periódicos esperado, como el silenciamiento de los casos del PSOE por El País o la defensa del PP por parte de ABC. También muestra cómo los periódicos generalistas de ámbito español están dedicando más espacio en sus portadas a la corrupción que los catalanes: El Mundo dedica un 43% de su portadas (El País 23%, ABC 33%), frente a un 22% de El Periódico y un 18% de La Vanguardia. En cualquier caso todos reflejan los viejos y nuevos casos de corrupción de una clase política que lleva mucho tiempo en el poder.

Algunos medios están desempeñando un papel muy importante a la hora de destapar esos casos de corrupción, mientras que otros informan sobre casos ya judicializados. En cualquier caso, casi todos dejan de cubrir, o lo hacen pero dedicándoles menos espacio, los casos de los partidos “amigos” o más afines.

Solo un ciudadano bien informado, con una dieta informativa que incluya todos los colores, podrá escapar de la visión partidista de un solo periódico. Los nuevos medios de comunicación digitales en España (entro otros El Confidencial, lainformación, el diario, La Marea o InfoLibre) o los agregadores de noticias, donde los usuarios votan cuales pasan a portada (reddit, meneame), podrían ayudar a romper esa visión predominantemente monocolor de los medios traicionales ligados estrechamente a partidos y empresas. La ley de transparencia, que no acaba de llegar, y de la cual se desconoce si tendrá un alcance real y efectivo, ayudaría también a reducir los casos de corrupción. Mientras, solo nos queda seguir buceando entre periódicos y mantener los ojos bien abiertos.

Escrito por Pablo Rey Mazón. Parte de este texto proviene de una artículo en preparación con Sasha Costanza-Chock.

Puedes consultar el análisis y descargar los datos de este análisis en http://pageonex.com/numeroteca/corrupcion-spain-enero-2013 y otros meses monitorizados de 2013 mayo, junio y julio

Newspaper Front Page Analysis: How Do They Tell the Story?

This article will be part of the forthcoming book Accountability Technologies: Tools for Asking Hard Questions edited by Dietmar Offenhuber and Katja Schechtner. It is based on previous published texts about PageOneX. It wants to be a short summary of the possibilities of the tool that has just been released: PageOneX.com
There is an article in preparation with Sasha Costanza-Chock that will provide a review of scholarship in this area (print newspaper coverage) and will describe our approach in-depth to the topic.

Newspaper Front Page Analysis: How Do They Tell the Story?

1. Introduction

Social Networking Sites (SNS), especially Twitter and Facebook, have played an important role in the current global social movement wave, from the Arab Spring to the Occupy movement in the United States. Social movement actors use SNS, among other tools, to document, promote, support and, in some cases, to coordinate movement activity. SNS have also become key sources of information for observers, both supporters, detractors, and non-participants, as well as for professional journalists working within print, broadcast, and online media, whose reporting strategies have, in some cases, shifted towards curating and incorporating content first circulated via SNS. In the context of increasingly transnationalized media firms and cross-platform convergence, information rapidly flows back and forth between SNS and mass media.
Print newspaper coverage also has an impact far beyond paid subscribers or readers, since it greatly influences broadcast (television and radio) news agendas; newspaper coverage also plays an important agenda-setting role for blogs and social media. The complexity of the converged media ecology requires new approaches to newspaper content analysis, which has long been used by social movement scholars as a proxy for social movement activity. This essay describes an innovative approach to the analysis and visualization of front page newspaper coverage.

2. Background: How Did I Start Coding Front Pages?

On Sunday May 15th, 2011, one week before the municipal elections that were taking place all around the country, there was a grassroots-organized march in many cities in Spain under the motto “Real Democracy Now” (Democracia Real Ya 1). By then, I was living in Boston and closely following all these events through the Internet.

Tens of thousands of people throughout Spain marched on the streets during what later would be known as #15M, the #SpanishRevolution or the ‘indignados’ movement. The movement was inspired by the Arab Spring and the Icelandic Revolution and was preceded by previous social mobilizations in Spain. The country was in the midst of a huge economic crisis and suffering from austerity measures that were dismantling the welfare state. The crisis was related to the world economic recession and to the bursting of the real estate bubble. In the short term, this new mobilization was related to #nolesvotes 2, a mobilization launched and forged on the Internet against Internet censorship that a new law was enforcing. In the years before, there had also been other mobilizations similar to the Democracia Real Ya platform involving demonstrations on the streets throughout the country, among others: Juventud sin futuro 3, to protest the precarious situation of the youth; Por una vivienda digna 4, a citizens’ platform created during the real estate bubble crisis to address housing problems.

Democracia Real Ya was a grassroots movement that received no supported from any party or union. It was a decentralized organization based on the Internet that opted for a multi-site demonstration, instead of the traditional march in the capital (Madrid). No flags were used and the “ghosts” of the two Spains from the Civil War; today’s two major political parties were also absent. Despite the movement’s success, the mainstream media did not pay much attention: It was just another demonstration in an electoral period.

That Sunday night after the march, around 40 people decided to stay in Puerta del Sol, the central square of Madrid. They wanted to keep on with the mobilization, and managed to convince the police to let them stay in the square during the night. After their first general assembly, they started organizing the first working groups. On the next day, many more people came to show support, and around 300 stayed on to sleep in the square. At 5 a.m. the police evicted them, an act that proved to be the tipping point of the movement. On Tuesday evening, more than 10,000 people crowded into the Puerta del Sol to protest the eviction. By that time, I was absorbed with the #acampadasol hashtag in Twitter, the 24-hour live streaming from soltv.tv, and trying to follow every bit of information about what was happening in my hometown of Madrid.

15m-portadas
This data visualization shows the front pages of 6 Spanish newspapers from Sunday, May 15th (up) through Friday, May 19th (down), 2011 in chronological order. The highlighted orange area indicates the articles about the 15M movement. Original image in yfrog.

Some major newspapers were covering the events, but people in social media, mainly Facebook and Twitter, argued that they were not getting enough coverage. On Wednesday, May 18th, the electoral board in Madrid denied the right to march or gather in the square, Junta Electoral Provincial de Madrid (2011), and that made the protests even more successful than the previous days: Puerta del Sol Square was full again. I tried to visualize the subsequent reactions of the mainstream media to this new event and tweeted my first newspaper front page data visualization.

On Thursday morning, May 19th, media attention was completely centered on the occupied squares: The protests started filling all the front pages only after the fourth night at Puerta del Sol, after the “tent cities” had already spread all around the country. The front page data visualization became popular after appearing on Menéame, a Spanish news aggregator site, as it showed the very moment when the protest entered the mass media loop in an easy and comprehensible way. Indeed, it was used by bloggers to reflect on how the media had waited too long to cover the protests. Some journalists also used it to think about how the media should cover these kinds of protests. The following Sunday, one week after the mobilization had started, the elections took place, but the camps and the spirit of change from the 15M movement remained.

The 15M movement was now live on the streets and ready to grow and take infinite shapes and ways of protests. My front page analysis was also making its first steps, and I was ready to start diving into it and testing its possibilities.

How Are Social and Mass Media Related?

Twitter is the tool researchers most frequently use to study information flows that Social Networking Sites enable, because these streams of information are open, allowing anyone to study their data. Facebook is arguably a more important site for spreading news, based on its far higher penetration rate, but as a closed network, the study of the data has not been as easy as with Twitter. We have used front page newspaper coverage analysis to compare newspaper coverage of recent mass protests with social media attention, in particular, in Twitter.

For example, we have compared the use of popular hashtags, the way message “tweets” are tagged in Twitter, in the 15M movement. The most popular hashtags were #acampadasol, #15M, and #spanishrevolution. We have compared the total number of tweets using these hashtags with the front pages of 7 major newspapers in Spain. These hashtags had been selected among those most used at the time regarding this movement according to research by the Complex Systems and Networks Group at the University of Zaragoza (BIFI). The Twitter data came from Trendistic, an online Twitter data visualization provider.

rtj
Surface dedicated to the 15M movement in 7 Spanish newspapers. Above is a line chart displaying the use of certain hashtags related to these social movements extracted from [link no longer works] http://trendistic.indextank.com/. From May 15th (left) through June 22nd (right), 2011.
A similar data analysis has been made with the Occupy movement with US newspapers. In this case, the chart above displays both the percentage of surface dedicated to the Occupy movement (red) and the number of tweets from the various related hashtags like: #ows, #occupywallstreet, #occupyLA, #occupyOakland or #occupyBoston.

occupy-27a
Surface coverage in newspapers front pages vs. Twitter about Occupy from September 17th through December 13th, 2011.The tweets per day come from the data released by r-shief.org in the context of the #occupydatahackathon.

Tweets are instant messages that cover events almost in real time. On the contrary, front pages cover the news of yesterday. Therefore, it is normal to see how different media react to the same event: Twitter coverage peaks the day that it occurs, and press coverage peaks the day after. Following this idea, it is more interesting to explore when Twitter and the press differ: When enormous tweet traffic about an event or action is not followed by that big coverage, or when a week-long, sustained conversation in Twitter around a hashtag doesn’t find its way into the print.

3. The Front Page Data Visualization: Building a Tool

The first data visualization started as “manual” process: I downloaded the images one by one from kiosko.net, a website providing newspaper front pages from all around the world, and built the array of images with Inkscape, a vector graphics program. Later on, after the good acceptance of the visualization, I started building a script to allow others to replicate this kind of analysis. Around a year later I started PageOneX, a free software tool (code available in github), designed to aid the coding, analysis, and visualization of front page newspaper coverage of major stories and media events.

PageOneX constitutes a straightforward way of interpreting front pages, a very specific piece of the media ecosystem that has direct influence on radio and TV broadcasts. In the past, researchers trying to analyze front pages needed to obtain copies of newspapers, measure column-inches by hand (with a physical ruler), and manually input measurements into a spreadsheet or database. This laborious and time-consuming process would be followed by calculation, analysis, and sometimes data visualization. Some of these steps can now be automated, while others can be dramatically simplified.

The process described here is designed to facilitate the relatively rapid creation of “small multiple” data visualizations of front page newspaper coverage. “Small multiple,” a term popularized by Edward Tufte, is a kind of data visualization that allows the visual comparison of multiple series of data: Series are displayed separately and placed next to each other. In the case of PageOneX, the displayed data include small images of the newspaper front pages themselves, as well as the surface area on the newspapers’ front pages dedicated to a specific news story (a “thread”) that runs chronologically along the x-axis (time). Coders manually select the portion of front pages dedicated to that thread. The selected areas are then displayed as shaded or colored transparencies on top of their original front pages. When viewed at sufficiently close range (zoomed in to a story), the text of the original stories that have been coded can still be easily read. However, this form of graphical information display is most compelling on a larger scale: Small thumbnails of the newspaper front pages are arrayed chronologically from left to right, and the viewer is then easily able to see at a glance the evolution of the coverage – or lack of coverage – of a particular news thread over time, as well as to compare different newspapers.

The visual approach allows the reader to have a sense of the coverage and, at the same time, have a look at the very raw data of the analysis, which are the components of the article, whether they be images, headlines or text. These highlighted areas could also be quantified to produce a bar chart. To make the measurements of the areas of news coverage comparable among different newspapers sizes, we use the percentage of used surface, and not the real area in mm².

The basic visualization of this type of graphic displays both the data itself (front pages and highlighted surfaces) as well as the measurement (the percentage of surface area) in a bar or line chart. Bar charts give a more accurate view of the surface devoted to the story, whereas line charts (see below) appear as a more continuous timeline, although they run the risk of suggesting a visual interpolation of discrete data. In other words, newspaper front pages provide one surface area datum per day, so a line connecting 2 surface area data points (from two consecutive days) produces a false sense of continuity. Line charts are useful, however, to compare more than 2 news threads over a long period of time, like the Arab Spring coverage (Egypt, Syria and Libya). When different topics are displayed one beside the other, it is a good way to study the battles for attention in the media; how related news “fight” for a position on page one, like in the Arab Spring coverage (Egypt, Syria, Libya and others) in Spanish newspapers.

svsvsvsv
Percentage of space used to display news regarding the “revolutions” (Egypt, Libya, Syria and others) in the Arab Spring in 4 Spanish newspapers front pages.

We can see how the media space is usually focused on one “revolution” at a time, and that there is not much juxtaposition of news about this topic.

We observed a big drop in the Arab Spring coverage on April 13th, because the Japanese tsunami was breaking news: Note how the green area (Japanese tsunami) “hides” all the other news related to the Arab Spring for a week. It is not the case that “nothing” related to the Arab Spring happened during that week, but rather that the media decided where to pay attention. News on front pages “fights” for space and its areas are related to one another.

Comparing Asynchronous News Coverage in Time

The relative measurement of the surfaces lets us not only compare different news from different newspaper sizes, but also from asynchronous timelines. This method would allow the measurement of the news cycle: enabling us to understand how long news lasts on the front pages and how similar events attract the attention of the media.

 

haiti-vs-japan

In the comparison of the surface coverage dedicated to the Haiti earthquake (day 1 = January 12th, 2010) and the Japanese tsunami (day 1 = March 11th, 2011) in 4 Spanish newspapers, we could measure and compare the length of the coverage. Remarkable is the rapid drop of the Japanese crisis coverage after day 8 (March 18th, 2011), caused by the UN’s authorization allowing the international community to enter the war in Libya.

Semantic Analysis of News Content

It is also possible to make an automatic estimation of the article’s content based on semantic technologies. This process would benefit from the automatic transcription of scanned newspaper front pages through optical character recognition (OCR). The graphic displays the number of times that certain words have appeared during the fall of Mubarak and Ali. Grouped under “democratic” and “dictatorial” groups, January and February 2011.

ali-mubarak_dictator-democratic
The fall of Ben Ali (Tunisia, orange) and Hosni Mubarak (Egypt, green) in 4 Spanish newspapers from January 10th through February 17th, 2011. More info.

As a case study, we used the fall of Mubarak and Ben Ali to compare how newspapers framed their last government/regime days. We analyzed the number of times that certain words appeared on the front page, and grouped them into two pools:

  • Democratic: president, government.
  • Dictatorial: dictator, rais, dictatorship, regime.

The aim of this study was to measure how newspapers are shifting their vocabulary along time, depending on their support / alignment with the issue they are covering. In Mubarak’s fall, we can see how newspapers shifted their frame during the crisis from a predominant use of democratic words (president, government) to more dictatorial ones (dictatorship, dictator, regime). In the case of Ben Ali, more “dictatorial” types of words were employed to describe his last days in power.

Content and Frame Analysis

We have seen how articles can be categorized, then colored and quantified, by multiple taxonomies related to their content: a particular thread or categorized by country. To understand how newspapers are addressing one topic would be not enough to understand how much they are covering it. We will need a framing analysis of their coverage: Are they positive/neutral/negative about it? Are they supportive? How biased is the information they provide?

We used this approach to analyze how different Spanish newspapers were covering corruption cases. The fast-growing list of corruption investigations in Spain contained almost every institution in the country. Everyday, new information and a new cases were being unveiled, provoking an increasing sense of indignation. It was also true that the levels of indignation had reached an apex, that they caused either incredulity or insensitivity.

The hypothesis and common ground knowledge is that every Spanish newspaper is aligned with a political party. Newspapers follow the corruption cases of the “opponent” parties. Measuring front page coverage seemed to be a good proxy to analyze their political agendas and to verify the hypothesis. I selected the most important Spanish newspapers and highlighted the stories related to the different corruption cases during a one-month period.

In January 2013, the El Mundo and El País newspapers reported that the ex-treasurer of the ruling party (Partido Popular, PP), Luis Bárcenas, had a $29 million Swiss account, and then published excerpts from the party’s parallel financial account. Both scoops impelled all the other newspapers to talk about the same PP corruption case, although other corruption cases affecting the main parties were also on the media menu. We coded the corruption cases from the major three parties: PP (conservative), blue; PSOE (center-left social democratic), red; CiU (conservative Catalan nationalist), orange; the royal house, green; other cases, purple.

corruption-spain-pageonex

Both newspapers, El Mundo and El País, are in opposite political spectrums, but made a common effort in this case to cover the Bárcenas story affecting the conservative party (PP) in the government.

El País centered its coverage on the PP (blue), leaving little space to the CiU (orange) or the monarchy (green), and none to the PSOE (red), following the expected behavior of a party related to the PSOE and the center-left. Meanwhile, El Mundo had a colorful timeline illustrating all the major corruption cases. Since the newspaper tends to defend the PP and attack the PSOE, it represented a change in their agenda.

However, some things did not fit into the alignment of mass media with certain major political parties that we could have expected. All of the newspapers were talking about the PP corruption case, but not in the same way. To understand how they were framing the story, we needed to add a new layer to the visualization: The issue of whether newspapers were framing corruption neutrally or negatively (plain areas) or defending and giving a positive view (striped areas).

A conservative newspaper like ABC (2nd row) dedicated their entire front page to the PP corruption case, but after the first news proclaimed that “PP must tell the truth about the Bárcenas case,”  they started defending the actions the PP was taking. As expected, other conservative newspapers (La Razón, La Gaceta, but not El Mundo, which had published the scoop) took a defensive position (Jan. 19-20). It is also worth noting that once El País released the excerpts of the parallel financial account (Jan. 31), La Gaceta, a far-right newspaper, stopped defending the PP.

I published a blog post about this case study that garnered a lot of attention in the social media sphere (Twitter). It is worth mentioning that El Mundo published a piece on this research: “El Mundo, the newspaper that covers all corruption cases” in a four-column headline 5. They were interested in showing how the data visualization supported their unbiased work, and redrew the graphic to show El Mundo in first place.

In Spain, mass media are usually blamed for maintaining and supporting the bi-partisan system 6. This time, however, some newspapers were playing a fundamental role in unveiling corruption cases, but most of them only kept reporting about certain corruption scandals. Only a well-informed citizen who escapes the biased point of view of his/her reference newspaper can get the full picture of what is happening and react accordingly.

4. Conclusion

The method for analyzing newspaper front pages that we have described here, as well as the PageOneX.com platform, provide a straightforward way to analyze and visualize news attention to specific stories over time, across or between newspapers. In the future, we imagine either extending this tool or connecting it to others focusing on other media platforms, such as TV 7 and radio broadcasts, or to the online versions of newspapers and social media.

Content analysis, and newspaper content analysis by amount of coverage, has had a long history in the field of communication studies. New tools are enabling novel approaches to this kind of analysis. Some aspects of newspaper content analysis can be automated, some can be distributed (crowdsourced), some can be done much more quickly by human coders using sophisticated new interfaces. The data produced by such analysis can also be visualized in new ways, and compared against data from other new sources of information flow such as social media. This essay has explained the approach we have taken with PageOneX, demonstrated its application to several specific stories, and suggested areas for further work. We hope that PageOneX provides a valuable example to anyone interested in monitoring the media: communication scholars, social movement activists, or advocacy organizations.

We invite anyone interested to contact us and to participate in the future development of the platform.

Pablo Rey Mazón 2013.

Notes:

  1. Democracia Real Ya was not only the motto, but also the citizen platform to deepen in democratic values http://democraciarealya.es
  2. #NoLesVotes (Do not vote for them) was the hashtag used in Twitter to promote this cyber movement. First used against the “Ley Sinde” law (Ley de Economía Sostenible [Sustainable Economy Law], March 2011), which opened the possibility of Internet censorship. That led to a second stage of the online movement that urged a change in the electoral system to fight bipartisanship, “Do not vote for them” was their motto, referring to the parties that approved the law. “Les” also meant “Ley de Economía Sostenible.”
  3. Started in Madrid in February 2011, “Youth without a future” is a citizens’ platform to address the problems of the precarious situation of the youth during the economic crisis  juventudsinfuturo.net.
  4. Started in Madrid in 2003 during that year’s real estate bubble, “Right to housing” is a citizens’ platform to address housing problems viviendadigna.org.
  5. “A study by the prestigious MIT in the US shows that this newspaper stands out in the Spanish press for investigating the political parties without exception”. . 
  6. PP-PSOE, both parties are the ones entangled in more corruption cases; check the Corruptódromo map.
  7.  Archive.org is making the TV searchable  by recording TV images and captions in a public archive: http://archive.org/details/tv .

Newspaper coverage goes 1:1 scale

PageOneX: How newspapers tell the story proposal for the Media Lab Festival
PageOneX: How newspapers tell the story? This is how the project would look like at the MIT Media Lab Festival

[Update: there is a post with all the photos related to the installation Guns, Wars and Terrorism in a PageOneX real size (photo essay)]

PageOneX keeps moving forward. We want to have it ready for the spring, but first we have to solve a large list of bugs and other issues. A lot to code! So much coding that we sometimes forget that paper newspapers are real objects. That’s why we want to make a physical visualization of newspapers, a 1:1 scale version of PageOneX for the MIT Media Lab Festival (April 2013).

We have yet to decide the topic/s we want to focus on and when we are going to start buying newspapers. Our original plan is having New York Times, Los Angeles Times, Washington Post and The Boston Globe.

Do you have any suggestion about which topic we should follow? When to start buying the newspapers?

We are inspired by other people that have done similar displays with real newspapers that we have came across recently:

The film Manufacturing Consent: Noam Chomsky and the Media (1992) (available to watch in archive.org) by Mark Achbar and Peter Wintonick makes visual what the book Manufacturing Consent by Chomsky and Herman describes. They use as a case study the coverage of Timor war and Cambodia wars, that were happening simultaneously (1975-1979) by stitching together all the columns of text that The New York Times dedicated to each topic. Column inches is the measure that academics (and advertisers) have used to measure the amount of coverage. It was a way to show the different amount of coverage that state atrocities get, depending if they came from friend or allies states or from official enemies of the US. It is an empirical demonstration of the propaganda model.

Genocides coverage in column inches in The New York Times:

East Timor vs Cambodia news  from film Manufacturing Consent: Noam Chomsky and the Media East Timor vs Cambodia news  from film Manufacturing Consent: Noam Chomsky and the Media East Timor vs Cambodia news  from film Manufacturing Consent: Noam Chomsky and the Media

They also make a wonderful display of surface area dedicated to see the ratio of advertisement and news in a  The New York Times newspaper (we are thinking on replicating this data visualization):

Ads vs news in New York Times from film Manufacturing Consent: Noam Chomsky and the Media
Ads vs news in New York Times from film Manufacturing Consent: Noam Chomsky and the Media

Inspired by the Manufacturing Consent film Siemon Allen made his Newspaper project. He was struck by the fact that during the same period 1975-1979 in South Africa another important event was happening “the Soweto uprisings, heightened police oppression, the expansion of separate development, and the death of many activists, including Steve Biko”. He made similar visual displays to show how was the coverage about South Africa in US newspapers:

Showing certain news in newspapers or cutting and pasting the news in long strips.

Siemon Allen Newspaper project. Hightlighing certain news
Siemon Allen Newspaper project. Hightlighing certain news
Siemon Allen Newspaper project. Cutting the news and forming strips.
Siemon Allen Newspaper project. Cutting the news and forming strips.

He also made standard data visualization (pie charts) when he analyzed the content of the news and classified it: aids, sport, culture, crime…

Siemon Allen Newspaper project. Percentage of coverage to certain categories in The Wahington Post.
Siemon Allen Newspaper project. Percentage of coverage to certain categories in The Washington Post.

Note: The photos from the film are screenshots I took. The Siemon Allen images are all extracted from his website.

 

3 steps to measure the corruption coverage in Spain

The fast-growing list of corruption investigations in Spain have involved almost every institution in the country: the major political parties, the royal house, the supreme court or the national bank, just to mention some of them. Everyday, new information and a new case is released/unveiled, provoking an increasing sense of indignation. It is also true that the levels of indignation have reached an apex, that they cause either incredulity or insensitivity.

I decided to test PageOneX, a tool to visualize the evolution of stories on newspaper front pages, to see how the coverage on corruption was being made. It is a good moment to do so, now that we, at the Center for Civic Media, are currently developing it. We hope to have a fully functional version by the end of the month, but you can always test the online alpha version or install the code locally. You can also get involved in the testing and development, it is open source.

This post is based on another I wrote in Spanish Es lo mismo pero no es igual in my blog.

1. Corruption or not corruption?

The hypothesis and common ground knowledge is that every Spanish newspaper is usually  aligned with a political party. They usually  follow the corruption cases of the ‘opponent’ parties. Measuring the coverage in the front page seemed a good proxy to analyze their political agendas and to verify the hypothesis.

I selected 9 Spanish newspapers and highlighted the stories related to corruption cases in the last days until February 5th, 2013.

130205_corruption-spain-pageonex

There are two big ‘black’ clusters: after Jan. 17th, when El Mundo published that the ruling party ex-treasurer, Bárcenas, had a $29 million swiss account, and after January 31st, when the excerpts from the party’s parallel financial accounts were published by El País. Both scoops drain all the other newspapers to talk about the same PP corruption case.
Continue reading

Three updates about PageOneX: How to Heroku, mail list and users start using

Three updates about the PageOneX:

PageOneX, ready steady go!


View this datavis full size at gigapan and the related post about May 2012 social mobilizations in Spain.

Today’s post is to present the tool we are building this summer: PageOneX. The idea behind is to make online and easier the coding process of front page newspapers. Make  this visualization process available for researchers, advocacy groups and anyone interested. I’ll will give some background about this process.

How things started
Approximately one year ago I started diving in the front page world. It was days after the occupations of squares in many cities from Spain, and I was living in Boston. I made a front page visualization to show what people was talking about: the blackout in the media about the indignados #15M movement. You can read more about Cthe story in the ivic Media blog. Since then I’ve been making more visualizations around front pages of paper newspapers, testing different methods and possible ways to use them. I’ve also made a tool, built in Processing, to scrap front pages from kiosko.net and build a .svg matrix.

 

PageOneX: first tool
Before starting with the new tool, I’d like to present the present one I’ve been using this past moths:  a semi-automated process with Processing and Inkscape. The code is available at https://github.com/numeroteca/pageonex-processing https://github.com/numeroteca/PageOneX.

The process is segmented in two main actions: 1. Get the front pages and 2. Code articles.

  1. Get the front pages
    Open the pageonex.pde file and open it in Processing:

    1. Select newspapers and starting and end dates (be aware of adjusting the size of the newspaper)
    2. Run the program to scrape front pages from kiosko.net. It automatically downloads them.
    3. It will construct the matrix of front pages in a .svg (Scalable Vector Graphics) file.
  2. Code articles
    1. Open the matrix.svg in Inkscape. It is a file with 3 layers:
      1. Highlights (multiply option to show transparency)
      2. Filter to make images look lighter.
      3. Images of front pages.
    2. Now highlight by hand the news we want by drawing rectangles (merging of rectangles for news with non-rectangular shapes) on the news.
    3. Export the file to a pretty .png file

That was the process until now. It works, but it is not easy for not tech savy people: you need to have Processing installed, change the parameters and be able to ‘play’ with Inkscape at an intermediate level. That is how we decided to make this tool online, to broaden its use.

 

PageOneX.com
PageOneX.com (now temporary redirected to this blog) is an online platform for analyzing and visualizing coverage of news in newspapers’ front pages. We’ll be coding this summer to have at least a part of the tool available by August-September. We’ll be having some beta tests, so if you are interested, just ask for it! The idea is to open a co-design process where future users take part in the design of the tool.

Why analyzing front pages? Some ideas behind the project:

 

1. 

It seems that analyzing front pages  is a good method, a shortcut to follow how news are being covered in the media. Front pages are a very special piece of the media ecology: newsrooms spend a lot of time deciding what goes in their A1, fighting which news have to be in their page one.

2. 

With this kind of visualizations we are able to show the data and the analysis at the same time. We can show in a bar chart quantitative data regarding the coverage, but also the data source it self: the front pages. We want to offer a visual and direct way to visualize all the coding. Check the The Global Media Monitoring Project Report methodology to see which other interesting  approaches to this coding process. We have tested with Gigapan the possibility of exploring this huge graphics, to be able to read the newspapers and also have a sense of the whole data visualization.

 

3. 

We’ll be using the percentage of every front page, instead of the actual size: it will allow us to compare newspapers with diferent sizes as we did with this example of US and Spanish newspapers covering the Japanese Tsunami in 2011.

Here there are slides about the project and basic draft for the User Interface.


Arab Spring, Spanish Revolution, and Occupy Movement: Mainstream Media vs Social Media coverage

The project is incorporating new collaborators: Ahmd Refat as coder, thanks to the Google Summer of Code programmSasha Costanza-Chock and Nathan Mathias from the Center for Civic Media at MIT Media Lab. Nathan is developing is also developing Mediameter with more people at the Center for Civic Media, we might be using their framework to build our tool and not start from scratch. Mediameter is used for crowd-source analysis of articles. We are also looking at Mapmill by Jeff Warren, built in Ruby on Rails, as it is a system to code  image as well.

Stay tuned!

 

 

Frontpage analysis tool in github

I’ve just uploaded to Github (opensource repository) the tool (in Processing) to scrap, download and build the matrix of newspapers frontpages: https://github.com/numeroteca/PageOneX Update 13.11.12: Renaming https://github.com/numeroteca/pageonex-processing Feedback welcome. See examples. By the way, this is the first “aside” of this blog.