After a while we are glad to announce brand new features in PageOneX.
We developed these features last summer, but until now they have not been available in the hosted version at pageonex.com. We worked with Juanjo Bazán (@xuanxu) in this.
Export a thread in raw format
Rebuilding the thread in R it is now possible. It
also works for multiple newspapers. Here a cleaner version. Compare it
with the thread in @PageOneX website. You can do it downloading Raw Areas Data json. R code available: https://t.co/4bVMRMbRwspic.twitter.com/gQXBhR2T1Y
Until now you could export the percentage of coverage per day and
paper in json and spreadsheet, now there is an extra feature that allows
you to export the raw data: the extact location of every area and all
its classifications (read following feature). We are starting a new
project pageonexR that allows you to import your threads to R and analyse their data.
Classify by multiple taxonomies
This new feature would add the capability to add extra information to
drawn areas. A highlighted area could have multiple taxonomies and open
fields.
Until this new release you could only classify each area with one
taxonomy. For example, an area could be categorized as “International
coveragae” but not as “International coverage” AND “Nigeria” AND
“positive framing”. Now you can do it . This feature is only available
for certain users. If you want to use it write a comment to this post. We are studying how to make this available for all the users.
Fork a thread
Another cool feature is that you can fork a thread in @pageonex. If you see a thread that you like you can clone it and work on it! pic.twitter.com/BxsH9wq6Ub
If you like another’s user thread: you can clone and edit it.
Edit and remove areas
Something basic that is now possible is to edit and delete areas in https://t.co/TSwWbvktjk.
Very useful for everyone, specially for heavy users. Before you have to
delete all the areas in a day to edit the category of one! @PageOneXpic.twitter.com/PosXAwteTl
Before you had to erase all the areas in a front page to remove one. Now you can remove them separately and re-classify them.
Another great thing is the new containerized versions of PageOneX. Rafa Porres (@walter_burns) developed it and Rahul Bhargava (@rahulbot) deployed it at Civic media server. Thanks for your support!!
Containeraized versions, make your own deployment
Pageonex is an open-source project. Thanks to Rafa Porres (@walter_burns)
we have PageOneX ready to use in a docker container. In fact, the new
containerized version is what we are using now in the production version
at pageonex.com. If you don’t want to use the hosted version of
pageonex at http://pageonex.com
you have a few options to run it yourself. Read our documentation and
choose the best option for you. We hope this helps other developers help
extending the features of PageOneX.
Hace unos meses publicamos un artículo en una revista científica sobre PageOneX, el software con el que analizamos las portadas.
The paper Sasha and I have been working on for quite a long time
has just been published at the International Journal of Communication PageOneX: New Approaches to Newspaper Front Page Analysis. We hope it provides an useful guide and resource to the field of the newspapers front page analysis.
PageOneX: New Approaches to Newspaper Front Page Analysis
Sasha Costanza-Chock, Pablo Rey-Mazón
Abstract
PageOneX is a Free/Libre and Open Source Software tool that we
designed to aid in the coding, analysis, and visualization of newspaper
front pages. Communication scholars have long analyzed newspaper front
pages, using column inches as an important indicator of mass media
attention. In the past, this involved obtaining physical copies of
newspapers, coding and measurement by hand, and manual input of
measurements into a spreadsheet or database, followed by calculation,
analysis, and visualization. PageOneX automates some of these steps,
simplifies others, and makes it possible for teams of investigators to
conduct shared newspaper front page analysis online. We review
scholarship in this area, describe our approach in depth, provide
concrete examples of analysis conducted by media scholars using
PageOneX, and discuss future directions for research and development.
The paper Sasha and I have been working on for quite a long time has just been published at the International Journal of Communication PageOneX: New Approaches to Newspaper Front Page Analysis. We hope it provides an useful guide and resource to the field of the newspapers front page analysis.
PageOneX: New Approaches to Newspaper Front Page Analysis
Sasha Costanza-Chock, Pablo Rey-Mazón
Abstract
PageOneX is a Free/Libre and Open Source Software tool that we designed to aid in the coding, analysis, and visualization of newspaper front pages. Communication scholars have long analyzed newspaper front pages, using column inches as an important indicator of mass media attention. In the past, this involved obtaining physical copies of newspapers, coding and measurement by hand, and manual input of measurements into a spreadsheet or database, followed by calculation, analysis, and visualization. PageOneX automates some of these steps, simplifies others, and makes it possible for teams of investigators to conduct shared newspaper front page analysis online. We review scholarship in this area, describe our approach in depth, provide concrete examples of analysis conducted by media scholars using PageOneX, and discuss future directions for research and development.
Este sábado estaré dando una charla en las IV jornadas de periodismo de datos en Madrid para tantear el interés en desarrollar un proyecto colaborativo sobre análisis de contenidos de los medios de comunicación en España ¿te animas?
Monitorización de medios (numeroteca)
IVJornadas periodismo de datos 2016
15.30h Sábado 7 de mayo 2016.
Medialab-Prado. Madrid.
Las noticias son noticia. Lo que cuentan, cómo lo cuentan y lo que no cuentan aportan datos para entender cómo los medios de comunicación transmiten la información a los ciudadanos. Necesitamos, en una amplia primera persona del plural que incluye a periodistas y ciudadanos, encontrar formas de archivar toda esa información. Existen bibliotecas y hemerotecas pero ¿qué pasa con los periódicos online? La waybackmachine de archive.org no es suficiente al ritmo con que se actualizan los periódicos en la web.
En mi charla haré un repaso a diferentes herramientas para monitorizar los medios de comunicación. Contaré el proyecto de monitorización de cobertura de corrupción en España a través de las portadas de los diarios impresos (Color Corrupción https://numeroteca.org/colorcorrupcion) y el software que he desarrollado: pageonex.com.
Repaso de iniciativas de monitorización: newsdiff (control de cambios de noticias), Past Pages (pastpages.org), Storytracker (portadas online), PageOneX (portadas papel). Fix the media, T-hoarder (monitorización de Twitter en abierto), monitorización de noticias TV (archive.org), mediacloud…
New feature in PageOneX.com: now you can switch topics on and off in the data visualization just by clicking on the topics in the legend.
New ways to understand your data.
Public Laboratory: comparte y cuida a la comunidad de usuarios
The Public Laboratory for Open Technology and Science, o mejor Public Lab, desarrolla su actividad en otro campo completamente diferente al del estudio de los flujos de información: diseña y construye herramientas de software y hardware de bajo coste en torno a temas relacionados con el medio ambiente. Un tipo de ciencia ciudadana, investigación científica desarrollada por científicos no profesionales (ciudadanos), que se desarrolla en formatos abiertos en torno a una comunidad de usuarios-desarrolladores interesados.
Los orígenes del proyecto fueron cuando Jeff Warren, todavía estudiante en Media Lab empezó a experimentar a hacer fotos desde el aire con una cámara compacta normal (=barata) colgada de un globo para producir imágenes aéreas de alta resolución, lo que más tarde sería su tesina de master. Por aquel entonces se llamaba Grassroots Mapping. Quería desarrollar técnicas y enseñárselas a comunidades de base para que pudieran producir sus propios mapas. La cámara hacía fotos en formato continuo mientras se elevaba: bastaba con unir esas fotos para poder tener el mapa de la zona mapeada.
Con el tiempo las actividades de Public Lab se han expandido a otra áreas de la ciencia, como son la espectrofotometría y la fotografía infraroja, a la vez que siguen compartiendo tanto el hardware y software que desarrollan como los datos que archivan con esas mismas herramientas.
Cuando en 2010 la plataforma petrolífera de BP estalló en el golfo de México, Jeff envió un email a la lista de correo de Grassroots Mapping, creada 6 meses antes, para preguntar cómo se podría empezar a mapear lo que el vertido de petróleo iba a destruir. Unos días después viajó a Nueva Orleans junto con Oliver Yeh y se empezaron a organizar con la Louisiana Bucket Brigade para hacer fotos de antes y de después de que llegara la marea de petróleo a la costa. Hacer las fotos cumplía una doble función: por un lado querían tener la documentación, ya que serían relevantes en un más que probable futuro juicio contra BP y no contaban con las fotografías de los satélites para apoyarles; por otro, el acto mismo de mapear servía para atraer la atención, y la colaboración, de la ciudadanía.
El proceso de hacer las fotos y enseñar a otros la técnica redundó en una mejora de las herramientas y en la creación de una comunidad de usuarios que detectaban problemas y proponía sus propias mejoras técnicas. Es un ejemplo idóneo para entender cómo hay que equilibrar el desarrollo de una herramienta y el cuidado del grupo de usuarios. Es tan importante el desarrollo de una tecnología que la gente pueda usar, porque es sencilla y asequible, como la creación de una comunidad de usuarios que la apoye y la use. En el proceso de diseño es también fundamental contar desde las primeras fases con los futuros usuarios (co-design o co-diseño). La experiencia del mapeado del vertido de petróleo del golfo de México y el trabajo en común fue el germen de Public Lab.
Public Lab como organización (hace poco consiguieron el estatus de organización sin ánimo de lucro en EE.UU.) empezó a andar gracias a el primer premio del News Challenge de la Kight Foundation. Desde entonces han buscado otras fuentes de ingresos para mantenerse, por ejemplo, sus campañas de crowdfunding para desarrollar projectos, como el caso reciente de infragram, o mediante la venta a través de su propia tienda de los productos de ciencia ciudadana que van desarrollando.
La investigación compartida se desarrolla principalmente a través de sus múltiples y abiertas listas de correo, organizadas temática y geográficamente. En su web también publican posts sobre las investigaciones y proyectos en marcha y animan a que cualquiera pueda publicar allí. Los modos de documentar se amplian haciendo que la web entera sea una wiki, esto es, que cualquiera pueda colaborar en editar, añadir y corregir cualquier parte de ella.
Hacer un mapa con este método es ir recomponiendo el terreno a partir de los cientos de imágenes que la cámara tomó en modo automático. Es un proceso que permite el trabajo colaborativo en Mapknitter.org, el software que ha desarrollado para componer ese puzzle de imágenes. Cuando el año pasado hacíamos fotos desde una cometa del vertedero de Boston en Saugus, donde se dejan las cenizas de la aneja incineradora, cumplíamos el doble propósito de estudiar cómo era ese vertedero a la vez que queríamos llamar la atención sobre su existencia y sobre la incineración de residuos. Además, la excursión al vertedero, anunciada públicamente en la lista de correo de Public Lab, era también un evento para enseñar esta técnica a quien quisiera acercarse a participar. El mapa producido quedó publicado con licencia CC-BY en el archivo de mapas de publiclab.org.
Sin embargo, ir al lugar y mapear algo físicamente es sólo una de las formas posibles para estudiar un lugar, a la vez que llamar la atención sobre él. En Google Maps (el que muchos entienden como el mapa online por defecto), el vertedero no aparece y la incineradora es difícilmente identificable como tal. En OpenStreetMap, un mapa construido colaborativamente por usuarios de todo el mundo, algo así como la Wikipedia de los mapas, fuimos nosotros los que dibujamos el perímetro del vertedero para hacerlo visible (la zona marrón). Es un proceso análogo a cuando un usuario corrige o escribe un artículo en Wikipedia: puede estar documentando para sí mismo, pero también sirve para compartir con otros lo que ha investigado.
Algo así me ocurrió en mayo de 2011 cuando iba siguiendo desde Boston todo lo que estaba ocurriendo en Madrid al hilo del movimiento 15M. Empecé entonces mi propio archivo personal de imágenes, documentos y prensa (online, televisión, papel), quería archivar todo lo que estaba aconteciendo. Después de leer varios comentarios sobre la pobre cobertura que las movilizaciones estaban teniendo pensé que se podía enfocar la respuesta como una visualización de datos. Descargué “a mano” las diferentes portadas de los periódicos más importantes, las ordené en una matriz y dibujé unas áreas naranjas allí donde había noticias relacionadas sobre el 15M. Publiqué en Twitter el gráfico y me fui a dormir. Cuando me levanté el viernes por la mañana aquel gráfico se había difundido y republicado en varios medios. Su amplia difusión seguramente se debía a la rapidez con que se leía el gráfico: hasta el jueves 19 de mayo los periódicos no se habían volcado enteramente a cubrir las movilizaciones. Era el inicio de lo que más tarde sería PageOneX.
PageOneX: del prototipo a la herramienta buscando usuarios
La buena acogida que tuvo el gráfico sobre la cobertura del 15M me llevó a continuar en el desarrollo de ese tipo de visualizaciones. Al igual que Nathan Matias, con su proyecto análisis de género en las noticias, quería automatizar el proceso de codificación de portadas lo más posible y permitir que otros lo usaran. Lo que había empezado como una respuesta al aparente blackout de los medios de comunicación, se iba a convertir en una de mis principales líneas de investigación.
Las portadas son el lugar donde los periódicos condensan la información más importante del día, y constituyen un elemento muy importante dentro del ecosistema de medios a la hora de definir la agenda mediática. La selección de noticias y su enfoque en la portada configuran su línea editorial, más casi que su línea editorial oficial. Utilizar la cantidad de espacio que ocupan en portada determinadas noticias ha resultado ser un buen atajo para estudiar a qué dedican su atención los periódicos. PageOneX, la herramienta que empecé a desarrollar entonces, automatiza y simplifica el proceso de descarga de las portadas, codificación, análisis y la visualización de los datos.
El proceso de desarrollo se ha basado en los retos y necesidades que aportaban los diferentes casos de estudio que fui haciendo: comparativa de cobertura de noticias en diferentes países; análisis cualitativo (positivo – negativo) de la cobertura sobre un tema; comparativa la cobertura en portadas, mass media, con datos de Twitter, social media;
El paso más trabajoso fue convertir la versión inicail del software, que funcionaba en mi ordenador usando diferentes programas y que requería conocimientos técnicos, en un programa online listo para ser usado por cualquiera. Proceso que llevó más de un año de desarrollo, primero con Ahmd Refat dentro del Google Summer of Code y luego apoyado por el MIT Center for Civic Media con Edward L. Platt y Rahul Bhargava. Recién llegados a una versión estable, lo que hace falta para seguir desarrollando, aprendiendo del ejemplo de Public Lab, es usuarios que la usen para sus investigaciones y que guíen hacia donde debe ir la herramienta. Por ejemplo como con el estudio sobre la cobertura de las protestas de Brasil de junio de 2013 por Débora Leal o recientemente con El Estado del periodismo, que analiza un año de portadas en México, por articulo19.
–
Cuando se comparten el proceso y los datos de una investigación se está facilitando la inclusión de otros investigadores e interesados en la misma, incluso antes de tener unas conclusiones o resultados terminados. El proceso de investigar se abre de este modo a la colaboración y puede nutrirse de críticas y sugerencias ajenas al mismo. Inicia así la difusión del mismo antes de haber concluido, sin necesidad de emplear recursos extra para publicitarlo. El mejor artículo publicado en una publicación especializada, aunque sea de acceso libre, puede no llegar al público u otros investigadores y no ser el motor de cambio deseado. Tener en cuenta cómo se va a difundir la investigación y convertirla en un proceso abierto aumenta las posibilidades de impacto de esta.
He pasado los dos últimos días en el encuentro/congreso #GlobalRev, hablando de cómo investigar, entender y apoyar las movilizaciones en red: desde la primavera árabe de Túnez y Egipto a las últimas movilizaciones en Brasil, pasando por 15M, occupy y Turquía. He desvirtualizado con mucha alegría (un verbo que se usa para decir que has visto en carne y hueso a gente de la cual solamente conocías su avatar en Twitter) a muchas personas que he seguido en la distancia desde Boston y a través de las cuales he seguido, visto y entendido más el 15M: @suysulucha y sus video streamings o a casi todo el equipo de DataAnalysis15M.
El objetivo, en pocas palabras, es organizar una plataforma de investigación abierta sobre los movimientos sociales en red que estudie comparativamente los casos de los 3 últimos años. En muchos aspecto me recuerda a la red que se intentó establecer con OccupyResearch: compartir datos, herramientas, reflexiones, ideas para pensar e interconectar las diferentes luchas. ¿Qué se puede aprender de los aciertos y errores de OcccupyResearch? ¿Cómo de abierta puede ser una red de investigación? ¿Cómo mantener viva la ilusión y las ganas de trabajar juntos? OccupyResearch funcionó para poner en contacto a diferentes personas que estaban investigando occupy por separado y generar grupos de trabajo que llegaron a desarrollar proyectos como la Occupy Research General Survey o los hackathons de OccupyData. Sus datos y metodologías aún se siguen usando y, según he visto estos días, son fuentes de inspiración. OccupyResearch no fue tan efectiva a la hora de lograr una colaboración estable y de largo recorrido entre sus participantes, y su participación fue poco a poco decayendo. Actualmente la red está casi inactiva, aunque algún nodo se mantenga activo fuera de la red inicial. Habría que poner por escrito en algún momento todo lo que hemos aprendido de la experiencia.
Volvamos al encuentro #Globalrev: si quereis ver lo que se habló el primer día de presentaciones de diferentes países, podéis consultar los estupendos liveblogs en ictlogy.net o las notas que tomamos colectivamente en un etherpad. El segundo día se dedicó a pensar conjuntamente cómo debía ser esa plataforma/grupo de investigación comparativa internacional. Un proyecto ambicioso, que cuenta con Javier @Toret y @DataAnalysis15M como núcleo duro, lo cual es esperanzador a la hora de pensar en un plan de investigación que abarca tantos contextos diferentes (de momento 7 países). Esperanzador porque hará falta un motor fuerte y organizado para coordinar y dinamizar a todo aquel que se sume al proyecto, y su recientemente autopublicada investigación “Tecnopolítica y 15M, la potencia de las multitudes conectadas. El sistema red 15M, un nuevo paradigma de la política distribuida” (junio 2013) es un buen precedente que ha consiguido dar sentido a la complejidad de millones de tuits, hashtags y movilizaciones en las calles.
Pero yo escribía este post para “hablar de mi libro” y de la alegría que ha sido ver las diferentes visualizaciones de PageOneX en varias de las presentaciones. Haciendo repaso mentalmente me daba cuenta de que había al menos una visualización de portadas de prensa por cada uno de los movimientos en red estudiados, menos del #yosoy132 mexicano. La serie se completó justo cuando estaba llegando a Barcelona hace dos días y recibí un email de Benjamín Arditi contándome que había acababa de completar un primer análisis de portadas sobre #yosoy132 en la prensa mexicana.
De hecho, el origen de PageOneX fue durante la primera semana del 15M, y surgió para medir y mostrar visualmente la escasez de cobertura de los medios tadicionales sobre un movimiento social entonces recién nacido. Estos casi 3 años de movilizaciones también han sido la evolución de la herramienta de análisis de portadas: desde una imagen en un tuit hecho descargando y organizando las portadas “a mano” hasta una herramienta online que cualquiera puede usar. He pensado que sería interesante repasar estas visualizaciones, verlas juntas y recordar cómo fueron realizadas y ver cómo la prensa escrita cubrió estos movimientos sociales en red.
Justo hoy, en unos de los infinitos pads en torno a los que se organiza #globalrev y DatAnalysis15M (o GRRN), @Toret había recopilado ya estos gráficos en una única lista, bendita lógica distribuida. Sin un estilo uniforme, pero con los mismos mimbres, pongo todas las imágenes juntas.
15M: blackout de los medios y método casi artesanal
Primavera árabe. Túnez, Egipto, Libia.
Occupy. USA.
#direnGezi #OccupyGezi. Turquía
Brasil protests #VemPraRua #BRevolução
#YoSoy132. México
Éste listado cronológico de visualizaciones es un ejemplo de cómo a medida que PageOneX se convierte en una herramienta más fácil de utilizar más gente puede usarla autónomamente sin depender de mi. En los primeros casos era una labor en solitario: dadas las características de la herramienta. Después, cuando pageonex.com versión beta ya estaba activo, mi papel ha podido pasar a ser el de guía, apoyo o compilador para generar las imágenes finales, pero no he tenido que codificar las portadas (portadas de periódicos turcos, periódicos brasileños). En el caso de México no he tenido más que imprimir pantalla.
–
Actualización 4 noviembre 2013: el trabajo que queda pendiente es poner en formatos visualmente comparables las diferentes visualizaciones; completar el estudio con la prensa local en los países (primavera árabe) de los que no se ha analizado: y hacer un análisis cualitativo de cómo era la cobertura en cada caso: favorable, desfavorable, etc. Como algunas visualizaciones son previas al lanzamiento de pageonex.com habrá que recodificarlas de nuevo en la nueva plataforma. Si alguien se anima a participar que me lo haga saber, ahora PageOneX permite que varias personas codifiquen un mismo hilo.
Un mes donde predomina el color rojo del caso corrupción de los ERE en Andalucía que afecta al PSOE.
A partir de la Diada (11 de septiembre) los periódicos catalanes dejaron prácticamente de cubrir ningún caso de corrupción. Parece que el efecto del debate independentista ocultó cualquier artículo sobre corrupción, salvo dos casos aislados de La Vanguardia.
El Mundo continuó con el escándalo de las facturas falsas de UGT Andalucía (rosa), solo acompañado mínimamente por ABC. También ABC y El mundo coincidieron en publicar noticias que afectan a CiU (caso de Jordi Pujol Ferrusola y por otro lado las empresas del cuñado de Mas).
El Mundo sigue siendo el que más espacio dedica en portada a corrupción con lo que equilvaldŕia a 5,6 portadas a lo largo del mes, si sumáramos todas las superficies de todos los artículos dedicados al tema. Le sigue ABC con 3,2 y El País, La Razón y Gaceta con 1,6. Los periódicos catalanes están por debajo de 1,0.
El Mundo también es el más diverso, que, salvo el caso del Tribunal Constitucional ý su presidente militante del PP (patrimonio ‘exclusivo’ de El País), cubre todos los casos.
Si analizamos por le porcentaje del total de artículos dedicados a corrupción por periódico durante est mes de septiembre vemos que predomina el color rojo PSOE, sobre todo en los periódicos conservadores y en todos los catalanes. El Mundo y El País son los únicos que casi hacen una cobertura similar del PSOE y PP.
En contra de lo que augurába a principios de mes con la declaración de las secretarias de Bárcenas y algunos otros detalles de la instrucción, septiembre no fue un mes azul PP sino rojo PSOE.
Un mes donde predomina el color rojo del caso corrupción de los ERE en Andalucía que afecta al PSOE.
A partir de la Diada (11 de septiembre) los periódicos catalanes dejaron prácticamente de cubrir ningún caso de corrupción. Parece que el efecto del debate independentista ocultó cualquier artículo sobre corrupción, salvo dos casos aislados de La Vanguardia.
El Mundo continuó con el escándalo de las facturas falsas de UGT Andalucía (rosa), solo acompañado mínimamente por ABC. También ABC y El mundo coincidieron en publicar noticias que afectan a CiU (caso de Jordi Pujol Ferrusola y por otro lado las empresas del cuñado de Mas).
El Mundo sigue siendo el que más espacio dedica en portada a corrupción con lo que equilvaldŕia a 5,6 portadas a lo largo del mes, si sumáramos todas las superficies de todos los artículos dedicados al tema. Le sigue ABC con 3,2 y El País, La Razón y Gaceta con 1,6. Los periódicos catalanes están por debajo de 1,0.
El Mundo también es el más diverso, que, salvo el caso del Tribunal Constitucional ý su presidente militante del PP (patrimonio ‘exclusivo’ de El País), cubre todos los casos.
Si analizamos por le porcentaje del total de artículos dedicados a corrupción por periódico durante est mes de septiembre vemos que predomina el color rojo PSOE, sobre todo en los periódicos conservadores y en todos los catalanes. El Mundo y El País son los únicos que casi hacen una cobertura similar del PSOE y PP.
En contra de lo que augurába a principios de mes con la declaración de las secretarias de Bárcenas y algunos otros detalles de la instrucción, septiembre no fue un mes azul PP sino rojo PSOE.
El accidente de tren de Santiago ocupó la mayor parte del espacio en las portadas de los últimos días.
Dentro del apartado otros (morado) incluimos a María Antonia Munar, de Unió Mallorquina, que ingresó en prisión.
Dentro del azul PP, el caso Bárcenas y el anuncio de la comparecencia de Rajoy el este mismo caso se llevan parte del espacio, y se añade la rebaja de la condena por parte del Tribunal Supremo a Jaume Matas (PP).
En rojo, la dimisión de Griñán, presidente de la Junta de Andalucía. En los casos en los que se hacía referencia al caso de los ERE se ha marcado, día antes de la comparecencia ante la juez Ayala del interventor que alertó de irregularidades en los ERE.
Gris TC: Añadimos Tribunal Constitucional como nuevo color, aunque solo lo publican EL País y El Periódico. Optamos por separarlo, auqnue está relacionado con el PP, ya que la noticia es que el presidente del TC era militante del PP.
Rojo PSOE (PSC): el rojo proviene de la imputación de la gerente del PSC por las grabaciones a Camacho, presidenta del PP catalán, caso de Método 3.
Verde claro Bankia: querella por prevaricar para Elipidio, el juez que encarceló a Blesa dos veces, pequeñas entradas de El Mundo y El País.
Azul PP: Ruz pregunta hay delito fiscal y cohecho en el PP (El Mundo, La Gaceta, La Vanguardia, La Razón), y si Rajoy declarará (La Gaceta). ABC dice: “Chantaje a Bárcenas: Soraya corrige a Gallardón. Ante la pasividad del ministro para defender al PP y al Gobierno, remarca que hay periódicos que falsean la realidad.” Inclasificable.
Las portadas de la prensa de papel son el lugar donde los periódicos condensan la información más importante del día. El uso cada vez más extendido de internet, ya sea en medios de comunicación clásicos (periódicos) o mediante redes sociales en internet (Twitter y Facebook) podría llevar a pensar que han perdido notoriedad, pero las portadas siguen siendo un elemento muy importante dentro del ecosistema de medios a la hora de definir la agenda mediática. Las portadas del día siguiente están presentes en los informativos de noticias nocturnos de televisión y radio y en las conversaciones de Twitter de madrugada. Las portadas de los principales periódicos marcan de este modo las agenda de lo que será “importante” al día siguiente en otros medios, como radios y periódicos más pequeños, y programas de televisión. La selección de noticias y su enfoque en la portada configuran su línea editorial, más casi que su línea editorial oficial. De un tiempo a esta parte han vuelto a ganar importancia y ha habido incluso “secuestros de portada” para no dar pistas a los competidores de las noticias que se van a publicar.
A finales de enero necesitaba un caso de estudio para poner a prueba el software y herramienta de estudio PageOneX. Ese mismo mes El Mundo y El País habían publicado sendos scoops sobre el caso Bárcenas, lo que arrastró a todos los periódicos a tratar un caso de corrupción que afectaba al Partido Popular (PP). Estas noticias podrían haber sido las causantes del aumento de la percepción pública de la corrupción como problema generalizado, y los periódicos, facilitadores a la hora de configurar la opinión pública/dirigir la mirada hacia ese tema. Según el barómetro del CIS del mes de marzo, los españoles situaron como segundo y cuarto problemas, después del paro, a la corrupción y el fraude y a los políticos.
Por otro lado, la hipótesis y el saber popular es que los periódicos en España están en general ideológicamente alineados con un determinado partido político. Esto implica que suelen silenciar los casos de corrupción y noticias negativas del partido al que son afines e informar sobre los casos de corrupción del partido de signo político contrario. El lector suele conocer la polarización de los medios españoles y escoge la prensa más afín a su ideología.
El primer paso era seleccionar todos los artículos sobre corrupción en España. Se aprecian claramente dos grandes zonas más densas después de que El Mundo y El País publicaran sus exclusivas. Todos los periódicos retrataban casi al unísono la corrupción del país. Este análisis binario, sí o no corrupción, nos da idea de la prominencia del tema, pero necesitábamos tener más datos para saber qué casos y cómo se estaban tratando.
El listado de casos de corrupción activos es muy grande pero principalmente afecta a los tres partidos con mayor representatividad parlamentaria: PP (azul), PSOE (rojo) y CiU (naranja). Creé otra categoría para la Casa Real por el caso Nóos y Urdangarín (verde) e hice un quinto grupo para agrupar otros casos de corrupción, como los problemas de control de cajas de ahorro por el Banco de España, que integraba también otras noticias generales sobre el estado generalizado de corrupción.
Cada noticia se clasificaba en función del caso de corrupción, asignándoselo a la institución/partido principalmente implicado en él. De este modo podíamos visualizar la atención que cada medio dedicaba a la corrupción de cada partido; sin embargo, esto no bastaba para entender si la información era presentada favorable o desfavorablemente. Por ello, se añadió una capa cualitativa al análisis ¿eran las noticias neutras o desfavorables, o por el contrario favorables o defensivas?
Resultados
El caso de los papeles de Bárcenas y la posible financiación ilegal del Partido Popular eran algo demasiado importante en ese periodo como para ser ignorado. Marcó la cobertura y color en todos los medios, incluso en los periódicos conservadores, habitualmente afines al PP. Para amortiguar el “daño” que una noticia así podía causar emplearon otras tácticas diferentes a silenciar el caso. ABC (aunque también La Razón y La Gaceta, que quedan fuera de este estudio) defendieron la actuación de los populares utilizando varios métodos: dar razones para situar a Bárcenas fuera del PP, declarar falsos los “papeles de Bárcenas” o apoyar los proyectos pro-transparencia de Mariano Rajoy y otros miembros del partido. En los días posteriores a la noticia de las cuentas suizas de Bárcenas, estos mismos periódicos coincidieron también en dedicar al menos una portada a la ‘corrupción’ en genérico, la corrupción como un mal generalizado que afecta a todos los partidos. Algo parecido hizo también El Periódico, mostrando la indignación de sus lectores ante la corrupción generalizada.
Portadas de varios periódicos tratando el tema de la corrupción como mal generalizado. La Gaceta y ABC publicaron collages con corruptos de todo signo político.
Periódico por periódico
El País “azul”
Media dedicada a corrupción por día 23%
El País dedica su cobertura de la corrupción fundamentalmente al azul PP (80% del total) con algunos pequeños toques verdes Urdangarín y Revenga, CiU y la supervisión de los inspectores del Banco de España. El rojo PSOE no aparece por ningún lado, congruente con su alineación política de centro-izquierda y afinidad socialista. Su cobertura de casos de corrupción es constante, en torno al 10-20% cada día. Después de publicar su exclusiva sobre papeles de Bárcenas, dedica entre un 40% y el 70% de su portada al caso en los día siguientes.
El Mundo “multicolor”
Media dedicada a corrupción por día 43%
Comienzan con naranja CiU (20% del total), luego llega el periodo azul PP (50%) con las cuentas de Bárcenas en Suiza que ellos mismos destapan, todo ello combinado con toques de rojo PSOE (13%) por el caso Amy-Mulas y verdes Urdangarín (15%). Al final vuelve a los papeles de Bárcenas empujado por la exclusiva de El País. Desde después del 6 de enero no hay día que no hable de algún caso de corrupción, dedicando habitualmente 20% y el 30%, y superando muchas veces el 60%. Es el periódico que más espacio dedica a la corrupción, con el 43% de todas sus portadas.
ABC “azul”
Media dedicada a corrupción por día 33%
Por las características de maquetación su portada, con una imagen que lo ocupa casi todo, tiene siempre mayores porcentajes que el resto de periódicos, superando a menudo el 50% de cobertura, hable del tema que hable. Después de la aparición de las cuentas en Suiza de Bárcenas le dedica dos portadas enteras seguidas: “El PP debe aclarar la verdad del caso Bárcenas” para al día siguiente “En el PP quien la hace la paga”, lo cual indica la estrategia de defensa del PP que habrá de seguir en los siguientes días. Al día siguiente “ataca” al PSOE sacando a Griñán (PSOE) y sus EREs. Días más tarde, el 22 de enero, titula “Luz y taquígrafos” para anunciar que Rajoy realizará una auditoría externa e interna para “zanjar especulaciones”. De este modo el ABC ha seguido todas las modalidades posibles de defensa: atacar al enemigo, y defender al partido afín. Cierra el periodo con unas fotocopias hechas trizas con el titular: “Las fotocopias que pusieron en jaque a España se desmoronan”.
La Vanguardia “azul”
Media dedicada a corrupción por día 18%
De todas las noticias que dedica a corrupción La Vanguardia dedica un 75% de su cobertura al PP. Puntualmente cubre la imputación del secretario de las infantas o los trámites para acusar de cohecho a Crespo (CiU), todas ellas basadas en noticias judiciales. Cabe destacar que de los 36 días a estudio, en casi la mitad (17 días – 47%) no tuvo noticia alguna sobre corrupción. Le siguen de cerca El Periódico (14 días – 38%) y ABC (12 días – 33%).
El Periódico “azul” y “naranja”
Media dedicada a corrupción por día 22%
El Periódico dedica mayoritariamente su cobertura de la corrupción al PP (50%) y a CiU (30%). Es significativo que dedique un cuarto de las noticias sobre corrupción a hablar de este tema en general, con titulares como: “Los jueces reclaman más medios contra la corrupción”, “Los partidos están obligados a mover ficha con la transparencia” o “#MásDemocracia”. Es relevante también la casi ausencia del PSOE con un 5% del total de superficie.
—
El análisis de este mes de enero permite comprobar el alineamiento de los periódicos esperado, como el silenciamiento de los casos del PSOE por El País o la defensa del PP por parte de ABC. También muestra cómo los periódicos generalistas de ámbito español están dedicando más espacio en sus portadas a la corrupción que los catalanes: El Mundo dedica un 43% de su portadas (El País 23%, ABC 33%), frente a un 22% de El Periódico y un 18% de La Vanguardia. En cualquier caso todos reflejan los viejos y nuevos casos de corrupción de una clase política que lleva mucho tiempo en el poder.
Algunos medios están desempeñando un papel muy importante a la hora de destapar esos casos de corrupción, mientras que otros informan sobre casos ya judicializados. En cualquier caso, casi todos dejan de cubrir, o lo hacen pero dedicándoles menos espacio, los casos de los partidos “amigos” o más afines.
Solo un ciudadano bien informado, con una dieta informativa que incluya todos los colores, podrá escapar de la visión partidista de un solo periódico. Los nuevos medios de comunicación digitales en España (entro otros El Confidencial, lainformación, el diario, La Marea o InfoLibre) o los agregadores de noticias, donde los usuarios votan cuales pasan a portada (reddit, meneame), podrían ayudar a romper esa visión predominantemente monocolor de los medios traicionales ligados estrechamente a partidos y empresas. La ley de transparencia, que no acaba de llegar, y de la cual se desconoce si tendrá un alcance real y efectivo, ayudaría también a reducir los casos de corrupción. Mientras, solo nos queda seguir buceando entre periódicos y mantener los ojos bien abiertos.
–
Escrito por Pablo Rey Mazón. Parte de este texto proviene de una artículo en preparación con Sasha Costanza-Chock.
This article will be part of the forthcoming book Accountability Technologies: Tools for Asking Hard Questions edited by Dietmar Offenhuber and Katja Schechtner. It is based on previous published texts about PageOneX. It wants to be a short summary of the possibilities of the tool that has just been released: PageOneX.com
There is an article in preparation with Sasha Costanza-Chock that will provide a review of scholarship in this area (print newspaper coverage) and will describe our approach in-depth to the topic.
Newspaper Front Page Analysis: How Do They Tell the Story?
1. Introduction
Social Networking Sites (SNS), especially Twitter and Facebook, have played an important role in the current global social movement wave, from the Arab Spring to the Occupy movement in the United States. Social movement actors use SNS, among other tools, to document, promote, support and, in some cases, to coordinate movement activity. SNS have also become key sources of information for observers, both supporters, detractors, and non-participants, as well as for professional journalists working within print, broadcast, and online media, whose reporting strategies have, in some cases, shifted towards curating and incorporating content first circulated via SNS. In the context of increasingly transnationalized media firms and cross-platform convergence, information rapidly flows back and forth between SNS and mass media.
Print newspaper coverage also has an impact far beyond paid subscribers or readers, since it greatly influences broadcast (television and radio) news agendas; newspaper coverage also plays an important agenda-setting role for blogs and social media. The complexity of the converged media ecology requires new approaches to newspaper content analysis, which has long been used by social movement scholars as a proxy for social movement activity. This essay describes an innovative approach to the analysis and visualization of front page newspaper coverage.
2. Background: How Did I Start Coding Front Pages?
On Sunday May 15th, 2011, one week before the municipal elections that were taking place all around the country, there was a grassroots-organized march in many cities in Spain under the motto “Real Democracy Now” (Democracia Real Ya[ref]Democracia Real Ya was not only the motto, but also the citizen platform to deepen in democratic values http://democraciarealya.es[/ref]). By then, I was living in Boston and closely following all these events through the Internet.
Tens of thousands of people throughout Spain marched on the streets during what later would be known as #15M, the #SpanishRevolution or the ‘indignados’ movement. The movement was inspired by the Arab Spring and the Icelandic Revolution and was preceded by previous social mobilizations in Spain. The country was in the midst of a huge economic crisis and suffering from austerity measures that were dismantling the welfare state. The crisis was related to the world economic recession and to the bursting of the real estate bubble. In the short term, this new mobilization was related to #nolesvotes[ref]#NoLesVotes (Do not vote for them) was the hashtag used in Twitter to promote this cyber movement. First used against the “Ley Sinde” law (Ley de Economía Sostenible [Sustainable Economy Law], March 2011), which opened the possibility of Internet censorship. That led to a second stage of the online movement that urged a change in the electoral system to fight bipartisanship, “Do not vote for them” was their motto, referring to the parties that approved the law. “Les” also meant “Ley de Economía Sostenible.”[/ref], a mobilization launched and forged on the Internet against Internet censorship that a new law was enforcing. In the years before, there had also been other mobilizations similar to the Democracia Real Ya platform involving demonstrations on the streets throughout the country, among others: Juventud sin futuro[ref]Started in Madrid in February 2011, “Youth without a future” is a citizens’ platform to address the problems of the precarious situation of the youth during the economic crisis juventudsinfuturo.net.[/ref], to protest the precarious situation of the youth; Por una vivienda digna[ref]Started in Madrid in 2003 during that year’s real estate bubble, “Right to housing” is a citizens’ platform to address housing problems viviendadigna.org.[/ref], a citizens’ platform created during the real estate bubble crisis to address housing problems.
Democracia Real Ya was a grassroots movement that received no supported from any party or union. It was a decentralized organization based on the Internet that opted for a multi-site demonstration, instead of the traditional march in the capital (Madrid). No flags were used and the “ghosts” of the two Spains from the Civil War; today’s two major political parties were also absent. Despite the movement’s success, the mainstream media did not pay much attention: It was just another demonstration in an electoral period.
That Sunday night after the march, around 40 people decided to stay in Puerta del Sol, the central square of Madrid. They wanted to keep on with the mobilization, and managed to convince the police to let them stay in the square during the night. After their first general assembly, they started organizing the first working groups. On the next day, many more people came to show support, and around 300 stayed on to sleep in the square. At 5 a.m. the police evicted them, an act that proved to be the tipping point of the movement. On Tuesday evening, more than 10,000 people crowded into the Puerta del Sol to protest the eviction. By that time, I was absorbed with the #acampadasol hashtag in Twitter, the 24-hour live streaming from soltv.tv, and trying to follow every bit of information about what was happening in my hometown of Madrid.
Some major newspapers were covering the events, but people in social media, mainly Facebook and Twitter, argued that they were not getting enough coverage. On Wednesday, May 18th, the electoral board in Madrid denied the right to march or gather in the square, Junta Electoral Provincial de Madrid (2011), and that made the protests even more successful than the previous days: Puerta del Sol Square was full again. I tried to visualize the subsequent reactions of the mainstream media to this new event and tweeted my first newspaper front page data visualization.
On Thursday morning, May 19th, media attention was completely centered on the occupied squares: The protests started filling all the front pages only after the fourth night at Puerta del Sol, after the “tent cities” had already spread all around the country. The front page data visualization became popular after appearing on Menéame, a Spanish news aggregator site, as it showed the very moment when the protest entered the mass media loop in an easy and comprehensible way. Indeed, it was used by bloggers to reflect on how the media had waited too long to cover the protests. Some journalists also used it to think about how the media should cover these kinds of protests. The following Sunday, one week after the mobilization had started, the elections took place, but the camps and the spirit of change from the 15M movement remained.
The 15M movement was now live on the streets and ready to grow and take infinite shapes and ways of protests. My front page analysis was also making its first steps, and I was ready to start diving into it and testing its possibilities.
How Are Social and Mass Media Related?
Twitter is the tool researchers most frequently use to study information flows that Social Networking Sites enable, because these streams of information are open, allowing anyone to study their data. Facebook is arguably a more important site for spreading news, based on its far higher penetration rate, but as a closed network, the study of the data has not been as easy as with Twitter. We have used front page newspaper coverage analysis to compare newspaper coverage of recent mass protests with social media attention, in particular, in Twitter.
For example, we have compared the use of popular hashtags, the way message “tweets” are tagged in Twitter, in the 15M movement. The most popular hashtags were #acampadasol, #15M, and #spanishrevolution. We have compared the total number of tweets using these hashtags with the front pages of 7 major newspapers in Spain. These hashtags had been selected among those most used at the time regarding this movement according to research by the Complex Systems and Networks Group at the University of Zaragoza (BIFI). The Twitter data came from Trendistic, an online Twitter data visualization provider.
A similar data analysis has been made with the Occupy movement with US newspapers. In this case, the chart above displays both the percentage of surface dedicated to the Occupy movement (red) and the number of tweets from the various related hashtags like: #ows, #occupywallstreet, #occupyLA, #occupyOakland or #occupyBoston.
Tweets are instant messages that cover events almost in real time. On the contrary, front pages cover the news of yesterday. Therefore, it is normal to see how different media react to the same event: Twitter coverage peaks the day that it occurs, and press coverage peaks the day after. Following this idea, it is more interesting to explore when Twitter and the press differ: When enormous tweet traffic about an event or action is not followed by that big coverage, or when a week-long, sustained conversation in Twitter around a hashtag doesn’t find its way into the print.
3. The Front Page Data Visualization: Building a Tool
The first data visualization started as “manual” process: I downloaded the images one by one from kiosko.net, a website providing newspaper front pages from all around the world, and built the array of images with Inkscape, a vector graphics program. Later on, after the good acceptance of the visualization, I started building a script to allow others to replicate this kind of analysis. Around a year later I started PageOneX, a free software tool (code available in github), designed to aid the coding, analysis, and visualization of front page newspaper coverage of major stories and media events.
PageOneX constitutes a straightforward way of interpreting front pages, a very specific piece of the media ecosystem that has direct influence on radio and TV broadcasts. In the past, researchers trying to analyze front pages needed to obtain copies of newspapers, measure column-inches by hand (with a physical ruler), and manually input measurements into a spreadsheet or database. This laborious and time-consuming process would be followed by calculation, analysis, and sometimes data visualization. Some of these steps can now be automated, while others can be dramatically simplified.
The process described here is designed to facilitate the relatively rapid creation of “small multiple” data visualizations of front page newspaper coverage. “Small multiple,” a term popularized by Edward Tufte, is a kind of data visualization that allows the visual comparison of multiple series of data: Series are displayed separately and placed next to each other. In the case of PageOneX, the displayed data include small images of the newspaper front pages themselves, as well as the surface area on the newspapers’ front pages dedicated to a specific news story (a “thread”) that runs chronologically along the x-axis (time). Coders manually select the portion of front pages dedicated to that thread. The selected areas are then displayed as shaded or colored transparencies on top of their original front pages. When viewed at sufficiently close range (zoomed in to a story), the text of the original stories that have been coded can still be easily read. However, this form of graphical information display is most compelling on a larger scale: Small thumbnails of the newspaper front pages are arrayed chronologically from left to right, and the viewer is then easily able to see at a glance the evolution of the coverage – or lack of coverage – of a particular news thread over time, as well as to compare different newspapers.
The visual approach allows the reader to have a sense of the coverage and, at the same time, have a look at the very raw data of the analysis, which are the components of the article, whether they be images, headlines or text. These highlighted areas could also be quantified to produce a bar chart. To make the measurements of the areas of news coverage comparable among different newspapers sizes, we use the percentage of used surface, and not the real area in mm².
The basic visualization of this type of graphic displays both the data itself (front pages and highlighted surfaces) as well as the measurement (the percentage of surface area) in a bar or line chart. Bar charts give a more accurate view of the surface devoted to the story, whereas line charts (see below) appear as a more continuous timeline, although they run the risk of suggesting a visual interpolation of discrete data. In other words, newspaper front pages provide one surface area datum per day, so a line connecting 2 surface area data points (from two consecutive days) produces a false sense of continuity. Line charts are useful, however, to compare more than 2 news threads over a long period of time, like the Arab Spring coverage (Egypt, Syria and Libya). When different topics are displayed one beside the other, it is a good way to study the battles for attention in the media; how related news “fight” for a position on page one, like in the Arab Spring coverage (Egypt, Syria, Libya and others) in Spanish newspapers.
We can see how the media space is usually focused on one “revolution” at a time, and that there is not much juxtaposition of news about this topic.
We observed a big drop in the Arab Spring coverage on April 13th, because the Japanese tsunami was breaking news: Note how the green area (Japanese tsunami) “hides” all the other news related to the Arab Spring for a week. It is not the case that “nothing” related to the Arab Spring happened during that week, but rather that the media decided where to pay attention. News on front pages “fights” for space and its areas are related to one another.
Comparing Asynchronous News Coverage in Time
The relative measurement of the surfaces lets us not only compare different news from different newspaper sizes, but also from asynchronous timelines. This method would allow the measurement of the news cycle: enabling us to understand how long news lasts on the front pages and how similar events attract the attention of the media.
In the comparison of the surface coverage dedicated to the Haiti earthquake (day 1 = January 12th, 2010) and the Japanese tsunami (day 1 = March 11th, 2011) in 4 Spanish newspapers, we could measure and compare the length of the coverage. Remarkable is the rapid drop of the Japanese crisis coverage after day 8 (March 18th, 2011), caused by the UN’s authorization allowing the international community to enter the war in Libya.
Semantic Analysis of News Content
It is also possible to make an automatic estimation of the article’s content based on semantic technologies. This process would benefit from the automatic transcription of scanned newspaper front pages through optical character recognition (OCR). The graphic displays the number of times that certain words have appeared during the fall of Mubarak and Ali. Grouped under “democratic” and “dictatorial” groups, January and February 2011.
As a case study, we used the fall of Mubarak and Ben Ali to compare how newspapers framed their last government/regime days. We analyzed the number of times that certain words appeared on the front page, and grouped them into two pools:
The aim of this study was to measure how newspapers are shifting their vocabulary along time, depending on their support / alignment with the issue they are covering. In Mubarak’s fall, we can see how newspapers shifted their frame during the crisis from a predominant use of democratic words (president, government) to more dictatorial ones (dictatorship, dictator, regime). In the case of Ben Ali, more “dictatorial” types of words were employed to describe his last days in power.
Content and Frame Analysis
We have seen how articles can be categorized, then colored and quantified, by multiple taxonomies related to their content: a particular thread or categorized by country. To understand how newspapers are addressing one topic would be not enough to understand how much they are covering it. We will need a framing analysis of their coverage: Are they positive/neutral/negative about it? Are they supportive? How biased is the information they provide?
We used this approach to analyze how different Spanish newspapers were covering corruption cases. The fast-growing list of corruption investigations in Spain contained almost every institution in the country. Everyday, new information and a new cases were being unveiled, provoking an increasing sense of indignation. It was also true that the levels of indignation had reached an apex, that they caused either incredulity or insensitivity.
The hypothesis and common ground knowledge is that every Spanish newspaper is aligned with a political party. Newspapers follow the corruption cases of the “opponent” parties. Measuring front page coverage seemed to be a good proxy to analyze their political agendas and to verify the hypothesis. I selected the most important Spanish newspapers and highlighted the stories related to the different corruption cases during a one-month period.
In January 2013, the El Mundo and El País newspapers reported that the ex-treasurer of the ruling party (Partido Popular, PP), Luis Bárcenas, had a $29 million Swiss account, and then published excerpts from the party’s parallel financial account. Both scoops impelled all the other newspapers to talk about the same PP corruption case, although other corruption cases affecting the main parties were also on the media menu. We coded the corruption cases from the major three parties: PP (conservative), blue; PSOE (center-left social democratic), red; CiU (conservative Catalan nationalist), orange; the royal house, green; other cases, purple.
Both newspapers, El Mundo and El País, are in opposite political spectrums, but made a common effort in this case to cover the Bárcenas story affecting the conservative party (PP) in the government.
El País centered its coverage on the PP (blue), leaving little space to the CiU (orange) or the monarchy (green), and none to the PSOE (red), following the expected behavior of a party related to the PSOE and the center-left. Meanwhile, El Mundo had a colorful timeline illustrating all the major corruption cases. Since the newspaper tends to defend the PP and attack the PSOE, it represented a change in their agenda.
However, some things did not fit into the alignment of mass media with certain major political parties that we could have expected. All of the newspapers were talking about the PP corruption case, but not in the same way. To understand how they were framing the story, we needed to add a new layer to the visualization: The issue of whether newspapers were framing corruption neutrally or negatively (plain areas) or defending and giving a positive view (striped areas).
A conservative newspaper like ABC (2nd row) dedicated their entire front page to the PP corruption case, but after the first news proclaimed that “PP must tell the truth about the Bárcenas case,” they started defending the actions the PP was taking. As expected, other conservative newspapers (La Razón, La Gaceta, but not El Mundo, which had published the scoop) took a defensive position (Jan. 19-20). It is also worth noting that once El País released the excerpts of the parallel financial account (Jan. 31), La Gaceta, a far-right newspaper, stopped defending the PP.
I published a blog post about this case study that garnered a lot of attention in the social media sphere (Twitter). It is worth mentioning that El Mundo published a piece on this research: “El Mundo, the newspaper that covers all corruption cases” in a four-column headline[ref]“A study by the prestigious MIT in the US shows that this newspaper stands out in the Spanish press for investigating the political parties without exception”. . [/ref]. They were interested in showing how the data visualization supported their unbiased work, and redrew the graphic to show El Mundo in first place.
In Spain, mass media are usually blamed for maintaining and supporting the bi-partisan system[ref]PP-PSOE, both parties are the ones entangled in more corruption cases; check the Corruptódromo map.[/ref]. This time, however, some newspapers were playing a fundamental role in unveiling corruption cases, but most of them only kept reporting about certain corruption scandals. Only a well-informed citizen who escapes the biased point of view of his/her reference newspaper can get the full picture of what is happening and react accordingly.
4. Conclusion
The method for analyzing newspaper front pages that we have described here, as well as the PageOneX.com platform, provide a straightforward way to analyze and visualize news attention to specific stories over time, across or between newspapers. In the future, we imagine either extending this tool or connecting it to others focusing on other media platforms, such as TV[ref] Archive.org is making the TV searchable by recording TV images and captions in a public archive: http://archive.org/details/tv .[/ref] and radio broadcasts, or to the online versions of newspapers and social media.
Content analysis, and newspaper content analysis by amount of coverage, has had a long history in the field of communication studies. New tools are enabling novel approaches to this kind of analysis. Some aspects of newspaper content analysis can be automated, some can be distributed (crowdsourced), some can be done much more quickly by human coders using sophisticated new interfaces. The data produced by such analysis can also be visualized in new ways, and compared against data from other new sources of information flow such as social media. This essay has explained the approach we have taken with PageOneX, demonstrated its application to several specific stories, and suggested areas for further work. We hope that PageOneX provides a valuable example to anyone interested in monitoring the media: communication scholars, social movement activists, or advocacy organizations.
We invite anyone interested to contact us and to participate in the future development of the platform.
PageOneX keeps moving forward. We want to have it ready for the spring, but first we have to solve a large list of bugs and other issues. A lot to code! So much coding that we sometimes forget that paper newspapers are real objects. That’s why we want to make a physical visualization of newspapers, a 1:1 scale version of PageOneX for the MIT Media Lab Festival (April 2013).
We have yet to decide the topic/s we want to focus on and when we are going to start buying newspapers. Our original plan is having New York Times, Los Angeles Times, Washington Post and The Boston Globe.
Do you have any suggestion about which topic we should follow? When to start buying the newspapers?
We are inspired by other people that have done similar displays with real newspapers that we have came across recently:
The film Manufacturing Consent: Noam Chomsky and the Media (1992) (available to watch in archive.org) by Mark Achbar and Peter Wintonick makes visual what the book Manufacturing Consent by Chomsky and Herman describes. They use as a case study the coverage of Timor war and Cambodia wars, that were happening simultaneously (1975-1979) by stitching together all the columns of text that The New York Times dedicated to each topic. Column inches is the measure that academics (and advertisers) have used to measure the amount of coverage. It was a way to show the different amount of coverage that state atrocities get, depending if they came from friend or allies states or from official enemies of the US. It is an empirical demonstration of the propaganda model.
Genocides coverage in column inches in The New York Times:
They also make a wonderful display of surface area dedicated to see the ratio of advertisement and news in a The New York Times newspaper (we are thinking on replicating this data visualization):
Inspired by the Manufacturing Consent film Siemon Allen made his Newspaper project. He was struck by the fact that during the same period 1975-1979 in South Africa another important event was happening “the Soweto uprisings, heightened police oppression, the expansion of separate development, and the death of many activists, including Steve Biko”. He made similar visual displays to show how was the coverage about South Africa in US newspapers:
Showing certain news in newspapers or cutting and pasting the news in long strips.
He also made standard data visualization (pie charts) when he analyzed the content of the news and classified it: aids, sport, culture, crime…
The fast-growing list of corruption investigations in Spain have involved almost every institution in the country: the major political parties, the royal house, the supreme court or the national bank, just to mention some of them. Everyday, new information and a new case is released/unveiled, provoking an increasing sense of indignation. It is also true that the levels of indignation have reached an apex, that they cause either incredulity or insensitivity.
I decided to test PageOneX, a tool to visualize the evolution of stories on newspaper front pages, to see how the coverage on corruption was being made. It is a good moment to do so, now that we, at the Center for Civic Media, are currently developing it. We hope to have a fully functional version by the end of the month, but you can always test the online alpha version or install the code locally. You can also get involved in the testing and development, it is open source.
The hypothesis and common ground knowledge is that every Spanish newspaper is usually aligned with a political party. They usually follow the corruption cases of the ‘opponent’ parties. Measuring the coverage in the front page seemed a good proxy to analyze their political agendas and to verify the hypothesis.
I selected 9 Spanish newspapers and highlighted the stories related to corruption cases in the last days until February 5th, 2013.
A “How to manual” set up your own online version of PageOneX in Heroku. Check it in the PageOneX develoment blog.
I’ve opened a mail list to have an open dialog for all of you interested in the PageOneX project or related tools for tracking news in newspaper front pages. Join the mail list!
Today’s post is to present the tool we are building this summer: PageOneX. The idea behind is to make online and easier the coding process of front page newspapers. Make this visualization process available for researchers, advocacy groups and anyone interested. I’ll will give some background about this process.
How things started
Approximately one year ago I started diving in the front page world. It was days after the occupations of squares in many cities from Spain, and I was living in Boston. I made a front page visualization to show what people was talking about: the blackout in the media about the indignados #15M movement. You can read more about Cthe story in the ivic Media blog. Since then I’ve been making more visualizations around front pages of paper newspapers, testing different methods and possible ways to use them. I’ve also made a tool, built in Processing, to scrap front pages from kiosko.net and build a .svg matrix.
The process is segmented in two main actions: 1. Get the front pages and 2. Code articles.
Get the front pages
Open the pageonex.pde file and open it in Processing:
Select newspapers and starting and end dates (be aware of adjusting the size of the newspaper)
Run the program to scrape front pages from kiosko.net. It automatically downloads them.
It will construct the matrix of front pages in a .svg (Scalable Vector Graphics) file.
Code articles
Open the matrix.svg in Inkscape. It is a file with 3 layers:
Highlights (multiply option to show transparency)
Filter to make images look lighter.
Images of front pages.
Now highlight by hand the news we want by drawing rectangles (merging of rectangles for news with non-rectangular shapes) on the news.
Export the file to a pretty .png file
That was the process until now. It works, but it is not easy for not tech savy people: you need to have Processing installed, change the parameters and be able to ‘play’ with Inkscape at an intermediate level. That is how we decided to make this tool online, to broaden its use.
PageOneX.com
PageOneX.com (now temporary redirected to this blog) is an online platform for analyzing and visualizing coverage of news in newspapers’ front pages. We’ll be coding this summer to have at least a part of the tool available by August-September. We’ll be having some beta tests, so if you are interested, just ask for it! The idea is to open a co-design process where future users take part in the design of the tool.
Why analyzing front pages? Some ideas behind the project:
1.
It seems that analyzing front pages is a good method, a shortcut to follow how news are being covered in the media. Front pages are a very special piece of the media ecology: newsrooms spend a lot of time deciding what goes in their A1, fighting which news have to be in their page one.
2.
With this kind of visualizations we are able to show the data and the analysis at the same time. We can show in a bar chart quantitative data regarding the coverage, but also the data source it self: the front pages. We want to offer a visual and direct way to visualize all the coding. Check the The Global Media Monitoring Project Report methodology to see which other interesting approaches to this coding process. We have tested with Gigapan the possibility of exploring this huge graphics, to be able to read the newspapers and also have a sense of the whole data visualization.
The project is incorporating new collaborators: Ahmd Refat as coder, thanks to the Google Summer of Code programm; Sasha Costanza-Chock and Nathan Mathias from the Center for Civic Media at MIT Media Lab. Nathan is developing is also developing Mediameter with more people at the Center for Civic Media, we might be using their framework to build our tool and not start from scratch. Mediameter is used for crowd-source analysis of articles. We are also looking at Mapmill by Jeff Warren, built in Ruby on Rails, as it is a system to code image as well.