Gastón Roitberg, Secretario de Redacción Multimedia de La Nación y ponente en la próxima conferencia Digital Media Latinoamérica de WAN-IFRA, que tendrá lugar los días 30 y 31 de octubre en Bogotá, nos habló acerca del galardonado proyecto de proyecto “open data ninjas” y sobre el rol de “los datos” en el futuro del periodismo.
A continuación la transcripción de la entrevista via correo electrónico que mantuvimos con Gastón Roitberg:
WAN-IFRA: La Nación ha colocado el periodismo de datos en la vanguardia de sus operaciones, incluso ha creado un espacio para la sección de datos en la barra de navegación de su página web principal lanacion.com, ¿cuál fue el motivo de esta decisión?
Gastón Roitberg: En La Nación, consideramos que al periodismo de datos es un proyecto prioritario, no sólo porque promueve más innovación en nuestra profesión, sino también porque creemos que los ciudadanos deben poder ejercer su derecho de acceso a la información pública.
WAN-IFRA: ¿Cuántas personas hay en el equipo de LN Data hoy en día?, ¿cuál es la composición del equipo entre periodistas, desarrolladores, analistas, diseñadores, etc?
Gastón Roitberg: Actualmente, LN Data es un equipo multidisciplinario formado por un director de proyecto, un especialista en investigación y tendencias, un “minero de datos”, un ingeniero de sistemas que extrae los archivos y los transforma en formatos legibles, un equipo de tres diseñadores interactivos y varios periodistas. También contamos con el apoyo de un becario Knight-Mozilla hasta finales de 2013.
WAN-IFRA ¿Cómo están vinculados los procesos técnicos, los procesos multimedia y los de investigación?
Gastón Roitberg: Están estrechamente vinculados a través de un proceso de flujo de trabajo que va desde la extracción de datos sin refinar, su división y filtrado en grandes conjuntos de datos, la estructuración de los mismos en grandes hojas de cálculo y el desarrollo de aplicaciones y visualizaciones interactivas. Cada especialidad aporta su conocimiento y los proyectos se organizan en diferentes fases que implican a todos aquellos que puedan aportar su conocimiento para hacer un mejor producto.
WAN-IFRA: En los proyectos grandes como el trabajo de LN sobre la corrupción en el Senado, ¿cómo se dividen las responsabilidades?
Gastón Roitberg: Las responsabilidades están bien divididas. Un equipo de tres o cuatro personas se encarga de la búsqueda, obtención y estructuración de los datos intentando encontrar los modelos o patrones que puedan orientar el análisis periodístico. Es entonces cuando esa base estructurada se pone en manos del periodista que hace el esfuerzo de utilizar los datos para encontrar historias de interés para el público. Entonces entra en juego el equipo de diseñadores interactivos que desarrolla interfaces de modo que los usuarios puedan navegar fácilmente por los datos.
WAN-IFRA: ¿Cómo LN desenredó la enorme cantidad de datos que obtuvo para el caso de la corrupción en el Senado? ¿Qué partes de estos procesos están automatizados por un ordenador, y qué partes son manuales?
Gastón Roitberg: Para analizar de manera eficaz los datos hay que ponerlos a disposición de un “minero de datos” que crea y arma columnas de datos, combina las variables y desarrolla un método sencillo de navegación que sirva al periodista para abordar los datos.
El trabajo de obtención de datos se realiza a través de robots que automatizan la tarea de peinado a través de enormes volúmenes de datos. También se utilizan programas para transformar, por ejemplo, los archivos pdf, los más odiados por los programadores, a .xls o a tablas .cvs. Todo ello permite que los datos sean estructurados. El programa Tableau Softwaw se utiliza para desarrollar gráficos interactivos, y para el desarrollo de mapas con diferentes capas basados en datos, hemos usado Google Fusion Tables.
WAN-IFRA: ¿Cómo pueden los equipos de datos y evitar errores y verificar la información cuando se enfrentan a grandes conjuntos de datos?
Gastón Roitberg: Hay dos maneras de hacer una verificación eficaz de los datos en las grandes bases de datos que manejamos para aquellos casos de envergadura, como por ejemplo el del presupuesto nacional: 1) consultamos a los expertos en cada una de las materias para detectar irregularidades y poner en orden los conjuntos de datos, 2) desarrollamos un equipo de trabajo especial con voluntarios de ONGs llamado "chequeaton" que comprueba manualmente los datos por lotes.
WAN-IFRA: La sección de datos de LN publica artículos nuevos todos los días, aunque el periodismo de datos se considera típicamente como un proyecto de obtención y generación de datos a largo plazo. ¿Cómo logra LN mantenerse al día con la obtención y el procesamiento de datos?, ¿cómo LN consigue mantener en perfecto balance sus distintos proyectos con la demanda diaria de noticias?
Gastón Roitberg: El periodismo de datos se aplica perfectamente a las noticias de última hora. De hecho lo llamamos “últimos datos” o “datos de última hora”, que es cuando obtenemos la información, la estructuramos y desarrollamos mapas que cuentan la misma historia. La adición de gráficos interactivos a los artículos del periódico es un esfuerzo recompensado por las visitas de nuestros usuarios.
WAN-IFRA: Frente a la falta de una ley de libertad de información en Argentina, ¿cómo se llevaba acabo la tarea de obtención de datos?, ¿cuánto tiempo, por lo general, tienen que esperar para recibir los datos una vez solicitados?
Gastón Roitberg: Argentina no tiene una ley de transparencia y acceso a la información pública, pero cuenta con un decreto presidencial por el cual los funcionarios del poder ejecutivo y otros poderes del Estado están obligados a proporcionar la información de su patrimonio. Recientemente hemos nombrado a un productor de datos que pasa por los distintos ministerios y secretarías haciendo solicitudes de la información que consideramos relevante. A menudo tenemos que esperar varios meses para que la información sea entregada y la mayoría de las veces viene en un formato inadecuado o directamente impresa en papel, lo que requiere de un trabajo de inserción manual de los datos para digitalizarlos.
WAN-IFRA: Es interesante ver que LN comparte sus recursos primarios con los lectores de DocumentCloud. ¿Por qué LN decidió hacer esto?
Gastón Roitberg: Además de periodismo de datos, nuestro otro gran objetivo es promover los “datos abiertos”. Así tenemos un archivo digital centralizado basado en tecnología Junar, donde se almacenan y catalogan los datos en conjuntos. También utilizamos otras herramientas para almacenar y compartir documentos como DocumentCloudo los diferentes productos de Google. De esta manera, otros periodistas y los usuarios pueden descargar los archivos originales para iniciar sus propias investigaciones.
WAN-IFRA: ¿Qué consejo le darías a las organizaciones de noticias que estén considerando la creación de equipos de datos por su cuenta?
Gastón Roitberg: Lo mejor que podemos hacer es alentarles a recorrer el camino de la innovación, e instarles a que tengan en consideración invertir en la capacitación de su personal así como promocionar el trabajo en equipo junto a las universidades y las organizaciones sin fines de lucro; propiciando además, la contratación de programadores y especialistas en tecnología para integrar las redacciones.
WAN-IFRA: ¿Por qué es importante el periodismo de datos?, ¿qué papel cree que los datos van a desempeñar en la configuración del futuro del periodismo en América Latina?
Gastón Roitberg: El periodismo de datos es una fase en la evolución del periodismo de investigación. Cada pieza de información puede ser analizada, estructurada y mirada con lupa para encontrar una posible historia de interés periodístico. Los Premios Pulitzer del New York Times por su trabajo interactivo y de ProPublica por la investigación basada en datos demuestran que la excelencia periodística es posible en esta etapa de la evolución.
WAN-IFRA: Con las redacciones recortando sus presupuestos, ¿cómo se puede invertir en recursos de datos como los que tiene LN?
Gastón Roitberg: La innovación es el mejor antídoto para enfrentar la crisis de la industria. Invertir en creatividad, investigación y desarrollo es lo que va a permitir hoy en día al negocio de los medios soportar y retener un lugar relevante en las sociedades democráticas. El periodismo de datos rescata los valores tradicionales del periodismo de investigación y añade la notable contribución de la tecnología para procesar de forma inteligente la información disponible.
Roitberg hablará más sobre LN Data durante la sesión “Innovar la narrativa digital, clave del periodismo del futuro” en la conferencia de WAN-IFRA Digital Media Latinoamérica, los próximos 30 y 31 de octubre en Bogotá, Colombia. Para obtener más información o inscribirse a este evento, haga clic aquí.