No mapees: cómo hacer una cartografía sobre embarazo adolescente en Cuba

Getting your Trinity Audio player ready...

¿Alguna vez te han vendido un mapa?

No es del todo un buen negocio, este. Para empezar, se ha de hacer en condiciones que son, digamos, no adecuadas para hacerte un chalet bajo el solecito. Al contrario: debido a la situación informacional general en Cuba, donde el acceso a fuentes públicas es sumamente escaso y, por tanto, donde hay que sacar y scrapear la información de cualquier rincón, muchas veces adjuntando largos procesos de investigación al trabajo en sí.

Y no nos hagan hablar, por ejemplo, del estado de las bases de datos de la ONEI.

El primer factor de peso a la hora de analizar el discurso mediático en Cuba para nuestro trabajo, fue especificar exactamente qué podíamos medir. Un análisis de sentimientos, si bien nos hubiera encantado, era demasiado enrevesado, por proceso de producción, para un primer trabajo. Un texto por completo interactivo era demasiado arriesgado. Una infografía a secas, demasiado burda y escasa

En cambio, emplear elementos de estilometría para el trabajo, combinado con análisis estadístico, podía adaptarse a una muestra tan pequeña como la que realmente teníamos.

La muestra también planteó problemas, sobre todo por la inexistencia de las versiones originales de ciertos sitios web. Para la definición de la muestra se seleccionaron una serie de sitios web (31) atendiendo a los siguientes factores:

  • Pertenencia del sitio al ecosistema mediático cubano, tenga o no su domicilio legal en la República de Cuba.
  • Producción de información periodística accesible en la web. Se excluyeron otros soportes ante la preponderancia del consumo digital en las audiencias y la dificultad de recopilar y procesar muestras en otros formatos.
  • Relevancia dentro del ecosistema mediático cubano.
  • Inclusión de medios cuyo perfil editorial debería acercarlos con mayor sistematicidad al embarazo adolescente.
  • Pertenencia o no al sistema de medios afiliado al Estado-Partido-Gobierno cubanos.

Los textos fueron recuperados vía el motor de búsqueda Google y las herramientas propias de recuperación de cada sitio. Como palabras clave se seleccionaron los términos «embarazo adolescente», «embarazo prematuro», «maternidad prematura», «embarazo precoz» y «embarazo en la adolescencia».

Cómo términos relevantes para el análisis, se escogieron:

  • Embarazo(s)
  • Adolescente(s)
  • Maternidad
  • Menores
  • Madres
  • Niñas
  • Aborto
  • Salud

La recolección de los textos y su minado se realizó utilizando técnicas de web-scrapping, mediante las librerías rvest y tidyverse del lenguaje de programación R. Para el análisis exploratorio de datos se empleó, además de tidyverse, además de ggplot2, igraph y ggraph para las visualizaciones de datos. La tokenización de los textos fue posible gracias a tidytext, incluyendo la obtención de los n-grams, mientras que los cálculos de concurrencia y correlación fueron computados mediante widyr.

Las palabras vacías (stopwords) utilizadas en el análisis de textos provinieron del corpus recopilado por el proyecto Snowball, a través de la librería SnowballC.

Para aplicar estos métodos al análisis específico de los textos que conformaban la muestra, utilizamos

  • Análisis de frecuencia de tokens: Se realizó un conteo de la frecuencia de aparición de cada palabra individual en el corpus muestreado. Se registraron las 20 palabras más frecuentes (frecuencia absoluta), así como su porcentaje de aparición en relación al total de palabras (frecuencia relativa).
  • Análisis de n-grams: Se generaron n-grams (secuencias de n palabras consecutivas) para identificar combinaciones frecuentes de palabras en la muestra. Se registraron los 10 n-grams más comunes, junto con su frecuencia absoluta.
  • Análisis de concurrencia y correlación: Se exploraron las correlaciones entre palabras y frases en el corpus mediante la medición de concurrencias y el cálculo de índices de correlación (coeficiente de correlación phi o de Mathews). Se identificaron las correlaciones más significativas, destacando aquellas que podrían indicar modos de tratamiento temático.

Para el trabajo, manejamos una serie de hipótesis de investigación ajustadas a conclusiones preliminares que sacamos una vez hecha la extracción primera de los textos. No todas fueron demostrables, ni realizables dentro del marco del texto, sobre todo por la carencia de herramientas adecuadas para un primer acercamiento al tema, pero también —ojo— porque algunas no eran ni demostrables o, simplemente, ciertas.

Entre las hipótesis principales que fueron comprobables en el trabajo, contemplamos:

  • El tipo de opinión y la perspectiva crítica a la hora de reportar sobre el tema en Cuba posee sesgo de género.
  • Las mujeres se encuentran infrarrepresentadas en el tema como autoras.
  • La producción de reportajes y contenido de investigación sobre el tema es escasa.

No fueron estos los únicos descubrimientos. En el proceso de producción, como se ve en el texto del trabajo, encontramos otras, como la distorsión que «fecundidad» genera en la cobertura del tema en Cuba.

En cambio, tuvimos que descartar las siguientes hipótesis:

  • Los medios privados favorecen un enfoque sensacionalista.
  • Los medios oficiales favorecen un enfoque triunfalista.
  • Existe poco acceso a los datos especializados al respecto.
  • La división medios financiados por estado-medios privados condiciona la perspectiva, carga emocional y entendimiento del tema.
  • Existe poca producción de contenido con matiz de género al respecto

Una vez realizado el informe sobre los resultados obtenidos, estábamos ya en condiciones de ponernos a mapear. Teníamos un concepto claro: AY-UDA va de mapas, de procesar y vender/regalar/entregarte cartografías y compendios. Por tanto, queríamos que nuestro primer trabajo fuera, visualmente, una serie de mapas.

Lo primero fue hallar una paleta. Queríamos que tuviera seis colores, para poder trabajar en una gama lo suficientemente amplia como para ilustrar cualquier elemento que fuera necesario. La paleta fue realizada mediante coolors, y esto fue lo que nos quedó:

Paleta 1

Donde el negro y el naranja pálido eran los colores base, el naranja fuerte y el azul persia los colores de acento para medios, el púrpura el color de acento general y el amarillo color de remarque.

Si bien esta no fue la paleta que finalmente utilizamos —al ajustar el concepto visual a un mapa de islas, el azul ganó preponderancia y hubo que buscar otro tono para acompañar, y el amarillo, como siempre, terminó desapareciendo— permite ver la centralidad que los colores adquirieron en nuestro trabajo.

Luego, comenzamos a bocetear nuestro mapa principal.

Pasamos de esto:

Mapa 2

 

a esto:

Mapa 3

Al mapa final.

De aquí fue relativamente sencillo sacar, por desagregación, tanto las visualizaciones acompañantes como la ilustración de portada que encabeza el trabajo.

Por último, decidimos ignorarle un grado de interactividad al texto, mediante links que se modificaran o se expandieran, dependiendo de su tipo, como primer acercamiento a un tipo de producto que nos gustaría hacer más adelante.

Pensamos usar Twine, que nos venía de maravillas para montar productos interactivos, pero finalmente, por el tipo de plataforma en que La Joven Cuba se aloja, montamos todo el código por HTML. Sacamos la idea original de Castle Forest Island Sea, un producto maravilloso de ficción interactiva pensado para promover cursos de filosofía a nivel universitario.

En cuanto a como quedó en realidad… bueno, dinos tú.

Y si quieres, cómpranos otro mapa.

Deja una respuesta

Más de este autor

Descubre más desde La Joven Cuba

Suscríbete ahora para seguir leyendo y obtener acceso al archivo completo.

Seguir leyendo