Reflexiones de un analista de datos para el sector cultural de Puerto Rico

En este corto ensayo, comparto mi experiencia como analista de datos de Inversión Cultural, enfocado principalmente en el desarrollo de los informes y en la visualización de la información, metodología, accesibilidad de los datos y sobre algunos retos a lo largo del camino que culminó con el mayor logro (del año 2020) del programa LabCultural con la publicación de 11 informes sobre el panorama de la cultura y arte en Puerto Rico. 

Recuerdo que hace un poco más de un año, el fundador de IC, Dr. Javier Hernández, me platicaba sobre todo el trabajo y los objetivos propuestos que debíamos llevar a cabo para poner al día la información estadística del sector cultural y artístico en Puerto Rico. Asumí el reto, y consciente de la cantidad de trabajo que eso ameritaba, poco a poco me fui adaptando. Uno de los retos fue familiarizarme con todos los códigos usados en la cuenta satélite del National Endowment for the Arts (NEA) y el Negociado de Análisis Económico (BEA, por sus siglas en inglés) en las definiciones de lo que considera trabajo cultural y creativo; una definición industrial (códigos NAICS) y una definición ocupacional (códigos SOC). En algunas bases de datos como la usada por el Censo Económico de Puerto Rico,  no tenemos el detalle de ciertas industrias, por ejemplo en la industria de fabricación de instrumentos musicales. O ejemplo es la industria de compañías de danza: solo contamos con la información de la industria más general que la incluye: “Artes escénicas, deportes para espectadores e industrias relacionadas”. Por lo tanto, no es posible hacer un análisis detallado de la industria de danza.

Básicamente, en la elaboración de los informes, se sigue esta metodología: 

Contar la materia prima para la elaboración de los informes (me refiero a las bases de datos), es relativamente fácil; podemos acceder a ella desde la página del United States Census Bureau, hacer una búsqueda por región, tipo de encuesta y año. Por lo general, los archivos descargados vienen en formato .csv (valores separados por comas) por lo que necesitamos de algún programa que pueda leer tales archivos. También precisamos descargar el diccionario de variables para poder identificar cada variable, qué mide y cuáles son sus valores.  Aquí usamos SPSS y Microsoft Excel para generar la mayor parte de las estadísticas, y R-project para las inferencias estadísticas tales como la estimación poblacional y los errores estándares.  

Para los primeros 5 informes (sobre el perfil de las ocupaciones artísticas y culturales), se usó la base de datos PUMS 2013 – 2017 (Public Use Microdata Sample) de 5 años. Estos archivos contienen información del 5% de la población de Puerto Rico (1% por cada año) con una gran cantidad de variables sociodemográficas. Las variables claves para marcar la distinción entre las personas dedicadas al arte/cultura y en qué industrias trabajan son las variables SOC (Standard Occupational Classification) y NAICS (North American Industry Classification System.  Hacemos uso de la Cuenta Satélite y la definición de ocupaciones creativas y artísticas del National Endowment for the Arts (NEA) y el Negociado de Análisis Económico (BEA) de los Estados Unidos, para los respectivos análisis.

La base de datos usada en los informes 6, 7 y 10 (sobre las entidades culturales y creativas) corresponde al County Business Pattern (CBP) para los años 2012 -2018 igualmente disponible en la página del United States Census Bureau. El tiempo invertido, desde la búsqueda, descarga y preparación de la base de datos hasta la generación del documento que pasa a diseño gráfico, es de alrededor de 1 mes por informe. 

El último paso es presentar la información no solo en un documento de tipo informe, también presentar la información (gráficas) de forma amigable e interactiva. Ya conocía de varios softwares especializados en esa área y tenía un par de propuestas, pero en cierto momento me encontraba en colaboración con una amiga que necesitaba hallar la mejor manera de visualizar datos de una encuesta que utilizaba las escalas Likert y fue en ese proceso que me encontré con Tableau (software y plataforma en línea para explorar visualizaciones de datos y compartir con el público general). Fue un momento de eureka porque no es fácil contar con un software que armonice la complejidad, sencillez y estética que se requiere para generar visualizaciones de datos de tipo gráfico. Desde entonces usamos Tableau para visualizar los informes. 

Concluyo con un par de estadísticas sobre el impacto que ha tenido el trabajo realizado y que he descrito en el LabCultural: Al momento de escribir este documento, contabilizamos más de 3,000 visitas en las distintas visualizaciones en Tableau,  más de 2,000 informes descargados y 3 cápsulas informativas (live streaming en Facebook y Youtube).

Seguimos trabajando, Analizar la información estadística en un proceso dinámico y constantemente debemos monitorear los cambios, compartirlos y ayudar en la toma de decisiones informadas.

Anterior
Anterior

¿Existen diferencias en el ingreso de las ocupaciones artísticas según el género?

Siguiente
Siguiente

Observatorio de las artes y la cultura