Escrito por Fernando Maciá
Pere Rovira, fundador de OneTandem, abre la segunda ronda del Clinic Summit.
Pere Rovira trabaja en la visualización de datos desde hace tres años, después de muchos de experiencia en analítica Web y marketing digital. Esto es lo que nos cuenta.
Las empresas nos entregan un conjunto de datos, los cuales exploramos libremente con Tableau. A partir de ellos, les presentamos unas conclusiones preliminares con lo que se ve en sus datos y navegamos hacia distintos finales para analizar más en profundidad distintos temas. O bien se construyen dashboards con Tableau o en sitios Web a medida con HTML y Javascript.
Cuando es un cliente privado y son datos de uso interno, entonces sí se puede usar internamente Tableau.
Veamos algunos ejemplos.
Analítica de paro
Pere presenta el caso de una empresa de investigación que trabaja para organismos públicos. Se puede vivir perfectamente sin Google Analytics, defiende Pere, hay mucha más gente usando datos. Las mismas técnicas o herramientas que usamos pueden servir. En este entorno, por ejemplo, se usa mucho Excel. Este es el típico gráfico de Excel.
Este cliente nos pide aprender, saber cómo analizar y mostrar los datos. Este gráfico presenta el porcentaje de paro por edades con la típica estética de Excel. Conclusión: cuanto más mayores, más paro.
Segundo intento de explicar los mismos datos:
Añadimos alguna interpretación en los textos que lo acompañan. Estos textos se tienen que cuidar pues permiten al lector entender mejor los datos.
Muchas veces, los porcentajes no son la mejor métrica para entender lo que pasa:
En esta gráfica estamos dando otro contexto con métricas que se complementan para construir una pequeña historia con texto y anotaciones que aportan información.
Demasiada información
A veces el problema es incluir demasiada información.
Nuestro cerebro procesa mal gráficas con tantos datos, con más de cinco o seis datos a la vez. Es difícil diseñar esto para que se entienda mejor si no reducimos los datos.
Utilizamos el color para destacar lo que queremos enfatizar: el único segmento para el que ha bajado el dato. Coordinamos el mismo color en la gráfica como en el texto para facilitar la lectura.
También podemos reducir el número de segmentos.
En este gráfico podemos probar formatos para ver qué aparece. Muestra muy claramente que el diferencial de paro entre hombres y mujeres se ha ido reduciendo en los últimos años.
Correlaciones
Correlación entre índice de envejecimiento y porcentaje de población de extranjeros:
Propicia una interpretación: vienen jóvenes extranjeros que ayudan a que no aumente el índice de envejecimiento.
Son dos métricas diferentes en el mismo gráfico, con ejes diferentes. El eje de la derecha se han olvidado de ponerlos, lo que da lugar a interpretaciones erróneas.
Podemos manipular:
Aplicando diversas escalas a cada uno de los ejes, la interpretación se presta a una interpretación sesgada:
Podemos aportar más contexto si añadimos anotaciones o comparar dos métricas normalizando los datos:
Lo que parecía una correlación muy clara, ahora presenta más dudas. La población extranjera aumenta mucho mientras que el índice de envejecimiento no cambia apenas.
Los gráficos de dispersión también pueden aportar contexto:
Aquí vemos un coeficiente de correlación alto (0,83) por lo que sí parece que existe correlación pero hay tres puntos que se separan de la línea en los últimos años. ¿Qué significa esta desviación?
Si no lo visualizas, se te pueden escapar datos.
Si unimos los puntos, podemos ver la historia de los datos: vemos que desde 2010 hasta 2015, la progresión es contraria: disminuye el número de extranjeros y vuelve a envejecer la población. Pero los últimos tres años, la tendencia cambia: aumenta el número de extranjeros pero también aumenta el índice de envejecimiento. ¿Qué ocurre? Visualizando los datos podemos tener esta conversación para extraer conclusiones:
No tenemos todas las respuestas. Visualizaciones que ayudan a reflexionar sobre qué significan los datos.
Habilidades de juego
Intentamos ver habilidades de juego de un conjunto de jugadores con un gráfico de barras:
Podemos intentar una visualización distinta para mostrar cada jugador como un puntito:
Y vemos qué otras habilidades de juego pueden tener. Podemos filtrar por equipo, por habilidad, etc.