Todos los días leo notas de analistas (o podríamos decir novelistas) que llegan a conclusiones absurdas a través del análisis de datos con el único objetivo de mostrar que su punto de vista tiene sentido. Lo que me hace recordar el libro How to lie with statistics (1954) que por casualidad encontré en mis primeros días de la universidad y que gracias a Internet pude leerlo nuevamente aquí.
El autor, Darrel Huff, nos muestra la manera en la que los periodistas, contadores, economistas e incluso estadísticos pueden sesgar la interpretación de hechos estadísticos o incluso confundir algo que es cierto cuando no lo es.
Uno de mis ejemplos favoritos es cuando se habla de salarios promedio y que Darrel Huff explica con la siguiente ilustración.
Seguramente esto les recuerde cuando escuchan que durante el año pasado, el salario promedio fue de $8,600 según cifras del INEGI. Cierto, pero no comentaron que el 66% de la población tuvo ingresos inferiores a 6 mil pesos al mes, es decir, la moda en México es ganar menos de 6 mil pesos al mes (66% de la población lo avala).
Darrel Huff también habla de cómo se pueden presentar gráficas de manera engañosa y nos pone el ejemplo de la siguiente imagen que muestra dos gráficos con los mismos datos pero con diferente escala en el eje vertical. Gran diferencia, ¿no creen?
Y esto me recuerda cientos de visualizaciones de datos, en particular una gráfica publicada en el Huffingtonpost sobre el monto de las donaciones por enfermedad comparado por las muertes causadas por enfermedad:
Observen cómo en la columna izquierda de círculos los dos primeros montos gráficamente no corresponden a los números $257mil y $147mil, el círculo rosa es aproximadamente tres veces más grande que el círculo naranja.
El objetivo principal de una visualización de datos es la facilidad de analizar los datos sin necesidad de ver los números y esto definitivamente no lo tienen claro en Vox (la revista que diseñó el gráfico). ¿Por qué?
¿Ahora comprenden el por qué saco mis ejemplos de libros de la prehistoria?
Los ejemplos de 1954 de Darrel Huff se repiten cotidianamente en la Era Big Data (más datos es igual a más errores). Así que mi consejo es que si usted lee datos, analice detalladamente lo que se le presenta. Y si usted es responsable de publicar gráficos o interpretar datos, no dude en leer How to lie with statistics, tomar algún curso de estadística y sobre todo pedir consejo a algún profesional (son simpáticos los nerds).
Estamos procesando tu membresía, por favor sé paciente, este proceso puede tomar hasta dos minutos.
No cierres esta ventana.
¡Agrega uno!