Hace 6 años | Por Adson a flowingdata.com
Publicado hace 6 años por Adson a flowingdata.com

Solía pasar que veíamos una gráfica mal hecha o un gazapo en el diseño y nos burlábamos un poco y seguíamos a lo nuestro. Pero en cierto momento —este año pasado para ser exactos— se volvió más difícil distinguir una cagada en una visualzación del sesgo o la desinformación deliberada.

Comentarios

BBE

Lo de dimensionar cuadrados por el tamaño de los lados o círculos por el radio, y no por superficie, es error muy típico.

La mayoría los he visto más habituarme como fallos que como mentiras premeditadas.

Abeel

#1 Te sorprendería, en los medios se tira bien conociendo el efecto y cuando se les pilla se escudan "nah el becario que no sabe hacer graficas, que error más típico hehe".


Es como aquél cartel "Debemos hacer un estudio sobre nuestro producto - ¿Quieres los datos a favor o en contra?".

zhensydow

regla 1: Si sale en un periódico español es mentira siempre.

dux

By using dual axes, the magnitude can shrink or expand for each metric. This is typically done to imply correlation and causation. “Because of this, this other thing happened. See, it’s clear.” The spurious correlations project by Tyler Vigen is a great example.

Me temo que esto es señal de que el autor del artículo ha hecho un copypaste y no entiende mucho de lo que está hablando.

La correlación entre dos variables implica que se podría (o casi se podría) deducir una de otra mediante una función. La escala no afecta a la correlación. Puedes tener una relación y = Kx donde K no tiene que ser 1. Usar un doble eje solo quiere decir que tienes un K bastante diferente de 1 para las unidades que estás usando.

En cuanto al "spurious correlations project by Tyler Vigen", las correlaciones son reales. Otra cosa es que no impliquen causaci´ón y que tengan un rango de datos pequeño (para que les salga), lo cual no sería muy serio en una investigación real (en plan "tengo correlación con 6 medidas y ¡ah! ya no miró más, que me chafa la correlación").

Adson

#3, creo que a lo que se refiere es que si las gráficas correlacionadas en el ejemplo se mostrasen con la misma escala, sería más difícil convencer al lector casual de que hay relación de causalidad.

Por otra parte, Flowingdata suele tener contenido original, y Nathan Yau, el autor, se presenta a sí mismo como doctor en estadística por la Universidad de California.

D

#3 Tampoco creo que se trate de que afecte o no afecte la correlación sino de cómo se presentan los datos. Tampoco olvides que muchas veces esas gráficas se presentan a personas que no tienen el mismo nivel de conocimientos que tu o que el autor del meneo.