EDICIóN GENERAL

Los cocineros del CIS obtienen su primera Estrella Michelin

Siempre a vueltas con el tema de la cocina de las encuestas, reciclo comentario a ver si nos dejamos de conspiraciones. Lo explico lo más brevemente que pueda en qué consiste y por qué no es necesariamente malo el "cocinar los datos" ni hay por qué tenerle miedo. Al revés, es muy útil porque muchas veces los datos faltan o son erróneos y es necesario reconstruir los datos. El problema surge cuando el cocinarlos es motivado para aumentar el sesgo y no para reducirlo -volvemos a lo de siempre...tortura los datos y te dirán lo que quieras-. Y en las encuestas electorales la cocina es imprescindible por varios motivos básicos, como por ejemplo, que la gente miente. O miente o, en el mejor de los casos, no quiere reconocer su afinidad política. Y "cocinar los datos" es algo que se hace siempre en cualquier muestreo, no necesariamente es exclusivo de las encuestas. Las fases de procesamiento o cocinado serían:

1- Ajuste utilizando como ponderaciones las tasas de falta de respuesta:
Divides la muestra en clases y subclases ponderando los resultados con los inversos de las tasas de respuesta.

2- Ajuste utilizando información complementaria disponible:
Esto se llama estratificación a posteriori porque establece estratos que no se tuvieron en cuenta y se forman con toda la información que se tenga, por ejemplo, de otras preguntas. Yo tengo la encuesta de un sujeto que dice admirar a Susana Díaz, ser votante de izquierdas y que ha votado siempre al PSOE, pero no me responde a la pregunta de a quién va a votar.

3- Imputación:
Se suelen usar dos métodos, "cold-check" y "hot-check". Metes en el ordenador valores iniciales de una encuesta anterior en frío y si en la encuesta en caliente falta un dato, se rellena con él.

4- Modelos de respuesta aleatorizada:
Esto es muy necesario sobre todo en encuestas delicadas, como drogas, aborto, etc...donde la quiere no quiere decir la verdad por unos motivos u otros y se utiliza una variable auxiliar de la que conoces su aleatoriedad para descartar respuestas deliberadamente falsas. Se suele hacer combinando dos preguntas, una que no tiene nada que ver con el tema en cuestión pero conocemos su probabilidad y la otra que sí es la que nos interesa. No es un detector de mentiras pero funciona sorprendentemente bien.

Este es el proceso -explicado de manera muyyyyy resumida y rápida- de cocinado. Hay que darse cuenta que el hecho de obviar alegremente a una persona por no tener todos los datos supondría crear un grupo de descarte -gente que se desecha en la encuesta por un criterio- y eso supone crear un patrón, que no es aleatorio y por tanto, predispone de sesgo.

Siento el tochazo, pero si así se entiende, me doy por satisfecho :-)
#8 Si todo eso esta muy bien, el problema es cuando tu cocina sistemáticamente da estimaciones erróneas y además con márgenes inadmisibles. En esta situación la pregunta que nos deberíamos hacer es para qué sirve que un organismo público haga encuestas de intención de voto que no aciertan ni de casualidad (o incluso si lo hiciesen) ¿Merece la pena gastar recursos públicos en algo que no tiene utilidad? No digo el CIS en general, el CIS es una herramienta muy útil, pero las encuestas de intención de voto... que mas dará si unos días más tarde nos vamos a enterar de verdad qué es lo que vota la gente.
#9 Los "márgenes admisibles" están sujetos a criterios estadísticos, no políticos. De lo contrario, ¿Cómo definimos lo que es admisible?¿Aquello que no nos gusta? y dado que hablamos de predicciones estadísticas y no de capacidades adivinatorias místicas, debemos asumir que equivocarnos es algo asumible sin que por ello se deba cuestionar la metodología pues insisto, no somos adivinos. Esto es especialmente importante en un terreno como éste, donde no poca gente puede cambiar de opinión de un día para otro. Decir que las encuestas de intención de voto son inútiles porque en un mapa político caótico no aciertan de pleno, es una afirmación un tanto injusta. ¿Hay posibilidad de que el CIS tenga influencia política y ello lo condicione? puede, pero la injerencia política en organismos públicos ya es otro tema aparte :-)

menéame