Hace 6 años | Por YizusKraist
Publicado hace 6 años por YizusKraist

Comentarios

p

La representatividad estadística se basa en la aleatoriedad de la elección de los individuos de la muestra (que ésta sea una muestra aleatoria simple) y en la igual probabilidad de escoger a estos individuos. NADA MÁS. Bajo ese prisma, se puede conseguir un muestreo representativo con 30 personas pero esto no quiere decir que sus conclusiones representen la realidad. Que es de lo que la gente habla.

La inferencia estadística puede llevarse por dos caminos:
1. La estimación por intervalo, es decir, encerrar al verdadero valor dentro de una horquilla o intervalo de valores muestrales (las estimaciones puntuales no son óptimas para esto).
2. El contraste de hipótesis: proponer una hipótesis a refutar (hipótesis nula) sobre el verdadero valor y que suceda algo, bajo esa hipótesis, tan jodidamente improbable (algo significativo) que sólo pueda significar que la hipótesis inicial sea errónea y tenga que ser refutada, y aceptar su complementaria. No rechazar la hipótesis nula NO APORTARÍA INFORMACIÓN ALGUNA.

En el primer caso (la estimación) podríamos hablar del error muestral cometido (o mas estrictamente del error estándar) como una relación de entre la dispersión de los datos de la muestra entorno al valor muestral que es el centro de la horquilla y el tamaño total de datos de la muestra. Mientras que en el segundo caso (el contraste) hablaríamos de la posibilidad de cagarla siempre, aunque el resultado sea significativo por jodidamente improbable (probabilidad de error tipo I).

En ambos casos, no son más que errores inevitables de un procedimiento que no es mágico y que tiende a llevar al equívoco: confundir representatividad o significación estadística con importancia o relevancia absoluta/relativa.

El p-valor por si solo, para un nivel de confianza dado, no nos da la información alguna sobre la magnitud de los resultados de una encuesta. (tanto absolutos como relativos), esto sólo lo podremos analizar si acompañamos a la inferencia con un análisis del tamaño del efecto (análisis sobre la importancia cuantitativa de lo que concluyes).

Para conjuntos de datos mayores de 30, sus valores medios tenderán a distribuirse, sigan el modelo que sigan, entorno a un valor poblacional en forma de campana de gauss y sabremos que el 66% de dichas medias estará a menos de una desviación típica de su valor real. No indicará nada más, simple onanismo matemático (teorema central del límite). Trasladado al ámbito electoral, un barómetro de opinión (encuesta telefónica robótica aleatorizada sobre una base de 1000 personas) puede ser representativo estadísticamente pero es irrelevante como reflejo de una tendencia FIABLE de voto ya que reflejarán una media, que es lo que se suele estimar/constrastar.

Pero qué es la ¿fiabilidad estadística?

Esto es muy fácil de explicar a nivel discreto como los disparos a una diana: Si yo realizo 30 disparos y van todos al número 17 habré sido muy fiable (muy preciso, porque logré la reproducibilidad de los resultados, una y otra vez) pero la validez (exactitud() de los mismos es muy baja (entendida la validad o exactitud como acertar en el centro de la diana).

Por tanto, la fiabilidad de un estimador NO es suficiente, además lo necesito preciso (válido, sin sesgo o error sistemático). Que un estimador sea preciso, es decir, fiable, con poca dispersión o varianza mínima (siempre existirá un mínimo de error aleatorio, dado por la cota de frechet-cramer-rao) está muy bien para obtener un bajo error muestral pero no ara asegurar una exactitud o validez (acertar con el centro de la diana), no cometer sesgos muestrales (error sistemático) y esto no se puede asegurar ni con 30, ni con 1000 personas.

p

#1 Obviamente en el último párrafo quería decir: Por tanto, la fiabilidad de un estimador NO es suficiente, además lo necesito "EXACTO" (en vez de "preciso")

masde120

Jajaja. Una encuesta Nunca es representativa!

Y como ejemplo:
"Radio Televisión Española (RTVE), las televisiones autonómicas (FORTA) y Atresmedia ofrecen desde las 20.00 horas sondeos realizados a pie de urna. El de los canales públicos ha sido realizado por TNS Demoscopia con 177.000 entrevistas en un total de 1.265 colegios electorales, mientras que la empresa GAD3 ha sido la encargada de elaborar el de Antena 3 y La Sexta."
Que con 177.000 a pie de urna no dieron ni una

D

Si las encuestas fueran representativas entonces habría habido sorpaso en su momento, o ahora mismo ciudadanos gobernaría el mundo. El problema de las estadísticas es justamente su interpretación, los datos recopilados son los que son (incluso si fueran falsos) pero a la hora de sacar conclusiones estás dando un paso en falso.

Para mi ninguna muestra de ese tipo es representativa de nada, si me apuran un poco hasta diría que ni unas elecciones son representativas de todo el sentir político de una sociedad. Simplemente por las limitaciones propias que tiene todo el sistema, por lo que si queremos hilar fino, es muy difícil tener datos representativos.

Por aclararlo, no discuto la base matemática/probabilistica de unas estadísticas, discuto las interpretaciones que se hacen luego sobre esos datos.