miércoles, 20 de noviembre de 2013

Intención de voto 2013 (Sigma Dos para El Mundo)

Se ha dado una fotocopia en clase de esta encuesta publicada el pasado domingo 17 de noviembre.

Ficha técnica

Universo: Mayores de 18 años.

Ámbito: Nacional.

Muestra: 1000 entrevistas con un margen de error ±3'16% para los datos globales, con un nivel de confianza del 95'5% (dos sigma) y un p/q=50/50.

Selección: Polietápica, estratificada, aleatoria.
Entrevista: Telefónica.
Fecha del trabajo de campo: Del 12 al 14 de noviembre de 2013.


Comentarios:

Veo que el tamaño muestral es n=1000. Pero dice que la forma de seleccionar la muestra ha sido "polietápica, estratificada, aleatoria". ¿Qué quiere decir eso?

Por ejemplo, se puede haber tomado cada provincia de España como un estrato. Recordad que en el muestreo por estratos se divide la población y se coge una muestra dentro de cada estrato. A Asturias se pudo haber decidido, por fijar ideas, que le corresponde una muestra de 22 individuos. Polietápico quiere decir que no se cogieron esos 22 asturianos directamente al azar, sino que en una segunda etapa Asturias se habría dividido otra vez en estratos (p.ej. Gijón, Oviedo, Avilés, resto de la zona centro, zona oriental y zona occidental), resultando p.ej. 6 personas de Gijón, 5 de Oviedo, etc. Este muestreo sería polietápico porque se han aplicado estratos o conglomerados más de una vez. Finalmente, las 6 personas de Gijón se escogerían al azar porque nos dicen que la selección es aleatoria.

¿Por qué la confianza es justo del 95'5% y no del 95? ¿No es un poco caprichoso?

Al tomar una confianza del 95% para hacer un intervalo, en la tabla de la normal obtenemos un valor b=1'96. A veces se toma como confianza 95'5% porque es la que hace que salga b=2 y las cuentas quedan más sencillas.

Dios mío, ¿qué es "dos sigma"?

Es lo mismo que acabo de decir, en la fórmula del error aparece b multiplicado por la desviación típica. Para una confianza del 95'5% tenemos b=2 y entonces "b por sigma" es "dos sigma". De ahí viene el nombre de la empresa que ha hecho la encuesta (Sigma Dos).

¿Qué era p/q=50/50?

Como vimos en clase, el margen de error sería distinto para cada partido. Para estar seguros de que ese valor del margen de error es siempre válido, sea toma el p con el que hay mayor error (p=0'5) y entonces, como q=1-p, también q=0'5. Con p/q=50/50 lo que se dice es que se ha calculado el error tomando p=50% y q=50%.

¿Qué significa que el margen de error es ±3'16%?

Es lo que llamamos en clase el error máximo en la estimación e, más exactamente es un margen que garantiza que el valor de e para todos los partidos va a ser como mucho del 3'16%.

Entonces, vamos a ver, si yo calculo el error con la fórmula que vimos en clase, ¿me va a salir el e=3'16/100=0'0316, o no?

No, para cada partido nos saldría un e distinto que siempre sería como máximo del 3'16%, pero normalmente será menor. La ficha nos dice que el error siempre va a ser como máximo del 3'16%, sea cual sea el partido, pero no dice el error exacto para cada partido individual.

¿Esto último va a caer en el examen?

No, hombre, no.

(Pregunta para nota) Pero si el error verdadero es más pequeño, quiere decir que estamos usando un intervalo más largo de lo necesario, y nos dijiste que al alargar el intervalo aumenta la confianza. Entonces, ¿sería el 95'5% o no? Ay, qué lío.

Exacto, si formamos un intervalo de confianza usando ese margen de error, la confianza será del 95'5% o mayor, pero nunca menos del 95'5%. Lo que la encuesta garantiza es que el error va a ser del 3'16% o menos aún, y la confianza del 95'5% o más aún, para los datos de todos los partidos.

Por eso esta encuesta dice "margen de error ±3'16% para los datos globales" y la anterior de La Vanguardia "margen de error total posible de ±3'16%".

¿Y esto último va a caer?

No, tampoco.

Menos mal. ¿Y hay algo en esta ficha técnica que no sea correcto? Es que como nos dijiste que lo vas a preguntar en el examen...

Sí, hay algo incorrecto y es que encuestando por teléfono la muestra no es realmente aleatoria, es decir, no todas las personas tienen la misma probabilidad de ser seleccionadas. Por ejemplo, aún hay gente que no tiene teléfono, otros pueden tener tanto fijo como móvil, otros pueden tener varios móviles, o tener un teléfono personal y otro en la empresa. A mayor nivel económico es más fácil que uno disponga de más teléfonos, y por tanto podría aparecer en la encuesta algún sesgo a favor de los partidos con votantes de mayor nivel económico.

Lo que ocurre es que encuestar por teléfono es más rápido y barato que seleccionar a la gente en el censo e ir a entrevistarlos a su casa, por eso se hace así.

No hay comentarios:

Publicar un comentario