En el primer ejercicio (ver abajo) lo único que se modeló aleatorio es la proporción de indecisos que se asigna a cada candidato, es decir, se asume que los proporción de votantes de cada candidato dada por el modelo de Pollster es la correcta.
Sin embargo, sabemos que las encuestas (información en la que se basa Pollster para sus estimaciones), tienen asociado un margen de error. Para los que no saben lo que es el margen de error les comento que no quiere decir que los encuestadores se hayan equivocado, sino más bien, en términos muy simplistas, que como no ha sido encuestado el total de la población, existe incertidumbre (margen de error) por que desconocemos la opinión de los que no entraron en la muestra. Mientras mayor es el tamaño de muestra (número de entrevistados) menor es la incertidumbre (margen de error).
Así que para este segundo ejercicio también pongo como variables aleatorias la proporción de votantes para cada candidato en cada estado, es decir que ya no es un valor fijo dado por Pollster, sino aleatorio.
Por ejemplo, en Florida, Pollster actualizó la información con encuestas recientes, con los siguientes datos: proporción para Obama = 48.7%, proporción para McCain = 44.5%. En el ejercicio anterior se asumía que esos valores eran fijos, lo cual no es cierto. Vamos a darle aleatoriedad a estas estimaciones. Para eso, vamos a usar distribuciones normales para cada candidato, (bendito TLC, y no me refiero al Tratado de Libre Comercio). La media de estas distribuciones normales, por obvias razones, es la misma proporción, lo interesante está en el margen de error. Usaré como percentil 95 de la distribución normal la media más el margen de error fijo para todos los estados y ambos candidatos.
El tamaño de muestra promedio de las encuestas con las que se basa esta información es de 854 encuestas personales. Para ese tamaño de muestra el margen de error es de .03353, es decir un 3.353% de margen de error. La fórmula es la siguiente: n = Z^2*p*(1-p)/d^2. Donde n = tamaño de muestra, Z = percentil al nivel de confianza deseado de una distribución normal estándar (0,1), p = proporción estimada y d = margen de error.
Es decir que ahora la proporción de votos de cada candidato es aleatoria, y una vez que se simulan esos 2, la proporción de indecisos también se asigna aleatoriamente como en el modelo anterior. Cabe señalar que existe una correlación negativa entre las normales de cada estado, por que al subir la proporción de un candidato, necesariamente decrece la proporción del otro. Así que usaré una correlación de -0.95 para cada estado.
Resultados:
Modelo Uniforme

Modelo Beta

Modelo Elba con punto de corte 25%

Modelo Elba con punto de corte 10%

Modelo Elba con punto de corte 5%

Modelo Elba con punto de corte 0.1%
Gráfica resumen de probabilidades

Sensibilidad
Conclusiones: Como podemos ver en las gráficas, bajo los Modelos Uniforme y Beta Obama sigue ganando con total certeza. Es necesaria la mano amiga (Modelo Elba) para que McCain tenga apenas una pequeña probabilidad de ganar.
Conforme el punto de corte de la asignación total se mueve cerca del 0, lo cual significaría que los indecisos son asignados en su totalidad a McCain (llamémosle el modelo Elba Esther a su máxima potencia), el traslape entre los votos electorales de ambos candidatos se hace más grande, dándole una pequeña probabilidad a McCain de ganar. En el caso del modelo de punto de corte de 0.1%, digamos el más extremo, la probabilidad de que McCain gane llega a ascender a 20% aproximadamente.
Otro punto de interés es ver la sensibilidad de los estados, la gráfica de Sensibilidad indica cuál estado tiene mayor influencia en el resultado final. En este caso, Ohio, Florida y Pensilvania son los estados que más influyen en el resultado final. Habrá que recomendarle al equipo de Obama que canalicen recursos en esos estados para cerciorarse de que Hildebrando no esté merodeando cerca de las máquinitas de votos electrónicos. La alta sensibilidad de un estado se puede deber a que la diferencia es pequeña entre los candidatos, pero también a que el número de indecisos es grande.








