Las elecciones presidenciales de Ecuador se llevaron a cabo el 7 de febrero de 2021. Durante toda la campaña electoral, numerosos sondeos de intención de voto fueron realizados por las más importantes encuestadoras de Ecuador, por organizaciones internacionales, así como investigadores independientes (entre ellos, el reconocido PhD. Omar Maluk).
En este artículo, hacemos un análisis de los últimos 16 sondeos publicados en los diferentes medios de comunicación ecuatorianos. Estos sondeos fueron realizados entre el 27 de diciembre de 2020 y el 31 de enero de 2021.
El primer sondeo que analizaremos será el nuestro, publicado el 31 de enero de 2021 (el domingo anterior al día de las elecciones) en nuestros diferentes canales:
En el Gráfico 1 se muestra el sondeo de datalimon publicado el 31 de enero (izquierda) junto al resultado oficial publicado en la página web del Consejo Nacional Electoral el 19 de febrero de 2021, con el cómputo de votos al 100.00% (derecha).
¿Cuándo se publicaron estos sondeos?
Como se puede apreciar en nuestra cuenta de Twitter, la predicción de datalimon fue publicada el 31 de enero de 2021, es decir, el domingo anterior al día de las elecciones. Esto nos permite operar dentro de reglamentos de difusión de encuestas electorales internacionales.
Con mucho entusiasmo, compartimos nuestro pronóstico para las elecciones presidenciales de Ecuador 2021, las cuales se llevarán a cabo el 7 de febrero. Lo publicamos hoy porque nuestra metodología solo hace uso de datos existentes hasta el domingo previo al día de las elecciones. pic.twitter.com/SbwqH2RSEq
— Datalimon (@datalimon) February 1, 2021
¿Cómo se calcula la distancia entre un sondeo electoral y el resultado oficial?
Existen muchas formas de calcular esta distancia. En este artículo revisaremos dos de las técnicas más usadas en este campo: La sima de los residuos, y la distancia euclidiana.
1. Técnica de suma de residuos
Esta técnica consiste simplemente en calcular la diferencia entre el valor que obtuvo cada candidato en el sondeo, contra el valor que obtuvo en el las elecciones reales. Finalmente, se suman todas estas diferencias.
Gráfico 2: Cálculo de suma de residuos entre los resultados oficiales y la predicción de datlimon.
Para el caso de datalimon, el valor obtenido para la suma de residuos es de 19.45 unidades.
2. Técnica de distancia euclidiana
Esta técnica es muy similar a la anterior. La diferencia es que cada diferencia entre el valor del sondeo y el valor real, debe ser elevada al cuadrado. Finalmente, se suman todos esos cuadrados.
Gráfico 3: Cálculo de distancia euclidiana entre los resultados oficiales y la predicción de datalimon.
Para el caso de datalimon, el valor obtenido para la suma de residuos es de 11.15 unidades.
¿Cuál fue el sondeo más cercano?
En la Tabla 1, se muestra la suma de residuos y distancia euclidiana de los otros 15 sondeos publicados entre el 27 de diciembre de 2020 y el 31 de enero de 2021 (para corroborar el cálculo de Suma de residuos y Distancia euclidiana, consultar el siguiente enlace).
En la Tabla 1, se aprecia que el sondeo de datalimon, es indiscutiblemente el más cercano de todos.
Usando la técnica de la suma de residuos, datalimon presenta la suma más baja, con solo 19.45, seguido por IESOP y Clima Social, con 20.90 y 21.66 respectivamente.
Usando la técnica de la distancia euclidiana, datalimon presenta la distancia euclidiana más baja, con solo 11.15, seguido por IESOP (12.18), Ecuasondeos (12.37) y Eureknow (12.94).
Notemos que CEDATOS no presenta valor en esta tabla porque dicho sondeo solo incluyó información para 3 candidatos. En la Tabla 2 mostramos la posición que tendría CEDATOS cuando comparamos los 16 sondeos usando solo esos 3 candidatos.
¿Por qué algunos sondeos tienen un (*) o un (**) al costado?
Ocurre que algunos sondeos no publicaron información para los 6 candidatos que suelen publicar todas las encuestadoras. Por ejemplo, el sondeo publicado por Merket (el 10 de enero), el sondeo publicado por Comunicaliza (el 20 de enero), y sondeo publicado por ISESOP (26 de enero) no presentaron información para Pedro José Freile. En estos 3 casos, hemos optado por asumir una diferencia de 0.00 para dicho candidato, debido a que los otros sondeos que sí presentaron esta información, tuvieron una diferencia despreciable.
Asimismo, el 25 de enero, CEDATOS publicó un sondeo que solo incluía estimaciones para 3 candidatos: Arauz con 29.2, Lasso con 28.7 y Yaku con 19.6. En este caso, para poder comparar qué tan cercano fue CEDATOS en comparación con los otros 15 sondeos, fue necesario recalcular las sumas de residuos y distancia euclidiana de todas las encuestadoras con solo esos 3 candidatos.
Tabla 2: Suma de residuos y distancia euclidiana considerando solo 3 candidatos.
En la Tabla 2, se muestran las sumas de residuos y las distancias euclidianas para los 16 sondeos, considerando solo 3 candidatos, es decir, bajo las reglas de CEDATOS (para corroborar estos cálculos, consultar el siguiente enlace).
Encontramos que, usando la técnica de la suma de residuos, el sondeo de Clima Social, publicado el 18 de enero, presenta la suma más baja, con solo 5.15, seguido por el de datalimon (8.03) y el de Omar Maluk (9.22), y, usando la técnica de la distancia euclidiana, Clima Social presenta la distancia euclidiana más baja, con solo 3.34, seguido por datalimon (5.92), Omar Maluk (6.95) y Ecuasondeos (6.99).
CEDATOS, en cambio, presenta una suma de residuos de 12.26 y una distancia euclidiana de 9.47, valores muy lejanos a los de los sondeos mencionados en el párrafo anterior.
¿Por qué Clima Social presenta distancias más bajas que las datalimon?
Clima Social no presenta distancias más bajas que datalimon. Jugando con las reglas de CEDATOS, aparentemente Clima social tiene estos valores más bajos, pero debemos tener en cuenta 2 cosas:
1. Comparación justa
Clima Social presentó en su sondeo valores para 6 candidatos (Andrés Arauz, Guillermo Lasso, Yaku Pérez, Xavier Hervas, Lucio Gutiérrez y Pedro José Freile), motivo por el que la comparación más justa debería ser contra los 6 candidatos con los que trabajó datalimon. Dicha comparación ya la hicimos en la Tabla 1.
El sondeo de Clima Social cometió errores muy altos en candidatos como Xavier Hervas, Lucio Gutiérrez y Pedro José Freile, y estos errores debe ser tomados en el cálculo de suma de residuos y distancia euclidiana de Clima Social para poder tener una evaluación general de su trabajo.
Además, realizar una comparación con solo 3 candidatos (según las reglas de CEDATOS) no es lo más oportuno, pues la mayoría de encuestadoras trabaja con 6, esas son las reglas de juego.
2. Antigüedad del sondeo
El sondeo de Clima Social se realizó el 18 de enero (20 días antes de las elecciones). Este tiempo es demasiado amplio para garantizar una predicción certera, ya que las 3 últimas semanas de votación son cruciales para que el electorado tome una decisión.
Dado que al 18 de enero, muchos ciudadanos ecuatorianos todavía no habían decidido su voto no hay ninguna evidencia científica que nos haga pensar que se debe tomar en cuenta un sondeo de intención de voto realizado en esa fecha, e ignorar todos los sondeos que se hicieron después de este.
Necesariamente uno e los 16 sondeos terminaría con la suma de residuos más baja si solo se consideran los 3 candidatos con los que trabajó CEDATOS, y, en este caso, fue el sondeo de Clima Social, pero puede que el factor casualidad esté teniendo un papel importante en este cálculo.
Curiosidades: algunos datos interesantes
En esta sección, discutiremos algunos datos que han sorprendido por completo a la ciudadanía ecuatoriana. Por ejemplo, la notable subida de votos que tuvo Xavier Hervas en los últimos días de campaña, así como también la incertidumbre de quién pasaría a segunda vuelta, Guillero Lasso o Yaku Pérez.
La subida de Xavier Hervas
Un hecho que sorprendió a todos, fue que el candidato Xavier Hervas obtuvo un total de 15.68% de votos válidos, cuando la mayoría de encuestadoras le daban alrededor de 4 puntos porcentuales. En la Tabla 3 se listan los sondeos de intención de voto de Xavier Hervas. El sondeo que mejor recogió los votos de Hervas fue el de Eureknow, publicado el 26 de enero (con 9.24% de votos válidos), seguido por el de datalimon, publicado el 31 de enero (con 6.40% de votos válidos).
Tabla 3: Intención de votos de Xavier Hervas, según los 16 últimos sondeos electorales.
Se recomienda contactar al equipo de Eureknow, para conocer qué técnicas de muestreo siguieron para poder llegar al electorado de Xavier Hervas, al que ninguno de los otros sondeos pudo llegar.
Incertidumbre sobre guillermo lasso
Otro dato interesante, es que durante el conteo de votos, hubo incertidumbre respecto a quién sería el candidato que pasaría a segunda vuelta (Guillero Lasso o Yaku Perez). El equipo de datalimon siempre estuvo seguro de que sería Lasso quien pase, y hasta publicó una estimación de cuántos votos tendría Lasso por encima de Yaku.
La estimación de datalimon fue que terminado el conteo de votos, Lasso tendría 32,945 más votos que Yaku. Esta información fue publicada en los canales oficiales de datalimon el 11 de febrero de 2021:
Lasso pasará a segunda vuelta con 32,945 votos por encima de Yaku (Lasso cerrará con 1'830,433 votos y Yaku con 1'797,458).#datalimon
— Datalimon (@datalimon) February 12, 2021
El 19 de febrero, la CNE terminó el conteo de votos, dándole 1,830,045 votos a Lasso y 1,797,445 votos a Yaku, valores muy cercanos al pronóstico de datalimon. La diferencia de votos fue de 32,600 (es decir, solo 345 votos menos de lo señalado por datalimon).
Existen muchas razones estadísticas para explicar la una eventual diferencia entre un valor proyectado y un valor real, sin embargo, aquí entró en juego un factor que no puede ser estimado con ningún modelo estadístico: Las actas electorales que presentan errores humanos, son anuladas en su totalidad, y estos votos no son ingresados al cómputo general.
Por más que se considere un porcentaje de actas anuladas de acuerdo al histórico de Ecuador en elecciones anteriores, o al valor obtenido en otras elecciones de la región (por ejemplo, Bolivia 2020, República Dominicana 2020, Guyana 2020, Argentina 2019, Uruguay 2019, El Salvador 2019, Panamá 2019 y Guatemala 2019), o a valores recomendados por la literatura, predecir cuántas actas van a ser anuladas en un proceso electoral es siempre una tarea muy difícil y nos enorgullece habernos equivocado por solo 345 votos.