¡OLLANTA VA GANANDO: Gracias DATUM!
Colaborador. Jorge Bernedo Alvarado.
Especialista Estadístico
Cierta terquedad, o descuido.
El diario Perú 21 publicó los resultados de otra encuesta donde “gana” la candidata de la dictadura. Hace un par de semanas alertamos que algo raro pasa con esta encuestadora. Si se ponderan los datos que publican con el peso de cada región tomado del padrón de electores del JNE, se reproducen los valores publicados para Ollanta Humala, pero no los de Keiko Fujimori a la que nuevamente le sobran unos tres o cuatro puntos.
Bamba Datum
Votos emitidos
Ollanta
Keiko
Regiones
Electores
Padrón JNE
Peso en Padrón Región
% Publicado
Ponderado JNE
% Publicado
Ponderado JNE
Lima
7258010
0,378095969
32,5
12,288119
51
19,2828944
Norte
4774819
0,248737576
38,5
9,5763967
50,5
12,5612476
Centro
1653487
0,086136113
51,4
4,4273962
39,4
3,39376285
Sur
3925602
0,204498794
60,2
12,310827
29,9
2,51754936
Oriente
1584293
0,082531548
41,2
3,4002998
46,1
3,80470434
19196211
1
41,8
42,0
45,4
42
Votos válidos
Lima
7258010
0,378095969
38,9
14,707933
61,1
23,1016637
Norte
4774819
0,248737576
43,3
10,770337
56,7
14,1034206
Centro
1653487
0,086136113
56,6
4,875304
43,4
3,7383073
Sur
3925602
0,204498794
66,8
13,660519
33,2
2,79355975
Oriente
1584293
0,082531548
47,2
3,895489
52,8
4,35766571
19196211
1
47,9
47,9
52,1
48
Es matemáticamente imposible que con los mismos pesos los datos publicados sean iguales para un candidato y diferentes para otro. Simplemente están favoreciendo a la candidata que prefieren, falseando datos de manera impune. Lo más posible – para el caso de los votos válidos - es que el resultado haya sido 50 y 50 (ya que no puede ser 48 a 48).
Podríamos usar como pesos la cantidad de observaciones que publica Datum para cada región. (380, 268, 129, 190 y 89 para las respectivas regiones) en lugar de las ponderaciones con el padrón JNE. ¿Cuánto sale la votación de Keiko?, Otra vez 48 y no 52. Datum es muy descuidado con lo que publica. Además de indicarnos que con 89 entrevistas se puede representar al Oriente y con 129 a la región Centro.
Muy poco (o nada) técnicos.
Pero esto no es todo. Es casi nada. Gracias a la “Ficha Técnica” – así se llama – podemos encontrar más perlas. (Se puede ingresar a conocerla través de las noticias de Perú 21)
Por ejemplo, que si el error de la encuesta es +/- 2.8, se necesitan 5.6% de diferencia para salir del empate técnico. Pero no, anuncian desde ya que “Keiko sigue adelante”. Además su fórmula de error es falsa: supone que sus encuestados se seleccionaron al azar del padrón electoral y se les visitó recorriendo todo el país. No tiene sentido.
Pero no vamos a entrar a todos los despropósitos metodológicos. Nos interesa releer los datos. Ver cómo y en cuánto los desvirtúa para aproximarnos a la verdad.
Vamos.
Cobertura baja y torcida
¿Selecciona al azar, como exige la teoría, las provincias y los distritos Datum?. Claro que no. “Selecciona” 53 de 195 provincias y a 145 de 1834 distritos, según su conveniencia y antojo. Basta ver la lista de los lugares de encuesta en su “Ficha Técnica”. Por lo general va a los sitios con poblaciones más grandes, más accesibles, urbanas. Cubre, suponiendo que vaya a los 145 distritos más grandes – lo cual no es rigurosamente cierto porque a veces se salta poblados importantes – al 62 por ciento de la población, o redondeando 60. Le falta el 40 por ciento.
Pero al hacerlo, distorsiona evidentemente los datos, a favor de la candidatura fujimorista. Algunos ejemplos escandalosos: En Huancavelica, donde Ollanta triplicó la votación de La Fujimori, hace encuestas en dos (2) de los 94 distritos, Huancavelica y Acoria en la provincia capital, cubriendo apenas un poco más del 60 por ciento de la población. En Moquegua donde Ollanta ganó por casi 5 a 1 va solamente a un distrito de 20, Moquegua, que es un tercio de la población. En Tacna, donde también el resultado de primera vuelta fue casi 5 a 1, va a dos distritos de la ciudad capital (de 13 posibles) que son el 70 por ciento de la población. En Apurímac donde la votación humalista fue el doble que la fujimorista, Datum visita tres distritos de 80 posibles, ni siquiera de la capital Abancay, sino de Andahuaylas, cubriendo un poco más de la mitad de la población. En cambio en Lima/Callao, un tercio de la población total donde ganó su candidata, la cobertura es del 90 por ciento. Y así por el estilo. Datum va más al norte y a Lima, donde hay más población y desprecia al resto de regiones, con menos población. Pero aún cuando va al norte, va a las provincias y a los distritos más grandes y deja de lado los distritos pequeños, al 40 por ciento de los electores.
Si ese 40 por ciento más pequeño y menos urbano votara en la misma proporción por los dos candidatos que lo que vota el 60 por ciento sí incluido, no pasa nada. Pero sabemos que no es así. Entonces hagamos un supuesto condescendiente - que podría calcularse con exactitud a partir de los resultados de la primera vuelta – y digamos que esta población excluida vota 60 a 40 a favor de Humala. En ese caso, el resultado sería 54 por ciento para Ollanta ( 30 % =0.6 por 50% de la parte incluida y 24% más. igual a 60% por 0.4 de la parte excluida) y no 50. Le “roban” de esta manera 4 puntos a Ollanta.
Baja tasa de respuesta.
Sigamos ahora con otra perla. Datum dice que su tasa de respuesta es de solamente el 75 por ciento. (En realidad, entonces no cubre al 60 por ciento de la población sino solamente el ¡45 por ciento!). Y aquí omite especialmente hombres, adultos, que trabajan. ¿Votan ellos igual que el 75 por ciento que sí contestó?. Muy difícil, votan más a favor de Ollanta según suelen decir las encuestas que pregonan que la población keikista es femenina y juvenil. Digamos que entre los no respondientes, la proporción a favor de Ollanta es solamente 52 contra 48. Con un cálculo similar al anterior resulta que Ollanta debería tener 50.5 y no 50 por ciento de los votos omitidos. Le birlan medio punto adicional.
Exclusión de las edades avanzadas.
Una más. Datum declara que se circunscribe a la población entre 18 y 70 años de edad. Lo que deja de lado 1 millón 138 mil 483 electores según la estimación del Centro Latinoamericano de Demografía de la población peruana al 2010. Supongamos que solamente vayan a votar la mitad, que es poco pero es considerable: 3 por ciento de los votos. ¿No serán, los que van a votar, más partidarios de Ollanta que de Keiko, ya que se les ofrece la pensión 65 y más? Si la votación de esta población se diera 50/50 para los dos candidatos, otra vez no pasa nada. Pero si fuera dos tercios a favor de Humala, el tendría 2 por ciento y Keiko 1 punto, y por tanto habría un punto a favor de Humala que no se ha contado.
Conclusión, agradecimiento y proyecto.
Al parecer lo que ha recogido Datum es un empate aritmético 50/50 y no una ventaja de 4 o 5 puntos de doña Fujimori. Pero los sesgos de su cobertura torcida le quitan 4 puntos a Ollanta, los de la no respuesta medio punto más, los votos de los adultos mayores podrían dar a Ollanta un punto más. Conservadoramente, hay una apropiación ilícita de 5.5 puntos.
Ollanta según Datum corregido tendría 55.5 por ciento de la votación y doña Keiko 44.5. ¡Diez puntos de diferencia!. Si gustan, hacemos rebajas. Pero es muy difícil de creer que de 8 puntos de ventaja que tenía Gana Perú sobre Fuerza 2011 en la primera vuelta, estuviera ahora perdiendo por 4 o 5 puntos, por más campaña mediática desgastada que tengamos que soportar diariamente ¿no es cierto?.
Felizmente Datum publica ciertas cosas, con las cuales aproximarnos a lo cierto. Para ello hay que perdonarles la carga arbitraria de 3 puntos a Keiko y suponer que ciertamente son muy deficientes en su trabajo, para ahorrarse plata y ganar más del pago que le hacen. Total es un negocio.
Las demás encuestadoras, en diversos grados, insistimos, son parecidas en deficiencias, algunas más que otras, claro está. Su concentración urbana y sus bajas tasas de respuesta están afectando por varios puntos, la candidatura del cambio. Con los resultados distritales de la primera vuelta, sus porcentajes reales de respuesta y con algunos supuestos racionales, podríamos saber en cuánto “falla” cada una, en especial si se anima un pequeño equipo de estudiantes para cálculos en Excel y si las encuestadoras tiene la misma transparencia de Datum que nos ha indicado los distritos y provincias por donde pasó y sus tasas de respuesta. Si dichas encuestadoras no hacen lo propio, los lectores ya saben por qué. Y también lo sabe el JNE, y el INEI.
¡Ah! En todo caso lean las cifras de nuestras encuestadoras y agreguen unos puntos a Ollanta para saber el resultado más realista. Ollanta va ganando. ¡Gracias Datum!