Cortesía de: http://www.noticierodigital.com/forum/viewtopic.php?t=83033&highlight=fabregat

Lo que encontré en el REP
Adolfo G. Fabregat
NoticieroDigital

He tenido muchos pedidos de describir en español los resultados de mis -muy superficiales- análisis de la base de datos del REP que se puede descargar en la pagina del CNE desde aproximadamente Marzo de este año.

Aunque soy uruguayo, mi articulo original lo escribí en inglés porque el sitio de web que me lo permitió publicar solo publica artículos en ingles. El link al articulo lo pondré al final de este post.

La base de datos consiste en 24 archivos, uno por estado, que contienen el nombre, fecha de nacimiento, cedula, nacionalidad (E o V) y código de centro de votación de cada ciudadano registrado.

Para mi no es difícil trabajar con bases de datos de este tamaño porque este tipo de operación es algo que tengo que hacer frecuentemente en mi trabajo diario. Esto no es algo que se pueda hacer con una planillita de Excel, este tipo de análisis requiere manipulaciones y transformaciones que demandan programas (herramientas) especificas que para mi, por suerte, resultan muy fáciles de escribir.

Total de Votantes:

Lo primero que hice fue analizar el total de registros, recuerden que esta base de datos contiene registros solo hasta enero de este año. Encontré 14,849,127 registros, después fui a la pagina de web del CNE donde encontré dos documentos que enumeran el numero de registros en el año 2000 y en el año 2003. Estos documentos los pueden encontrar aquí:

(Estos documentos no permiten "cut-n-paste" así que tuve que transcribir los totales por estado a mano, pero verifiqué que mis totales están de acuerdo con los del CNE).

En resumen, encontré que hubo un aumento de unos 2.2 millones entre el 2003 y el 2003 pero solo 200 mil entre el 2000 y el 2003. Esto confirma lo que ya es sabido corrientemente que se están registrando votantes a un ritmo aceleradísimo.

Algo que me sorprendió fue el bajo numero de "Extranjeros. Leyendo artículos sobre el tema diciendo que estaban inscribiendo extranjeros de todo el mundo yo tenia una idea de que me encontraría con un 10% o unos 2 millones, pero solo encontré 144,000. Aunque esto es un aumento del 88% sobre el numero de extranjeros en el año 2003.

Uds pueden ver el cuadro de registros por estado en esta planilla:

http://fabregat.us/TotalesPorEstado.htm

Los totales en la parte izquierda y el porcentaje de cambio en las columnas
a la derecha.

No hay números de cédulas duplicados.

El paso siguiente fue ordenar el archivo por numero de cedula. Aquí también, después de leer tantos artículos que hablan de cedulas duplicadas yo esperaba encontrar miles pero la verdad es que no hay ninguna. Todas las cedulas en la base de datos del CNE tienen una numeración única.

Los mas viejitos.

Ordenando el archivo por fecha de nacimiento, me encuentre con una sorpresa. Al tope de la lista esta una Señora llamada Josefa Molina Lantz quien tiene una fecha de nacimiento de Abril 30 -- agárrense -- 1831. Esta señora debía haber cumplido 175 años el mes pasado. Primero pensé que debía ser un error tipográfico, y que la año debería ser 1931 no 1831, pero igual publique un "post" en Noticiero Digital simplemente por diversión y unos muy curiosos y hábiles lectores de ND rápidamente la encontraron el el registro de los Seguros Sociales y en la lista Maisanta donde se confirma que la fecha de nacimiento no es un error.

Pero doña Josefa no es la única, hay 17000 personas registradas nacidas en el Siglo 19, o sea personas que tienen -o tendrían- mas de 105 años.

El archivo donde encontraran a doña Josefa es este:

http://fabregat.us/Over106/CNE-106+-1-500.html

Estas son las 500 personas mas viejas del registro.

El resto de los archivos con registros de mas de 106 años, ordenado por fecha de nacimiento, los pueden encontrar aquí:

http://fabregat.us/Over106/

Cada archivo contiene 500 nombres.

Tampoco podemos olvidarnos de la personas de entre 100 y 105 años de edad, este grupo lo pueden encontrar aquí, también ordenado por fecha de nacimiento en archivos de 500 nombres cada uno:
http://fabregat.us/Between100-105/

Lo mas sorprendente es que esta base de datos fue supuestamente auditada y depurada antes de ser publicada y es difícil de entender como estos miles de personas todavía estén en el registro.

Enero 1, el mes de Octubre y Marzo 15.

Mientras analizaba la base de datos por fecha de nacimiento también la analice por día y mes de nacimiento - sin incluir el año.

Lo que encontré aquí son unos padrones que no son, yo diría, naturales. Lo primero que note fue que Enero 1 tenia totales mucho mas altos que el de los demás días del año. Entonces decidí hacer una cross-tabulación de fechas de nacimiento por estado que me fue muy fácil de cargar en Excel y publicarla en html.

Voy a explicar la planilla antes de darles el link. Lo que verán aquí son los 30 días con mas cumpleaños por estado. Como verán Enero 1 es el día con mas cumpleaños en 12 estados, pero no solo eso esta entre los "top-10" en el resto de los estados. Esta no es una distribución que ocurra naturalmente.

Ahora la planilla la hice buscando los resultados de Enero 1 pero cuando observo los resultados me encuentro con otro patrón "no natural".

En prácticamente todos los estados, fechas en Octubre están en los "top-30". Por ejemplo en Capital 28 de 30, Aragua 29 de 30, Bolívar 26 de 30, Cojedes 29 de 30, Falcón 26 de 30, Miranda 28 de 30.

Esto a mi me parece muy inusual, mi próximo paso será analizar todos estos cumpleaños en Octubre y ver si tienen una relación con la numeración de sus cedulas.

La planilla, que yo llame Días Populares por Estado, la pueden leer aquí:

http://fabregat.us/CNE-DiasPopularesPorEstado.mht

Vuelvan a la planilla y vayan la columna mas a la derecha, Zulia. Ahí verán que el día mas popular en Zulia es el 15 de Marzo. Este es un detalle yo ya lo había oído, el caso de los "Gonzáles de Zulia", pero pensé que la auditoria los habría depurado.

Como verán, el 15 de Marzo en Zulia es el día de mas cumpleaños en todo el país en todo el año. No solo supera los promedios de los otros estados por un factor de hasta 20 veces sino supera los promedios de cumpleaños en Zulia por un factor de 5. Zulia tiene un promedio de entre 3 y 6 mil cumpleaños por día. Los 30 días mas altos en Zulia tienen entre 6 y 8 mil cumpleaños pero el 15 de Marzo tiene 24000.

Esto me pico la curiosidad y le hice un análisis al 15 de Marzo en Zulia y encontré que de los 24000, hay 19000 con la misma fecha del mismo año -
1974. Yo puse la lista de 19000 en orden alfabético y ahí es donde se pueden encontrar -todavía- los 2000 Gonzáles.

Aquí esta el link a la pagina aunque puede ser un poco lenta en cargar
porque tiene 19000 nombres:

http://fabregat.us/ZuliaMarch15/ZuliaListaDeRegistros15Marzo1974.htm

Dos Cedulas

La verdad que no se como se me ocurrió hacer un análisis por nombre y fecha de nacimiento pero este análisis resulto en un patrón muy inusual.

Lo que hice fue ordenar el archivo por nombre y fecha de nacimiento y después escribí un programita que cuenta cuantos hay que tengan el mismo nombre, y cuantos tengan el mismo nombre y fecha y lo que encontré es que hay miles de los que hay solo dos registros con el mismo nombre y -que casualidad- tienen la misma fecha de nacimiento.

Ahora yo ya les dije que no hay cedulas repetidas así que los que estos registros tienen en común es que tienen dos cedulas distintas pero una de ellas es -ta dah- Extranjera.

Aquí les doy dos ejemplos, los primeros dos del primer archivo:

    1 AAMER BORHAN 1955-05-01 V-23168144 EDO. BARINAS 50207001
    1 AAMER BORHAN 1955-05-01 E-82292736 EDO. BARINAS 50207002

    2 AARON CARIAS LUIS ALFREDO 1927-11-13 V-24687331 EDO. PORTUGUESA 160101009
    2 AARON CARIAS LUIS ALFREDO 1927-11-13 E-876593 EDO. PORTUGUESA 160101006

La lista completa la pueden encontrar aquí, en orden alfabético, en archivos de 200, para que la descarga no sea larga.

http://fabregat.us/DuplicateNamesE/

También encontré miles de nombres que ocurren solo dos veces en la base de datos y que tienen la misma fecha de nacimiento, pero en este grupo las dos cedulas son "V"enezolanas.

Lo interesante de este grupo es que hay muchísimos, no cuantos, que tienen cedulas no son consecutivas pero con un solo numero diferente. Aquí les doy unos ejemplos:

    5 ACERO GARCIA LOIS ZOILA 1984-07-20 V-16759097 EDO. BOLIVAR 60901006
    5 ACERO GARCIA LOIS ZOILA 1984-07-20 V-16758097 EDO. ANZOATEGUI 21701002

    6 ACEVEDO SILVA RICARDO 1970-03-30 V-10163484 EDO. TACHIRA 180801020
    6 ACEVEDO SILVA RICARDO 1970-03-30 V-10163454 EDO. TACHIRA 180801020

    9 ACOSTA SEIJAS YANIRKA CARIDAD 1980-12-13 V-15711643 EDO. GUARICO
    100601024
    9 ACOSTA SEIJAS YANIRKA CARIDAD 1980-12-13 V-15711634 EDO. ARAGUA 41501003

    12 ADRIAN SALAZAR ALEX JOSE 1978-12-14 V-16336523 EDO. NUEVA ESPARTA
    150401002
    12 ADRIAN SALAZAR ALEX JOSE 1978-12-14 V-16336522 EDO. NUEVA ESPARTA
    150601024
La lista completa de Venezolanos "dobles" la pueden encontrar aquí:

http://fabregat.us/DuplicateNamesV/

Aquí tienen el link al articulo original publicado el 25 de Abril gracias a Alek Boyd en www.vcrisis.com 

http://www.vcrisis.com/index.php?content=letters/200604251640

regreso a documentos