Cortesía de:
http://www.noticierodigital.com/forum/viewtopic.php?t=83033&highlight=fabregat
Lo que encontré en el
REP
Adolfo G.
Fabregat
NoticieroDigital
He tenido muchos pedidos de
describir en español los resultados
de mis -muy superficiales- análisis
de la base de datos del REP que se
puede descargar en la pagina del CNE
desde aproximadamente Marzo de este
año.
Aunque soy uruguayo, mi articulo
original lo escribí en inglés porque
el sitio de web que me lo permitió
publicar solo publica artículos en
ingles. El link al articulo lo
pondré al final de este post.
La base de datos consiste en 24
archivos, uno por estado, que
contienen el nombre, fecha de
nacimiento, cedula, nacionalidad (E
o V) y código de centro de votación
de cada ciudadano registrado.
Para mi no es difícil trabajar con
bases de datos de este tamaño porque
este tipo de operación es algo que
tengo que hacer frecuentemente en mi
trabajo diario. Esto no es algo que
se pueda hacer con una planillita de
Excel, este tipo de análisis
requiere manipulaciones y
transformaciones que demandan
programas (herramientas) especificas
que para mi, por suerte, resultan
muy fáciles de escribir.
Total de Votantes:
Lo
primero que hice fue analizar el
total de registros, recuerden que
esta base de datos contiene
registros solo hasta enero de este
año. Encontré 14,849,127 registros,
después fui a la pagina de web del
CNE donde encontré dos documentos
que enumeran el numero de registros
en el año 2000 y en el año 2003.
Estos documentos los pueden
encontrar aquí:
(Estos
documentos no permiten "cut-n-paste"
así que tuve que transcribir los
totales por estado a mano, pero
verifiqué que mis totales están de
acuerdo con los del CNE).
En resumen, encontré que hubo un
aumento de unos 2.2 millones entre
el 2003 y el 2003 pero solo 200 mil
entre el 2000 y el 2003. Esto
confirma lo que ya es sabido
corrientemente que se están
registrando votantes a un ritmo
aceleradísimo.
Algo que me sorprendió fue el bajo
numero de "Extranjeros. Leyendo
artículos sobre el tema diciendo que
estaban inscribiendo extranjeros de
todo el mundo yo tenia una idea de
que me encontraría con un 10% o unos
2 millones, pero solo encontré
144,000. Aunque esto es un aumento
del 88% sobre el numero de
extranjeros en el año 2003.
Uds pueden ver el cuadro de
registros por estado en esta
planilla:
http://fabregat.us/TotalesPorEstado.htm
Los totales en la parte izquierda y
el porcentaje de cambio en las
columnas
a la derecha.
No
hay números de cédulas duplicados.
El paso siguiente fue ordenar el
archivo por numero de cedula. Aquí
también, después de leer tantos
artículos que hablan de cedulas
duplicadas yo esperaba encontrar
miles pero la verdad es que no hay
ninguna. Todas las cedulas en la
base de datos del CNE tienen una
numeración única.
Los
mas viejitos.
Ordenando el archivo por fecha de
nacimiento, me encuentre con una
sorpresa. Al tope de la lista esta
una Señora llamada Josefa Molina
Lantz quien tiene una fecha de
nacimiento de Abril 30 -- agárrense
-- 1831. Esta señora debía haber
cumplido 175 años el mes pasado.
Primero pensé que debía ser un error
tipográfico, y que la año debería
ser 1931 no 1831, pero igual
publique un "post" en Noticiero
Digital simplemente por diversión y
unos muy curiosos y hábiles lectores
de ND rápidamente la encontraron el
el registro de los Seguros Sociales
y en la lista Maisanta donde se
confirma que la fecha de nacimiento
no es un error.
Pero doña Josefa no es la única, hay
17000 personas registradas nacidas
en el Siglo 19, o sea personas que
tienen -o tendrían- mas de 105 años.
El archivo donde encontraran a
doña Josefa es este:
http://fabregat.us/Over106/CNE-106+-1-500.html
Estas son las 500 personas mas
viejas del registro.
El resto de los archivos con
registros de mas de 106 años,
ordenado por fecha de nacimiento,
los pueden encontrar aquí:
http://fabregat.us/Over106/
Cada archivo contiene 500
nombres.
Tampoco podemos olvidarnos de la
personas de entre 100 y 105 años de
edad, este grupo lo pueden encontrar
aquí, también ordenado por fecha de
nacimiento en archivos de 500
nombres cada uno:
http://fabregat.us/Between100-105/
Lo mas sorprendente es que esta base
de datos fue supuestamente auditada
y depurada antes de ser publicada y
es difícil de entender como estos
miles de personas todavía estén en
el registro.
Enero 1, el mes de Octubre y Marzo
15.
Mientras analizaba la base de datos
por fecha de nacimiento también la
analice por día y mes de nacimiento
- sin incluir el año.
Lo que encontré aquí son unos
padrones que no son, yo diría,
naturales. Lo primero que note fue
que Enero 1 tenia totales mucho mas
altos que el de los demás días del
año. Entonces decidí hacer una
cross-tabulación de fechas de
nacimiento por estado que me fue muy
fácil de cargar en Excel y
publicarla en html.
Voy a explicar la planilla antes de
darles el link. Lo que verán aquí
son los 30 días con mas cumpleaños
por estado. Como verán Enero 1 es el
día con mas cumpleaños en 12
estados, pero no solo eso esta entre
los "top-10" en el resto de los
estados. Esta no es una distribución
que ocurra naturalmente.
Ahora la planilla la hice buscando
los resultados de Enero 1 pero
cuando observo los resultados me
encuentro con otro patrón "no
natural".
En prácticamente todos los estados,
fechas en Octubre están en los "top-30".
Por ejemplo en Capital 28 de 30,
Aragua 29 de 30, Bolívar 26 de 30,
Cojedes 29 de 30, Falcón 26 de 30,
Miranda 28 de 30.
Esto a mi me parece muy inusual, mi
próximo paso será analizar todos
estos cumpleaños en Octubre y ver si
tienen una relación con la
numeración de sus cedulas.
La planilla, que yo llame Días
Populares por Estado, la pueden leer
aquí:
http://fabregat.us/CNE-DiasPopularesPorEstado.mht
Vuelvan a la planilla y vayan la
columna mas a la derecha, Zulia. Ahí
verán que el día mas popular en
Zulia es el 15 de Marzo. Este es un
detalle yo ya lo había oído, el caso
de los "Gonzáles de Zulia", pero
pensé que la auditoria los habría
depurado.
Como verán, el 15 de Marzo en Zulia
es el día de mas cumpleaños en todo
el país en todo el año. No solo
supera los promedios de los otros
estados por un factor de hasta 20
veces sino supera los promedios de
cumpleaños en Zulia por un factor de
5. Zulia tiene un promedio de entre
3 y 6 mil cumpleaños por día. Los 30
días mas altos en Zulia tienen entre
6 y 8 mil cumpleaños pero el 15 de
Marzo tiene 24000.
Esto me pico la curiosidad y le hice
un análisis al 15 de Marzo en Zulia
y encontré que de los 24000, hay
19000 con la misma fecha del mismo
año -
1974. Yo puse la lista de 19000 en
orden alfabético y ahí es donde se
pueden encontrar -todavía- los 2000
Gonzáles.
Aquí esta el link a la pagina
aunque puede ser un poco lenta en
cargar
porque tiene 19000 nombres:
http://fabregat.us/ZuliaMarch15/ZuliaListaDeRegistros15Marzo1974.htm
Dos
Cedulas
La verdad que no se como se me
ocurrió hacer un análisis por nombre
y fecha de nacimiento pero este
análisis resulto en un patrón muy
inusual.
Lo que hice fue ordenar el archivo
por nombre y fecha de nacimiento y
después escribí un programita que
cuenta cuantos hay que tengan el
mismo nombre, y cuantos tengan el
mismo nombre y fecha y lo que
encontré es que hay miles de los que
hay solo dos registros con el mismo
nombre y -que casualidad- tienen la
misma fecha de nacimiento.
Ahora yo ya les dije que no hay
cedulas repetidas así que los que
estos registros tienen en común es
que tienen dos cedulas distintas
pero una de ellas es -ta dah-
Extranjera.
Aquí les doy dos ejemplos, los
primeros dos del primer archivo:
1 AAMER BORHAN
1955-05-01 V-23168144 EDO.
BARINAS 50207001
1 AAMER BORHAN 1955-05-01
E-82292736 EDO. BARINAS 50207002
2 AARON CARIAS LUIS ALFREDO
1927-11-13 V-24687331 EDO.
PORTUGUESA 160101009
2 AARON CARIAS LUIS ALFREDO
1927-11-13 E-876593 EDO.
PORTUGUESA 160101006
La
lista completa la pueden encontrar
aquí, en orden alfabético, en
archivos de 200, para que la
descarga no sea larga.
http://fabregat.us/DuplicateNamesE/
También encontré miles de nombres
que ocurren solo dos veces en la
base de datos y que tienen la misma
fecha de nacimiento, pero en este
grupo las dos cedulas son "V"enezolanas.
Lo interesante de este grupo es que
hay muchísimos, no cuantos, que
tienen cedulas no son consecutivas
pero con un solo numero diferente.
Aquí les doy unos ejemplos:
5 ACERO GARCIA
LOIS ZOILA 1984-07-20 V-16759097
EDO. BOLIVAR 60901006
5 ACERO GARCIA LOIS ZOILA
1984-07-20 V-16758097 EDO.
ANZOATEGUI 21701002
6 ACEVEDO SILVA RICARDO
1970-03-30 V-10163484 EDO.
TACHIRA 180801020
6 ACEVEDO SILVA RICARDO
1970-03-30 V-10163454 EDO.
TACHIRA 180801020
9 ACOSTA SEIJAS YANIRKA CARIDAD
1980-12-13 V-15711643 EDO.
GUARICO
100601024
9 ACOSTA SEIJAS YANIRKA CARIDAD
1980-12-13 V-15711634 EDO.
ARAGUA 41501003
12 ADRIAN SALAZAR ALEX JOSE
1978-12-14 V-16336523 EDO. NUEVA
ESPARTA
150401002
12 ADRIAN SALAZAR ALEX JOSE
1978-12-14 V-16336522 EDO. NUEVA
ESPARTA
150601024
La lista completa
de Venezolanos "dobles" la pueden
encontrar aquí:
http://fabregat.us/DuplicateNamesV/
Aquí tienen el link al articulo
original publicado el 25 de Abril
gracias a Alek Boyd en
www.vcrisis.com
http://www.vcrisis.com/index.php?content=letters/200604251640