Edición de Datos
La validación de la información se llevó a cabo en dos etapas:
1. Microvalidación, y
2. Validación
La microvalidación, consiste en la identificación de las inconsistencias en la información a nivel de registro dentro del cuestionario (instrumento de captación), mediante la aplicación de los criterios básicos establecidos en los programas informáticos desarrollados especialmente para este proyecto, y posteriormente solicitando al informante las aclaraciones necesarias sobre el dato o valor registrado en el CNGMD 2013. Esto último, con la finalidad de confirmar si la información emitida en el instrumento es correcta o se requiere modificar dicha información (proceso de reconsulta), y una vez terminado este proceso, generar la base de datos preliminar. La etapa de validación consiste en un proceso denominado macrovalidación, el cual se realizó para identificar comportamientos incorrectos (de estructura o de valor) presentes en las bases de datos preliminares, y a su vez, validarlos mediante los criterios establecidos en el marco conceptual y metodológico de los temas correspondientes. Para este propósito, se emplearon las reglas de congruencia lógica, identificación de falta de información e inconsistencia de la respuesta. Terminados los procesos de validación de los microdatos, y realizados los ajustes necesarios que garanticen la calidad en la información, se generan e integran las bases de datos definitivas. Por lo tanto, el procesamiento de la información emitida a través del CNGMD 2013 fue realizado mediante las actividades de microvalidación de los datos emitidos en el instrumento de captación, macrovalidación de la base de datos preliminar y por último, la generación de las bases de datos definitivas.
La etapa de microvalidación de los datos emitidos en los tipos de preguntas cerradas (que son aquellas en que la respuesta está condicionada a una selección de opciones) y abiertas (que son aquellas donde el dato emitido es un valor numérico o alfanumérico), se realizó a partir de la aplicación de los criterios de validación de rango, que se refiere al proceso de revisar que los microdatos se expresen como valores numéricos positivos y se encuentren dentro de los parámetros esperados; la de consistencia, se refiere al proceso de revisar que los datos numéricos solicitados de manera agregada sean consistentes con los datos numéricos solicitados de manera desagregan en tablas; la de filtro, se refiere a la revisión de las preguntas que por el tipo de selección de las opciones en la pregunta que antecede no deben ser respondidas; la de selección, se refiere a la revisión de la selección de las opciones que se presentan en las preguntas donde una o dos opciones invalidan la selección de las demás opciones, y finalmente, la de asignación, se refiere a la elección de las funciones que no aplican y que dicha elección afecta a los tipos de funciones que se presentan en varias tablas concatenadas por la selección de la columna de “No aplica”.
Estos procesos se realizaron para cada una de las preguntas contenidas en los primeros cuatro módulos dentro del CNGMD 2013, mismos que fueron expresados en funciones lógicas con el fin de revisar su cumplimiento y cuyo propósito principal fue la detección de inconsistencias de datos numéricos agregados y desagregados, de pase de pregunta mal aplicados, de selección de opciones mutuamente excluyentes y de selección de tipo de función que no aplica mal asignada.
Después de realizada la confronta de los registros estadísticos contra los criterios de validación establecidos, se detectaron las inconsistencias siguientes:
• Espacios vacíos y/o falta de respuesta
• Uso heterogéneo del término “NS” (No sé), “NA” (No aplica) y “ND” (No disponible)
• Dato numérico agregado que no es congruente con datos numéricos desagregados
• Valores emitidos en tipo de funciones, tipo de corporación policiaca y tipo de cargo que fueron seleccionados como no aplica en tablas relacionadas.
Para lo cual se aplicaron las soluciones siguientes:
a) Homologación del término “No sé” de acuerdo con el tipo de pregunta y los valores aceptados por cada pregunta, asignando los caracteres “-1” : I. Sustitución de los términos “NA” y “ND” por “-2” y “-3” respectivamente determinados por el tipo de valor aceptado en cada pregunta. II. Aquellas que contenían un campo específico para el término “No sé” y no contaran con algún dato y/o se encontraran sin respuesta. III. Todas las que se desprendían de tablas en las que, por la naturaleza de los datos solicitados en la misma, se aceptaban valores alfanuméricos y no contaran con algún dato y/o se encontraran sin respuesta. IV. Para aquellas que no tenían valor alguno en la respuesta, se determinó incorporar el código “-1”, debido a que el informante no respondió por falta de información, desconocimiento y/u omisión.
b) Incorporación del código “NA” (no aplica), identificado con los caracteres “-2”, y que se asignó a los espacios en las variables de las preguntas que por su carácter condicionado a otras preguntas no tenían que ser respondidas, y en caso de contener una respuesta en la pregunta de referencia se cambió el valor de la pregunta que determina el pase de ésta.
c) Imputación del valor cuando el mismo dato esta desagregado en otra pregunta o se solicitó aclaración del mismo por parte del informante o responsable en el llenado del cuestionario, o bien, presentaron datos en anexos y que no se encontraban registrados en los campos de respuesta correspondientes.
d) Imputación del valor obtenido de la sumatoria de los valores desagregados en aquellas preguntas que solicitaban el mismo dato agregado.
e) Imputación de valores, a partir del valor obtenido de la sumatoria de los valores desagregados en aquellas preguntas que solicitaban el mismo dato pero con otros clasificadores, y en este último contaban con información que permitiera identificar la asignación proporcional a realizar.
f) Imputación de valores a partir de su peso relativo, considerando el o los valores porcentuales registrados, cuando la sumatoria de estos no era de 100% y se encontraba en valores muy cercanos (97%, 98%, 99%, 101%, 102% o 103%), a efecto de que dicha suma fuera 100 por ciento.
g) Reasignación de valores que fueron emitidos en tipo de funciones, tipo de corporación policiaca y tipo de cargo que no aplicaban, bajo el criterio de las funciones secundarias y/o alineación por totales por sexo.
Después de concluido el proceso de microvalidación, se generó la base de datos preliminar, que contempló los ajustes y modificaciones derivados de la identificación de los errores e inconsistencias mencionadas. La etapa denominada macrovalidación de la base de datos preliminar, implicó el uso del criterio de validación llamado congruencia lógica, que se define como un conjunto de reglas de naturaleza conceptual y estadística que sirve de base para la identificación de las inconsistencias entre los datos relacionados, omisiones y datos emitidos que no son congruentes con el tipo de valor solicitado en las preguntas específicas (datos emitidos en preguntas agregadas que no son consistentes con el valor solicitado de manera desagregada). Este criterio sólo fue empleado para aquellas preguntas que se encontraban relacionadas entre sí, por lo que dicha validación se realizó mediante el análisis de la interrelación de las preguntas contenidas en los módulos.
Una vez terminado el análisis de los microdatos mediante la validación de congruencia lógica se detectaron en las bases de datos preliminares las inconsistencias siguientes:
a) Valores numéricos menores entre los datos solicitados de forma agregada y desagregada.
b) Valores numéricos no consistentes según sumatoria por tipo de sexo (hombres y mujeres) con referencia a los tipos de funciones, tipos de corporación policiaca y tipos de cargo seleccionados.
Las soluciones a estas inconsistencias dentro de la base de datos fueron las siguientes:
• Imputación del valor obtenido de la sumatoria de los valores desagregados para ser sustituido por el dato emitido en el total solicitado.
• Reasignación de valores en función de la alineación por la sumatoria de los valores por tipo de sexo (hombres y mujeres) según sea el caso.
Una vez terminada la macrovalidación sobre la base de datos preliminar, se consideraba como concluido el procedimiento de validación. Adicionalmente, se realizó un análisis comparativo respecto a las características de la información registrada en el Censo Nacional de Gobierno 2011 – Gobiernos Municipales y Delegacionales contra el cuestionario de 2013. En este sentido, se pudo observar una mayor tasa de respuesta y una mayor calidad de la información obtenida en el proceso de captación del CNGMD 2013, lo anterior derivado de las mejoras en el diseño de los instrumentos de captación, la ampliación y precisión de las preguntas establecidas en los cuestionarios, y la mejora en los programas informáticos desarrollados para este Censo, así como la experiencia adquirida por los informantes y el avance en la mejora de sus registros administrativos, resultaron en la captación de la mayoría de los módulos en que se dividió el instrumento, en el registro de una mayor cantidad de datos desagregados y en una mejora en la consistencia y la calidad de la información recopilada.