Edición de Datos
El procesamiento de la información emitida a través de los cuestionarios fue realizado mediante las actividades de:
1.Microvalidación de los datos emitidos en el instrumento de captación.
2.Macrovalidación de la base de datos preliminar y
3.La generación de la Base de Datos definitiva, teniendo como principal objetivo la revisión y ajuste de los datos obtenidos en el CNIJE 2012, así como la integración de los datos estadísticos para su posterior explotación.
A continuación se explican las tres etapas del procesamiento de la información por cada uno de los cinco Módulos que integran al presente Censo.
1.- La etapa de Microvalidación de los datos emitidos en los tipos de preguntas cerradas y abiertas se realizó a partir de la aplicación de los criterios de:
•Validación de rango, se refiere al proceso de revisar que los microdatos se expresen como valores numéricos o alfanuméricos y se encuentren dentro de los parámetros esperados
•Validación de consistencia, se refiere al proceso de revisar que los datos numéricos solicitados de manera agregada sean consistentes con los datos numéricos solicitados de manera desagregada en tablas
•Validación de filtro, se refiere a la revisión de las preguntas que por el tipo de selección de las opciones en la pregunta que antecede no deben ser respondidas
•Validación de selección, se refiere a la revisión de la selección de las opciones que se presentan en las preguntas donde una o dos opciones invalidan la selección de las demás opciones, y
•Validación de asignación, se refiere a la elección de las funciones que no aplican y que dicha elección afecta a los tipos de funciones que se presentan en varias tablas vinculadas por la selección de la columna "No aplica".
Esta revisión se realizó para cada una de las preguntas contenidas en los cinco módulos que integran el presente Censo, mismos que fueron expresados en funciones lógicas con el fin de revisar su cumplimiento y cuyo propósito principal fue la detección de inconsistencias de datos numéricos agregados y desagregados, de pase de pregunta mal aplicados, de selección de opciones mutuamente excluyentes y de selección de tipo de función que no aplica mal asignada.
Después de realizada la confronta de los registros estadísticos contra los criterios de validación establecidos, se detectaron las inconsistencias siguientes:
•Omisión, espacio vacío y/o falta de respuesta.
• Uso heterogéneo del término "NS" (No se sabe), "NA" (No aplica) y "ND" (No disponible).
• Inconsistencia en las respuestas a preguntas condicionadas por la selección de las opciones únicas en pregunta antecedente.
• Respuesta múltiple en preguntas cerradas con selección de opción única.
• Dato numérico agregado que no es congruente con la suma de los datos numéricos desagregados.
• Valores emitidos en tipos, materias y funciones que fueron seleccionados como no aplica en tablas relacionadas.
Con la finalidad de resolver estas inconsistencias, la solución aplicada consistió en el envío del cuestionario electrónico, con las observaciones correspondientes a cada una de las inconsistencias detectadas, para su reconsulta con el informante, con el objeto de aclarar las posibles dudas que causaron las inconsistencias o detectar condiciones específicas que las causaron.
Finalizado el proceso de reconsulta con el informante, se revisaron nuevamente los microdatos, detectándose nuevamente las inconsistencias siguientes:
• Espacios vacíos y/o falta de respuesta.
• Uso heterogéneo del término "NS" (No se sabe), "NA" (No aplica) y "ND" (No disponible).
• Dato numérico agregado que no es congruente con datos numéricos desagregados.
• Valores emitidos en tipo y materia y funciones que fueron seleccionados como no aplica en tablas relacionadas.
Debido a que las inconsistencias se mantenían en los datos emitidos por los informantes, se aplicaron las soluciones siguientes:
a) Homologación del término "No se sabe" de acuerdo con el tipo de pregunta y los valores aceptados por cada pregunta, asignando los caracteres "NS":
I. Sustitución de los términos "NA" y "ND" por "NS" determinados por el tipo de valor aceptado en cada pregunta.
II. Aquellas que contenían un campo específico para el término "No se sabe" y no contaran con algún dato y/o se encontraran sin respuesta.
III. Todas las que se desprendían de tablas en las que, por la naturaleza de los datos solicitados en la misma, se aceptaban valores alfanuméricos y no contaran con algún dato y/o se encontraran sin respuesta.
IV. Para aquellas que no tenían valor alguno en la respuesta, se determinó incorporar el código "NS", debido a que el informante no respondió por falta de información, desconocimiento y/u omisión.
b) Incorporación del código "NA" (no aplica), identificado con los caracteres NA, y que se asignó a los espacios en las variables de las preguntas que por su carácter condicionado a otras preguntas no tenían que ser respondidas y, en caso de contener una respuesta en la pregunta de referencia, se cambió el valor de la pregunta que determina el pase de ésta.
c) Imputación del valor cuando el mismo dato esta desagregado en otra pregunta o se solicitó aclaración del mismo por parte del informante o responsable en el llenado del cuestionario, o bien presentaron datos en anexos, que no se encontraban registrados en los campos de respuesta correspondientes.
d) Reasignación de valores que fueron emitidos en tipo de funciones, tipo de corporación policiaca, tipos de centros penitenciarios, tipos de centros de tratamiento o de internamiento para adolescentes y tipo de cargo que no aplicaban, bajo el criterio de las funciones secundarias, alineación de totales por sexo, y/o recuperación de valores no especificados.
e) Realización de los cálculos con base en la información presentada por el informante con el fin de modificar los microdatos para ser incorporados en las preguntas correspondientes.
Después de concluido el proceso de microvalidación, se generó la base de datos preliminar, misma que contempló los ajustes y modificaciones derivados de la identificación de los errores e inconsistencias mencionadas.
2.- Etapa de Macrovalidación de la base de datos preliminar.
La segunda etapa, denominada macrovalidación de la base de datos preliminar, implicó el uso del criterio de validación de consistencia, que se define como un conjunto de reglas de naturaleza conceptual y estadística que sirve de base para la identificación de las inconsistencias, omisiones y multirrespuestas no aplicables; este criterio sólo fue empleado en aquellas preguntas que se encontraban relacionadas entre sí, por lo que dicha validación se realizó mediante el análisis de la interrelación de las preguntas en cada cuestionario y para los cinco módulos objeto de este Censo.
Esta etapa, implicó el uso del criterio de validación de consistencia, que se define como un conjunto de reglas de naturaleza conceptual y estadística que sirve de base para la identificación de las inconsistencias, omisiones y multirrespuestas no aplicables; este criterio sólo fue empleado en aquellas preguntas que se encontraban relacionadas entre sí, por lo que dicha validación se realizó mediante el análisis de la interrelación de las preguntas en cada cuestionario y para los cinco Módulos del CNIJE 2012.
Una vez terminado el análisis de los microdatos mediante la validación de consistencia, se detectaron en las bases de datos preliminares las inconsistencias siguientes:
a) Valores numéricos menores entre los datos solicitados de forma agregada y desagregada.
b) Valores numéricos no consistentes según sumatoria por tipo de sexo (hombre y mujeres) con referencia a tipo de funciones, tipo de corporación policiaca, tipos de centros penitenciarios, tipos de centros de tratamiento o de internamiento para adolescentes y tipo de cargo seleccionados.
c) Datos estadísticos emitidos inconsistentes entre preguntas relacionadas.
d) Omisión e inconsistencias de datos en tablas relacionadas por las características de ejecución de delitos.
Las soluciones a estas inconsistencias dentro de la base de datos fueron las siguientes:
• Imputación del valor obtenido de la sumatoria de los valores desagregados para ser sustituido por el dato emitido en el total solicitado.
• Reasignación de valores en función de la alineación por la sumatoria de los valores por sexo (hombres y mujeres) según el caso.
• Modificación o reasignación de los valores estadísticos presentes en las tablas de las preguntas interrelacionas mediante consulta a la información expuesta en el apartado de comentarios generales, y/o recuperación de valores totales en base de datos.
• Aplicación del término "NS" en las variables en las que existía un total registrado para un determinado tipo de delito del Fuero Común o conducta antisocial asociada a delito del Fuero Común, pero que no contenían valor estadístico alguno.
Una vez terminada la macrovalidación sobre la base de datos preliminar, se considera concluido el procedimiento de validación.
3.- Etapa de generación de la Base de Datos definitiva.
Esta etapa es la última del procesamiento de la información y tuvo como objetivo la integración de las bases de datos preliminares ya validadas en una sola base de datos que contiene toda la información generada por cada módulo del Censo y desagregada por temas, misma que se estructuró conforme a los criterios y lineamientos establecidos para su explotación y la posterior generación de los tabulados correspondientes.