Edición de Datos
El procesamiento de la información se concibe como la etapa final de la ejecución de un proyecto, iniciando éste con el traslado de los datos obtenidos en papel a medios magnéticos, para posteriormente realizar los procesos de depuración, limpieza, congruencia, clarificación, codificación, y validación, entre otros; y finalmente la generación y presentación de resultados.
El procesamiento de la información se dividió en tres grandes subprocesos: captura, codificación y validación. El último proceso se aplicó en tres momentos: 1) durante el levantamiento (validación de campo), 2) posterior a la captura (validación primaria) y 3) al concluir el procesamiento estatal (validación automática). El proceso comenzó con la recepción de la información proveniente de campo y terminó con la generación de la base de datos para la explotación.
1. Captura
La captura se realizó a imagen de los cuestionarios, mediante una serie de pantallas que presentaban las preguntas de los instrumentos de captación. El sistema captaba, en primer lugar, el apartado de identificación geográfica (el cual era común para todos los instrumentos), inmediatamente después un campo llamado tipo de instrumento, el cual identificó cada uno de los cuatro instrumentos existentes (A, B, C y D), de manera que el sistema mostrara las pantallas apropiadas para capturar cada caso.
2. Codificación
Una vez capturada la información se procedió a codificar las preguntas abiertas.
3.- Validación
La validación es un proceso que da limpieza a la información proveniente de campo; con ello se evitan posibles inconsistencias y omisión de información, asignando valores mediante el análisis de preguntas relacionadas. Este proceso se planteó en tres etapas: • Validación de campo. • Validación primaria. • Validación automática.
El último proceso se aplicó en tres momentos:
Validación de campo
Este proceso se llevó a cabo durante el levantamiento de la información y consistió en la revisión de la información contenida en los diferentes instrumentos de captación (cuestionario, módulos y hoja de no respuesta); para ello, se definieron criterios, lineamientos y procedimientos, cuyo propósito fue cuidar la calidad de la información durante la recolección y en caso necesario realizar las reconsultas pertinentes, así también se establecieron las instrucciones para la generación de paquetes con cuestionarios y módulos, garantizando con ello que llegaran completos y ordenados para su captura y verificación. Entre los criterios que se aplicaron en esta etapa, cabe destacar los relacionados con la revisión de la carátula del cuestionario en términos de identificación geográfica, control de las viviendas seleccionadas, la congruencia de preguntas interrelacionadas como número de personas en la vivienda, número de hogares y personas listadas. Asimismo fue de suma importancia para el análisis sociodemográfico y de la temática de la encuesta, cuidar variables como edad, sexo, condición de actividad, posición en la ocupación, fecha de nacimiento y elegibilidad. Durante esta etapa, algunos cuestionarios se regresaron a campo para verificar la información.
Validación primaria
La validación primaria consistió en la aplicación del sistema de códigos válidos y secuencias, una vez capturada la información, con el fin de detectar omisiones de información, inconsistencias entre preguntas y secciones, así como errores cometidos durante captura. Una vez ejecutado el módulo del sistema, se emitió un reporte con los errores que presentaba la base de datos, los cuales se desplegaban en dos formatos: Val_prim1 y Val_prim2. En el primero se asentaron los errores correspondientes a secuencias y códigos válidos, y en el segundo los errores referentes a las incongruencias entre preguntas. Con estos reportes los analistas localizaron los cuestionarios con error; si se trataba de un error de captura se corregía inmediatamente, pero si se trataba de un error proveniente de campo, éste era justificado para posteriormente aplicar los tratamientos automáticos de validación.
La consulta y correcciones se realizaron mediante una interfaz gráfica de fácil manejo, en donde los analistas podían visualizar el error y corregir de acuerdo con los criterios establecidos en su manual. Los reportes emitidos por el sistema y el seguimiento que se les dio, permitieron informar a la estructura operativa los errores más comunes en que estaban incurriendo.
Validación automática
La validación automática consistió en la revisión de la consistencia lógica de la información, mediante un sistema que analizó las respuestas a las preguntas y su congruencia, en relación con las respuestas a otras preguntas que están relacionadas.
Integridad I
Adicional a la validación que revisó la congruencia, se realizaron procesos para garantizar la integridad de la información captada durante el levantamiento. En una primera etapa se ejecutó un proceso en dos pasos para asegurar que los datos del paquete "liberados de captura" fueran correctos y estuvieran completos. Con estos procedimientos se podían identificar, por medio de reportes que generaba el sistema, los casos en donde se encontraban errores.
Integridad II
El diseño de procedimientos de revisión para esta etapa fue a nivel entidad, lo que significó que toda la información de la muestra debía estar capturada y liberada, con lo cual se garantizó su cobertura para cada uno de los estados.
Para realizar el análisis y corrección de los problemas que se presentaron en esta etapa se generaron dos reportes. En el primero se desplegaron los casos de duplicidad entre paquetes, es decir, existían cuestionarios, módulos y hojas de no respuesta con la misma identificación geográfica en dos paquetes diferentes. Para el segundo reporte se desarrollaron procedimientos para garantizar la cobertura de la muestra y detectar viviendas faltantes o sobrantes.