Edición de Datos
Tratamiento de la información
El tratamiento de la información recolectada en el cuestionario básico, cuestionario socioeconómico y el módulo, por medio de dispositivos móviles, se inicia desde el diseño del cuestionario electrónico, en el cual se implementan algunos procesos básicos de secuencia de datos y de códigos asignados por pregunta, en oficinas centrales.
Posterior al trabajo de campo, sigue una serie de etapas encaminadas a revisar más a fondo los datos recolectados. Dichas etapas son las siguientes:
- Recolección de información en dispositivos móviles.
- Procesos de validación y depuración de archivos.
- Procesamiento de la información.
a) Recolección de información en dispositivos móviles
Una vez concluidas las actividades de levantamiento en dispositivos móviles, supervisión y crítica de campo, cada oficina auxiliar es responsable de verificar los registros de cada vivienda y que esta información se envíe a los procesos de validación y depuración de archivos, de manera que se pueda garantizar la calidad de los resultados.
b) Procesos de validación y depuración de archivos
La validación y depuración de archivos consiste en aplicar los criterios de validación de integridad, secuencia y códigos válidos y congruencia, con la finalidad de detectar y corregir los errores cometidos en la crítica de campo o en la captura de la información.
- Integridad: este proceso asegura que toda la información capturada esté completa, es decir, verifica que las viviendas registradas sean las que le corresponden en la muestra mensual, confrontando también el número de control y folio asignados por mes; de esta manera, se garantiza que la base de datos esté completa. Si faltara alguna vivienda, se envía el reporte para que el supervisor verifique el estado de la vivienda faltante y realice su ubicación para ser enviada al proceso de validación. Por la naturaleza de la rotación de panel de la muestra, cada mes sale una octava parte de la muestra y entra otra nueva; además, otra octava parte descansa ocho meses y, a su vez, se integra una octava parte que viene de descasar sus ocho meses; por lo tanto, es necesario que el proceso de integridad esté libre de error para que la base quede liberada por entidad.
- Secuencia y códigos válidos: proceso que consiste en verificar la secuencia lógica del cuestionario y, además, reportando aquellos valores registrados donde debería estar en blanco. A su vez, se verifica que los valores almacenados estén en el rango de códigos aceptados por pregunta. Se genera un reporte temporal que el supervisor verifica y, en su caso, corrige los errores detectados por el validador.
- Congruencia: proceso que permite la verificación de preguntas relacionadas entre sí. La respuesta puntual de una pregunta puede provocar un error en otra y, para verificar esto, se analizó el cuestionario y se determinó qué preguntas estaban relacionadas entre sí y así verificar sus valores de respuesta; por ejemplo, las claves de parentesco van relacionadas con la edad de los integrantes del hogar, no puede existir que un hijo tenga más años que el padre o la madre, que una persona de edad menor sea considerada como jefe del hogar, etcétera.
c) Procesamiento de la información
Para obtener los resultados a publicar, es necesario aplicar los siguientes procesos de información: integración de la base nacional de captura, aplicación del factor de expansión, generar la base nacional de explotación y obtener los resultados definitivos e indicadores.
De acuerdo con el calendario de actividades de la ENCO y el MODECULT, se establece la fecha de liberación de la base por entidad; una vez concluida la validación por cada entidad, se exporta la información para generar la base nacional de captura, esta base se envía a diseño estadístico para que se realice el cálculo del factor de expansión y, posteriormente, se coloca el factor a cada registro de la encuesta y, con ello, se obtiene la base nacional de explotación. Los procesos de generación de información se realizan mediante un sistema de generación de resultados desarrollado para obtener las frecuencias por pregunta y por opción, éste realiza los cálculos de prorrateo de la opción "No sabe", obtiene los porcentajes de cada opción y aplica las multiplicaciones de los resultados para obtener el valor que le corresponde a cada pregunta.