Edición de Datos
Procesamiento a nivel de unidad económica
En el ámbito de la Encuesta Mensual de la Industria Manufacturera (EMIM), la captación de la información a nivel de unidad económica ya implica la clasificación de los establecimientos de acuerdo con el Sistema de Clasificación Industrial de América del Norte, así como los códigos de identificación de cada una de las variables captadas, razón por la cual estas dos actividades no se realizan de manera específica como parte del procesamiento.
La base de datos que integra los cuestionarios captados es objeto de validación mediante la aplicación de un esquema de verificación de consistencia y congruencia, con lo cual se asegura el cumplimiento de los criterios mínimos de validación en campo y los criterios adicionales de procesamiento que aseguran la calidad de la información.
Criterios básicos de validación en campo
Este conjunto de criterios se conforma por un total de 13 aspectos fundamentales que se verifican al momento mismo de la captación de información, cuando se trata de la captación de cuestionarios en papel. En el caso de la captación mediante el dispositivo de cómputo móvil o a través del capturador en internet, se aplican en forma automatizada un total de 123 criterios de validación en campo.
Criterios básicos de validación para el procesamiento
Durante el procesamiento a nivel de unidad económica se verifican los criterios básicos de validación en campo y se aplican criterios de validación adicionales. Bajo este contexto, cada uno de los cuestionarios captados es objeto de análisis exhaustivo, mediante el análisis transversal y longitudinal.
En el primer caso, se revisa la existencia de variables correlacionadas de un mismo cuestionario como son Personal ocupado y Remuneraciones, Personal ocupado y Horas trabajadas, Personal ocupado y Valor de producción, Capacidad de planta utilizada y Valor de producción, y Valor de producción y Ventas, entre otros. Su propósito es verificar la congruencia y consistencia de la información, además de la completez de la misma.
El segundo análisis se centra en la evolución de los datos de un cuestionario con la información de la misma unidad económica referente a periodos previos. En este sentido, se verifica la comparabilidad y tendencia económica de los datos a nivel de cada variable.
En total se aplican 110 criterios de validación en esta etapa, considerando los criterios básicos de validación en campo.
Identificación de valores atípicos
Uno de los principales resultados del procesamiento a nivel de unidad económica es la identificación de valores atípicos.
A partir de la aplicación del conjunto de criterios de validación, se generan listados con los datos atípicos que son revisados para determinar si los mismos requieren ser objeto de reconsulta con el informante.
Reconsultas de la información
Las reconsultas se llevan a cabo a través de dos medios: vía telefónica o bien a través de correo electrónico.
Debido a la programación de las actividades, dichos medios son los más eficientes para ratificar o rectificar, con oportunidad, los datos recolectados directamente con los informantes.
En esta actividad participan tanto los y las analistas y supervisores(as) de procesamiento como los entrevistadores(as) de la estructura operativa Regional y Estatal en todo el país.
Imputación de información faltante
Para finalizar la actividad de procesamiento a nivel de unidad económica, se efectúa la imputación de los establecimientos faltantes tomando como base primordial la condición operativa de las unidades económicas reportada por el operativo de campo.
Dicha imputación se realiza utilizando el método del vecino más cercano, que es una técnica consistente en agrupar establecimientos de tipo similar por estrato, con la finalidad de ordenar el grado de asociación entre dos establecimientos que pertenecen al mismo grupo, en este caso, clase de actividad y/o estrato, según corresponda a los dominios de estudio con diseño probabilístico o no probabilístico. A través de este procedimiento es posible imputar la información de los establecimientos faltantes retomando la información del donante en este caso es el vecino más cercano del mismo grupo.
No siempre se logra identificar al vecino más cercano óptimo, de tal forma que se aplica el método de la tendencia del dominio-estrato al que pertenece la unidad económica faltante. Dicho procedimiento consiste en retomar la información del establecimiento en cuestión del periodo previo para estimar los datos del periodo en estudio. En este sentido, se aplica la tendencia que se obtiene a nivel del dominio-estrato con base en las unidades económicas captadas.
Finalmente, se integra la base de datos procesados del periodo en estudio y se procede con el cálculo de los factores de expansión en el caso de los dominios con diseño probabilístico.
Procesamiento de datos agregados
Para los dominios con diseño probabilístico se aplica el proceso de expansión de los datos y éstos se suman con los datos de los diseños no probabilísticos para generar los agregados de los valores de todas las variables (monetarias y no monetarias) a nivel de clase de actividad, rama, subsector y sector.
Una de las actividades finales de la fase de procesamiento es la derivación de variables no provistas de forma explícita como parte de la captación, pero que son necesarias para integrar la oferta estadística total de la EMIM.
En primer lugar, se derivan los totales y/o subtotales de las variables de personal ocupado y horas trabajadas a nivel de clase de actividad, rama, subsector y sector; lo anterior, a partir de las variables específicas que se captan de esos rubros.
Adicionalmente, se calculan variables como las remuneraciones pagadas promedio por persona ocupada y/u horas trabajadas de los mismos niveles de agregación mencionados previamente. En este caso, se utilizan las variables específicas de personal ocupado, horas trabajadas y remuneraciones pagadas, respectivamente.
Por último, se integra la base de datos procesados definitiva del periodo en estudio.