Edición de Datos
Procesamiento a nivel de unidad económica
En el ámbito de la Encuesta Mensual de la Industria Manufacturera (EMIM), la captación de la información a nivel de unidad económica ya implica la clasificación de los establecimientos de acuerdo con el Sistema de Clasificación Industrial de América del Norte (SCIAN 2018), así como los códigos de identificación de cada una de las variables captadas, razón por la cual estas dos actividades no se realizan de manera específica como parte del procesamiento.
La base de datos que integra los cuestionarios captados es objeto de validación mediante la aplicación de un esquema de verificación de consistencia y congruencia, con lo cual se asegura el cumplimiento de los criterios mínimos de validación en campo y los criterios adicionales de procesamiento que aseguran la calidad de la información.
Criterios básicos de validación en campo
Este conjunto de criterios se conforma por un total de 13 aspectos fundamentales que se verifican al momento mismo de la captación de información, cuando se trata de la captación de cuestionarios en papel. En el caso de la captación mediante el dispositivo de cómputo móvil o a través del capturador en internet, se aplican en forma automatizada un total de 123 criterios de validación.
Como ejemplo de los criterios de validación en campo se tienen los siguientes:
Existencia de remuneraciones pagadas cuando se reporta personal ocupado dependiente de la razón social (Obreros y técnicos en producción, y Empleados administrativos, contables y de dirección), y viceversa.
Información de los Pagos a otra razón social por el suministro de personal y/o Gastos por honorarios y comisiones sin sueldo o salario fijo, cuando haya reportado Personal no dependiente de la razón social, y viceversa.
Total de los Ingresos por suministro de bienes y servicios mayor o igual que la suma de las Remuneraciones pagadas más el Total de los gastos por consumo de bienes y servicios.
Criterios básicos de validación para el procesamiento
Durante el procesamiento a nivel de unidad económica se verifican los criterios básicos de validación en campo y se aplican criterios de validación adicionales. Bajo este contexto, cada uno de los cuestionarios captados es objeto de análisis exhaustivo, mediante el análisis transversal y longitudinal.
En el primer caso, se revisa la existencia de variables correlacionadas de un mismo cuestionario como son Personal ocupado y Remuneraciones, Personal ocupado y Horas trabajadas, Personal ocupado y Valor de producción, Capacidad de planta utilizada y Valor de producción, y Valor de producción y Ventas, entre otros. Su propósito es verificar la congruencia y consistencia de la información, además de la completez de la misma.
El segundo análisis se centra en la evolución de los datos de un cuestionario con la información de la misma unidad económica referente a periodos previos. En este sentido, se verifica la comparabilidad y tendencia económica de los datos a nivel de cada variable.
Se obtienen diferencias absolutas y variaciones porcentuales que permiten realizar el análisis.
Este tipo de análisis se hace respecto al periodo previo o respecto a varios periodos a lo largo de la serie estadística de la propia EMIM.
En total se aplican 110 criterios de validación en esta etapa, considerando los criterios básicos de validación en campo. A continuación, se describen algunos ejemplos.
Validar la variación mensual del total de personal ocupado dependiente de la razón social dando prioridad a las unidades económicas grandes de 251 y más personas ocupadas, y en caso de que presenten variaciones fuera de la media se debe reconsultar con la fuente informante el origen de la variación.
Corroborar que la variación entre el volumen de ventas totales y el de producción por producto no presente diferencias mensuales que no se expliquen por el inventario de periodos previos y en su caso se debe reconsultar con la fuente informante el origen de la variación.
Validar las causas que originaron que se dejen de reportar productos que se reportaron en periodos previos; así como verificar la incorporación de nuevos productos elaborados por la unidad económica.
Identificación de valores atípicos
Uno de los principales resultados del procesamiento a nivel de unidad económica es la identificación de valores atípicos.
A partir de la aplicación del conjunto de criterios de validación, se generan listados con los datos atípicos que son revisados para determinar si los mismos requieren ser objeto de reconsulta con el informante.
Reconsulta de la información
Las reconsultas se llevan a cabo a través de dos medios: vía telefónica o bien a través de correo electrónico.
Debido a la programación de las actividades, dichos medios son los más eficientes para ratificar o rectificar, con oportunidad, los datos recolectados directamente con los informantes.
En esta actividad participan tanto las y los analistas y supervisores(as) de procesamiento como las y los entrevistadores de la estructura operativa Regional y Estatal en todo el país, utilizando la herramienta informática definida para tal efecto.
Imputación de información faltante
Para finalizar la actividad de procesamiento a nivel de unidad económica, se efectúa la imputación de los establecimientos faltantes tomando como base primordial la condición operativa de las unidades económicas reportada por el operativo de campo.
Dicha imputación se realiza utilizando el método del vecino más cercano, que es una técnica consistente en agrupar establecimientos de tipo similar por estrato, con la finalidad de ordenar el grado de asociación entre dos establecimientos que pertenecen al mismo grupo, en este caso, clase de actividad y/o estrato, según corresponda a los dominios de estudio con diseño probabilístico o no probabilístico. A través de este procedimiento es posible imputar la información de los establecimientos faltantes retomando la información del donante en este caso es el vecino más cercano del mismo grupo.
No siempre se logra identificar al vecino más cercano óptimo, de tal forma que se aplica el método de la tendencia del dominio-estrato al que pertenece la unidad económica faltante. Dicho procedimiento consiste en retomar la información del establecimiento en cuestión del periodo previo para estimar los datos del periodo en estudio. En este sentido, se aplica la tendencia que se obtiene a nivel del dominio-estrato con base en las unidades económicas captadas.
Con la imputación, se consolida la información de la muestra completa que permite integrar la base de datos procesados del periodo en estudio y se procede a la solicitud de factores de expansión en el caso de los dominios con diseño probabilístico.
Proceso de expansión
El factor de expansión se considera como el número de elementos de la población que representa cada unidad económica en muestra de la encuesta.
Por lo anterior, la expansión de datos se realiza para calcular el valor de la estimación poblacional de las variables en estudio en la encuesta a partir de los datos reportados por las unidades económicas de la muestra.
Una vez que se obtienen los datos expandidos o el valor de la estimación poblacional se obtiene la base de datos procesados de las clases de actividad con diseño probabilístico.
Procesamiento de datos agregados
Para los dominios con diseño probabilístico se aplica el proceso de expansión de los datos y éstos se suman con los datos de los dominios con diseño no probabilístico para generar los agregados de los valores de todas las variables (monetarias y no monetarias) a nivel de clase de actividad, rama, subsector y sector.
Una de las actividades finales de la fase de procesamiento es la derivación de variables no provistas de forma explícita como parte de la captación, pero que son necesarias para integrar la oferta estadística total de la EMIM.
En primer lugar, se derivan los totales y/o subtotales de las variables de personal ocupado y horas trabajadas a nivel de clase de actividad, rama, subsector y sector; lo anterior, a partir de las variables específicas que se captan de esos rubros.
Adicionalmente, se calculan variables como las remuneraciones pagadas promedio por persona ocupada y/u horas trabajadas de los mismos niveles de agregación mencionados previamente. En este caso, se utilizan las variables específicas de personal ocupado, horas trabajadas y remuneraciones pagadas, respectivamente.
La información agregada también se somete al esquema de análisis e investigación de los datos aparentemente incongruentes, lo cual se sustenta y apoya con las investigaciones realizadas a nivel establecimiento.
Por último, se crea el conjunto de datos procesados del periodo en estudio que permite iniciar el análisis de la producción.