Edición de Datos
Procesamiento a nivel de unidad económica
En el ámbito de la Encuesta Anual de la Industria Manufacturera (EAIM), la captación de la información a nivel de unidad económica ya implica la clasificación de los establecimientos de acuerdo con el Sistema de Clasificación Industrial de América del Norte (SCIAN) 2018, así como los códigos de identificación de cada una de las variables captadas, razón por la cual estas dos actividades no se realizan de manera específica como parte del procesamiento.
La base de datos que integra los cuestionarios captados es objeto de validación mediante la aplicación de un esquema de verificación de consistencia y congruencia, con lo cual se asegura el cumplimiento de los criterios mínimos de validación en campo y los criterios adicionales de procesamiento que aseguran la calidad de la información.
Criterios básicos de validación en campo
Este conjunto de criterios se conforma por un total de 23 aspectos fundamentales que se verifican al momento mismo de la captación de información, cuando se trata de la captación de cuestionarios en papel. En el caso de la captación mediante el dispositivo de cómputo móvil o a través del capturador en internet, se aplican en forma automatizada un total de 110 criterios de validación.
Como ejemplo de los criterios de validación en campo se tienen los siguientes:
• Existencia de remuneraciones pagadas cuando se reporta personal ocupado dependiente de la razón social (hombres y mujeres), y viceversa.
• Información de los Pagos a otra razón social por el suministro de personal y/o Gastos por honorarios y comisiones sin sueldo o salario fijo, cuando haya reportado Personal no dependiente de la razón social, y viceversa.
• Total de los Ingresos por suministro de bienes y servicios mayor o igual que la suma de las Remuneraciones pagadas más el Total de los gastos por consumo de bienes y servicios.
Criterios básicos de validación para el procesamiento
Durante el procesamiento a nivel de unidad económica se verifican los criterios básicos de validación en campo y se aplican criterios de validación adicionales. Bajo este contexto, cada uno de los cuestionarios captados es objeto de análisis exhaustivo, mediante el análisis transversal y longitudinal.
En el primer caso, se revisa la existencia de variables correlacionadas de un mismo cuestionario como son Personal ocupado y Remuneraciones, Personal ocupado y Horas trabajadas, Personal ocupado y Valor de producción, y Valor de producción y Ventas, entre otros. Su propósito es verificar la congruencia y consistencia de la información, además de la completez de la misma.
El segundo análisis se centra en la evolución de los datos de un cuestionario con la información de la misma unidad económica referente a periodos previos. En este sentido, se verifica la comparabilidad y tendencia económica de los datos a nivel de cada variable.
Se obtienen diferencias absolutas y variaciones porcentuales que permiten realizar el análisis.
Este tipo de análisis se hace respecto al periodo previo o respecto a varios periodos a lo largo de la serie estadística de la propia EAIM.
Asimismo, como parte del análisis comparativo a nivel de unidad económica, los datos de la EAIM son comparados con los producidos por la Encuesta Mensual de la Industria Manufacturera (EMIM) para el mismo periodo de referencia y para variables afines entre ambas encuestas.
Cuando el resultado del comparativo arroja diferencias sustanciales el o la analista de información realiza la reconsulta con la fuente informante para verificar ambos datos.
Aplicando este análisis se asegura que las diferencias entre ambas encuestas sean mínimas ya que se trata de la misma unidad económica y los factores que pueden incidir para que se presenten diferencias entre los datos pueden provenir de la periodicidad, el estatus de la información al momento de responder las encuestas y que la fuente informante sea diferente, en
cuyo caso son aclarados con la misma.
Este análisis permite validar la información reportada en la EAIM por unidad económica siendo el principal análisis comparativo utilizado.
En total se aplican 167 criterios de validación en esta etapa, considerando los criterios básicos de validación en campo. A continuación, se describen algunos ejemplos.
• Validar la variación anual del personal ocupado dependiente de la razón social (hombres y mujeres) dando prioridad a las unidades económicas grandes de 251 y más personas ocupadas, y en caso de que presenten variaciones fuera de la media se debe reconsultar con la fuente informante el origen de la variación.
• Corroborar que la variación entre el valor de ventas totales y el de producción no presente diferencias que no se expliquen por el inventario de productos elaborados del periodo, y en su caso se debe reconsultar con la fuente informante el origen de la variación.
• Validar la variación anual de las compras y mejoras de activos fijos de todos los rubros de activo captados dando prioridad a las cantidades más grandes, y en caso de que se presenten variaciones fuera de a media se debe reconsultar con la fuente informante el origen de la variación.
Reconsulta de la información
Las reconsultas se llevan a cabo a través de dos medios: vía telefónica o bien a través de correo electrónico.
Debido a la programación de las actividades, dichos medios son los más eficientes para ratificar o rectificar, con oportunidad, los datos recolectados directamente con los informantes.
En esta actividad participan tanto las y los analistas y supervisores de procesamiento como las y los entrevistadores de la estructura operativa Regional y Estatal en todo el país, utilizando la herramienta informática definida para tal efecto.
Imputación de información faltante
Para finalizar la actividad de procesamiento a nivel de unidad económica, se efectúa la imputación de los establecimientos faltantes tomando como base primordial la condición operativa de las unidades económicas reportada por el operativo de campo.
La imputación de establecimientos faltantes con actividades operativas normales se realiza aprovechando la información recibida por la Encuesta Mensual de la Industria Manufacturera (EMIM), con la cual se comparte el mismo diseño estadístico.
El proceso que se sigue es por unidad económica e implica retomar las variables comunes entre ambas encuestas. Asimismo, se toman como pivote para la imputación de la información que se mide exclusivamente por la EAIM, considerando también la información histórica reportada por las propias unidades económicas y las estructuras por dominio de estudio para variables como los consumos de bienes y servicios, existencias e inversión.
Cabe indicar que para el caso de las clases de actividad con diseño probabilístico únicamente se imputan los faltantes del estrato de certeza y en los dominios con diseño no probabilístico se imputan todos los faltantes.
La razón de que en los dominios con diseño probabilístico únicamente se imputen los faltantes del estrato con certeza es que para el resto de los estratos el factor de expansión hace el ajuste.
Con la imputación, se consolida la información de la muestra completa que permite integrar la base de datos procesados del periodo en estudio y se procede a la solicitud de factores de expansión en el caso de los dominios con diseño probabilístico.
Proceso de expansión
El factor de expansión se considera como el número de elementos de la población que representa cada unidad económica en muestra de la encuesta.
Por lo anterior, la expansión de datos se realiza para calcular el valor de la estimación poblacional de las variables en estudio en la encuesta a partir de los datos reportados por las unidades económicas de la muestra.
Una vez que se obtienen los datos expandidos o el valor de la estimación poblacional se obtiene la base de datos procesados de las clases de actividad con diseño probabilístico.
Procesamiento de datos agregados
Para los dominios con diseño probabilístico se aplica el proceso de expansión de los datos y estos se suman con los datos de los dominios con diseños no probabilísticos para generar los agregados de los valores de todas las variables (monetarias y no monetarias) a nivel de clase de actividad, rama, subsector y sector.
Una de las actividades finales de la fase de procesamiento es la derivación de variables no provistas de forma explícita como parte de la captación, pero que son necesarias para integrar la oferta estadística total de la EAIM.
En primer lugar, se derivan los totales y/o subtotales de las variables de personal ocupado, horas trabajadas, insumos totales, producción bruta total, valor agregado bruto, valor total de ventas de los productos elaborados e inversión fija bruta total a nivel de clase de actividad, rama, subsector y sector; lo anterior, a partir de las variables específicas que se captan de esos rubros.
Adicionalmente, se calculan variables como las remuneraciones pagadas por persona ocupada dependiente de la razón social de los mismos niveles de agregación mencionados previamente. En este caso, se utilizan las variables específicas de personal ocupado y remuneraciones pagadas, respectivamente.
La información agregada también se somete al esquema de análisis e investigación de los datos aparentemente incongruentes, lo cual se sustenta y apoya con las investigaciones realizadas a nivel establecimiento. Asimismo, se cuenta con indicadores de uso interno elaborados a partir de datos de la propia encuesta que ayudan al control de la calidad de los resultados, según los diferentes niveles de agregación.
En complemento a lo anterior la información agregada se compara con los resultados de la Encuesta Mensual de la Industria Manufacturera (EMIM).
Por último, se crea el conjunto de datos procesados del periodo en estudio que permite iniciar el análisis de la producción.