Edición de Datos
CAPTURA. La captura de información de la ENA 2017 se efectuó durante la entrevista con el informante de forma directa en el DCM, siendo en este momento en donde dio inicio a la actividad de verificación de la calidad de la información, ya que el sistema de captura del cuestionario validó en línea algunas congruencias en los datos proporcionados por el informante. En este nivel, los criterios de revisión fueron muy específicos, ya que se cuidó no obstaculizar el desarrollo de la entrevista, así como no influir en las respuestas que proporcionó el informante. En este sentido, se dio prioridad en validación en línea a algunas variables que se tienen identificadas como susceptibles de ser captadas erróneamente. Asimismo, se incluyeron algunas otras que son de flujo en el llenado del cuestionario y aquéllas que tienen que ver con la suma de desglose con respecto al total.
CLAVIFICACIÓN DURANTE EL LEVANTAMIENTO. Como en cada proyecto en el que se levantan estadísticas agropecuarias y/o forestales, se elaboran y se analizan diversos catálogos que permiten que la información quede bien organizada e identificada; pues esto, facilita el procesamiento y el análisis de los datos. Estos catálogos corresponden a diversas variables de los cuestionarios y permiten asignar claves a las respuestas del productor, facilitando su interpretación, su análisis, su procesamiento y su publicación. Este proceso de asignación de claves es conocido como Clavificación. Los catálogos han sido construidos y actualizados permanentemente a través de diferentes operativos de captación de información agropecuaria, tanto censos como encuestas. Para realizar los primeros pasos de la clavificación, se almacenaron diferentes catálogos en el DCM, de tal manera que cuando el entrevistador realizaba alguna pregunta con diferentes alternativas de respuesta, el sistema desplegaba una lista en la que se presentaba la descripción de cada una de las opciones, entre las cuales el entrevistador seleccionaba la correspondiente a la respuesta del informante; en estos casos el sistema almacenaba la clave, con base en el catálogo de la pregunta.
NORMALIZACIÓN. La información captada en una encuesta agropecuaria y forestal presenta una amplia variedad de unidades de medida, ya sea de superficie o de volumen para diferentes variables del cuestionario aplicado, debido a los regionalismos y conceptos que se utilizan en las diversas zonas del país, principalmente en la zona sur y sureste. Para dar atención a este aspecto, se diseñaron catálogos que permiten una conversión electrónica al momento de captar la información y su equivalencia al sistema métrico decimal. Dichos catálogos son el producto de los trabajos realizados durante los diferentes operativos de recolección e investigación de información estadística agropecuaria. Esta tarea de homogeneización se denomina Normalización. Con la finalidad de presentar resultados y publicar la información en unidades de medida del sistema métrico decimal fue necesario “normalizar” aquellas cantidades disímbolas tales como: fanegas, almud, yunta, apantle, etc. Las conversiones de equivalencia, se realizaron principalmente en kilogramos o toneladas para unidades de peso y en metros o hectáreas para el caso de superficies. Para determinar la equivalencia, en algunos casos fue necesaria la reconsulta de los datos con el productor que proporcionó la información, o bien en ocasiones sólo fue necesario realizar la investigación con el personal de las oficinas estatales responsable de recabar la información.
MONITOREO. El monitoreo de información tuvo como objetivo analizar y detectar información inconsistente durante el periodo de levantamiento de información, con la finalidad de corregirla oportunamente aprovechando la disponibilidad del personal operativo. La etapa de monitoreo estableció 12 criterios de validación, los cuales se aplicaron a todos los cuestionarios. Los criterios diseñados tuvieron que ver con la relación lógica entre algunos temas y variables del cuestionario mayormente relevantes, así como con la detección de datos extremos o atípicos para dichas variables. Esta etapa de validación se dio cuando la información ya estaba clavificada y normalizada.
Esta actividad se realizó a través del Sistema de Monitoreo y Reconsulta, en el cual interactuaba personal de oficinas centrales y de las coordinaciones estatales del INEGI. Este sistema fue la principal herramienta para identificar los datos inconsistentes que se presentaron de manera simultánea al operativo de campo.
VALIDACIÓN. Este proceso comprendió el conjunto de actividades que permitió identificar en la información captada, los datos que cumplían con los requisitos de completes, integridad y congruencia lógica y aritmética al interior del cuestionario, así como identificar aquellos que no cumplían estas características, con el propósito de aplicar una solución electrónica o manual bajo criterios específicos que aseguraran la eliminación de inconsistencias sin afectar los datos válidos originales. Para la ENA 2017 se desarrolló un Sistema de Validación Automatizada, el cual tuvo como objetivo analizar exhaustivamente la información captada a través de los instrumentos de captación de información, asegurando la adecuada relación lógica y aritmética de las variables dentro de cada cuestionario. El sistema estuvo diseñado con poco más de 200 criterios de validación por tipo de cuestionario, conformados por uno o más elementos y/o condicionantes previamente definidos, mediante los cuales fue posible detectar y corregir posibles inconsistencias en la información. Esto permitió solucionar algunos casos electrónicamente, o bien, mostrar a través de un reporte aquellos casos a los que no fue posible aplicar este tipo de solución, con el propósito de corregirlos manualmente. De manera similar a otros proyectos de generación de estadísticas se estableció que para la validación automatizada de la información se utilizara el método de 'vectores teóricos', en el cual se definieron previamente funciones en donde a sus variables dependientes se les asignaron valores de acuerdo a las preguntas y respuestas de cada capítulo del cuestionario. A partir de éstos valores las funciones proporcionaron un conjunto de 'imágenes' que correspondían a todas las combinaciones posibles de respuestas a las preguntas objeto de estudio, cada imagen identificó una y sólo una combinación. Posterior a ello, cada imagen fue sometida a una metodología de análisis y corrección para las inconsistencias que se pudieran presentar, de tal forma que los registros que no cumplían con los criterios establecidos serían en algunos casos corregidos automáticamente y en otros diagnosticados para su depuración manual.
ANÁLISIS DE INFORMACIÓN AGRUPADA. Para asegurar la calidad de la información agrupada se realizó el análisis de la información entre cuestionarios, el cual consistió en detectar y analizar potenciales inconsistencias o atipicidades en la información dentro de las distintas agregaciones de las unidades económicas agropecuarias con características económico-geográficas homogéneas. Las agrupaciones se realizaron por tipo de actividad principal, por tamaño de unidad de producción, por tipo de cultivo y por especie ganadera, entre otras. Para este análisis se identificaron previamente las variables susceptibles a obtener valores atípicos. Para la detección de éstos se utilizó el análisis univariado y multivariado. Para el análisis univariado se definieron estadísticamente los intervalos entre los cuales los datos de estas variables podrían fluctuar sin salirse del comportamiento promedio de los demás. Los intervalos sirvieron para detectar todas aquellas unidades de producción que registraron datos atípicos al salirse de la fluctuación acotada, es decir, todos aquellos datos cuya dimensión fue superior o inferior a lo que registra el comportamiento promedio predeterminado de los demás. Por otro lado, para el análisis multivariado, se definieron las variables que estuvieran correlacionadas y fueran dependientes entre sí; en función de ello, se detectaron las unidades de producción con atipicidades en el comportamiento agrupado de dichas variables. Los casos detectados se analizaron y, en caso necesario, se dio solución.
COMPROBACIÓN CON FUENTES INTERNAS Y EXTERNAS. Esta actividad tuvo el propósito de garantizar la calidad de los datos captados por la ENA 2017, al confrontar la información captada con la generada por otras fuentes, tanto internas como de instituciones relacionadas con el Sector Agropecuario.
Las fuentes de consulta empleadas fueron las siguientes:
Fuentes Internas: información de Censos y Encuestas Agropecuarias 2012 y 2014.
Fuentes Externas: información del SIAP-SAGARPA, SEMARNAT, CONAGUA, RAN, etc.
Organización y preparación
La estructura organizacional del INEGI está orientada al desarrollo de la normatividad a nivel central y delegar la ejecución de los programas estadísticos en los ámbitos regionales y estatales.
Como parte del universo de productores que fueron seleccionados para la ENA 2017, se definió un grupo de los mismos, que, por su aportación al sector agropecuario en relación al valor de producción, se consideran como Gran Productor y por lo tanto requirieron de un tratamiento especial para la captación de su información, en este sentido, para el levantamiento de información, se contemplan procedimientos operativos diferenciados, en función de la relevancia del productor.
Para los que no se consideraron como Gran Productor, el levantamiento de la información se realizó con una estructura operativa integrada por Entrevistadores (ENT) y Jefes de Entrevistadores (JENT); Mientras que, para los productores seleccionados como Gran Productor, la captación de su información se realizó a través de la figura operativa denominada Entrevistador de Grandes Productores (EGP) y con apoyo del JENT.
Para ambos casos, la planeación constituye un proceso básico, ya que permitió calcular la plantilla de personal operativo y de control necesaria para el levantamiento de la información; así como definir y distribuir equitativamente las cargas de trabajo mediante la conformación de áreas geográficas de responsabilidad, de esta manera se determinó los recursos materiales necesarios y para efectos de establecer una adecuada organización del trabajo y optimizar el control del operativo de campo.
La planeación general del operativo de campo se basó en el cálculo de recursos humanos necesarios para satisfacer las necesidades de la Encuesta, la planeación operativa se definió en función del tamaño de la muestra y la dispersión de las localidades donde se ubicaba el domicilio de los Productores, accesibilidad, tiempo promedio de identificación, total de terrenos y conformación de la Unidad de Producción; además se consideran otras variables como el número de días del operativo de campo y el promedio de cuestionarios por día que aplicaría el Entrevistador; con estos elementos se definieron las cargas y áreas de trabajo, lo que determinó la cantidad de Entrevistadores, Responsables de Unidades de Producción Especiales, Jefes de Entrevistadores y demás figuras asociadas en los tramos de control requeridos por la encuesta.
En la primera fase de planeación, se señaló el universo de localidades objeto de levantamiento y se describen los factores y criterios considerados en el sistema de planeación para realización del cálculo de la fracción de Entrevistador y Jefe de Entrevistadores requerido por localidad.
En la segunda fase de planeación se detallaron los criterios y lineamientos para la conformación de las Áreas de Entrevistadores y Jefaturas de Entrevistadores que se describieron en los reportes generados por sistema para la asignación de cargas de trabajo de estas figuras.
Adicionalmente se especificó el procedimiento para conformar las áreas de Entrevistadores en localidades compartidas, por presentar estas un requerimiento mayor a un Entrevistador; finalmente se señalaron los criterios para la integración y asignación de los productos resultantes de la planeación.
Para este evento se contrató personal de manera eventual, la capacitación fue presencial, instructores de Oficinas Centrales capacitaron al personal responsable de impartir en las Coordinaciones Estatales, la capacitación masiva mediante el uso de manuales e instructivos en formato digital para todas las figuras operativas involucradas, utilizando el DEM (Dispositivo Electrónico Móvil) con cargas de trabajo para practicar la rutina operativa, el módulo cartográfico y el llenado del cuestionario electrónico
Adicionalmente se realizó una sesión de reforzamiento en campo, con el propósito de retroalimentar al personal respecto a posibles inconsistencias. La sesión consistió en la aplicación de la rutina operativa, actualización o alta de terrenos mediante el módulo cartográfico o por medio de material cartográfico impreso y la aplicación del cuestionario.
Por último, se elaboraron reportes de avance, generados con información resguardada en el DEM y transferida al Sistema de Administración de Control y Seguimiento de los Procesos Operativos (SACSPO) vía Web, con el propósito de mantener el control sobre el grado de avance de las actividades desarrolladas en cada área de responsabilidad en las entidades y de acuerdo a ello, trazar las medidas pertinentes en aquellos casos en que se consideraron necesarios.
La estructura de organización de la ENA 2017 se definió, en función de las cargas de trabajo, de la forma siguiente:
Jefe de Control Agropecuario (JC)
Intervenir en las diferentes etapas que integran los censos o encuestas en el ámbito de las coordinaciones estatales, con la finalidad de monitorear las actividades de la estructura operativa, para detectar y documentar los problemas o situaciones que se presentaron en los informes operativos; responsable de llevar los controles necesarios en donde concentró la información de campo, mismos que permitieron resolver situaciones o rectificar datos de campo, e investigar la información necesaria durante el evento censal.
Analista de Información Agropecuario(AI)
Responsable de atender las actividades de revisión y análisis de la información captada a través de censos y encuestas mediante la identificación de datos inconsistentes y generación de propuestas de solución resultantes de reconsultas en campo o investigaciones sustentadas en gabinete, con el propósito de producir información con los mejores estándares de calidad.
Jefe de Entrevistador Agropecuario (JENT)
Cooperar en la supervisión y seguimiento de los entrevistadores asignados a su área de responsabilidad; responsable de vigilar la realización de actividades en apego a la planeación, estrategia y procedimientos operativos definidos durante las diferentes etapas de los censos y encuestas agropecuarias.
Entrevistador de Grandes Productores Agropecuarios (EGP)
Responsable de captar la información de los productores agropecuarios económicamente más representativos a nivel nacional con base en la planeación, estrategia y procedimientos operativos definidos para la generación de estadísticas de censos y encuestas agropecuarias.
Entrevistador Agropecuario (ENT)
Encargado de captar mediante una entrevista directa, la información de las unidades de observación asignadas en su área de responsabilidad, con base en la planeación y la estrategia estipulada en el manual de procedimientos operativos del entrevistador agropecuario para la generación de información de los censos y encuestas agropecuarias.
Técnico Informático Agropecuario (TI)
Responsable de cargar los equipos con los insumos y el Sistema de Captación de Información de Productores Agropecuarios; proporciona asesoría y apoyo en problemas con el uso y manejo del Dispositivo Electrónico Móvil; impresión de reportes de control de avance y cobertura de la página Web; asesora y apoya para el envío de la información del DEM a través de la Web.
Técnico en Cartografía (TCAR)
Asesor y apoyo en la interpretación de material cartográfico impreso y digita para la identificación de terrenos, se relaciona con otras figuras que participaron como supervisores durante la encuesta, para verificar y evaluar el cumplimiento de los objetivos planteados en el operativo.