Procedimiento de muestreo
Diseño estadístico de la muestra
La introducción de un muestreo probabilístico en el INPC responde a la Resolución de la Organización Internacional del Trabajo de 2003 que señala, para la construcción de los Índices de Precios al Consumidor: "Las técnicas de muestreo probabilístico son los métodos preferidos, en principio, debido a que permiten una inferencia estadística sólida y un control sobre la representatividad del muestreo. Además, permiten estimar la varianza del muestreo (errores).
Por su parte, el Manual del índice de precios al consumidor: Teoría y Práctica recomienda: La teoría moderna del muestreo estadístico se centra en el muestreo probabilístico, cuya utilización también se recomienda y se considera práctica estándar para todo tipo de encuestas estadísticas, entre ellas las encuestas económicas.
El esquema de muestreo consideró un muestreo probabilístico para 248 genéricos de la canasta y un muestreo no probabilístico para los 51 genéricos restantes; se aplicó para la selección de unidades económicas o puntos de venta donde se realizan las cotizaciones de precios. En el caso de los genéricos con muestreo probabilístico, se utilizó este tipo de muestreo porque son muchos y diversos los establecimientos donde se ofertan estos productos y también para eliminar la selección a juicio de dichos establecimientos. Además, porque era factible construir un marco de muestreo de unidades económicas razonable para estos genéricos a partir de los Censos Económicos 2014, pues guardan correspondencia con la actividad económica del establecimiento, es decir, que podían asociarse a través del Clasificador SCIAN. La información de los Censos Económicos 2014 fue actualizada a 2017 con el Registro Estadístico de Negocios de México (RENEM).
El muestreo no probabilístico se continúa considerando en los 51 genéricos restantes de la canasta debido a que, en éstos, la variación de los precios de los productos y servicios tiene una dinámica particular, ya sea porque sus tarifas son autorizadas o reguladas por el gobierno, o porque solo existe uno o pocos oferentes de los servicios, por lo que no se requiere del uso de un muestreo probabilístico. Tal es el caso de la Electricidad, los Servicios de telefonía móvil, Derechos por el suministro de agua, Cuotas de autopistas, entre otros. El muestreo en estos genéricos es a juicio y en algunos de cobertura completa, como es el caso del Metro y la Expedición de documentos del sector público, donde prácticamente se censa a los proveedores del servicio.
Muestreo probabilístico de 248 genéricos
El diseño muestral de los 248 genéricos probabilísticos se basa en el principio fundamental de la estadística inferencial, el cual posibilita seleccionar una muestra de unidades económicas con una probabilidad conocida y distinta de cero, para generalizar los resultados de la muestra a la población objeto de estudio. Se consideró la selección de una muestra de unidades económicas ante la imposibilidad de poder contar con un marco muestral completo de productos.
Lo anterior se fundamenta también en el hecho de que es imposible cotizar la totalidad de los precios de los bienes o servicios que se comercializan en el país a través de todos y cada uno de los establecimientos donde se ofertan. Se consideró para los 248 genéricos debido a la correspondencia que se tiene entre el genérico y la unidad económica de acuerdo al Clasificador SCIAN.
- Población objetivo
Está definida por las unidades económicas de las 55 áreas geográficas donde es posible cotizar el precio de al menos uno de los 248 genéricos de la canasta de bienes y servicios del INPC. Dentro de cada unidad económica se selecciona a juicio del informante, la especificación más vendida del genérico. De manera que cada unidad económica tiene un precio por genérico o subgenérico cotizado al que se le denomina especificación.
Para identificar las unidades económicas donde es posible cotizar el precio de al menos un genérico se utilizó la información obtenida de la ENGASTO, la cual permitió determinar los principales lugares de compra de cada genérico y obtener las clases de actividad SCIAN de dichos lugares. Lo anterior dio por resultado la identificación de un total de 169 clases de actividad SCIAN (ver Anexo K Genéricos por Clases de Actividad SCIAN).
- Variable de análisis
La variable de estudio para la cual se realizan las estimaciones es el Índice nacional de precios por genérico. Por tratarse de un Índice de Laspeyres, el estimador corresponde a una media aritmética ponderada de los índices de precios de las áreas geográficas de ese genérico, que a su vez se calculan con media geométrica conforme se describe en el apartado 8.1.1 Índice elemental probabilístico.
- Marco de muestreo
La unidad de muestreo es la unidad económica o establecimiento donde es posible cotizar el precio de al menos un genérico, representado por una especificación de la canasta de bienes y servicios. Al no contar con un marco de productos, se consideró un marco de unidades económicas como una aproximación de aquél, por la relación que existe entre la actividad económica de la unidad y los principales productos o servicios que oferta. La selección de la especificación a cotizar al interior de la unidad económica es a juicio del informante bajo el criterio de mayor venta.
El marco de muestreo para cada genérico se integró con aquellas unidades económicas provenientes del Censo Económico 2014, donde es posible cotizar una especificación del genérico, cuya actividad principal pertenece a alguna de las 169 clases de actividad SCIAN 2013 (ver Anexo K Genéricos por Clases de Actividad SCIAN), agrupadas en 74 ramas.
De esta manera, se cuenta con 2 391 194 unidades económicas o establecimientos dentro de las 55 áreas geográficas, en las cuales se puede cotizar por lo menos uno de los genéricos. Estas unidades representan la unión de los 248 marcos correspondientes a cada uno de los genéricos probabilísticos. A cada unidad económica en marco se le asignaron los genéricos según su clase de actividad.
- Estratificación
Como estratos se definieron grupos de unidades económicas relativamente homogéneos del marco de muestreo, con base en tres criterios; el primero, respecto a su ubicación geográfica; el segundo, al tipo de mercado y, por último, de acuerdo al tamaño de la unidad económica respecto a sus ingresos por ventas, siguiendo la estructura de agregación del Índice.
Como resultado, cada genérico tiene 55 estratos de área geográfica, por lo que en total se tienen 13,640 estratos de genérico - área geográfica, de los cuales 9,552 cuentan con dos estratos por tipo de mercado, para un total de 23,192 estratos de tipo de mercado. A su vez, dentro de estos estratos se tiene una sub estratificación por tamaño de la unidad económica según sus ingresos; en total, 2,628 estratos de tipo de mercado tienen sub estrato de ingresos, para un total de 25,820 estratos.
- Esquema de muestreo
El diseño de muestreo es probabilístico estratificado con selección aleatoria simple dentro de cada estrato o sub estrato. Dado que las unidades de muestreo tienen una probabilidad conocida y distinta de cero de entrar en la muestra, los resultados de la muestra se generalizan a toda la población objetivo, y es posible conocer la precisión de los resultados.
- Tamaño y distribución de la muestra
a) Tamaño de muestra de acuerdo al diseño
El tamaño de muestra se calculó para estimar el Índice nacional por genérico, el cual se agrega con una media aritmética ponderada de los índices elementales, usando cada uno de los 46 estratos como se establece en el Manual del índice de precios al consumidor: Teoría y Práctica. La información utilizada fueron los índices que se tenían en la canasta de los 283 genéricos en las 46 ciudades que anteriormente consideraba el INPC (base segunda quincena de diciembre de 2010).
El tamaño de la muestra por genérico se determinó a partir del cálculo de las varianzas de los índices del genérico dentro de las 46 ciudades, considerando las 96 quincenas de 2012 a 2015. Dado que el Índice nacional de cada genérico se obtiene mediante un promedio ponderado, el tamaño de muestra del genérico, para un nivel de confianza del 95% y un error relativo diferenciado por genérico.
b) Ajustes adicionales por aspectos operativos y de cálculo
Los tamaños de muestra derivados del diseño antes descrito, se ajustaron a partir de los requerimientos operativos de campo. El proceso de distribución del tamaño de muestra total, considerando los aspectos operativos y de cálculo, partió de obtener un tamaño de muestra mínimo dentro de cada estrato o sub estrato con base en su ponderación de gasto, con el objetivo de que una especificación en el índice elemental no tuviera un aporte superior al 33.33%
Distribución por Área Geográfica
La información de la ENGASTO es el principal insumo para el cálculo de la estructura de ponderación de los índices nacionales por genérico. Esta ponderación se denota como "Wlk" y corresponde a la proporción de gasto del "k-ésimo" genérico en la "l-ésima" área geográfica del periodo base del Índice.
El tamaño de muestra del genérico a nivel nacional se distribuyó en cada estrato de área geográfica de manera proporcional al porcentaje de gasto que realizan los hogares dentro de cada área según la ENGASTO.
Distribución por Tipo mercado
De forma similar, el tamaño de muestra a nivel área geográfica - genérico - tipo de mercado (Moderno o Tradicional) se distribuyó de manera proporcional al ponderador de gasto de los hogares por tipo de mercado dentro de cada área geográfica
Distribución por Sub estrato de ingresos
Una vez obtenido el tamaño de muestra a nivel área geográfica - genérico - tipo de mercado se distribuyó en cada sub estrato de ingreso, de manera proporcional al total de ingresos de las unidades económica.
Selección de la muestra
La selección de la muestra se realizó de manera aleatoria e independiente dentro de cada estrato de ingreso según la distribución. Aunque un mismo establecimiento puede ser incluido más de una vez en la muestra por expender más de un genérico, las probabilidades de selección son diferentes de acuerdo al genérico por el cual fue seleccionado, ya que se tuvieron 248 marcos independientes. La muestra probabilística quedó integrada por 21,161 unidades económicas, las cuales pueden captar uno o más genéricos probabilísticos. A nivel de especificación, el tamaño de muestra para los 248 genéricos probabilísticos es de 97,773 especificaciones
Estimaciones
La estimación del INPC se desarrolla en dos etapas principales. En la primera, se calculan los índices de precios elementales. En la segunda etapa, los índices elementales se agrupan o promedian utilizando los datos de gasto como ponderaciones para obtener índices más elaborados o de mayor nivel de agrupación, hasta llegar al INPC (nivel general). Los agregados elementales y sus índices de precios son los componentes básicos del INPC. Los agregados elementales son grupos de bienes y servicios relativamente homogéneos (especificaciones), y son el nivel más bajo para el que existe información del gasto
Muestreo no probabilístico en unidades económicas y vivienda
En el muestreo no probabilístico los resultados son válidos exclusivamente para el conjunto de elementos de la muestra. En este esquema se consideraron los genéricos cuyas tarifas son autorizadas o reguladas por el gobierno, solo existe uno o pocos oferentes de los servicios, no se cuenta con un marco de muestreo u otros genéricos cuyo precio es muy semejante, por lo que no es necesario hacer un muestreo probabilístico.
En estos genéricos, la selección de fuentes de información para la cotización de los productos específicos se realiza de forma dirigida o a juicio, esto es, cada una de las y los investigadores de precios, dependiendo del genérico, se dirige a la fuente de información única que proporciona el bien o servicio para cotizar el precio, o bien, propone el establecimiento o vivienda en la que se realizarán las cotizaciones, a partir de criterios previamente establecidos en oficinas centrales.
El muestreo dirigido se aplicó en 51 genéricos:
· Tres genéricos relacionados con la Vivienda (Renta de Vivienda, Vivienda Propia y Servicio Doméstico) por que no se cotizan en unidades económicas, sino que se visitan las viviendas;
· Tarifas que son autorizadas por el gobierno, como la expedición de documentos públicos, derechos por el suministro de agua, metro, cuotas de autopistas, transporte público, etc.; los cuales tienen una sola fuente de información para las cotizaciones o éstas no se realizan en un establecimiento específico;
· Genéricos con tratamientos especiales o subsistemas. Son los genéricos en los que es necesario emplear un modelo o tratamiento especial (Telefonía móvil, Electricidad, entre otros) para la compilación y cálculo de sus índices de precios. Lo anterior, derivado de la complejidad y particularidad de los bienes o servicios.
A continuación, se resume el procedimiento aplicado para la selección de la muestra de fuentes de cotización de los genéricos con diseño no probabilístico más importantes.
· Renta de vivienda y Vivienda Propia
Se considera un muestreo a juicio, estratificado de acuerdo al nivel de renta por ciudad, en función de su tamaño: bajo, medio y alto. El tamaño de la muestra total es de 5,678 viviendas para las 55 áreas geográficas y su distribución por área depende del tamaño de la misma. La selección de las viviendas a cotizar se realiza a criterio del Investigador de precios en coordinación con el Supervisor, cuidando siempre que la muestra no esté concentrada en ciertas zonas. Para esto se hace uso de un mapa de la ciudad en el que se ubican las viviendas seleccionadas, buscando que la muestra esté distribuida en toda la ciudad.
· Derechos por suministro de agua
Se aplica un muestreo dirigido ya que las tarifas de suministro de agua son establecidas por el gobierno. El Ayuntamiento de cada ciudad determina las tarifas de suministro de agua, por lo que no procede aplicar un diseño muestral probabilístico.
· Electricidad
Al ser la Comisión Federal de Electricidad (CFE) el único comercializador del servicio de electricidad residencial, se construye un modelo que refleja las diferentes tarifas según la región del país y/o área geográfica, rangos de consumo en kilo watt hora, y la temporada del año. Se cotizan las diferentes tarifas por área geográfica en el portal de la CFE, las cuales se definen previamente con información proporcionada directamente por la Comisión.
· Automóviles
La cotización de este genérico se realiza en agencias de automóviles con base en una muestra dirigida, obtenida con información de las ventas de autos que proporciona la Asociación Mexicana de la Industria Automotriz. Cada investigador de precios, en coordinación con su Supervisor, selecciona la agencia de acuerdo al modelo de auto buscado. En caso de contar con varias opciones de agencias, se elige la más representativa en función de sus ventas.
· Mantenimiento de automóvil y Reparación de automóvil
Se utiliza un muestreo a juicio del investigador de precios por tratarse de dos genéricos de difícil cotización, ya que los servicios considerados como variedades para estos genéricos están dirigidos a particulares. Como el Censo Económico no separa estos tipos de servicio para particulares o flotilla, aunado a que los establecimientos que brindan este tipo de servicios a particulares son más propensos a desaparecer o cambiar de giro comercial, no es fácil identificarlos a través del Censo, por lo que es más factible identificar los establecimientos representativos en la ciudad a través de la experiencia de los investigadores de precios en coordinación con su Supervisor.
· Cuotas de Autopista
Los oferentes de estos servicios son únicos, por lo que no es necesario hacer una selección de puntos de venta. La recolección de precios se hace de forma centralizada, mediante los portales de internet. Se cotizan las rutas entre las ciudades del INPC en el portal de Caminos y Puentes Federales de Ingresos y Servicios Conexos (CAPUFE) con la aplicación Traza tu ruta.
· Metro o transporte eléctrico
Los precios del Metro o transporte eléctrico son tarifas establecidas por el gobierno para las áreas geográficas que cuentan con este genérico: CDMX, Guadalajara y Monterrey. Por consiguiente, la fuente de información es única, y por tanto no se requiere utilizar un muestreo probabilístico.
· Taxi
El marco muestral no considera unidades que presten este tipo de servicio. El muestreo se realiza con base en la experiencia de campo de los investigadores de precios, que conocen cuáles son los sitios de taxi más representativos, así como sus tarifas, cuidando siempre que la muestra no esté concentrada.
· Transporte aéreo
En el caso de Transporte aéreo se realizó un análisis de los principales vuelos por origen-destino, con información proveniente del "Compendio Estadístico del Turismo en México". De esta forma se determinaron los destinos a cotizar, la participación de cada aerolínea y las fuentes de información representativas, por lo que no fue necesario que se incluyera en el muestreo probabilístico.
· Paquetes de internet, telefonía y televisión de paga, 236 Servicio de internet y 238 Servicios de telefonía fija
Con información del Instituto Federal de Telecomunicaciones se seleccionan las compañías más importantes que ofrecen este tipo de servicios y que tienen cobertura a nivel nacional o regional. Esta muestra se modifica en función de la oferta disponible y se seleccionan los servicios que mejor representen las preferencias de los consumidores.
· Servicios de telefonía móvil
Se incluyen las compañías más importantes del mercado (Telcel, AT&T y Movistar) que ofrecen el servicio de telefonía móvil, las cuales tienen constantes modificaciones en cuanto a sus precios y oferta de paquetes. Por este motivo, se crea un modelo hedónico para capturar las variaciones de precios. El modelo considera los siguientes servicios: los números gratis; números con tarifa preferente; tarifas on net, off net y preferente; planes; servicios adquiridos (voz, SMS y datos). La muestra se modifica en función de la oferta disponible de los planes tanto en prepago y postpago, seleccionando los planes que mejor representen las preferencias de los consumidores.
· Barbacoa o birria y Carnitas
La barbacoa o birria y las carnitas se venden en infinidad de establecimientos de manera que si se consideraran dentro del muestreo probabilístico se tendría que incluir un gran número de clases de actividad del Censo Económico, sin que necesariamente fueran representativas de la venta de estos productos. Derivado de lo anterior, se continúa con el muestreo a juicio a través de la experiencia de los investigadores de precios en coordinación con el Supervisor.
· Expedición de documentos del sector público
Se trata de tarifas asignadas por el gobierno, generalmente, en cada entidad. Los precios son los mismos, por lo que la fuente de información es única.