Procedimiento de muestreo
1.Objetivo de la encuesta
Obtener información estadística de la población de 18 años y más que tienen el hábito de la lectura según tipo de material.
2. Población objetivo
La población objetivo son las personas de 18 años y más que residen permanentemente en viviendas particulares dentro del territorio nacional.
3. Cobertura geográfica
El MOLEC permite generar estimaciones para el agregado de las 32 principales áreas urbanas, considerando una ciudad por cada entidad federativa.
4. Marco de la encuesta
El diseño de la muestra del MOLEC se caracteriza por ser probabilístico, en consecuencia, los resultados obtenidos de la encuesta se generalizan a toda la población. A su vez el diseño es trietápico, estratificado y por conglomerados, donde la unidad última de selección es la persona.
El marco de muestreo que se empleó es el Marco Nacional de Viviendas 2012 del INEGI, construido a partir de la información cartográfica y demográfica que se obtuvo del Censo de Población y Vivienda 2010. Este marco es una muestra maestra a partir de la cual se seleccionan las muestras para todas las encuestas en viviendas que realiza el INEGI; como tal, su diseño es probabilístico, estratificado, unietápico y por conglomerados a los que se denominó unidades primarias de muestreo, pues es en ellos donde se seleccionan en una segunda etapa las viviendas que integran las muestras de las diferentes encuestas.
4.1. Unidad primaria de muestreo (UPM)
Las unidades primarias de muestreo (UPM) son agrupaciones de manzanas o localidades, que constituyen la muestra maestra y que se seleccionan en la primera etapa de muestreo de las encuestas en viviendas. Las UPM del MOLEC se seleccionaron de la muestra ENOE.
4.2. Estratificación
La estratificación es el proceso por el cual se le asigna a cada UPM, el estrato socioeconómico que le corresponde. La clasificación de los estratos se realiza a partir de las características socioeconómicas de las viviendas ubicadas dentro de las UPM.
Las UPM anteriormente definidas se estratifican en tres estratos: alto, medio y bajo, con base en los 34 indicadores construidos con información del Censo de Población y Vivienda 2010, para lo cual se emplearon métodos estadísticos multivariados.
5.Tamaño de la muestra
El tamaño de muestra de 2,336 viviendas permite estimar proporciones de 16% o más, de la población objeto de estudio, considerando una confianza de 90%, un error relativo máximo esperado de 14.528%, un efecto de diseño de 2.95 y una tasa de No respuesta de 15%. La expresión empleada para el cálculo del tamaño de muestra fue la siguiente:
n=(z^2)qDEFF / [p(r^2)(1-tnr)]
Donde:
n=tamaño de la muestra.
p=estimación de la proporción de interés.
q=(1-p).
z=valor asentado en las tablas estadísticas de la distribución normal estándar que garantiza realizar las estimaciones con una confianza prefijada.
r=error relativo máximo esperado.
tnr=tasa de No respuesta máxima esperada.
DEFF=efecto de diseño definido como el cociente de la varianza en la estimación del diseño utilizado, entre la varianza obtenida considerando un muestreo aleatorio simple para un mismo tamaño de muestra.
Para proporciones mayores se obtendrán errores menores al 14.528% para la misma confianza. Para proporciones menores, los errores serán superiores al 15%.
6. Distribución de la muestra
Con el propósito de tener muestra en todos los estratos antes definidos, la muestra se distribuyó de manera proporcional en los cuatro estratos nacionales, al interior de estos.
La muestra se distribuyó en cuatro dominios: Ciudad de México, Guadalajara y Monterrey y un resto de 29 áreas metropolitanas autorrepresentadas con el fin de garantizar mayores tamaños de muestra en esas áreas. La distribución de la muestra aparece en el siguiente cuadro:
Distribución de la muestra por área urbana y estrato:
Área urbana.........................................Estrato alto...................................Estrato medio............................Estrato bajo.........................Total
Ciudad de México.......................................96..............................................160........................................128................................384
Guadalajara..............................................64...............................................96..........................................96................................256
Monterrey................................................64...............................................96..........................................96................................256
Resto....................................................288.............................................672.........................................480...............................1,440
Total.....................................................512............................................1,024.........................................800............................. 2,336
La muestra se distribuyó de manera proporcional al tamaño de los estratos, por área urbana, en el anexo, se presenta la relación de las ciudades de interés para la encuesta.
7. Selección de la muestra
La selección para el MOLEC es probabilística, trietápico, estratificado y por conglomerados, donde la unidad última de selección es una persona de 18 años y más, al momento de la entrevista.
1. Se seleccionaron nh UPM con probabilidad proporcional al número de viviendas por estrato.
2. En cada UPM, se seleccionaron 4 viviendas con igual probabilidad.
3. Al interior de cada vivienda se seleccionó de manera aleatoria una persona de 18 años y más, que fuera habitante permanente en la vivienda.
8. Estimación de errores de muestreo
Para la evaluación de los errores de muestreo de las principales estimaciones se usó el método de Conglomerados Últimos, basado en que la mayor contribución a la varianza de un estimador, en un diseño polietápico es la que se presenta entre las unidades primarias de muestreo (UPM). El término "Conglomerados Últimos" se utiliza para denotar el total de unidades en muestra de una unidad primaria de muestreo.
9. Homologación de la Semaforización para los Umbrales de Indicadores de precisión estadística
Para facilitar la interpretación de las precisiones estadísticas de la información pública en tabulados, el Comité de Aseguramiento de la Calidad, en la cuarta sesión celebrada el 1 de noviembre de 2018, aprobaron los siguientes umbrales y especificaciones para la publicación en los tabulados los CV, así como su semaforización de estos.
Umbrales aprobados para la cobertura del CV
Interpretación......................................Semaforización....................................Viviendas/Hogares/Otras unidades diferentes a las económicas
Alta..........................................................Blanco....................................................... [0%,15%)
Moderada..................................................Amarillo......................................................[15%,30)
Baja........................................................Naranja oscuro...............................................>=30%
Umbrales aprobados para el reporte de la precisión de acuerdo con el coeficiente de variación en los tabulados de resultados de los proyectos con muestreo probabilístico
(acuerdo CAC-007/01/2018).