Procedimiento de muestreo
Diseño de la muestra
El diseño muestral se caracteriza por ser determinístico para 45 ramas de actividad con una cobertura en ingresos específica y probabilístico para las 12 restantes.
Marco de la encuesta
El marco de muestreo se conformó por las 57 ramas de actividad según el SCIAN 2002, que en conjunto aportaron un poco más del 66% del valor de los ingresos totales en el sector de servicios privados no financieros.
El marco se integró con base en los directorios de los resultados preliminares de los Censos Económicos 2009 y actualizado al mes de enero de 2010. Se adicionaron 450 altas de unidades económicas no identificadas en el directorio. De esta manera el marco de los Servicios Privados no financieros quedó integrado por 1 411 861 unidades económicas. Las unidades económicas de los resultados preliminares de los Censos Económicos 2009 se clasificaron de acuerdo al Sistema de Clasificación Industrial de América del Norte (SCIAN 2007), sin embargo, para poder comparar con el clasificador anterior, la distribución del marco se hizo manteniendo la clasificación SCIAN 2002.
Unidad de muestreo
La empresa y el establecimiento son las unidades de muestreo empleadas en esta encuesta. La empresa aplica a aquellas unidades económicas que realizan la prestación de servicios de mensajería, paquetería, almacenamiento, telefonía y del servicio público de transporte. El establecimiento es la unidad económica que aplica al resto de actividades de la prestación de los servicios.
Estratificación
Únicamente se estratificaron las ramas de actividad cuyo diseño es probabilístico. De acuerdo a las características de estas actividades económicas, el diseño es univariado para 10 ramas y bivariado para las 2 restantes. El número de estratos y la estratificación óptima se obtuvo aplicando el método de Dalenius-Hodges.
Esquema de muestreo
En virtud de las características muy particulares de cada rama de actividad, se tomaron diferentes criterios para la definición del esquema de muestreo formando cuatro grupos, a tres de ellos se aplicó un diseño determinístico y al restante un diseño probabilístico.
Diseño determinístico
Se seleccionaron tantas unidades económicas como fuera necesario hasta alcanzar la cobertura establecida para cada rama de actividad económica. El procedimiento empleado para cada rama de actividad fue el siguiente:
a) Se incluyeron en la muestra las unidades económicas activas en la muestra de diseño 2009; es decir, que en la encuesta estuvieran proporcionando la información solicitada de manera continua.
b) Se agregaron al diseño las unidades económicas cuyo personal ocupado fuera mayor a 500 personas ocupadas y cuyos ingresos fueran mayores a 100 000 miles de pesos. Además se incorporaron a la muestra tantas unidades económicas hasta alcanzar la cobertura establecida.
Considerando que existen características específicas en cada rama de actividad económica, se definieron tres criterios de clasificación según el tipo de cobertura en los ingresos establecida:
Grupo1. Cobertura total.
Se consideró como cobertura total a las ramas de actividad económica donde la totalidad de las unidades que las conforman se integraron en la muestra. Las ramas de actividad pertenecientes a este grupo son: 4821 Transporte por ferrocarril y la 4831 Transporte marítimo.
Grupo 2. Cobertura media.
Corresponde a las ramas de actividad económica cuya cobertura en ingresos fue mayor al 79% sin alcanzar la cobertura total. Las ramas con esta cobertura se indican a continuación:
4811 Transporte aéreo regular
4812 Transporte aéreo no regular,
4852 Transporte de pasajeros interurbano y rural
4921 Servicios de mensajería y paquetería foránea
4922 Servicios de mensajería y paquetería local
4931 Servicios de almacenamiento
5111 Edición de periódicos, revistas, libros y similares, excepto a través de Internet
5151 Transmisión de programas de radio y televisión, excepto a través de Internet
5152 Producción de programación de canales para sistemas de televisión por cable o satelitales, excepto a través de Internet
5161Creación y difusión de contenido exclusivamente a través de Internet
5171 Telefonía tradicional, telegrafía y otras telecomunicaciones alámbricas
5172 Telefonía celular y otras telecomunicaciones inalámbricas, excepto los servicios de satélite
5175 Distribución por suscripción de programas de televisión, excepto a través de Internet
5182 Procesamiento electrónico de información, hospedaje de páginas Web y otros servicios relacionados
6221 Hospitales generales
7211 Hoteles, moteles y similares
7212 Campamentos y albergues recreativos
Grupo 3. Cobertura media-baja.
Lo comprenden las ramas de actividad cuya participación en ingresos fue mayor o igual al 60% y menor al 79%. Las ramas con esta cobertura se indican a continuación:
5417 Servicios de investigación científica y desarrollo
5612 Servicios combinados de apoyo en instalaciones
5122 Industria del sonido
6115 Escuelas de oficios
6113 Escuelas de educación superior
4885 Servicios de intermediación para el transporte de carga
5181 Proveedores de acceso a Internet y servicios de búsqueda en la red
5613 Servicios de empleo
6223 Hospitales de otras especialidades médicas
5413 Servicios de arquitectura, ingeniería y actividades relacionadas
4832 Transporte por aguas interiores
5615 Agencias de viajes y servicios de reservaciones
7223 Servicios de preparación de alimentos por encargo
6112 Escuelas de educación postbachillerato no universitaria
5611 Servicios de administración de negocios
5617 Servicios de limpieza
5616 Servicios de investigación, protección y seguridad
5416 Servicios de consultoría administrativa, científica y técnica
5418 Servicios de publicidad y actividades relacionadas
5415 Servicios de consultoría en computación
5324 Alquiler de maquinaria y equipo industrial, comercial y de servicios
7131 Parques con instalaciones recreativas y casas de juegos electrónicos
5121 Industria fílmica y del video
6114 Escuelas comerciales, de computación y de capacitación para ejecutivos
5312 Inmobiliarias y corredores de bienes raíces
5511 Dirección de corporativos y empresas
Diseño probabilístico
Grupo 4. Ramas con esquema de diseño probabilístico.
El esquema de muestreo empleado fue probabilístico y estratificado, para 10 ramas fue univariado y para 2 bivariado; la selección de cada unidad de muestreo fue independiente por estrato y para cada una de las ramas de actividad pertenecientes a esta clasificación. La estratificación univariada se efectuó a la variable económica ingresos totales y aplicó para las ramas de actividad:
4841 Autotransporte de carga general
4842 Autotransporte de carga especializado
5321 Alquiler de automóviles, camiones y otros transportes terrestres
5419 Otros servicios profesionales, científicos y técnicos
6111 Escuelas de educación básica, media y especial
6116 Otros servicios educativos
7221 Restaurantes con servicio de meseros
7222 Restaurantes de autoservicio y de comida para llevar
7224 Centros nocturnos, bares, cantinas y similares
8131 Asociaciones y organizaciones comerciales, laborales profesionales y recreativas
La estratificación bivariada se realizó con base en las variables de personal ocupado total e ingresos totales, determinándose el primer componente principal, como la variable estadística resultante de la combinación lineal entre las variables de interés. Esta estratificación aplicó a las siguientes ramas económicas:
5414 Diseño especializado
7213 Pensiones y casas de huéspedes, y departamentos y casas amuebladas con servicios de hotelería
En caso de tener que agregarse un nuevo registro a la muestra y éste no sea parte del marco de diseño de alguna de estas ramas de actividad, debe de encontrarse el valor que le corresponde del componente principal para ubicarlo en el estrato correspondiente. La estimación de ese valor se obtiene aplicando el modelo de regresión lineal múltiple.
Tamaño de Muestra
El tamaño de muestra necesario para alcanzar las coberturas deseadas por grupo es el que se desglosa a continuación:
Grupo 1 (determinístico)...........23
Grupo 2 (determinístico)......1 508
Grupo 3 (determinístico)......3 611
Grupo 4 (probabilístico).......2 702
TOTAL muestra...................7 844
El tamaño de muestra para las ramas con diseño determinístico fue obtenido al acumular tantas unidades económicas hasta alcanzar la cobertura establecida.
Para el diseño probabilístico, el cálculo del tamaño de muestra se obtuvo de manera independiente para cada rama de actividad económica, mediante la expresión para estimar un total, con un nivel de confianza de 95% y una Tasa de No Respuesta esperada de 15%.
Afijación de la muestra
Para cada rama de actividad con diseño probabilístico, la muestra en cada estrato se asignó por el método de Neyman de acuerdo a la ponderación de ingresos totales por estrato.
Selección de la muestra
Las unidades económicas con diseño determinístico se seleccionaron de acuerdo a su contribución en ingresos en la rama de actividad.
Las unidades económicas con diseño probabilístico se seleccionaron de manera aleatoria, sin reemplazo e independiente para cada estrato.
Cálculo de los factores de expansión
El factor de expansión del h-ésimo estrato de la r-ésima rama de actividad es el inverso de la probabilidad de seleccionar una unidad económica del h-ésimo estrato de la r-ésima rama de actividad.
Para conocer mayor detalle acerca de las ecuaciones referentes al cálculo de los factores de expansión, su ajuste por la No Respuesta así como los Estimadores, ver el documento Encuestas de Servicios y Transportes 2010 (diseño muestral) en los recursos externos.