Procedimiento de muestreo
Diseño de la muestra
El diseño muestral se caracteriza por ser determinístico para 45 ramas de actividad con una cobertura en ingresos específica y probabilístico para las 12 restantes.
Marco de la encuesta
El marco de muestreo se integró por las 57 ramas de actividad que en conjunto aportaron un poco más del 75% del valor de los ingresos totales en el sector de servicios privados no financieros. Se conformó con base en los directorios de los Censos Económicos 2004 actualizado al mes septiembre de 2008. El proceso de actualización consiste en lo siguiente: a) Incorporación de altas de unidades económicas; b) Reclasificación sectorial de acuerdo con el SCIAN; y por último, c) La depuración de aquellas unidades que al momento de la conformación del marco ya no realizaban actividad económica alguna.
Unidad de muestreo
La empresa y el establecimiento son las unidades de muestreo empleadas en esta encuesta. La empresa aplica a aquellas unidades económicas que realizan la prestación de servicios de mensajería, paquetería, almacenamiento, telefonía y del servicio público de transporte. El establecimiento es la unidad económica que aplica al resto de actividades de la prestación de los servicios.
Estratificación
Únicamente se estratificaron las ramas de actividad cuyo diseño es probabilístico. De acuerdo con las características de estas actividades económicas, el diseño es univariado para 9 ramas y bivariado para las 3 restantes. El número de estratos y la estratificación óptima se obtuvo aplicando el método de Dalenius-Hodges.
Esquema de muestreo
En virtud de las características muy particulares de cada rama de actividad, se tomaron diferentes criterios para la definición del esquema de muestreo formando cuatro grupos, a tres de ellos se aplicó un diseño determinístico y al restante un diseño probabilístico.
Diseño determinístico
Se seleccionaron tantas unidades económicas como fuera necesario hasta alcanzar la cobertura establecida para cada rama de actividad económica. El procedimiento empleado para cada rama de actividad fue el siguiente:
a) Se incluyeron en la muestra las unidades económicas activas en la muestra de diseño 2008; se verificó que al mes de septiembre continuaran con actividad; es decir, que en la encuesta estuvieran proporcionando la información solicitada de manera continua.
b) Si con las unidades económicas activas del diseño 2008 aún no se alcanzaba la cobertura establecida, se tomaron las unidades económicas necesarias hasta alcanzarla; las unidades seleccionadas fueron las que tenían mayor cantidad de ingresos totales.
Considerando que existen características específicas en cada rama de actividad económica, se definieron tres criterios de clasificación según el tipo de cobertura en los ingresos establecida:
Grupo1. Cobertura total.
Se considera como cobertura total a las ramas de actividad económica donde la totalidad de las unidades que las conforman se integraron en la muestra. Las ramas de actividad pertenecientes a este grupo son: 4821 Transporte por ferrocarril; 4831 Transporte marítimo y 5161 Creación y difusión de contenido exclusivamente a través de Internet.
Grupo 2. Cobertura media.
Corresponde a las ramas de actividad económica cuya cobertura en ingresos fue mayor al 79% sin alcanzar la cobertura total. Las ramas con esta cobertura se indican a continuación:
4811 Transporte aéreo regular
4812 Transporte aéreo no regular
4832 Transporte por aguas interiores
4921 Servicios de mensajería y paquetería foránea
5111 Edición de periódicos, revistas, libros y similares, excepto a través de Internet
5122 Industria del sonido
5151 Transmisión de programas de radio y televisión, excepto a través de Internet
5152 Producción de programación de canales para sistemas de televisión por cable o satelitales excepto por internet
5171 Telefonía tradicional, telegrafía y otras telecomunicaciones alámbricas
5172 Telefonía celular y otras telecomunicaciones inalámbricas, excepto los servicios de satélite
5175 Distribución por suscripción de programas de televisión, excepto a través de Internet
5181 Proveedores de acceso a Internet y servicios de búsqueda en la red
5182 Procesamiento electrónico de información, hospedaje de páginas Web y otros servicios relacionados
5415 Servicios de consultoría en computación
5417 Servicios de investigación científica y desarrollo
5511 Dirección de corporativos y empresas
5612 Servicios combinados de apoyo en instalaciones
6112 Escuelas de educación postbachillerato no universitaria
6113 Escuelas de educación superior
6221 Hospitales generales
6223 Hospitales de otras especialidades médicas
7212 Campamentos y albergues recreativos
Grupo 3. Cobertura media-baja.
Lo comprenden las ramas de actividad cuya participación en ingresos fue mayor o igual al 60% y menor al 79%. Las ramas con esta cobertura se indican a continuación:
4852 Transporte de pasajeros interurbano y rural
4885 Servicios de intermediación para el transporte de carga
4922 Servicios de mensajería y paquetería local
4931 Servicios de almacenamiento
5121 Industria fílmica y del video
5312 Inmobiliarias y corredores de bienes raíces
5324 Alquiler de maquinaria y equipo industrial, comercial y de servicios
5413 Servicios de arquitectura, ingeniería y actividades relacionadas
5416 Servicios de consultoría administrativa, científica y técnica
5418 Servicios de publicidad y actividades relacionadas
5611 Servicios de administración de negocios
5613 Servicios de empleo
5615 Agencias de viajes y servicios de reservaciones
5616 Servicios de investigación, protección y seguridad
5617 Servicios de limpieza
6114 Escuelas comerciales, de computación y de capacitación para ejecutivos
6115 Escuelas de oficios
7131 Parques con instalaciones recreativas y casas de juegos electrónicos
7211 Hoteles, moteles y similares
7223 Servicios de preparación de alimentos por encargo
Diseño probabilístico
Grupo 4. Ramas con esquema de diseño probabilístico.
El esquema de muestreo empleado fue probabilístico y estratificado, para 9 ramas fue univariado y para 3 bivariado; la selección de cada unidad de muestreo fue independiente por estrato y para cada una de las ramas de actividad pertenecientes a esta clasificación.
La estratificación univariada se efectuó a la variable económica ingresos totales y aplicó para las ramas de actividad:
4841 Autotransporte de carga general
4842 Autotransporte de carga especializado
5419 Otros servicios profesionales, científicos y técnicos
6111 Escuelas de educación básica, media y especial
6116 Otros servicios educativos
7221 Restaurantes con servicio de meseros
7222 Restaurantes de autoservicio y de comida para llevar
7224 Centros nocturnos, bares, cantinas y similares, y
8131 Asociaciones y organizaciones comerciales, laborales profesionales y recreativas
La estratificación bivariada se realizó con base en las variables de personal ocupado total e ingresos totales, determinándose el primer componente principal, como la variable estadística resultante de la combinación lineal entre las variables de interés. Esta estratificación aplicó a las siguientes ramas económicas:
5321 Alquiler de automóviles, camiones y otros transportes terrestres
5414 Diseño especializado
7213 Pensiones y casas de huéspedes, y departamentos y casas amuebladas con servicios de hotelería
A través de un modelo de regresión lineal múltiple es posible estimar el valor del componente principal que le corresponde a cada registro, según sus datos de personal ocupado (totpop) e ingresos totales (totingr).
Tamaño de Muestra
El tamaño de muestra necesario para alcanzar las coberturas deseadas por grupo es el que se desglosa a continuación:
Grupo 1 (determinístico)...........26
Grupo 2 (determinístico)......1 338
Grupo 3 (determinístico)......3 521
Grupo 4 (probabilístico).......3 032
TOTAL muestra...................7 917
El tamaño de muestra para las ramas con diseño determinístico fue obtenido al acumular tantas unidades económicas hasta alcanzar la cobertura establecida.
Para el diseño probabilístico, el cálculo del tamaño de muestra se obtuvo de manera independiente para cada rama de actividad económica, mediante la expresión para estimar un total, con un nivel de confianza de 95% y una Tasa de No Respuesta esperada de 15%.
Afijación de la muestra
Para cada rama de actividad con diseño probabilístico, la muestra en cada estrato se asignó por el método de Neyman de acuerdo a la ponderación de ingresos totales por estrato.
Ajuste de los factores de expansión
El factor de expansión para el h-ésimo estrato en la r-ésima rama de actividad es el inverso de la probabilidad de seleccionar una unidad económica en el h-ésimo estrato en la r-ésima rama de actividad.