Procedimiento de muestreo
Diseño muestral
Población objetivo
Se integra por las empresas del país que cuentan con seis o más personas ocupadas (micro, pequeña, mediana y gran empresa) pertenecientes a los sectores de Construcción, Manufacturas, Comercio y Servicios Privados no Financieros (incluyendo Transportes), ubicadas en localidades con 50,000 o más habitantes.
Adicionalmente, se cuenta con una base de datos con las principales empresas que cotizan en la bolsa; tomando las razones sociales, se les asigna tanto Clave Estadística Empresarial (CLEE) como estatus según el Registro Estadístico de Negocios de México (RENEM) y se revisa la coincidencia entre las razones sociales y su CLEE, considerando que preferentemente fueran matrices.
Con el fin de mejorar el control de información, se prosigue a verificar los corporativos que integraban a cada grupo, así como la identificación de los establecimientos según empresa o franquicia.
Cobertura sectorial
La cobertura es a nivel nacional por tamaño de empresa y gran sector de actividad.
Cobertura Geográfica
Nacional y estratos de localidad con 50,000 habitantes o más.
Dominios de estudio
Nacional - Gran sector
Nacional - Tamaño de empresa
Nacional - Tamaño de localidad
Unidad de muestreo
La unidad de muestreo es la empresa, puede estar integrada por uno o más de un establecimiento bajo la misma denominación o razón social. Se ubicó a la empresa en la entidad federativa donde se encuentra la matriz o en su defecto, al establecimiento con mayor personal ocupado.
Marco de muestreo
El marco de muestreo se integra por las empresas con seis o más personas ocupadas proveniente del Marco Estadístico Nacional de Unidades Económicas (MENUE) alimentado por el Registro Estadístico de Negocios de México (RENEM) actualizado al tercer trimestre del 2017; cuya actividad económica corresponda a los sectores de Construcción, Manufacturas, Comercio y Servicios Privados no Financieros que se ubicaron en localidades de 50,000 o más habitantes.
El marco se integró por 273,909 empresas.
Estratificación
Las empresas se clasificaron en cuatro grupos con base en el personal ocupado según la clasificación presentada por la Secretaria de Economía en el Diario Oficial de la Federación, publicado el 30 de junio de 2009.
De las empresas micro, se consideraron sólo las que tenían de 6 a 10 personas ocupadas.
Rangos de personal ocupado
Tamaño de empresa........Comercio........................Servicios........................Industria
Grande..........................101 y más........................101 y más........................251 y más
Mediana..........................31 a 100.........................51 a 100..........................51 a 250
Pequeña...........................11 a 30............................11 a 50............................11 a 50
Micro.................................6 a 10.............................6 a 10.............................6 a 10
En la estratificación geográfica se establecieron dos estratos con base en el número de habitantes por tipo de localidad.
Estrato de localidad......Rango de habitantes........Total de empresas
........................................Total....................................273,909
1...............................500,000 y más............................149,579
2.................................50,000 a 499,999......................124,330
En el cuadro siguiente se observa la distribución del marco de muestreo por sector de actividad:
Gran sector...........Total empresas
Total..........................273,909
Construcción...............11,868
Manufacturas..............41,929
Comercio....................72,690
Servicios...................147,422
Mientras que la distribución del marco de muestreo por tamaño de empresa es el siguiente:
Tamaño de empresa...........Total empresas
Total.....................................273,909
Grande...................................11,207
Mediana.................................18,721
Pequeña................................102,155
Micro....................................141,826
Esquema de muestreo
El esquema de muestreo fue probabilístico y estratificado:
a) Probabilístico
Cada unidad de selección tiene una probabilidad conocida y distinta de cero de ser seleccionada.
b) Estratificado
Las unidades primarias de muestreo con características similares se agrupan para formar estratos.
Tamaño de la muestra
Para cada dominio, se calculan tamaños de muestra para estimar una proporción con un nivel de confianza del 95%, error relativo del 10.8%, salvo para empresas grandes y medianas cuyo error relativo es del 9% y 10% respectivamente y tasa de no respuesta esperada del 20%. La proporción se obtuvo de los resultados definitivos de los Censos Económicos 2014, correspondiente a la pregunta "O511" ¿Obtuvo créditos, préstamos o financiamiento para la operación del negocio?
La expresión para calcular el tamaño de muestra fue la siguiente:
nd = (z2qd/r2pd) / (1+z2qd/Ndr2pd) (1-TNR)
Donde:
nd = Tamaño de muestra en el d-ésimo dominio.
z = Valor en tablas para una distribución normal estándar.
qd = 1-pd
r = Nivel de error relativo.
pd = Proporción de establecimientos que obtuvieron créditos en el d-ésimo dominio.
Nd = Número de empresas en el marco, en el d-ésimo dominio.
TNR = Tasa de no respuesta esperada.
El número 2 expresa potencia.
El tamaño de muestra obtenido, para cada dominio, fue el siguiente:
a) Dominio: Gran sector
Gran sector...........Total empresas
Total.............................4,188
Construcción...................505
Manufacturas..................957
Comercio.......................988
Servicios.....................1,738
b) Dominio: Tamaño de empresa
Tamaño de empresa...........Total empresas
Total...........................4,188
Grande..........................756
Mediana........................518
Pequeña......................1,103
Micro..........................1,811
c) Dominio: Tamaño de localidad
Tamaño de localidad
(Rango de habitantes).....Muestra
Total..............................4,188
500,000 y más...............2,461
50,000 a 499,999..........1,727
Afijación de la muestra
Se realizó la afijación de la muestra proporcional al número de empresas por gran sector - tamaño de empresa.
Selección de la muestra
La selección de la muestra fue aleatoria e independiente para cada sector - tamaño de empresa de acuerdo a la fijación. Se cuidó que para el tamaño de localidad se cubriera el tamaño de muestra mínimo.
Problemática y no respuesta
Durante la captación de la encuesta se encontraron empresas con la siguiente problemática:
Descripción.............................Total
Total.........................................892
Cierres .....................................108
No localizados..........................485
Negativas......................................3
Otros...........................................25
Existen empresas que no se logró obtener su información o se recuperó en forma incompleta.
La no respuesta total de la muestra fue de 892 empresas que representan el 21.3% de la muestra de diseño.
La muestra recuperada con información completa fue de 3 296 empresas.
La distribución de la muestra recuperada por gran sector, tamaño de empresa y tamaño de localidad fue la siguiente:
a) Dominio: Gran sector
Gran sector..........Muestra
Total........................3,296
Construcción..............356
Manufacturas.............779
Comercio....................804
Servicios..................1,357
b) Dominio: Tamaño de empresa
Tamaño de empresa.......Muestra
Total.................................3,296
Grande.................................692
Mediana...............................529
Pequeña...............................989
Micro................................1,086
c) Dominio: Tamaño de localidad
Tamaño de localidad
(Rango de habitantes).........Muestra
Total.......................................3,296
500,000 y más........................1,944
50,000 a 499,999....................1,352
Hay 328 empresas que en la selección de la muestra se encontraban en el estrato de micros (6-10 personas ocupadas), pero que en la recuperación reportaron menos de 6 personas ocupadas, por lo que salen de la población objeto de estudio, por tal motivo se opta que se representen a sí mismas (es decir, se les asigna factor de expansión = 1).
Cálculo de los factores de expansión
Los factores de expansión se elaboraron mediante el siguiente procedimiento:
fdh =Ndh/ndh
Donde:
fdh = Factor de expansión del d-ésimo dominio en el h-ésimo estrato.
Ndh = Total de unidades económicas en el d-ésimo dominio en el h-ésimo estrato.
ndh = Muestra del d-ésimo dominio en el h-ésimo estrato.
Los factores de expansión también se ajustaron con base en el siguiente concepto:
Ajuste por no respuesta
El ajuste por no respuesta se realizó para cada uno de los dominios.
f 'dh=fdh (ndh/n'dh)
Donde:
f 'dh = Factor de expansión con ajuste por no respuesta del d-ésimo dominio y en el h-ésimo estrato.
fdh = Factor de expansión del d-ésimo dominio y en el h-ésimo estrato.
ndh = Número de unidades económicas seleccionadas, en el d-ésimo dominio y en el h-ésimo estrato.
n'dh = Número de unidades económicas recuperadas, en el d-ésimo dominio y en el h-ésimo estrato.
Estimadores
El estimador de total de la característica X en un dominio específico se calculó con la siguiente expresión:
X^d = sumatoria de h=1 a H (sumatoria de i=1 a nh (f'hixhi))
Donde:
X^d = Estimador total de la característica X del d-ésimo dominio.
H = Número de estratos en el dominio.
nh = Número de unidades en la muestra en el h-ésimo estrato.
f'hi = Factor de expansión del i-ésimo elemento, del h-ésimo estrato.
xhi = Característica a estimar reportada en el i-ésimo elemento, en el h-ésimo estrato.
Para la estimación de proporciones, tasas y promedios se utilizó el estimador de razón, donde, Y^ se definió en forma análoga a X^.
R^= X^d/Y^d = (sumatoria de h=1 a H (sumatoria i=1 a nh (f'hixhi))) / (sumatoria de h=1 a H (sumatoria i=1 a nh (f'hiyhi)))
Donde:
R^ = Estimador de razón.
X^d = Estimador total de la característica X del d-ésimo dominio.
Y^d = Estimador total de la característica Y del d-ésimo dominio.
f'hi = Factor de expansión del i-ésimo elemento, del h-ésimo estrato.
xhi = Característica X a estimar reportada en el i-ésimo elemento, en el h-ésimo estrato.
yhi = Característica Y a estimar reportada en el i-ésimo elemento, en el h-ésimo estrato.
El estimador de la varianza del estimador del total de la característica X para un dominio específico se obtiene con la siguiente expresión:
V^(X^d) = sumatoria h=1 a H (N2h (1- nh/Nh) S2h/nh) donde: S2h = (1/nh-1) (sumatoria i=1 a nh) [xhi - x(media)h]2
V^(X^d) = Varianza estimada del total estimado del d-ésimo dominio.
H = Número de estratos.
Nh = Tamaño de la población en el h-ésimo estrato.
nh = Tamaño de la muestra en el h-ésimo estrato.
S2h = Varianza muestral del h-ésimo estrato.
xhi = El valor de la característica de interés en la i-ésima unidad económica, en el h-ésimo estrato.
x(media)h= Media muestral del h-ésimo estrato.
El número 2 expresa potencia.
Error de estimación:
EE = raíz cuadrada de V^(X^d)
Coeficiente de variación:
CV = EE/X^d
Intervalo de confianza:
(X^d-Z(alfa)/2 raíz cuadrada de V^(X^d), X^d+Z(alfa)/2 raíz cuadrada de V^(X^d))
Donde:
V^(X^d) = Varianza de diseño estimada del total estimado del d-ésimo dominio.
X^d = Total estimado en el d-ésimo dominio.
Z(alfa)/2 = Factor de confiabilidad para un nivel de significancia a(alfa) dado.
Código.......Descripción..............................Total
Total...........................................................274
21............Con información incompleta.........9
22............Pendiente...................................265
La no respuesta total de la muestra fue de 892 empresas, que representan el 21.3% de la muestra de diseño.
La muestra recuperada con información completa fue de 3,296 empresas.
La distribución de la muestra recuperada por gran sector, tamaño de empresa y tamaño de localidad es la siguiente:
a) Dominio: Gran sector
Gran sector..........Muestra
Total........................3,296
Construcción..............356
Manufacturas.............779
Comercio....................804
Servicios..................1,357
b) Dominio: Tamaño de empresa
Tamaño de empresa.......Muestra
Total.................................3,296
Grande.................................692
Mediana...............................529
Pequeña...............................989
Micro................................1,086
c) Dominio: Tamaño de localidad
Tamaño de localidad
(Rango de habitantes).........Muestra
Total.......................................3,296
500,000 y más........................1,944
50,000 a 499,999....................1,352
Hay 328 empresas que en la selección de la muestra se encontraban en el estrato de micros (6-10 personas ocupadas), pero que en la recuperación reportaron menos de 6 personas ocupadas, por lo que salen de la población objeto de estudio, por tal motivo se opta que se representen a sí mismas (es decir, se les asigna factor de expansión = 1).
Cálculo de los factores de expansión
Los factores de expansión se elaboraron mediante el siguiente procedimiento:
fd =Nd/nd
Donde:
fd = Factor de expansión del d-ésimo dominio.
Nd = Total de unidades económicas en el d-ésimo dominio.
nd = Muestra del d-ésimo dominio.
Los factores de expansión también se ajustaron con base en el siguiente concepto:
Ajuste por no respuesta
El ajuste por no respuesta se realizó para cada uno de los dominios.
f 'd=fd (nd/n'd)
Donde:
f 'd = Factor de expansión con ajuste por no respuesta del d-ésimo dominio.
fd = Factor de expansión del d-ésimo dominio.
nd = Número de unidades económicas seleccionadas, en el d-ésimo dominio.
n'd = Número de unidades económicas recuperadas, en el d-ésimo dominio.
Estimadores
El estimador de total de la característica X en un dominio específico se calculó con la siguiente expresión:
X^d = sumatoria de h=1 a H (sumatoria de i=1 a nh (fhiXhi))
Donde:
X^d = Estimador total de la característica X del d-ésimo dominio.
H = Número de estratos en el dominio.
nh = Número de unidades en la muestra en el h-ésimo estrato.
fhi = Factor de expansión del i-ésimo elemento, del h-ésimo estrato.
Xhi = Característica a estimar reportada en el i-ésimo elemento, en el h-ésimo estrato.
Para la estimación de proporciones, tasas y promedios se utilizó el estimador de razón, donde, Y^ se definió en forma análoga a X^.
R^= X^d/Y^d = (sumatoria de h=1 a H (sumatoria i=1 a nh (FhiXhi))) / (sumatoria de h=1 a H (sumatoria i=1 a nh (FhiYhi)))
Donde:
R^ = Estimador de razón.
X^d = Estimador total de la característica X del d-ésimo dominio.
Y^d = Estimador total de la característica Y del d-ésimo dominio.
Fhi = Factor de expansión del i-ésimo elemento, del h-ésimo estrato.
Xhi = Característica X a estimar reportada en el i-ésimo elemento, en el h-ésimo estrato.
Yhi = Característica Y a estimar reportada en el i-ésimo elemento, en el h-ésimo estrato.
El estimador de la varianza del estimador del total de la característica X para un dominio específico se obtiene con la siguiente expresión:
V^(X^d) = sumatoria h=1 a H (N2h (1- nh/Nh) S2h/nh) donde: S2h = (1/nh-1) (sumatoria i=1 a nh) [Xhi - X(media)h]2
V^(X^d) = Varianza estimada del total estimado del d-ésimo dominio.
H = Número de estratos.
Nh = Tamaño de la población en el h-ésimo estrato.
nh = Tamaño de la muestra en el h-ésimo estrato.
S2h = Varianza muestral del h-ésimo estrato.
Xhi = El valor de la característica de interés en la i-ésima unidad económica, en el h-ésimo estrato.
X(media)h= Media muestral del h-ésimo estrato.
El número 2 expresa potencia.
Error de estimación:
EE = raíz cuadrada de V^(X^d)
Coeficiente de variación:
CV = EE/X^d
Intervalo de confianza:
(X^d-Z(alfa)/2 raíz cuadrada de V^(X^d), X^d+Z(alfa)/2 raíz cuadrada de V^(X^d))
Donde:
V^(X^d) = Varianza de diseño estimada del total estimado del d-ésimo dominio.
X^d = Total estimado en el d-ésimo dominio.
Z(alfa)/2 = Factor de confiabilidad para un nivel de significancia a(alfa) dado.