Procedimiento de muestreo
1. Marco de La Muestra
El marco se formó con base en el directorio definitivo de los Censos Económicos 2009 (CE 2009), actualizado con base en la información que proviene del Directorio Nacional de Unidades Económicas (DENUE) y la misma encuesta, también se incluyen 401 unidades económicas provenientes de la información preliminar del Censo Económico 2014. El marco de muestreo quedó integrado por un total de 1 189 958 unidades económicas.
Los dominios de estudio para esta encuesta son las clases o conjunto de clases de actividad económica de interés, agrupadas según el sector, subsector o rama de actividad económica a la cual pertenecen, de acuerdo al Sistema de Clasificación Industrial de América del Norte 2007 (SCIAN 2007).
Las unidades económicas con diseño probabilístico se estratificaron según las características de cada dominio, debido a esto se definieron dos tipos de estratificación, una en términos de la variable de personal ocupado considerando cinco estratos y otra con respecto a la variable de ingresos totales considerando seis estratos.
2. Esquema de muestreo
En virtud de las características muy particulares de cada dominio, se tomaron diferentes criterios para la definición del esquema de muestreo formando cinco grupos, tres de ellos con diseño determinístico y dos con diseño probabilístico.
2.1. No Probabilístico
El procedimiento consistió en ordenar de mayor a menor para la variable de ingresos a todas las unidades económicas dentro de cada dominio y seleccionar a aquellas con mayor participación porcentual hasta alcanzar la cobertura establecida para cada dominio.
Los tres grupos con diseño no probabilístico se definen a continuación:
Grupo1. Cobertura alta
Corresponde a los dominios cuya cobertura en ingresos es mayor o igual al 80%.
Grupo 2. Cobertura media
Corresponde a los dominios cuya cobertura en ingresos es mayor o igual al 60% y menor al 80%.
Grupo 3. Cobertura baja
Corresponde a los dominios cuya cobertura en ingresos es menor al 60%.
2.2. Probabilístico
El esquema de muestreo empleado fue probabilístico y estratificado, con selección independiente para cada estrato por dominio de estudio.
a) Probabilístico
Las unidades de muestreo tuvieron una probabilidad conocida y distinta de cero de ser seleccionadas.
b) Estratificado
Las unidades de muestreo con características similares se agruparon para formar estratos. Y debido a las características de cada dominio, se consideraron dos grupos probabilísticos:
Grupo 4. Estratificación por Personal Ocupado
Corresponde a los dominios que de acuerdo a sus características fueron estratificados tomando como base al personal ocupado.
Grupo 5. Estratificación por Ingresos
Corresponde a los dominios que de acuerdo a sus características fueron estratificados tomando como base sus ingresos totales.
3. Tamaño de la muestra
Para la EMS 2008, 2009, 2010 y 2011, el tamaño de muestra total fue de 6,911 unidades económicas. De las cuales 1,652 corresponden a los dominios No Probabilísticos y 5,259 unidades a los dominios probabilísticos, considerando para este ultimo un nivel de confianza del 95%, error relativo del 10% y una tasa de No Respuesta esperada del 15%. Cabe mencionar que el periodo comprendido de 2008-2011 tienen la misma muestra debido al ajuste por el nuevo diseño muestral que adopta la EMS y al ajuste por el cambio de año base a 2008=100.
Para la EMS 2012, el tamaño de muestra total fue de 7,092 unidades económicas. De las cuales 1,928 corresponden a los dominios No Probabilísticos y 5,164 unidades a los dominios probabilísticos, considerando para este último un nivel de confianza del 95%, error relativo del 10% y una tasa de No Respuesta esperada del 15%.
Para la EMS 2013, el tamaño de muestra total fue de 7,371 unidades económicas. De las cuales 2,006 corresponden a los dominios No Probabilísticos y 5,365 unidades a los dominios probabilísticos, considerando para este último un nivel de confianza del 95%, error relativo del 10% y una tasa de No Respuesta esperada del 15%.
Para la EMS 2014, el tamaño de muestra total fue de El tamaño de muestra total fue de 7,382 unidades económicas. De las cuales 1,968 corresponden a los dominios No Probabilísticos y 5,414 unidades a los dominios probabilísticos, considerando para este ultimo un nivel de confianza del 95%, error relativo del 10% y una tasa de No Respuesta esperada del 15%.
Para la EMS 2015, el tamaño de muestra total fue de 7,307 unidades económicas. De las cuales, 2,060 corresponden a los dominios no probabilísticos y 5,247 unidades a los dominios probabilísticos. Para los dominios con diseño probabilístico, el cálculo del tamaño de muestra se obtuvo de manera independiente para cada uno de ellos, tomando como referencia la variable con la que fueron estratificados; además se consideró un nivel de confianza de 95%, una tasa de no Respuesta esperada de 15% y un error relativo del 10%.
Para la EMS 2016, el tamaño de muestra total fue 8,237 (08/01/2016) unidades económicas. De las cuales, 2,472 corresponden a los dominios no probabilísticos y 5,765 unidades a los dominios probabilísticos. Para los dominios con diseño probabilístico, el cálculo del tamaño de muestra se obtuvo de manera independiente para cada uno de ellos, tomando como referencia la variable con la que fueron estratificados; además se consideró un nivel de confianza de 95%, una tasa de no Respuesta esperada de 15% y un error relativo del 10%.
Para la EMS 2017, el tamaño de muestra total fue 7,961 unidades económicas. De las cuales, 2,388 corresponden a los dominios no probabilísticos y 5,573 unidades a los dominios probabilísticos. Para los dominios con diseño probabilístico, el cálculo del tamaño de muestra se obtuvo de manera independiente para cada uno de ellos, tomando como referencia la variable con la que fueron estratificados; además se consideró un nivel de confianza de 95%, una tasa de no Respuesta esperada de 15% y un error relativo del 10%.
4. Afijación de la muestra
Para cada dominio de estudio se distribuyó la muestra por estrato, considerando la afijación de Neyman.
5. Selección de la muestra
Las unidades económicas con diseño determinístico se seleccionaron de acuerdo a su contribución en la variable de ingresos dentro de cada dominio de estudio. Las unidades económicas con diseño probabilístico se seleccionaron de manera aleatoria, sin reemplazo e independiente para cada estrato.
Para conocer mayor detalle acerca de las ecuaciones referentes al cálculo de los factores de expansión, su ajuste por la No Respuesta así como los Estimadores, ver el documento Encuestas de Servicios y Transportes 2015 (EMS 2015); dicho documento es vigente para el año 2016-2017 y se encuentra anexo en la documentación de estos metadatos.