Академический Документы
Профессиональный Документы
Культура Документы
Este documento describe una metodología que permite clasificar los hogares
representados por la ENAHO de acuerdo a un conjunto de variables
socioeconómicas, como variables relacionadas con el hogar y la vivienda y
relacionadas con la educación del jefe de hogar. Para tal efecto se trabajó con
los hogares observados por la ENAHO anual correspondiente al año 2009 y las
variables que ya han estado utilizando las empresas de Investigación de
Mercados asociadas a APEIM, de modo que estas mismas variables se
encuentren involucradas en el nuevo indicador de niveles socioeconómicos pero
aplicados a las ENAHO, coherente con las distribuciones históricas que APEIM
determinó en su momento para años anteriores.
Presentación
Una solución para el manejo de esta información de tipo cualitativa es asignar valores a
cada una de las categorías de las variables y, observar que hogares tienen cualidades
similares con respecto a un conjunto de variables. Esto se puede realizar con un
consenso de expertos y realizar las asignaciones mencionadas, pero esto puede
funcionar en un número reducido de individuos, pero ya dentro de un grupo de hogares
o personas mucho más amplio y con la heterogeneidad que existe en un número
grande de individuos, este tipo de procedimientos pueden llevar a calificaciones
subjetivas o erróneas de la población.
Presentación
Se presenta entonces una breve descripción del Escalamiento Óptimo y del método
de los Mínimos Cuadrados Alternantes y el método de Análisis de Componentes
Principales No Lineal en su parte teórica, para luego pasar a la manera como se
construyó el indicador socioeconómico, utilizando la información de la ENAHO 2009.
Ahora bien, las puntuaciones individuales en cada dimensión (una en nuestro caso),
promediadas para los individuos de cada categoría en las respectivas variables, son
las que nos proporcionan las Category Quantifications, y que no son otra cosa que los
centroides de cada categoría en cada dimensión, que son asignados a cada categoría
por el propio sistema.
Técnica utilizada: Componentes Principales No Lineales (PRINCALS)
Este problema puede ser resuelto si se cuantifican o valoran las categorías de las
variables cualitativas. En particular, Young, Takane y de Leeuw (1978) desarrollaron
el procedimiento descrito en el punto anterior que realiza el análisis de componentes
principales sobre todo tipo de variables, incluyendo mezcla de variables cuantitativas
y cualitativas.
Método para la asignación de puntajes a las categorías de las variables que
definen el NSE del hogar
Con la valoración de las categorías con base en este método, se logra maximizar la
correlación lineal entre las variables dadas, consecuentemente se logra transformar
las variables cualitativas en variables cuantitativas, es decir se cuenta con la mejor
combinación lineal posible de las variables tratadas, sirviendo esto, por ejemplo, para
la construcción de modelos de regresión (en donde interesa precisamente la
linealidad), o poder discriminar o caracterizar mejor casos ambiguos, entre muchos
otros análisis que se podrían efectuar.
APEIM viene trabajando con 5 dimensiones para la cuantificación del Índice Socio
Económico, las cuales son:
•Nivel de Instrucción del Jefe de Hogar
•Donde acude el Jefe de Hogar de manera regular para atención médica
•Tenencia de bienes (computadora, lavadora, teléfono fijo, refrigeradora, cocina/leña
•Hacinamiento (miembros del hogar / habitaciones exclusivas para dormir)
•Material predominante en los pisos
Basado en las características deseables del índice, y buscando la semejanza entre las
variables que utiliza APEIM y las que se miden en la ENAHO, se determinó las variables
siguientes para la construcción del índice socioeconómico.
•Nivel educativo alcanzado por el jefe de hogar
•Material predominante en los pisos
•Habitaciones exclusivas para dormir
•Tenencia de bienes (computadora, lavadora, teléfono fijo, refrigeradora/congeladora,
horno microondas)
En base a la ENAHO del año 2009 y utilizando todas las variables mencionadas
anteriormente, se cuantificaron óptimamente las categorías de cada una de estas
variables, las cuales fueron transformadas a una escala de puntajes enteros cuya suma
máxima para un hogar es de 49 puntos. En el Anexo N°3 se presentan las salidas de
puntajes óptimos generados por el procedimiento de escalamiento óptimo.
Determinación del índice de NSE
Haciendo uso de las tres escalas de puntajes de los hogares, se calculan las
correlaciones lineales entre estos tres puntajes. Dichas correlaciones se muestran en la
tabla N°2
Tabla N° 2
Correlaciones Lineales entre los tres Índices de Nivel Socioeconómico
Indice con
Indice con
Indice con puntajes
puntajes optimos
puntajes enteros continuos (escala
(PRINCALS)
0 a 50)
Se puede afirmar, de los valores altos de las correlaciones y su significancia que, los tres
índices nos darán similares ordenamientos de los hogares, lo cual nos permite establecer
como índice de NSE de los hogares al generado con las cuantificaciones enteras, por
mantener la propiedad de ordenamiento de los hogares y a la vez, ser fácil de calcular.
Gráfico N°1
Distribución Acumulada de los Hogares en base al Índice Socioeconómico Óptimo
Determinación del índice de NSE
De la tabla N°1 se puede observar que los puntajes enteros determinados para cada
categoría de las variables, en varios casos son iguales entre una categoría y otra, lo cual
permite agrupar las categorías de las variables donde sucede dicha igualdad, quedando
entonces las variables y sus categorías con sus respectivos puntajes enteros como se
muestra en la Tabla N°3.
Tabla N°3
Variables del Índice Socioeconómico con Categorías Agrupadas y sus Puntajes
Enteros Correspondientes
PUNTAJES ENTEROS
Suma máxima de puntajes = 49
Material predominante en los pisos Puntaje
Otro material / Tierra 0
Cemento / Madera (entablados 2
Losetas, terrazos o similares 5
Láminas asfálticas, vinílicos o similares / Parquet o madera pulida 6
Nivel educativo alcanzado por el jefe de hogar
Sin Nivel / Educación inicial 0
Primaria incompleta / Primaria completa / Secundaria incompleta 1
Secundaria completa / Sup. No Univ. Incompleta 2
Sup. No Univ. Completa / Sup. Univ. Incompleta 4
Sup. Univ. Completa 6
Post - Grado universitario 7
Determinación del índice de NSE
Tabla N°3
Variables del Índice Socioeconómico con Categorías Agrupadas y sus Puntajes Enteros Correspondientes
Habitaciones exclusivas para dormir
0–1 0
2 2
3 3
4 5
5 6
6 8
7 10
8 11
9 13
10 14
11 o más 16
Computadora
No 0
Sí 4
Lavadora
No 0
Sí 4
Teléfono fijo
No 0
Sí 4
Refrigeradora / Congeladora
No 0
Sí 4
Horno Microondas
No 0
Sí 4
Determinación del índice de NSE
El índice de NSE queda definido entonces por las variables que se muestran en la
tabla Nº 3 y, la suma de los puntajes obtenidos en cada una de estas variables da
como resultado una cuantificación socioeconómica a cada hogar de la muestra, lo
que permite clasificar a cada uno de los hogares en que NSE se encuentra, de
acuerdo a rangos establecidos.
Gráfico N°2
Distribución Acumulada de los Hogares en base al Índice Socioeconómico con Puntajes Enteros
Determinación de los puntos de corte del índice para la clasificación en NSE
Los intervalos de niveles socioeconómicos en base al índice con puntajes enteros queda
determinado como sigue:
Puntaje
NSE
L.Inferior L.Superior
A 35 49
B 27 34
C 15 26
D 6 14
E 0 5
El puntaje mínimo posible que puede obtener un hogar si todas las condiciones
socioeconómicas (medidas de acuerdo al conjunto de variables dadas) le son
desfavorables, es de 0 puntos, mientras que si todas las condiciones socioeconómicas le
son favorables, puede alcanzar 49 puntos.
Aplicación del índice de NSE a las Encuestas Nacionales de Hogares de los
años 2008 y 2009 de Lima Metropolitana
Tabla N°4
Lima Metropolitana: Distribución Porcentual por NSE de los Hogares (ENAHO 2008 y 2009)
La comparación entre las distribuciones porcentuales por NSE de los hogares de Lima
Metropolitana para el año 2008 y 2009 en base al índice de NSE nuevo y el índice de
NSE utilizado por APEIM, se muestra en la imagen Nº 1.
Aplicación del índice de NSE a las Encuestas Nacionales de Hogares de los
años 2008 y 2009 de Lima Metropolitana
Imagen N°1
Lima Metropolitana: Distribución por NSE de los hogares en base al Índice Propuesto y APEIM
Se debe considerar que en el 2008 APEIM realizó un trabajo de campo para obtener la
distribución de NSE válida para el 2009. De igual manera, durante el 2009 se hizo el
trabajo de campo para tener la distribución válida para el 2010. Debido a ello, la
comparación de la distribución de NSE según datos de ENAHO (Indice de NSE
propuesto) con la obtenida por la fórmula actual de APEIM se hace considerando la data
de ENAHO de un año anterior para que la fuente de ambas fórmulas sean iguales (la
situación de la población en un año determinado). En ese sentido, se ha comparado
ENAHO 2008 con APEIM 2009 y ENAHO 2009 con APEIM 2010.
Como se puede observar de la imagen anterior, las distribuciones por NSE de los
hogares elaboradas en base a las ENAHO 2008 y 2009 con el índice de NSE propuesto
y, los determinados por APEIM en base a los datos recogidos esos mismos años (APEIM
2009 y APEIM 2010), muestran una semejanza, no solo para el año 2009 en base al cual
se definió el índice propuesto, sino además, para el año 2008, lo que permite afirmar que
el índice propuesto no está siendo forzado a que represente las distribuciones históricas
y por ende, nos permitirá estimar distribuciones por NSE para los años posteriores al año
2009.
Determinación de la distribución socioeconómica
de los hogares para el año 2011
Imagen N°2
Esquema de Periodos de la ENAHO a ser considerados para la determinación de
las distribuciones por niveles socioeconómicos de los hogares para el año 2011
Tabla N°5
Lima Metropolitana: Distribución Porcentual por NSE de los Hogares, 2011
NSE A 5.1
NSE Hogares Porcentaje NSE B 16.8
A 113113 5.1 55.8
B 375141 16.8
C 757897 34.0 NSE C 34.0
D 699850 31.4
E 286308 12.8
NSE D 31.4
Total 2232308 100.0 12.8
NSE E
2011
2010
Determinación de la distribución socioeconómica
de los hogares para el año 2011
Tabla N°6 Departamentos: Distribución Porcentual por NSE de los Hogares, 2011
Departamentos: Distribución Porcentual por NSE de los Hogares, 2011
Urbano
Departamento
A B C D E
Amazonas 0.2 2.2 9.9 38.5 49.1
Ancash 0.4 7.6 28.2 42.3 21.5
Apurimac 0.0 4.0 12.4 29.6 54.0
Arequipa 3.3 12.9 25.1 33.4 25.3
Ayacucho 0.0 4.9 15.4 32.5 47.1
Cajamarca 0.9 8.5 18.0 38.8 33.7
Callao 2.5 16.5 35.3 32.4 13.4
Cusco 1.6 8.5 20.8 30.5 38.6
Huancavelica 0.0 1.7 11.1 41.2 45.9
Huanuco 1.0 4.6 24.6 35.1 34.7
Ica 1.4 7.5 24.9 46.0 20.2
Junin 1.2 3.9 21.1 37.7 36.1
La Libertad 3.0 6.8 23.9 39.7 26.7
Lambayeque 1.4 6.7 21.0 42.5 28.3
Lima 5.1 16.1 33.6 31.8 13.4
Loreto 0.3 5.3 23.3 42.6 28.5
Madre de Dios 0.5 2.7 21.5 44.9 30.4
Moquegua 1.6 11.6 25.7 38.4 22.7
Pasco 0.0 0.7 16.0 41.0 42.3
Piura 0.5 4.5 17.2 40.9 36.9
Puno 0.8 1.2 13.7 38.5 45.8
San Martin 0.3 4.2 17.6 40.0 37.9
Tacna 2.6 6.6 28.7 36.6 25.5
Tumbes 0.4 2.7 17.2 46.3 33.4
Ucayali 0.0 5.5 20.2 40.7 33.5
Fuente: Enaho 2010
El Anexo N° 4 muestra la sintaxis que se utiliza para el cálculo de los puntajes del índice de niveles
socioeconómicos de cada hogar en la muestra.
CONCLUSIONES
Conclusiones
• Este nuevo índice ha permitido determinar, en base a una mixtura entre los tres
primeros trimestres de la ENAHO 2010 y el último trimestre de la ENAHO 2009, la
distribución por niveles socioeconómicos de los hogares para el año 2011. Esta
distribución ha sido elaborada para Lima Metropolitana y Departamentos.
RECOMENDACIONES
Recomendaciones
• Generar la distribución de los hogares por NSE con la base de datos anual de la
ENAHO 2010, una vez que el cuarto trimestre esté disponible, esto para validar la
distribución aproximada que se elaboró con la unión de los tres primeros trimestres
de la ENAHO 2010 y el cuarto trimestre de la ENAHO 2009.
ANEXO Nº 1
VARIABLES DE LA ENAHO QUE DEFINEN EL ÍNDICE DE NIVELES
SOCIOECONÓMICOS
Variable Código Capítulo ENAHO
El material predominante en los pisos es : (p103)
Parquet o Madera Pulida 1
Láminas asfálticas, vinílicos o similares 2
Losetas, terrazos o similares 3
ENAHO 100
Madera (entablados) 4
Cemento 5
Tierra 6
Otro Material 7
Nivel educativo que aprobó (p301a)
Sin nivel 1
Educación Inicial 2
Primaria incompleta 3
Primaria completa 4
Secundaria incompleta 5
ENAHO 300
Secundaria completa 6
Sup. no Univ. Incompleta 7
Sup. no Univ. Completa 8
Sup. Univ. Incompleta 9
Sup. Univ. Completa 10
Post-Grado Universitario 11
Habitaciones exclusivas para dormir ENAHO 100
Teléfono Fijo
No 1 ENAHO 100
Sí 2
Anexo 1
Computadora
No 1
Sí 2
Lavadora
No 1
Sí 2
ENAHO 612
Refrigeradora / Congeladora
No 1
Sí 2
Horno Microondas
No 1
Sí 2
Anexo 2
ANEXO Nº 2
SINTAXIS EN SPSS QUE PREPARA LA MATRIZ DE DATOS PARA EL CÁLCULO DEL ÍNDICE
DE NSE
/**********************************************************************.
/* GENERAR ARCHIVO DE EQUIPAMIENTO POR HOGAR.
/* UTILIZANDO EL ARCHIVO ENAHO 612.
/**********************************************************************.
/* SELECCION DE SOLO REGISTROS CON INDICACION DE TENER UN EQUIPAMIENTO.
FILTER OFF.
USE ALL.
SELECT IF (P612 = 1).
EXECUTE.
/***********************************************************************************.
/* GENERAR ARCHIVO DE NIVEL EDUCATIVO DEL JEFE DE HOGAR.
/* UTILIZANDO EL ARCHIVO ENAHO 300 .
/***********************************************************************************.
/* SELECCIONANDO SOLO JEFES DE HOGAR.
FILTER OFF.
USE ALL.
SELECT IF (P203 = 1).
EXECUTE.
SORT CASES BY CONGLOME(A) VIVIENDA(A) HOGAR(A).
SAVE OUTFILE='PATH\Nivel Educativo del Jefe de Hogar.sav'
Determinación del índice de NSE
/COMPRESSED.
/*****************************************************************************************************************
**************.
/* GENERAR ARCHIVO CON TIPO DE PISO, HABITACIONES Y TENENCIA DE TELEFONO FIJO.
/* UTILIZANDO EL ARCHIVO ENAHO 100 .
/*****************************************************************************************************************
**************.
/* SELECCIONANDO SOLO HOGARES CON RESULTADO FINAL DE LA ENCUESTA :
COMPLETA O INCOMPLETA.
FILTER OFF.
USE ALL.
SELECT IF (RESULT = 1 | RESULT = 2).
EXECUTE.
Determinación del índice de NSE
VALUE LABELS
/pisos
1 "Otro material"
2 "Tierra"
3 "Cemento"
4 "Madera (entablados)"
5 "Losetas, terrazos o similares"
6 "Láminas asfálticas, vinílicos o similares"
7 "Parquet o madera pulida".
execute.
/*DUPLICANDO VARIABLE TELEFONO_FIJO.
COMPUTE telefono_fijo=P1141.
EXECUTE.
RECODE telefono_fijo (0=1) (1=2).
EXECUTE.
VALUE LABELS
/telefono_fijo
1 "No"
2 "Si".
Execute.
Determinación del índice de NSE
/*****************************************************************************************************************
**************.
/* AÑADIR VARIABLE NIVEL EDUCATIVO DEL JEFE HOGAR Y EQUIPAMIENTO AL ARCHIVO
ENAHO 100.
/* UTILIZANDO EL ARCHIVO ENAHO 100 .
/*****************************************************************************************************************
**************.
/*AÑADIR NIVEL EDUCATIVO DEL JEFE DE HOGAR.
MATCH FILES /FILE=*
/TABLE='PATH\Nivel Educativo del Jefe de Hogar.sav'
/RENAME (D3121C D311B$6 D311B$2 D311B$3 D311B$5 D311B$7 D311B$4 D311B$1 D3122B
D3121B D311D$6
I311D$6 D311D$2 I311D$2 D311D$3 I311D$3 D311D$5 I311D$5 D311D$7 I311D$7 D311D$1
I311D$1 D311D$4
I311D$4 D3122C I3121C I311B$6 I311B$2 I311B$3 I311B$5 I311B$7 I311B$4 I311B$1 I3122B
I3121B I3122C
P307 P302X AÑO P308B P301A1 UBIGEO CODINFOR P300I CODPERSO P300N DOMINIO
P303 P305 P314C P3152
P3151 P3156 P3154 P3153 P3155 P3122 P3121 P314A P314B$1 P314B$2 P314B$5 P314B$3
P314B$4 P302B P302A
Determinación del índice de NSE
P3092A P3091A P311$6 P311$2 P311$3 P311$5 P311$7 P311$1 P311$4 P311N$1
P311N$2 P311N$3 P311N$4
P311N$5 P311N$6 P311N$7 P310 P306 ESTRATO P308C P300A P316A$3 P316A$4
P316A$2 P316A$1 MES P308A
P304A P301A0 T313A P203 P302 P207 P308D P304D P301D P314D P304B P304C
P313A P3122D P3121D P3121C
P3122B P3121B P312T1 P3122A2 P3122A1 P3122A6 P3122A4 P3122A3 P3122A5
P312T2 P3122C P204 P206 P205
P209 P311E$6 P311E$2 P311E$3 P311E$5 P311E$7 P311E$1 P311E$4 D315B
I315B P315B P311B$6 P311B$2
P311B$3 P311B$5 P311B$7 P311B$4 P311B$1 D315A I315A P315A P311T1
P311A2$6 P311A3$6 P311A1$6
P311A7$6 P311A5$6 P311A4$6 P311A6$6 P311A2$2 P311A3$2 P311A1$2
P311A7$2 P311A5$2 P311A4$2 P311A6$2
P311A2$3 P311A3$3 P311A1$3 P311A7$3 P311A5$3 P311A4$3 P311A6$3
P311A2$5 P311A3$5 P311A1$5 P311A7$5
P311A5$5 P311A4$5 P311A6$5 P311A2$7 P311A3$7 P311A1$7 P311A7$7
P311A5$7 P311A4$7 P311A6$7 P311A2$1
Determinación del índice de NSE
d143 d144 d145 d146 d147 d148 d149 d150 d151 d152 d153 d154 d155 d156 d157 d158
d159 d160 d161 d162
d163 d164 d165 d166 d167 d168 d169 d170 d171 d172 d173 d174 d175 d176 d177
d178 d179 d180 d181 d182
d183 d184 d185 d186 d187 d188 d189 d190 d191 d192 d193 d194 d195 d196 d197
d198 d199 d200 d201 d202
d203 d204 d205 d206 d207 d208 d209 d210 d211 d212 d213 d214 d215 d216 d217
d218 d219 d220 d221 d222
d223 d224 d225 d226 d227 d228)
/BY CONGLOME VIVIENDA HOGAR
/DROP= d0 d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 d11 d12 d13 d14 d15 d16 d17 d18 d19 d20
d21 d22 d23 d24
d25 d26 d27 d28 d29 d30 d31 d32 d33 d34 d35 d36 d37 d38 d39 d40 d41 d42 d43 d44
d45 d46 d47 d48 d49
d50 d51 d52 d53 d54 d55 d56 d57 d58 d59 d60 d61 d62 d63 d64 d65 d66 d67 d68 d69
d70 d71 d72 d73 d74
d75 d76 d77 d78 d79 d80 d81 d82 d83 d84 d85 d86 d87 d88 d89 d90 d91 d92 d93 d94
d95 d96 d97 d98 d99
d100 d101 d102 d103 d104 d105 d106 d107 d108 d109 d110 d111 d112 d113 d114
d115 d116 d117 d118 d119
Determinación del índice de NSE
d120 d121 d122 d123 d124 d125 d126 d127 d128 d129 d130 d131 d132 d133 d134
d135 d136 d137 d138 d139
d140 d141 d142 d143 d144 d145 d146 d147 d148 d149 d150 d151 d152 d153 d154
d155 d156 d157 d158 d159
d160 d161 d162 d163 d164 d165 d166 d167 d168 d169 d170 d171 d172 d173 d174
d175 d176 d177 d178 d179
d180 d181 d182 d183 d184 d185 d186 d187 d188 d189 d190 d191 d192 d193 d194
d195 d196 d197 d198 d199
d200 d201 d202 d203 d204 d205 d206 d207 d208 d209 d210 d211 d212 d213 d214
d215 d216 d217 d218 d219
d220 d221 d222 d223 d224 d225 d226 d227 d228.
EXECUTE.
/*****************************************************************************************************
***************************.
/* RENOMBRANDO NOMBRE DE VARIABLES PARA EL CALCULO DEL INDICADOR
DE NSE.
/* UTILIZANDO EL ARCHIVO ENAHO 100 .
/*****************************************************************************************************
***************************.
RENAME VARIABLES (pisos=v2_material_pisos)
(habitaciones_dormir=v3_habitaciones_dormir_vivienda)
(telefono_fijo=v4_4_telefono_fijo) (p301a=v1_nivel_educativo_aprobado)
(equipo_7=v4_5_computadora)
(equipo_12=v4_1_refrig_conge) (equipo_13=v4_2_lavadora)
(equipo_14=v4_3_horno_microondas).
execute.
/*****************************************************************************************************
***************************.
/* CREANDO VARIABLE AREA = URBANO/RURAL.
/* UTILIZANDO EL ARCHIVO ENAHO 100 .
Determinación del índice de NSE
/*****************************************************************************************************
***************************.
COMPUTE area=ESTRATO <= 5.
EXECUTE.
VALUE LABELS
/area
0 "Rural"
1 "Urbano".
EXECUTE.
/*****************************************************************************************************
***************************.
/* CREANDO VARIABLE CODIGO DE DEPARTAMENTO UTILIZANDO EL ARCHIVO
ENAHO 100.
/*****************************************************************************************************
***************************.
STRING cod_dep (A2).
COMPUTE cod_dep=substr(UBIGEO,1,2).
VARIABLE LABELS cod_dep 'codigo departamento'.
EXECUTE.
Determinación del índice de NSE
VALUE LABELS
/cod_dep
01 "Amazonas"
02 "Ancash"
03 "Apurimac"
04 "Arequipa"
05 "Ayacucho"
06 "Cajamarca"
07 "Callao"
08 "Cusco"
09 "Huancavelica"
10 "Huanuco"
11 "Ica"
12 "Junin"
13 "La Libertad"
14 "Lambayeque"
15 "Lima"
16 "Loreto"
17 "Madre de Dios"
18 "Moquegua"
19 "Pasco“
Determinación del índice de NSE
20 "Piura"
21 "Puno"
22 "San Martin"
23 "Tacna"
24 "Tumbes"
25 "Ucayali".
EXECUTE.
ANEXO Nº 3
DESARROLLO MATEMÁTICO DE LA DETERMINACIÓN DEL ÍNDICE DE NIVELES
SOCIOECONÓMICOS Y SU REESCALAMIENTO
Las cuantificaciones obtenidas por Componentes Principales No Lineales, para cada una
de las categorías de una variable, nos permiten construir indicadores con base en un
conjunto de variables nominales u ordinales; para esto sean las cuantificaciones
categóricas óptimas de las J variables con j=1,……...…, m y de la K-ésima categoría
dentro de cada variable, es decir que por ejemplo la cuantificación es la cuantificación de
la variable uno y de la cuarta categoría u orden de la misma.
Entonces se obtiene un vector que está formado por las cuantificaciones más
claramente se tendrá:
Anexo 3
Ahora bien analicemos el caso de la primera variable y para esto supongamos que la
variable en cuestión tiene s1 categorías es decir nuestro vector de cuantificaciones para
la primera variable estaría dado por:
Donde es un escalar que mide la diferencia entre una cuantificación menor y otra más
grande con i=1, …., k-1 es decir por ejemplo mide la diferencia que existe entre el
mínimo y la segunda cuantificación con respecto a los valores dados por el algoritmo.
Es decir nuestro vector de cuantificaciones estaría dado por:
Se puede entonces realizar una transformación restando el mínimo de cada variable a las
cuantificaciones de las mismas y así se consigue cambiar las puntuaciones a una escala
que va de cero que, correspondería al valor mínimo hasta un valor dado por
transformación ya que ; por lo que se tendría y de este modo se logra obtener una
escala que va desde cero hasta cierto valor que sería el máximo menos el mínimo; así
nuestras cuantificaciones estarían dadas por:
Anexo 3
obteniendo el mayor valor posible que puede tener un individuo con respecto a las
variables de interés, de este modo se puede obtener un factor de escalamiento que no
es sino el valor de una escala z deseada (por ejemplo diez o cien) dividido por el valor ,
es decir tendríamos que nuestro factor de escalamiento estaría dado por:
Anexo 3
ANEXO Nº 4
SINTAXIS EN SPSS QUE CALCULA EL ÍNDICE DE NSE DE CADA HOGAR
if (v3_habitaciones_dormir_vivienda<=1) x_nse_habitaciones_dormir_vivienda=0.
if (v3_habitaciones_dormir_vivienda=2) x_nse_habitaciones_dormir_vivienda=2.
if (v3_habitaciones_dormir_vivienda=3) x_nse_habitaciones_dormir_vivienda=3.
if (v3_habitaciones_dormir_vivienda=4) x_nse_habitaciones_dormir_vivienda=5.
if (v3_habitaciones_dormir_vivienda=5) x_nse_habitaciones_dormir_vivienda=6.
if (v3_habitaciones_dormir_vivienda=6) x_nse_habitaciones_dormir_vivienda=8.
if (v3_habitaciones_dormir_vivienda=7) x_nse_habitaciones_dormir_vivienda=10.
if (v3_habitaciones_dormir_vivienda=8) x_nse_habitaciones_dormir_vivienda=11.
if (v3_habitaciones_dormir_vivienda=9) x_nse_habitaciones_dormir_vivienda=13.
if (v3_habitaciones_dormir_vivienda=10) x_nse_habitaciones_dormir_vivienda=14.
if (v3_habitaciones_dormir_vivienda>=11) x_nse_habitaciones_dormir_vivienda=16.
if (v4_5_computadora=1) x_nse_computadora=0.
if (v4_5_computadora=2) x_nse_computadora=4.
if (v4_2_lavadora=1) x_nse_lavadora=0.
if (v4_2_lavadora=2) x_nse_lavadora=4.
if (v4_4_telefono_fijo=1) x_nse_telefono_fijo=0.
if (v4_4_telefono_fijo=2) x_nse_telefono_fijo=4.
if (v4_1_refrig_conge=1) x_nse_refrig_conge=0.
if (v4_1_refrig_conge=2) x_nse_refrig_conge=4.
if (v4_3_horno_microondas=1) x_nse_horno_microondas=0.
if (v4_3_horno_microondas=2) x_nse_horno_microondas=4.
Anexo 4
ANEXO Nº 5
RESULTADOS DE LA APLICACIÓN DEL ANÁLISIS DE COMPONENTES PRINCIPALES
NO LINEALES SOBRE LA MATRIZ DE DATOS DE LA ENAHO 2009
/DIMENSION=1
/NORMALIZATION=SYMMETRICAL
/MAXITER=100
/CRITITER=.00001
/PRINT=CORR LOADING QUANT(v1_nivel_educativo_aprobado v2_material_pisos
v3_habitaciones_dormir_vivienda v4_1_refrig_conge v4_2_lavadora
v4_3_horno_microondas
v4_4_telefono_fijo v4_5_computadora) VAF
/PLOT=OBJECT (20) JOINTCAT(v1_nivel_educativo_aprobado v2_material_pisos
v3_habitaciones_dormir_vivienda v4_1_refrig_conge v4_2_lavadora
v4_3_horno_microondas
v4_4_telefono_fijo v4_5_computadora) (20)
/SAVE=OBJECT.
La sintaxis anterior corre bajo el software estadístico IBM SPSS Statistics versión 18.
Dicha sintaxis corresponde a la técnica multivariada de Componentes Principales No
Lineales o Categóricos.
Anexo 5
Historial de iteraciones
Número de iteraciones Varianza explicada Pérdida
Restricción del
centroide a las
Coordenadas coordenadas
Total Incremento Total de centroide del vector
0a 3,416109 ,000008 4,583891 4,511746 ,072145
dimension0
5b 3,469494 ,000005 4,530506 4,497868 ,032638
a. La iteración 0 muestra los estadísticos de la solución con todas las variables, excepto las
variables con un nivel de escalamiento óptimo nominal múltiple, consideradas como numéricas.
b. Se ha detenido el proceso de iteración debido a que se ha alcanzado el valor de la prueba para
la convergencia.
Resumen del modelo
Dimensión Varianza
explicada
Total
Alfa de Cronbach (Autovalores)
1 ,813 3,469
• Cuantificaciones
Nivel educativo que aprobó (p301a)a
Categoría Coordenadas Coordenadas
de centroide del vector
Frecuencia Dimensión Dimensión
ponderada Cuantificación 1 1
1 Sin nivel 46031,000 -1,323 -,650 -,991
2 Educación Inicial 1887,110 -1,323 -,717 -,991
3 Primaria incompleta 187314,210 -,907 -,447 -,679
4 Primaria completa 194878,450 -,764 -,306 -,573
5 Secundaria incompleta 310355,650 -,764 -,422 -,573
6 Secundaria completa 634815,380 -,439 -,217 -,329
7 Sup. no Univ. 97412,930 -,399 -,197 -,299
Incompleta
8 Sup. no Univ. 232575,700 ,674 ,333 ,505
Completa
9 Sup. Univ. Incompleta 105103,650 ,686 ,338 ,514
10 Sup. Univ. Completa 286124,080 1,809 ,892 1,355
11 Post-Grado 63662,520 2,500 1,234 1,873
Universitario
Normalización simétrica.
a. Nivel de escalamiento óptimo: Ordinal.
Anexo 5
v4_1_refrig_congea
Categoría Coordenadas de Coordenadas del
centroide vector
Frecuencia Dimensión Dimensión
ponderada Cuantificación 1 1
1 No 661872,450 -1,519 -,755 -1,147
dimension0
2 Sí 1498288,230 ,650 ,323 ,491
Normalización simétrica.
a. Nivel de escalamiento óptimo: Ordinal.
Anexo 5
v4_2_lavadoraa
Categoría Coordenadas de Coordenadas del
centroide vector
Frecuencia Dimensión Dimensión
ponderada Cuantificación 1 1
1 No 1373816,410 -,768 -,474 -,720
dimension0
2 Sí 786344,270 1,310 ,808 1,228
Normalización simétrica.
a. Nivel de escalamiento óptimo: Ordinal.
v4_3_horno_microondasa
Categoría Coordenadas de Coordenadas del
centroide vector
Frecuencia Dimensión Dimensión
ponderada Cuantificación 1 1
1 No 1413086,570 -,739 -,431 -,654
dimension0
2 Sí 747074,110 1,363 ,794 1,206
Normalización simétrica.
a. Nivel de escalamiento óptimo: Ordinal.
Anexo 5
v4_4_telefono_fijoa
Categoría Coordenadas de Coordenadas del
centroide vector
Frecuencia Dimensión Dimensión
ponderada Cuantificación 1 1
1 No 888067,160 -1,210 -,641 -,973
dimension0
2 Sí 1272093,520 ,822 ,435 ,661
Normalización simétrica.
a. Nivel de escalamiento óptimo: Ordinal.
v4_5_computadoraa
Categoría Coordenadas de Coordenadas del
centroide vector
Frecuencia Dimensión Dimensión
ponderada Cuantificación 1 1
1 No 1448484,800 -,713 -,421 -,640
dimension0
2 Sí 711675,880 1,414 ,836 1,269
Normalización simétrica.
a. Nivel de escalamiento óptimo: Ordinal.
Anexo 5
Saturaciones en componentes
Dimensión
1
Nivel educativo que aprobó (p301a) ,749
El material predominante en los pisos es : (p103) ,883
¿ Cuántas habitaciones para dormir (p104a) ,495
v4_1_refrig_conge ,755
v4_2_lavadora ,937
v4_3_horno_microondas ,885
v4_4_telefono_fijo ,804
v4_5_computadora ,897
Normalización simétrica.
Anexo 5
Gráfico
Puntos de categoría
Anexo 5
Varianza explicada
Total (coordenadas del
Coordenadas de centroide vector)
Dimensión Dimensión
1 Media 1 Total
Nivel educativo que aprobó (p301a) ,371 ,371 ,370 ,370
El material predominante en los pisos es : (p103) ,514 ,514 ,513 ,513
¿ Cuántas habitaciones para dormir (p104a) ,192 ,192 ,161 ,161
v4_1_refrig_conge ,375 ,375 ,375 ,375
v4_2_lavadora ,578 ,578 ,578 ,578
v4_3_horno_microondas ,516 ,516 ,516 ,516
v4_4_telefono_fijo ,426 ,426 ,426 ,426
v4_5_computadora ,530 ,530 ,530 ,530
Total activo 3,502 3,502 3,469 3,469
Cuadros adicionales
Departamentos: Distribución Porcentual de Hogares por Area Urbana y Total ENAHO 2010
Niveles Socioeconómicos
Area
A B C D E
ENAHO 2010
NIVEL SOCIOECONÓMICO
Porcentaje
Población Porcentaje Porcentaje válido
acumulado
A 469588 5,3 5,3 5,3
Total 648756 3.1 2309386 11.1 5969310 28.8 7415760 35.8 4371527 21.1 20,714,740 100.0
Amazonas 77 .1 4601 3.3 13509 9.6 54185 38.5 68283 48.5 140654 100.0
Ancash 3822 .6 52955 8.7 179585 29.6 251372 41.4 118905 19.6 606639 100.0
Apurimac 0 .0 3778 2.8 17727 13.1 41397 30.5 72731 53.6 135632 100.0
Arequipa 41668 3.8 147917 13.3 307187 27.7 376582 34.0 234939 21.2 1108293 100.0
Ayacucho 0 .0 16841 6.1 43715 15.9 95680 34.8 119087 43.3 275324 100.0
Cajamarca 3960 1.1 38389 10.4 71400 19.3 138433 37.4 117758 31.8 369941 100.0
Callao 27681 3.0 160394 17.1 343894 36.7 297588 31.8 107210 11.4 936767 100.0
Cusco 11163 2.0 46823 8.4 126222 22.6 177662 31.9 195716 35.1 557585 100.0
Huancavelica 0 .0 1651 2.1 11072 14.0 29248 37.1 36872 46.8 78843 100.0
Huanuco 4857 1.8 11837 4.3 66934 24.3 97505 35.4 94290 34.2 275423 100.0
Ica 11954 1.8 53183 8.1 189244 29.0 289698 44.3 109269 16.7 653349 100.0
Junin 11041 1.4 28100 3.6 172841 21.9 315119 39.9 262618 33.3 789719 100.0
La Libertad 36128 3.2 85351 7.6 292660 26.2 440660 39.5 261483 23.4 1116280 100.0
Lambayeque 15760 1.7 55287 5.8 211095 22.3 416100 44.0 248229 26.2 946470 100.0
Lima 450211 5.2 1420707 16.5 3095116 36.0 2675674 31.2 946641 11.0 8588348 100.0
Loreto 2095 .3 26884 4.4 138576 22.5 253590 41.2 194071 31.5 615216 100.0
Madre de Dios 359 .5 2319 3.5 16376 24.8 30808 46.7 16084 24.4 65945 100.0
Moquegua 2843 1.9 19512 12.9 41406 27.4 58182 38.4 29389 19.4 151332 100.0
Pasco 0 .0 803 .5 28122 17.3 70431 43.3 63208 38.9 162565 100.0
Piura 8671 .7 58014 4.7 231666 18.9 527048 42.9 403270 32.8 1228670 100.0
Puno 4700 .8 9091 1.5 86844 14.2 237778 39.0 271220 44.5 609633 100.0
San Martin 1865 .4 22657 4.8 85142 17.9 194670 40.9 171176 36.0 475509 100.0
Tacna 9290 3.2 18636 6.3 87851 29.8 111726 38.0 66818 22.7 294321 100.0
Tumbes 611 .3 5827 3.0 37394 19.1 91999 47.0 59762 30.6 195592 100.0
Ucayali 0 .0 17831 5.3 73732 21.9 142627 42.4 102499 30.4 336689 100.0
Fuente: Enaho 2010
Anexo 6 Rangos 8 Grupos
Puntaje
NSE
L.Inferior L.Superior
A1 38 49
A2 35 37
B1 31 34
B2 27 30
C1 20 26
C2 15 19
D 6 14
E 0 5
Anexo 6 Definición de rural
El INEI ya tiene definido que centro poblado es urbano y cual es rural, y esto se hace en base
a los tamaños de vivienda o poblacion de los mismos.
Esta definición la utiliza tanto para sus encuestas (caso de la ENAHO) y los censos.
En los archivos ENAHO no se encuentra una variable que diga a que área pertenece pero la
variable estratificación permite identificar a que área (urbana/rural) pertenece el hogar:
Los 5 primeros estratos corresponden a aéreas urbanas, mientras que los estratos 6, 7 y 8
corresponden a aéreas rurales.