Вы находитесь на странице: 1из 6

Universidad Autnoma de Zacatecas

Francisco Garca Salinas


Unidad Acadmica de Contadura y Administracin

Maestra en Administracin
Estadstica I
Dr. Vctor Hugo Bauelos Garca
Mapa conceptual de:
Imputacin de datos faltantes

Elabor:
Domnguez Macas Jos Carlos

2 B

Zacatecas, Zacatecas, Mayo de 2014

Entrevistador olvida preguntar


algo

1. Definicin

Sustituir observaciones, ya sea


porque se carece de informacin
(missing values) o porque se
detecta que algunos de los valores
recolectados no corresponden con
el comportamiento esperado
(outliers).

Asignar valores a elementos


faltantes

2. Objetivos

Entrevistado se rehusa a
contestar

Encuestado no puede contestar

Error de captura

Disminuye el sesgo y produce


un conjunto de datos
completos

IMPUTACIN DE
DATOS
Crea una nueva variable en el
conjunto de datos

3. Distribucin de los
elementos faltantes

Missing at Random (MAR)

Un proceso de datos omitidos se genera en forma


aleatoria si la distribucin de los valores observados
no depende del patrn de comportamiento de
losregistros sin informacin

Missing Complete at Random


(MCAR)

Ocurre cuando la omisin no depende de los datos


observados

Missing not at Random (MNAR)

La falta de respuesta no puede ser ignorada en el


proceso de construccin del estimador ni al analizar
las relaciones de causalidad entre variables

Anlisis con datos completos


Trabajar nicamente con las observaciones que
disponen de informacin completa para todas
las variables

4. Procedimientos
tradicionales de imputacin

Anlisis con datos disponibles

Hace uso de toda la informacin disponible sin


efectuar ningn tipo de correccin en los
factores de expansin.

Reponderacin

Cuando no se cuenta con cierta informacin en


la muestra se aplican algoritmos de
reponderacin para compensar la falta de
respuesta.

IMPUTACIN DE DATOS
Mltiple

Deductiva

5. Tipos de imputacin

Por regresin

De la media por celda

Por sustitucin

5. Tipos de imputacin

Mltiple
Cada valor faltante se asigna m
veces distintas. Se crea m
conjuntos de datos distintos,
sin valores faltantes.

Imputacin por el mtodo de


medias no condicionadas

Sustitucin de datos utilizando


promedios.

Imputacin por medias


condicionadas para datos
agrupados

Sustituir datos utilizando


promedios y formar categoras
a partir de covariables
correlacionadas con la variable
de inters, e imputar los datos
omitidos con observaciones
provenientes de la submuestra
que comparte caractersticas
comunes.

Imputacin con variables


ficticias

Crear una variable indicador


para
identificar
las
observaciones
con
datos
faltantes.

Imputacin mediante una


distribucin no condicionada

Llenar los registros vacos


(receptores) con informacin
de campos con informacin
completa (donantes), y los
datos faltantes se reemplazan
a partir de una seleccin
aleatoria
de
valores
observados, lo cual no
introduce sesgos en la
varianza del estimador.

IMPUTACIN DE
DATOS

5. Tipos de imputacin

Mltiple

Deductiva

Algunos valores se pueden


asignar mediante relaciones
lgicas entre variables.

Por regresin

Predice el valor faltante


usando una regresin del
elemento de inters sobre
las variables observadas para
todos los casos.

De la media por celda

Las personas que responden


se dividen en clases con base
en variables conocidas y se
sustituyen los valores
faltantes por la media de la
clase:
Est mtodo supone que los
datos faltantes son
completamente al azar.

Por sustitucin

En ocasiones, se permite a
los entrevistadores elegir un
sustituto cuando est en el
campo.

Conjuntos rectangulares

6. Ventajas

Resultados consistentes
Se reduce el sesgo por
ausencia de respuesta

IMPUTACIN DE
DATOS

Anlisis futuro no distingue


entre imputaciones y datos
reales

7. Desventajas
Los valores imputados pueden
ser buenas estimaciones, pero
no datos reales