Академический Документы
Профессиональный Документы
Культура Документы
Agenda
Introduo
Mecanismos de valores ausentes
O que fazer com VAs
Tcnicas de Imputao
Imputao por Mdia e Moda
Imputao Local
kNN - Vizinhos mais prximos
R
Weka
Introduo
Valores ausentes:
Omisso de dados pela prpria fonte de informao
Atributo no aplicvel
Evento no aconteceu
Dados indisponveis ou muito difceis de serem obtidos
Exemplo: Questionrio
Tcnicas de Imputao
Imputao pela mdia ou moda (Mean-mode Imputation - MMImpute)
Tcnicas de Imputao
Mtodos Preditivos:
Imputao local
Exemplo:
Escolaridade
Filhos
Carro
Renda Mensal
Superior
Sim
R$6.000,00
Mdio
No
R$1.500,00
Superior
Sim
R$4.500,00
Superior
Sim
R$5.500,00
Mdio
No
R$1.200,00
Superior
Sim
R$7.500,00
Sim
NA
Imputao local
Imputao Hot-deck ou Cold-deck
Hot e Cold diferem quanto ao processo de agrupamento - Cold
Exemplo:
Escolaridade
Filhos
Carro
Renda Mensal
Superior
Sim
R$7.000,00
Mdio
No
R$1.500,00
Superior
Sim
R$4.500,00
Superior
Sim
R$5.500,00
Mdio
No
R$1.200,00
Superior
Sim
R$8.500,00
Cluster
Superior
Sim
NA
Substitudo por
R$7.750,00
Exemplo ilustrativo:
Desvantagem:
Necessidade de percorrer toda a base para encontrar os vizinhos mais
prximos para cada instncia com valor ausente.
Algoritmo:
Soluo Iterativa
Referncias
THIRUKUMARAN, S.; SUMATHI, A. Missing Value Imputation Techniques Depth Survey And
an Imputation Algorithm To Improve The Efficiency Of Imputation. 2012 Fourth International
Conference on Advanced Computing (ICoAC), Dec. 2012.
ACOCK, Alan C. Working with Missing Values. Journal of Marriage and Family 67.4(2005).
SCHAFER, Joseph L.; GRAHAM, J. W. Missing data: Our View of the State of the Art.
Psychological methods 7.2 (2002): 147.