Академический Документы
Профессиональный Документы
Культура Документы
Descriptiva para
variables
continuas
Tpicos a tratar
Que buscamos?
Obtener un sabor de los datos
continuos
Aprender de los datos continuos a travs
de una visualizacin grfica
Examinar la calidad de los datos
Los observables
En la naturaleza existen los
observables aquellas propiedades que
pueden ser percibidas por los sentidos o
instrumentos especializados.
Observables fsicos
Cuantificables (medibles)
Observables no-fsicos
No pueden ser cuantificados (an)
Medicin
Cuantificar = Medir
Medir = Comparar con un patrn
El patrn define la unidad de medida
adoptada por un instrumento de medicin
Observables fsicos
Observables fsicos: (magnitudes fsicas)
Temperatura
Peso
Talla
Edad
Estado civil
Sexo
Color
Observables No-fsicos
La belleza de una obra de arte
El amor
La inteligencia?
Tipos de variables:
Discretas, categricas
Ordinal: severidad de un clico
Nominal: sexo
Dicotmica: si o no, ausencia o presencia
Rigurosamente hablando
Por ltimo, nada es continuo cuando se
alcanza los lmites moleculares!! El
principio de incertidumbre de Heisenberg
De manera prctica, todo depende de la
escala en que trabajemos
ATENCION !
STATA puede identificar un tipo de
variable de manera erronea !
Debemos apoyarnos en la ciencia, en
nuestro conocimiento previo de la variable
con que estamos trabajando.
Distribucin de frecuencias
Una lista exhaustiva y mutuamente
excluyente de categorias (cualitativas o
cuantitativas) con una tabulacin (en
valores absolutos o porcentajes) de
cuntas observaciones en los datos se
encuentran en cada categora.
Frequency
2
1
2
2
2
1
2
4
3
5
5
5
5
1
2
2
2
1
2
1
n= 50
Raw Scores
(Intervalsof Five)
6064
5559
5054
4549
4044
3539
3034
2529
2024
1519
1014
59
04
Frequency
5
4
3
0
0
7
10
11
4
3
0
2
1
n = 50
Comando histogram
Estadsticas de resumen:
El conjunto de agregados numricos de una
distribucin de frecuencias las que
resumen una caracterstica especfica de
un conjunto de datos.
Mediana
Percentil
Variacin
Moda
Rango
Varianza
Coeficiente
de Variacin
Desviacin Estandar
Medidas de Variacin
Variacin
Varianza
Rango
Desviacin Estandar
Varianza de
la poblacin
Varianza
de la
muestra
Rango Intercuartil
Desviacin
estandar de
la poblacin
Desviacin
estandar
de la
muestra
Coeficiente
de variacin
S
CV
100%
X
Ejemplo
by / bysort y Tabstat
Poblacin
Muestra
Estimacin puntual de la
VARIANZA
Poblacin
Muestra
Intervalos de confianza de
variables normales
Ci varlist, level( )
Intervalos de confianza de
proporciones
Exploracin grfica
Una manera visual y muy intuitiva de
tener una imagen clara de los datos.
Mtodo muy usado para presentar
resultados.
Un solo grfico puede contener una
densidad muy alta de informacin
Sujeta a interpretaciones subjetivas y
problemas de ilusin
66
13
14
15
16
17
18
19
20 21
Mean = 15.5
s = 3.338
20 21
Mean = 15.5
s = .9258
20 21
Mean = 15.5
s = 4.57
Data B
11 12
13
14
15
16
17
18
19
Data C
11 12
13
14
15
16
17
18
19
Al incrementar datos
la distribucin cambia..
Perfil de la distribucin
(skewness coefficient)
Describe cmo los Datos estn
Distribudos
Perfil de la distribucin
Describe cmo los Datos estn
Caracterizacin del perfil de la
distribucin:
Simtrica o sesgada
Distribudos
Perfil de la distribucin
Describe cmo los Datos estn
Caracterizacin del perfil de la
distribucin:
Simtrica o sesgada
< -1
Sesgada izquierda
Mean Median Mode
Distribudos
Perfil de la distribucin
Describe cmo los Datos estn
Caracterizacin del perfil de la
distribucin:
Distribudos
Simtrica o sesgada
< -1
Sesgada izquierda
Media Mediana Moda
>1
Sesgada derecha
Moda MedianaMedia
10
12
Simtrica
Q1
Mediana Q3
Sesgada derecha
Q1 Mediana Q3
.01
Density
.02
.03
20
40
Edad del paciente
60
80
Box plot
Ganancias
25%
Ganancias
25%
Ganancias
25%
Labor
Costs
Administrative
Costs
Administrative
Costs
Labor
Costs
75
50
25
87
88
89
90
91
92
100
75
50
25
87
88
89
90
91
92
1.
Errores de medicin
2.
Resultados atpicos
La recomendacin es corregir los errores (si es
posible) y remover las observaciones atpicas.
PERO! Y si as es la ciencia ?! Mejor hacer doble
anlisis: con y sin outliers
Anlisis de OUTLIERS:
Datos Simtricos
Valores que se exceden en 3 DS de la media
outlier
region
outlier
region
X -3s
X + 3s
Anlisis de OUTLIERS:
Datos sesgados:
Valores que se exceden de 3 rangos intercuartiles
por debajo del primer cuartil Q1 o por encima del
tercer cuartil (Q3) (percentiles 25 y 75
respectivamente)
Sesgada izquierda
Sesgada Positiva
outlier
region
Q1 3(Q3 Q1)
outlier
region
Q1
Q3
Q1
Q3
Q3 + 3(Q3 Q1)
Tratamientos TB MDR
Beginning of
treatment
1st month of
treatment
P++
P++
+
P-+
+
P-+
P +-
P +P--
3rd month of
treatment
P++
P-+
P +P--
2nd month of
treatment
P--
Probabilidad de Conversin en Bk
y Cultivo durante el tratamiento
Estandarizado