Академический Документы
Профессиональный Документы
Культура Документы
Bloque repaso UD 5
UD 5- ESTADSTICA BSICA
NDICE
1-INTRODUCCIN
2-CONCEPTOS BSICOS
3-REPRESENTACIN DE LOS DATOS
3.1-TABLAS DE DISTRIBUCIN DE FRECUENCIAS
3.2-GRFICAS
4-MEDIDAS DE TENDENCIA CENTRAL
4.1-MEDIA
4.2-MEDIANA
4.3-MODA
5-CUARTILES Y PERCENTILES
6-MEDIDAS DE DISPERSIN
6.1-VARIANZA
6.2-DESVIACIN TIPICA O ESTNDAR
6.3-AMPLITUD DEL INTERVALO
6.4-COEFICIENTE DE VARIACIN
7-DISTRIBUCION DE VARIABLES CONTNUAS
8-LA CURVA NORMAL (Gaussiana)
9-LA DISTRIBUCION NORMAL ESTANDAR (TIPIFICACIN)
9.1-INTERPRETACION DE LAS AREAS DE LA CURVA NORMAL
9.2-USO DE LA TABLA DE AREAS BAJO LA CURVA NORMAL
10-ESTUDIO CONJUNTO DE DOS VARIABLES CUANTITATIVAS: CORRELACION Y
REGRESIN
10.1-DIAGRAMA DE DISPERSION
10.2-COEFICIENTE DE CORRELACION DE PEARSON
10.2.1-INTERPRETACIN DEL COEFICIENTE DE CORRELACION DE
PEARSON
10.2.2-FACTORES DE LOS QUE DEPENDE EL COEFICIENTE DE
CORRELACION DE PEARSON
10.3-REGRESION: ECUACIN DE LA RECTA
10.3.1-CLCULO DE LA ECUACIN DE REGRESIN POR EL MTODO
DE LOS MNIMOS CUADRADOS
10.4-ERROR DE ESTIMACIN O ERROR MUESTRAL
10.4.1-CLCULO DEL ERROR DE ESTIMACIN O ERROR MUESTRAL
EN DISTRIBUCIONES NORMALES (GAUSIANAS), N>30
10.4.2-CLCULO DEL ERROR DE ESTIMACIN O ERROR MUESTRAL
PARA
DISTRIBUCIONES
PEQUEAS
(N<30
DATOS)
DISTRIBUCIONES DE STUDENT
11-PRUEBA DEL JI (CHI) AL CUADRADO (2): PRUEBA DE INDEPENDENCIA ENTRE
DOS VARIABLES CUALITATIVAS
12-DETERMINACIN DEL TAMAO DE UNA MUESTRA
1
Bloque repaso UD 5
1-INTRODUCCIN
La Estadstica es la ciencia cuyo objetivo es recopilar, organizar y analizar una serie de
datos sobre individuos, grupos, series de hechos, etc. para deducir unos significados
precisos (ej. porcentaje de nios que nacern con una determinada enfermedad en una
determinada poblacin), o para decidir la aceptacin o rechazo de una hiptesis
previamente planteada (ej: fumar cigarrillos de tabaco puede provocar cncer de
pulmn?).
2-CONCEPTOS BSICOS
Poblacin es el conjunto de todos los individuos que tienen en comn alguna
caracterstica que puede ser observada y en los que se desea estudiar un
determinado fenmeno.
Tambin puede definirse como el grupo de individuos a los que se desea extrapolar o
aplicar los resultados obtenidos en una investigacin.
Ej: si se desea saber si el fumar cigarrillos de tabaco provoca cncer de pulmn, la
poblacin es todos los hombres o mujeres que fuman cigarrillos de tabaco.
La poblacin puede ser finita o infinita. Por ejemplo, si se desea saber el porcentaje de
enfermos hospitalizados en la Comunidad Valenciana que contraen una enfermedad
nosocomial (enfermedad infecciosa diferente del motivo del ingreso) la poblacin es
finita (suma de todos los pacientes de los hospitales de la red valenciana de salud).
Mientras que si se desea saber el porcentaje de nios que nacern con sndrome de
Down en madres mayores de 35 a. la poblacin es infinita ya que comprende todas las
mujeres del mundo mayores de 35 a.
Como la poblacin normalmente est formada por un n tan grande de individuos (que
es imposible procesar y analizar todos los datos posibles), la recopilacin de datos y su
anlisis posterior se efecta sobre una muestra de la poblacin objeto de estudio.
Muestra una parte de la poblacin en la cual se observa un fenmeno y del que se
recopilan los datos, se organizan y se analizan para, a partir de los resultados obtenidos,
aplicarlos al total de la poblacin.
Ej. para la poblacin mujeres mayores de 35 a. la muestra puede ser 2000 mujeres
mayores de 35 a. que han tenido un nio en el ltimo ao. Es obvio que sera imposible
recoger el resultado de todos los nacimientos de todas las mujeres del mundo aunque
solo fuera en el ltimo ao.
Estadstica descriptiva es la parte de la Estadstica dedicada a describir las
caractersticas de un conjunto de individuos (muestra) sobre los que se efectuar el
estudio estadstico.
Estadstica inferencial es la parte de la Estadstica dedicada a sacar conclusiones de
las caractersticas de la poblacin a partir del anlisis de los datos recopilados y
analizados en una muestra de esa poblacin.
Variable es cada una de las caractersticas que se estudian en una poblacin (o
muestra). Por ejemplo: estado civil, n de hijos, sexo, tipo de enfermedad, nivel de
colesterol, etc. A cada una de las posibles formas que puede adoptar la variable que se
estudie se le llama modalidad o categora.
2
Bloque repaso UD 5
Semicuantitativa o
cuasicuantitativa
Cuantitativa discreta
Cuantitativa continua
CARACTERSTICAS
Son cualidades o atributos de la
muestra (y poblacin).
Estas cualidades no pueden ser
ordenadas de mayor a menor.
Son cualidades o atributos que
pueden ser ordenados de mayor
a menor (o viceversa)
Son atributos o caractersticas
que pueden ser contados, pero
entre dos valores no hay
valores intermedios.
Se llama discreta porque hay
vacios o interrupciones entre
dos valores.
Son atributos o caractersticas
que pueden ser contados, y
adems entre dos valores
puede haber infinitos valores
intermedios.
EJEMPLOS
Sexo, estado civil, tipo de
enfermedad
Grado de mejora en un
tratamiento:
nula,
leve,
moderada o mxima.
N de hijos: 1,2, 3, (no
puede ser 1,43 hijos)
N de infartos.
N de partos.
Etc.
Nivel de glucosa en sangre:
90/ 90,1/90,2/o
90,10/ 90,11/90,12
90,100/
90,101/90,102,
Frecuencia absoluta
Xi
X1
X2
X3
.
.
.
Xi
N
(n
individuos
estudiados)
Frecuencia relativa
(o proporcin o tanto
por uno)
p1
p2
p3
.
.
.
pj
Porcentaje %
P1
P2
P3
.
.
.
Pi
Es condicin de la variable estudiada que cada caso (fenmeno o individuo) est solo
representado en una modalidad, por ejemplo, si la variable es el n de hijos, las
3
Bloque repaso UD 5
modalidades sern 1,2,3n. y cada mujer estudiada solo puede estar contemplada en
una modalidad (1 hijo, o dos hijos, o.., etc.).
La frecuencia absoluta es el n de casos (fenmeno o individuos) observados en el
estudio.
La frecuencia relativa es el cociente entre la frecuencia absoluta y el n total de casos
observados (N)
El porcentaje es la frecuencia relativa multiplicada por 100.
Las tablas difieren un poco segn el tipo de variable estudiada:
Tablas de distribucin de frecuencias para variables cualitativas.
Tablas de distribucin de frecuencias para variables cuasicuantitativas.
Tablas de distribucin de frecuencias para variables cuantitativas discretas.
Tablas de distribucin de frecuencias para variables cuantitativas continuas.
A continuacin se ver un ejemplo de cada tabla.
3.1.1-EJEMPLO DE TABLAS
VARIABLES CUALITATIVAS
DE
DISTRIBUCIN
DE
FRECUENCIAS
PARA
Modalidades de la
variable
Postparto
Preparto
Preoperatorio
Postoperatorio
Total =
Frecuencia absoluta
Frecuencia relativa
(o proporcin o tanto
por uno)
Porcentaje %
Xi
60
50
30
60
200
(N= camas estudiadas
con
pacientes
ingresadas)
3.1.2-EJEMPLO DE TABLAS DE
VARIABLES CUASICUANTITATIVAS
0,30
0,25
0,15
0,30
1
(como es tanto por
uno la suma debe dar
siempre 1)
DISTRIBUCIN
DE
30 %
25 %
15 %
30 %
100 %
FRECUENCIAS
PARA
Modalidades
de la variable
Frecuencia
absoluta
Bloque repaso UD 5
Frecuencia
relativa/proporci
n
Xi
Nula
Leve
Moderada
Mxima
TOTAL
147
129
212
134
622 = N
pacientes
estudiados
0,236
0,207
0,341
0,216
23,6 %
20,7 %
34,1 %
21,6 %
100 %
Frecuenci
a absoluta
acumulad
a
na
Frecuenci
a relativa
acumulad
a
pa
Porcentaj
e
acumulad
o
147
276
488
622
0,236
0,443
0,784
1
23,6 %
44,3 %
78,4 %
100%
Como norma antes de comenzar con los clculos, y para facilitar la interpretacin de
las frecuencias acumuladas, es mejor que se site la modalidad ms baja o
pequea arriba del todo y abajo la mayor.
Se comienza calculando la frecuencia acumulada para la modalidad ms inferior (en
este caso nula), anotando su frecuencia absoluta como acumulada (147).
Se sigue calculando la frecuencia acumulada de la modalidad siguiente (leve)
sumando a su frecuencia absoluta (129) la frecuencia acumulada de antes (147)
147 + 129 = 276
La frecuencia acumulada de la tercera modalidad (moderada) es su frecuencia
absoluta ms las dos anteriores 147 + 129 + 212= 488
Y as sucesivamente hasta llegar a la ltima modalidad (en este caso es mxima)
donde su frecuencia acumulada es su frecuencia absoluta ms las tres anteriores
147 + 129 + 212 + 134= 622 (que debe coincidir con N)
De forma semejante se calcula la frecuencia relativa acumulada y el porcentaje
acumulado siempre partiendo de la modalidad ms inferior y sumando cada vez
las siguientes modalidades superiores.
DE
FRECUENCIAS
PARA
Son iguales que las tablas para variables cuasicuantitativas pero con valores numricos
en la columna de modalidades/categoras.
Ejemplo: se estudia el n de hijos en una muestra de 107 familias:
Modalidades
de la variable
Frecuencia
absoluta
Frecuencia
relativa
pi
Pi =
Xi
0
1
2
3
4
5
6
7
9
12
TOTAL
5
7
10
18
16
14
13
12
10
2
107
0,047
0,065
0,093
0,168
0,149
0,131
0,122
0,112
0,094
0,019
1
4,7 %
6,5 %
9,3 %
16,8 %
14,9 %
13,1 %
12,2 %
11,2 %
9,4 %
1,9 %
100 %
Frecuencia
absoluta
acumulada
na
Frecuencia
relativa
acumulada
pa
Porcentaje
acumulado
Pa
5
12
22
40
56
70
83
95
105
107
0,047
0,112
0,205
0,373
0,522
0,653
0,775
0,887
0,981
1
4,7 %
11,2 %
20,5 %
37,3 %
52,2 %
65,3 %
77,5 %
88,7 %
98,1 %
100 %
5
Bloque repaso UD 5
DE
FRECUENCIAS
PARA
Las tablas de distribucin de frecuencias para variables cuantitativas se realizan con los
datos agrupados en intervalos.
Ya hemos comentado que en estos casos, entre dos valores (de n enteros), puede haber
infinitos valores decimales. Por ello, para facilitar los clculos y la interpretacin, se
recurre a agruparlos por intervalos. Para ello se sigue el siguiente proceso:
1- Se determina la amplitud de la distribucin (A) el intervalo dentro del cual se
encuentran todos los valores de la variable. Se calcula restando al valor mximo el valor
mnimo:
A = X mx. X mn.
2-Se fija o elige el n de intervalos que queremos en la representacin de resultados
depende del tamao de la muestra.
Teniendo en cuenta que si hay pocos intervalos se perder parte de la informacin y si
hay muchos la tabla ser excesivamente larga.
Algunos autores recomiendan que el n de intervalos sea la raz de N ( ) (n de datos),
por tanto se seguir este criterio.
3-Se calcula la amplitud de los intervalos (i) se calcula dividiendo la amplitud de la
distribucin (A) por el n de intervalos:
116
123
140
124
144
115
121
122
133
123
139
109
138
126
120
127
130
146
111
139
114
125
131
112
137
125
Como es una variable cuantitativa continua suponemos que cada valor discreto (entero)
representa a todos los infinitos valores comprendidos entre media unidad a su izquierda y
media unidad a su derecha ej, el valor discreto 112 representa a todos los valores
comprendidos entre 111,5 y 112,5
Se construye la tabla siguiendo el protocolo anterior:
Bloque repaso UD 5
Intervalos
Recuento
Frecuencia
absoluta
Frecuencia
relativa
%
Pi
Frecuencia
absoluta
acumulada
na
Xi
105-113
114-122
123-131
132-140
141-149
TOTAL
////
//// /
//// ////
//// //
///
4
6
10
7
3
30
0,13
0,20
0,34
0,23
0,10
1
13 %
20 %
34 %
23 %
10 %
100 %
4
10
20
27
30
Frecuencia
relativa
acumulada
Porcentaje
acumulado
Pa
pa
0,13
0,33
0,67
0,90
1
13
33
67
90
100
Bloque repaso UD 5
Se llaman lmites aparentes de la variable a los valores que marcan los extremos de
los intervalos en este caso son los nmeros 105, 113, 114, 122, 123, 131, 132, 140,
141 y 149.
Sin embargo, como la variable es continua, es decir con infinitos valores entre un valor
discreto y otro, se definen otros lmites, los lmites reales o exactos de la variable
que comprenden media unidad por arriba y por debajo de cada lmite aparente en
este caso seran 104,5; 113,5; 122,5; 131,5; 140,5 y 149,5. Estos valores tambin se
pueden utilizar para marcar los lmites de los intervalos. Si esto lo vemos representado
en una tabla sera:
Lmites
Lmites reales o
Marca de clase o Punto medio del intervalo
aparentes
exactos
Xj
105 113
114 122
123 - 131
132 140
141 - 149
104,5 - 113,5
113,5 - 122,5
122,5 - 131,5
131,5 - 140,5
140,5 - 149,5
109
118
127
136
145
Por otro lado, al establecer dos intervalos consecutivos, por ejemplo de 113,5 a 122,5 y
de 122,5 a 131,5, hemos de decidir si el valor 122,5 (final de uno e inicio del siguiente)
pertenece al primer intervalo o al segundo. Para ello empleamos los smbolos [ y
Si empleamos [ (delante del intervalo) o ] (detrs del intervalo) el valor
situado junto a l pertenece al intervalo.
Si empleamos (delante del intervalo) o [ (detrs del intervalo) el valor
situado junto a l no pertenece al intervalo.
Por ejemplo se pueden anotar los intervalos de la siguiente forma:
Lmites reales o
exactos
Significado
[104,5 - 113,5[
[113,5 - 122,5[
[122,5 - 131,5[
[131,5 - 140,5[
[140,5 - 149,5[
3.2-REPRESENTACIONES GRFICAS
Es otra forma de ofrecer los resultados de un estudio estadstico. Pueden ser:
Diagramas de barras
Diagramas de sectores
Histogramas
Polgonos de frecuencias.
8
Tipo de
grfica
Diagramas de
barras
Se emplea para
representar
Variables
cualitativas,
cuasicuantitativas o
cuantitativas
discretas
Variables
cualitativas,
Diagramas de
cuasicuantitatisectores
vas o
cuantitativas
discretas
Pictogramas
Variables
cualitativas,
cuasicuantitativas o
cuantitativas
discretas
Caractersticas
Bloque repaso UD 5
Aspecto
Conjunto de barras
separadas sobre un eje
de
coordenadas:
la
altura de la barra es la
frecuencia
de
la
modalidad
(absolutas,
relativas o %).
La base de las barras
es la misma para todas
ellas.
Si
la
variable
es
cuantitativa el orden
de las barras es
indiferente.
Si
es
cuasicuantitativa
o
cuantitativa discreta se
respeta el orden de
menos a ms.
Crculo con sectores de
diferentes colores.
Cada sector representa
una modalidad.
El tamao del cada
sector es proporcional
a cada frecuencia el
tamao se calcula con
una regla de tres
sabiendo que la suma
de todas las frecuencias
debe corresponder con
los 360 del crculo.
Un dibujo representa la
variable estudiada.
El tamao del dibujo o
en n de dibujos que se
incluyan en el grfico es
proporcional
a
la
frecuencia.
Bloque repaso UD 5
Intervalos diferentes
Variables
cuantitativas
continuas
Conjunto
de
rectngulos adosados
unos a otros.
La
base
de
los
rectngulos
es
la
amplitud del intervalo.
Puede ser la misma o
diferente.
La altura de cada
rectngulo
es
proporcional
a
la
frecuencia
(absoluta,
relativa o al %)
Variables
Polgonos de
cuantitativas
frecuencias
continuas
Histogramas
Intervalos iguales
Frecuencia
absoluta
Xi
Nula
Leve
Moderada
Mxima
147
129
212
134
TOTAL =N pacientes
estudiados
622
23,6 %
20,7 %
34,1 %
21,6 %
10
EJEMPLO DE
FRECUENCIAS
REPRESENTACIN
Bloque repaso UD 5
DE
HISTOGRAMA
POLGONO
DE
105-113
114-122
123-131
132-140
141-149
Intervalos
reales
Frecuencia absoluta
Xi
104,5 -113,5
113,5-122,5
122,5-131,5
131,5-140,5
140,5-149,5
TOTAL
4
6
10
7
3
30
11