Вы находитесь на странице: 1из 49

Estadstica

Aspectos generales.
Qu es la estadstica?
Mtodo general de investigacin
Se utiliza en todas las ramas o ciencias y en un conjunto de procedimientos
(mtodos) que se utilizan para la recoleccin, organizacin, presentacin y
anlisis de observaciones.
Bioestadstica
Envuelve el desarrollo y aplicacin de tcnicas estadsticas a la investigacin
en campos relacionados a la salud incluyendo medicina, epidemiologa, salud
pblica y tambin en reas de estudios ambientales, investigacin agrcola y
biologa.
Conceptos
Poblacin: Es un conjunto de sujetos o individuos con determinadas
caractersticas. Como por ejemplo:
Gallinas Huevos que producen
Vacas Kilogramos de leche que producen
Modulo de ECSF
Universitarios Forneos
Mujeres
Conceptos
Muestra: Recoleccin de medidas u observaciones tomadas de una
poblacin. Hay dos tipos de muestras: Probabilsticas y NO Probabilsticas.
Conceptos
Parmetro: Caracterstica medible de una poblacin, se considera
imprescindible y orientativo para lograr evaluar o valorar una determinada
situacin.
Como:
Una vaca debe producir entre 16-20 litros de leche por da, si hay menos
produccin puede existir un problema.
Un mujer debe ingerir entre 1800 y 2200 Kcal. Al da.
Tipos de investigacin
Descriptiva: Se basa en una poblacin a la que se pretende describir en funcin
de un grupo de variables. Como por ejemplo: Los hbitos alimenticios de los universitarios de la
UAM- Xochimilco.

Comparativa: Contrasta una o mas variables. Como por ejemplo: Consumo del
desayuno en alumnos del horario de 8.00 a 12.00 en comparacin con alumnos del horario de
12.00 a 4.00.
Variables:
Una variable es un atributo o caractersticas que hacen similares a los
individuos, grupos sociales entre s, objeto o fenmeno que puede
adoptar diversos valores. Un indicador indica cmo se medir la variable.
Tipos de variables:
En cuanto al papel que tienen en la investigacin:
Dependientes
Independientes
Ejemplo:
La obesidad depende de los hbitos alimenticios de los estudiantes de la
UAM-Xochimilco.
Dependiente (X) Independiente (Y)
Medidas Descriptivas
Media
Tendencia Central
Moda

Mediana
Rango

Variacin Desviacin media


Varianza

Desviacin estndar
Coeficiente de variacin
Media
La media es la suma de todos los valores y el resultado de la suma dividido
entre todos los valores. Como por ejemplo:
Pesos en universitarios:
56
57.4
61.3 392.5/6= 65.41
61.3
76.5
80
Moda y Mediana
La moda es el valor que se repite mas veces.
La mediana es el valor que parte la distribucin por la mitad. centro de la distribucin

61.3+61.3=
122.6/2= 61.3
Rango y Desviacin media
El rango es el valor mximo valor mnimo. Como por ejemplo:
80 56 = 24 es el rango.
La desviacin media es como un criterio Qu tanto se alejan del promedio o
rango normal?

52.32/6= 8.71
Varianza
Se denomina varianza muestral cuando se calcula la varianza de una
comunidad, grupo o poblacin en base a una muestra.
Desviacin Estndar
Bsicamente es la raz cuadrada del resultado de la varianza.
Coeficiente de Variacin
En condiciones menos controladas el coeficiente de variacin es mas grande.
Muestreo Aleatorio Simple

Muestreo Simple: De acuerdo con Webster (1998) una


muestra aleatoria simple es la que resulta de aplicar un
mtodo por el cual todas las muestras posibles de un
determinado tamao tengan la misma probabilidad de ser
elegidas.
Muestreo
Para calcular el tamao de la muestra hay que tomar en cuenta 3 factores:
1. El porcentaje de confianza: Este se elige deliberadamente, los porcentajes mas utilizados
son 95% y 99%.
2. El porcentaje de error: De igual manera este valor se elige deliberadamente pero se debe
tomar en cuenta que entre mas grande sea mas pequea ser la poblacin y entre mas
pequea sea la poblacin mas inexacto ser el resultado ( existir mas fluctuacin).
Comnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de
que no son complementarios la confianza y el error.
3. El nivel de variabilidad: Hay que considerar que p y q son complementarios, es decir,
que su suma es igual a la unidad: p+q=1. Cuando no existe una investigacin estadstica
previa para fundamentar el nivel de variabilidad se suele utilizar el P: 0.5 y por lo tanto
q: 0.5 (p+q = 0.5 + 0.5).
Poblacin Infinita.
Una vez que se han determinado estos tres factores, entonces se puede
calcular el tamao de la muestra.
En el caso de que no se conozca con precisin el tamao de la poblacin:
Ejemplo:
Un estudiante de la UAM-Xochimilco quiere hacer un muestreo pero no tiene
los datos de la poblacin total. Entonces:
1 : 95% Z= 1.96
E: 5% E = 0.05
p: 0.5 y q: 1 - 0.5 = 0.5
(1.96)2 (0.5)(0.5) (3.48)(0.25) 0.96
N: = = = 384 Estudiantes
(0.05)2 0.0025 0.0025
Poblacin Finita.
Una vez que se han determinado estos tres factores, entonces se puede
calcular el tamao de la muestra.
En el caso de que SI se conozca el tamao de la poblacin:
Ejemplo
Un estudiante de la UAM-Xochimilco pretende hacer un estudio de los
hbitos alimenticios y la poblacin que quiere estudiar es la del modulo de
ECSF del turno matutino.
N: 612 estudiantes
1 : 95% Z= 1.96
E: 5% E = 0.05
p: 0.5 y q: 1 - 0.5 = 0.5
Hiptesis Estadstica
Se refiere a una hiptesis que puede ser evaluada por medio de
procesos que se modelan con una base probabilstica.
Significa que se evalan por medio de tcnicas estadsticas.
Da sustento (estadstico) a las hiptesis conceptuales o de
investigacin.
Prueba de Hiptesis
Esta prueba estadstica te ayuda a validar o comprobar una hiptesis.
PASOS:
1 Proponer las hiptesis H0 y H1, donde HO simboliza a la hiptesis nula y
H1 simboliza a la hiptesis alternativa.
2 Especificar la significacin ( de libre albedrio).
3 Calcular los valores crticos y de prueba.
4 Decisin y conclusin.
Significancia.
2 Especificar la Significacin ( de libre albedrio). Tomando en cuenta que:
P () 95% o 0.05( la probabilidad de error es menor al 5%) ES
SIGNIFICATIVO
P () 99% o 0.01( la probabilidad de error es menor al 1%) ES
ALTAMENTE SIGNIFICATIVO.
P () 90% o 0.10 ( la probabilidad de error se acerca al 5%) ES
MARGINAL.
Valores Crticos
Zc n 30
VC Depende del tamao
i tamao de la muestra Tc n < 30

<
GRAFICO H1 >

Ejemplo 1
Un universitario de la UAM- Xochimilco piensa que el porcentaje de sobrepeso en la UAM-
Xochimilco es de 30%.
Al realizar un muestreo de 200 estudiantes y tomar el IMC de cada uno de ellos encontr que
de 200 estudiantes 45 estn en sobrepeso.
Estudiantes con sobre peso: 45
Estudiantes sin sobrepeso: 155
Total de estudiantes: 200
H0 P = 0.30
HA P 0.30
Ejemplo 1
Por lo tanto:

El valor critico que se usara ser la Zc o distribucin binomial, ya que la poblacin


es mayor (>) a 30 personas. Y la significancia que el universitario eligi es de 95%.
Resultados del ejemplo 1
La formula empleada para calcular la Z es:

Si usamos : 0.05, entonces ( 1-)% es igual al 95% Zt = 1.96


[ Dado que 2.5773 > 1.96 se rechaza la H0 ], por lo tanto se concluye que estadsticamente
el porcentaje de alumnos es diferente a 30%, con un nivel de confianza del 95%. Es decir que el
porcentaje de alumnos con sobrepeso no es igual a 30%.
Ejemplo 2
En la UAM-Xochimilco un universitario comparo dos medicamentos para combatir la
hiperlipidemia (concentracin de lpidos en la sangre) en jvenes. Los niveles de triglicridos
fueron:
m
1 115 430 28
2 108 398 24
Ejemplo 2
La formula empleada en este ejemplo es:
Ejemplo 2
Por lo tanto es igual a:

Dado que la H0 nos dice que 1 2 = 0, es decir no existe diferencia,


entonces:
Resultados de ejemplo 2
Entonces:
Si el universitario deseo un nivel de confianza de 95% y la muestra es pequea
( t ), la t de tablas es igual a 2.009.
[ Dado que 1.23 < 2.009 no se rechaza Ho]
Entonces se concluye que estadsticamente no existe diferencia entre los dos
tratamientos para controlar la hiperlipidemia (P > 0.05).
Precaucin
Ni la prueba de hiptesis ni la inferencia estadstica
conducen a la comprobacin de una hiptesis,
solamente indica si la hiptesis es apoyada o no por
los datos disponibles.
Tcnicas de Anlisis Cuantitativa
Objetivo: Describir, graficar, comparar, relacionar y resumir datos obtenidos (Encuestas, series
histricas, otros)
Medidas de Asociacin entre Variables (X,Y)

REGRESION LINEAL SIMPLE


Nos sirven para determinar si existe relacin entre una variable y otra y estas
son determinadas de acuerdo a valores estadsticos y graficas.
Tipos de graficas:
Valores
Los valores que se determinan para determinar la relacin entre variables son:
Covarianza: Nos dice en porcentaje que tanta relacin existe o que tan viable
es el calculo.
Correlacin Lineal De Pearson: Este valor nos dice si la relacin que existe es
alta, media o baja(para determinar esta se requiere de la covarianza).
Coeficiente de Determinacin: Bsicamente es el valor de la correlacin
lineal multiplicada al cuadrado y multiplicado por 100, es decir el porcentaje
que explica la relacin entre las variables.
y X

MANO (cm) PIE (cm)


17 22
17.3 22.1
18 22.5

Ejemplo 1
16 24
17.4 22.1
16 23
16 22.5
Un alumno de la UAM-Xochimilco quiere
17.5 24
determinar la relacin que existe entre el 16.5 23
tamao de la mano y el tamao del pie. 16 21.5
Obtuvo las medidas (cm) del pie y de la 17.1 24

mano de una muestra de 15 universitarios. 18 25


17.5 23.5
17.5 22
16 24
Clculos Ejemplo 1
(1 )(1 )
1 1
COVARIANZA: CovXY:

=
1
(345.2)(253.8)
5842.02 5842.02 5840.78
CovXY: 15
= = 0.0883
14 14

[ Nos dice que hay muy poca relacin entre el tamao del pie y el
tamao de la mano]
Clculos Ejemplo 1
CORRELACION LINEAL DE PEARSON

Rxy: =
()
0.0883
Rxy: = 0.1113
(1.0218)(0.7636)
COEFICIENTE DE DETERMINACION
R2xy%: ()2 x 100 =
R2xy%: (0.1113)2 100 = 1.3%
Grafica de Regresin Lineal Simple
Para predecir la recta se requieren otra ecuacin llamada Ecuacin de prediccin de
la regresin lineal simple.
i = o + 1 ( Xi)
0.0883
B1 = = = 0.84 [nos dice que de acuerdo a los datos, por cada Cm del pie la
2 1.044
mano crece 0.84 ml].
o = My (1)(Mx)= 16.9 (0.84)(23.0) =14.97 [ nos dice que de acuerdo a los datos,
nadie que calce entre el 21.5 25.0 debe tener la mano mas pequea de 14.97 cm].
Ecuacin de prediccin de regresin lineal
simple
Entonces:
i = o + 1 ( Xi) i= 14.97 + (0.84)( el valor que quieras predecir)
El alumno de la UAM-Xochimilco decidi predecir los Cm de la mano y para esto
utilizo el valor mas grande y el valor mas pequeo de los datos que obtuvo ( cm del
PIE).
Cuando en la ecuacin utilizas el valor (cm) de los pies el resultado es la
prediccin de lo que debera medir la MANO y viceversa.
i= 14.97 + (0.84)( 21.5) = 16.78
i= 14.97 + (0.84)(25) = 17.89
Grafica de Regresin Lineal Simple
REGRESION LINEAL SIMPLE
25.5

25 25
24.5

24 24 24 24
23.5 23.5
23 23 23
22.5 22.5 22.5
22 22 22.1 22.1 22

21.5 21.5
21
15.5 16 16.5 17 17.5 18 18.5
Prueba de Independencia
Se usa para probar si 2 criterios de clasificacin son independientes.
La mastitis es independiente del sistema de ordeo.
CON SIN MASTITIS TOTAL
MASTITIS
SISTEMA DE 135 745 880
ORDEO A
SISTEMA DE 159 995 1554
ORDEO B
TOTAL 294 1740 2043
Porcentajes
294
Con Mastitis: 2034
= 0.1445 14.5%
1740
Sin Mastitis: 2034
= 0.855 85.5%
880
Sistema A: 2034= 0.4374 43.74%
1154
Sistema B: 2034= 0.5674 56.74%
Clculos Probabilsticos
(Sistema A)(Mastitis): (0.4326)(0.1445) = 0.0625 Esperado: (0.0625)(2034)= 127.2
(Sistema A)(Sin Mastitis): (0.4326)(0.855)=0.3701 Esperado: (0.3701)(2034)=752.8
(Sistema B)(Sin Mastitis): (0.5674)(0.8555)= 0.4853 Esperado: (0.4853)(2034)=987.2
(Sistema B)(Mastitis): (0.5674)(0.1445)= 0.0820 Esperado: (0.0820)(2034)=166.8
Clculos
La formula empleada para este ejemplo es:
() 2
2
X = 1

En este caso los grados de libertad se calculan con la siguiente formula:
gl= (numero de columnas menos 1)(numero de reglones menos 1) = (2-1)(2-1) = (1)(1) = 1 gl

2 (.) (.) (.) (.)


Entonces: X = + + + =
. . . .

X = 0.4783 + 0.0808 + 0.3647 + 0.1941 = 0.9854


Resultados de la Prueba de Independencia

X 2 Xt
[ Dado que 0.9854 < 3.48 no se rechaza Ho, es decir de acuerdo a los datos
observados el sistema de ordeo es independiente de la mastitis.]
Este resultado indirectamente nos dice que no existe ninguna asociacin entre
el sistema de ordeo y la mastitis.
Bibliografa
Dr. Hctor Castillo Jurez. Prueba de hiptesis[ presentacin de power
point]. Mxico. [ consultado el 1 junio del 2017]. Disponible en:
https://outlook.live.com/owa/?mkt=es-es&path=/attachmentlightbox
EcuRed conocimiento con todos y para todos[sede web].
Mxico.[consultado el 5 de junio del 2017]. Disponible en:
https://www.ecured.cu/Bioestad%C3%ADstica
Dra. Gabriela Miranda Villasana. Captura de datos [presentacin de power
point]. Mxico.[ Consultado el 3 de junio del 2017].