Вы находитесь на странице: 1из 26

Bioestadstica

Tema 1: Introduccin a la estadstica

Para qu sirve la estadstica?


La Ciencia se ocupa en general de fenmenos observables La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes Los modelos que crea la ciencia son de tipo determinista o aleatorio La Estadstica se utiliza como tecnologa al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza La Bioestadstica [...] ensea y ayuda a investigar en todas las reas de las Ciencias de la Vida donde la variablidad no es la excepcin sino la regla Carrasco de la Pea (1982)

Definicin
La Estadstica es la Ciencia de la

Sistematizacin, recogida, ordenacin y presentacin de los datos referentes a un fenmeno que presenta variabilidad o incertidumbre para su estudio metdico, con objeto de
deducir las leyes que rigen esos fenmenos,

y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.

Pasos en un estudio estadstico

Plantear hiptesis sobre una poblacin


Los fumadores tienen ms bajas laborales que los no fumadores En qu sentido? Mayor nmero? Tiempo medio?

Decidir qu datos recoger (diseo de estudio)

Qu individuos pertenecern al estudio (muestras)


Fumadores y no fumadores en edad laboral. Criterios de exclusin Cmo se eligen? Descartamos los que padecen enfermedades crnicas? Nmero de bajas Tiempo de duracin de cada baja Sexo? Sector laboral? Otros factores?

Qu datos recoger de los mismos (variables)


Recoger los datos (muestreo)

Estratificado? Sistemticamente?

No tienes que entenderlo (an)

Describir (resumir) los datos obtenidos


tiempo medio de baja en fumadores y no (estadsticos) % de bajas por fumadores y sexo (frecuencias), grficos,...

Realizar una inferencia sobre la poblacin

Los fumadores estn de baja al menos 10 das/ao ms de media que los no fumadores.

Cuantificar la confianza en la inferencia


Nivel de confianza del 95% Significacin del contraste: p=2%

Mtodo cientfico y estadstica


Plantear hiptesis Disear experimento

Obtener conclusiones

Recoger datos y analizarlos

Poblacin y muestra

Poblacin es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para poder abarcarlo.

Muestra es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones) Debera ser representativo Esta formado por miembros seleccionados de la poblacin (individuos, unidades experimentales).

Variables

Una variable es una caracterstica observable que vara entre los diferentes individuos de una poblacin. La informacin que disponemos de cada individuo es resumida en variables.

En los individuos de la poblacin, las caractersticas de uno a otro es variable:


El grupo sanguneo

{A, B, AB, O} Var. Cualitativa {Deprimido, indiferente, Muy Feliz} Var. Ordinal

Su nivel de felicidad declarado

El nmero de hijos

{0,1,2,3,...} Var. Numrica discreta


{162 ; 174; ...} Var. Numrica continua

La altura

Tipos de variables y Escalas de medicin


ESCALAS DE MEDICIN

Cualitativas Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero (no se pueden hacer operaciones algebraicas con ellos). Cuantitativas o Numricas Si sus valores son numricos (tiene sentido hacer operaciones algebraicas con ellos) Por lo tanto tienen diferentes escalas en que se pueden medir (Escalas de medicin) VARIABLES CUALITATIVAS

Nominales: Si sus valores no se pueden ordenar

Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)

Ordinales: Si sus valores se pueden ordenar

Mejora a un tratamiento, Grado de satisfaccin, Intensidad del dolor

VARIABLES NUMERICAS

Discretas: Si toma valores enteros

Nmero de hijos, Nmero de cigarrillos, Num. de cumpleaos

Continuas: Si entre dos valores, son posibles infinitos valores intermedios.

Altura, Presin intraocular, Dosis de medicamento administrado, edad

LA CODIFICACION DE VARIABLES EN UNA BASE DE DATOS

Cuando se usa un paquete estadstico es muy importante saber codificar las variables de acuerdo al tipo de variable y su escala de medicin, mediante nmeros se codifican para poder procesarlas con facilidad en un ordenador. Es conveniente asignar etiquetas a los valores de las variables para recordar qu significan los cdigos numricos.

Sexo (Cualit: Cdigos arbitrarios)

1 = Hombre 2 = Mujer 1 = Blanca 2 = Negra,... 1 = Muy feliz 2 = Bastante feliz 3 = No demasiado feliz 0 = No sabe 99 = No contesta...

Raza (Cualit: Cdigos arbitrarios)


Felicidad Ordinal: Respetar un orden al codificar.


Se pueden asignar cdigos a respuestas especiales como


Estos cdigos especiales deben ser tenidos en cuenta en el anlisis como Datos perdidos (missing data)

LA CODIFICACION DE VARIABLES EN UNA BASE DE DATOS


En el caso de algunas variables numricas tambin se pueden codificar con escalas de medicin ordinales, aunque en algunos casos es preferible capturar los datos crudos por que de esa forma se les pueden realizar mejores y mas anlisis estadsticos detallados. Esto lo determina el investigador dependiendo de los fines que persiga, incluso puede tener ambas a la vez.

EJEMPLOS: PESO, TEMPERATURA. HIPERTERMICO SOBREPESO EDAD NIO, ADULTO

EJERCICIO No. 1 (Grupal)

Del cuestionario entregado debe determinar el tipo de variable as como la escala de medicin de la que se trata y codificar para llenar una base de datos.

Ejercicio en la base de datos SPSS

Con base al instrumento codificado vamos a disear una base de datos iniciando con la codificacin de las variables.

Aunque se codifiquen como nmeros, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de clculo estadstico. No todo est permitido con cualquier tipo de variable.

Otras modalidades para procesar la informacin numrica es mediante subcategorias o intervalos . Ejemplo de subcategoras: Edades:

Menos de 20 aos, de 20 a 50 aos, ms de 50 aos Menos de 3 hijos, De 3 a 5, 6 o ms hijos

Hijos:

Algunos autores recomiendan que los intervalos pueden ser desde6 yno superen a 8 pero otros consideran que dependiendo de la extensin de los rangos se pueden considerar de 6 a 15 intervalos. Existe una formula para calcular el nmero de intervalos la regla de sturges k= 1 + 3.322 (log10 n) En donde:

k= Nmero de intervalos n= Nmero de valores o datos Para sacar la amplitud de intervalo entonces la frmula es: w= R/k En donde : w= amplitud de intervalo R= rango = valor superior - valor inferior

Las subcategorias/clases deben forman un sistema exhaustivo y excluyente Exhaustivo: No podemos olvidar ningn posible valor de la variable

Mal: Cul es su color del pelo: (Rubio, Moreno)? Bien: Cul es su grupo sanguneo?

Excluyente: Nadie puede presentar dos valores simultneos de la variable

Estudio sobre el ocio


Mal: De los siguientes, qu le gusta: (deporte, cine) Bien: Le gusta el deporte: (S, No) Bien: Le gusta el cine: (S, No) Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)

Escala de medicin de frecuencias

Cuando se agrupan los datos en intervalos y se quiere saber el nmero de valores que caen dentro de cada intervalo de clase es necesario hacer una distribucin de frecuencias. Existen varios tipos de frecuencias entre las que encontramos: Frecuencia absoluta Frecuencia acumulada Frecuencia relativa o porcentaje. Frecuencia relativa acumulada

Ejemplo:

Ordena y clasifica en intervalos de clase la siguiente serie de edades, posteriormente saca todas las frecuencias en una tabla.
DICTADO.

INTERVALOS

FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA ACUMULADA RELATIVA RELATIVA ACUMULADA

10-19 20-29 30-39

4 66 47

4 70 117

.0237 .3905 .2781

.0237 .4142 .6923

40-49
50-59 60-69 TOTAL

36
12 4 169

153
165 169

.2130
.0710 .0237 1.0000

.9053
.9763 1.0000

Tablas de frecuencia

Las tablas de frecuencia permiten exponer de forma ordenada y clasificada la informacin , de forma que no se pierda nada de informacin (o poca).

Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad Frecuencias relativas (porcentajes): Idem, pero dividido por el total Frecuencias acumuladas(porcentaje acumulado) :Slo tienen sentido para variables ordinales y numricas

Muy tiles para calcular cuantiles (ver ms adelante)


Qu porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8 Entre 4 y 6 hijos? Soluc 1: 8,4%+3,6%+1,6%= 13,6%. Soluc 2: 97,3% - 83,8% = 13,5%
Nmero de hij os

Sexo del encuestado Porcentaje vlido 41,9 58,1 100,0

Vlidos

Hombre Mujer Total

Frecuencia 636 881 1517

Porcentaje 41,9 58,1 100,0

Vlidos

Perdidos Total

0 1 2 3 4 5 6 7 Ocho o ms Total No contesta

Frecuencia 419 255 375 215 127 54 24 23 17 1509 8 1517

Porcentaje 27,6 16,8 24,7 14,2 8,4 3,6 1,6 1,5 1,1 99,5 ,5 100,0

Porcentaje vlido 27,8 16,9 24,9 14,2 8,4 3,6 1,6 1,5 1,1 100,0

Porcentaje acumulado 27,8 44,7 69,5 83,8 92,2 95,8 97,3 98,9 100,0

Presentacin ordenada de datos


7

Gnero Hombre Mujer

Frec. 4 6

6 5 4 3 2 1 0 Hombre Mujer

Las tablas de frecuencias y las representaciones grficas son dos maneras equivalentes de presentar la informacin. Las dos exponen ordenadamente la informacin recogida en una muestra.

Ejemplo

Cuntos individuos tienen menos de 2 hijos? frec. indiv. sin hijos + frec. indiv. con 1 hijo = 419 + 255 = 674 individuos Qu porcentaje de individuos tiene 6 hijos o menos? 97,3% Qu cantidad de hijos es tal que al menos el 50% de la poblacin tiene una cantidad inferior o igual? 2 hijos

50%

Grficos para v. cualitativas

Diagramas de barras

Alturas proporcionales a las frecuencias (abs. o rel.) Se pueden aplicar tambin a variables discretas

Diagramas de sectores (pastel, polares)


No usarlo con variables ordinales. El rea de cada sector es proporcional a su frecuencia (abs. o rel.)

Pictogramas

Fciles de entender. El rea de cada modalidad debe ser proporcional a la frecuencia. De los dos, cul es incorrecto?.

Grficos diferenciales para variables numricas


419
400

375

Recuento

Son diferentes en funcin de que las variables sean discretas o continuas. Valen con frec. absolutas o relativas.

300

255 215
200

127
100

54 24 23 17

Diagramas barras para v. discretas

7 Ocho o ms

Se deja un hueco entre barras para indicar los valores que no son posibles
250 200

Nme ro de hijos

El rea que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.

Recuento

Histogramas para v. continuas

150

100

50

20

40

60

80

Edad del encue stado

Diagramas integrales

Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos en clase. Se pasan de los diferenciales a los integrales por integracin y a la inversa por derivacin (en un sentido ms general del que visteis en bachillerato.)

Qu hemos visto?

Definicin de estadstica Poblacin Muestra Variables


Cualitativas Numricas Tablas de frecuencias


Presentacin ordenada de datos

absolutas relativas acumuladas Cualitativas Numricas


Representaciones grficas

Diferenciales Integrales

Вам также может понравиться