Вы находитесь на странице: 1из 48

Bioestadística

Tema 1: Introducción a la estadística

Universidad Colegio Mayor de Cundinamarca


Introducción a la estadística

Universidad Colegio Mayor de Cundinamarca


Estudio estadístico:

Universidad Colegio Mayor de Cundinamarca


¿Qué es la estadística?
Es la ciencia que maneja los datos a través de un
proceso que va desde el diseño del estudio, recogida de
los datos, análisis, para finalmente organizar, resumir y
mostrar la información contenida en ellos para sacar
conclusiones

Universidad Colegio Mayor de Cundinamarca


Términos estadísticos:
Dato: no solo es un número, sino un número en
un contexto.
Individuo: el cual forma un colectivo que
llamamos población que es finalmente sobre lo
que nos interesa estudiar y sacar conclusiones.
Muestreo: Es el proceso mediante el cual
seleccionamos a los individuos que van a formar
parte de la muestra y es clave para garantizar un
mínimo de calidad en los datos obtenidos de una
muestra representativa de su población.

Universidad Colegio Mayor de Cundinamarca


Tipos de variables estadísticas:
Una variable es una característica observable que varía entre los diferentes
individuos de una población.

 En los individuos de la población de Colombia, de uno a otro


es variable:

 El grupo sanguíneo
 {A, B, AB, O}  Var. Cualitativa
 Su nivel de felicidad “declarado”
 {Deprimido, Ni fu ni fa, Muy Feliz}  Var. Ordinal
 El número de hijos
 {0,1,2,3,...}  Var. Numérica discreta
 La altura
 {1’62 ; 1’74; ...}  Var. Numérica continua

Universidad Colegio Mayor de Cundinamarca


Tipos de variables estadísticas:
 Cualitativas (categóricas):
Si sus valores (modalidades) no se pueden asociar naturalmente a un número (no se
pueden hacer operaciones algebraicas con ellos)

 Nominales: Si sus valores no se pueden ordenar


 Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)

 Ordinales: Si sus valores se pueden ordenar


 Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor

 Cuantitativas o Numéricas
Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos)

 Discretas: Si toma valores enteros


 Número de hijos, Número de cigarrillos, Num. de “cumpleaños”

 Continuas: Si entre dos valores, son posibles infinitos valores intermedios.


 Altura, Presión intraocular, Dosis de medicamento administrado, edad

Universidad Colegio Mayor de Cundinamarca


Trabajo en clase:
Indica que variables son cualitativas y cuales cuantitativas:
Comida Favorita.
Profesión que te gusta.
Número de goles marcados por tu equipo favorito .
Número de alumnos de UNICOMAYOR
El color de los ojos de tus compañeros de clase.
Coeficiente intelectual de tus compañeros de clase.

De las siguientes variables indica cuáles son discretas y cuales continuas.
Número de acciones vendidas cada día en la Bolsa.
Temperaturas registradas cada hora en un observatorio.
Período de duración de un automóvil.
El diámetro de las ruedas de varios autos.
Número de hijos de 50 familias.
Censo anual de los españoles.

Clasificar las siguientes variables en cualitativas y cuantitativas discretas o continuas.


La nacionalidad de una persona.
Número de litros de agua contenidos en un depósito.
Número de libros en un estante de librería.
Suma de puntos tenidos en el lanzamiento de un par de dados.
La profesión de una persona.
El área de las distintas baldosas de un edificio.

Universidad Colegio Mayor de Cundinamarca


1. Trata de recordar al menos tres encuestas que conozcas, hayas
presenciado o en las que hayas participado. Puede haber sido por
internet, telefónica o por la calle ¿A qué clase de muestreo piensas
que pertenecía cada una y por qué motivo lo piensas así?
2. ¿De las muestras obtenidas en los ejemplos anteriores cual
piensas que resultaría en la muestra más representativa y cuál en
la que menos? Razona tu respuesta.
3. ¿Cuál es la diferencia entre los datos cuantitativos y los
categóricos? ¿Existen diferencias entre los datos discretos y los
ordinales? Pon un ejemplo cercano a ti de variables de cada tipo.
4. Imagina que estás preparando un estudio sobre los hábitos
televisivos de tus compañeros de clase. Describe que dos variables
cuantitativas y que dos categóricas podrías emplear para recabar
información interesante sobre tales hábitos.

Universidad Colegio Mayor de Cundinamarca


Muestreo: El muestreo es una herramienta de la investigación científica. Su función
básica es determinar que parte de una realidad en estudio (población o universo)

debe examinarse con la finalidad de hacer inferencias sobre dicha población .

Universidad Colegio Mayor de Cundinamarca


•Incapacidad de juzgar la precisión En este tipo de muestreo, todos los
de la muestra. individuos de la población pueden
•Mecanismo poco objetivo de formar parte de la muestra.
apreciación.
•No ofrece representatividad.
•No se puede medir la exactitud de Excepciones Ej: Si se desea ensayar una
los resultados. droga y solo se tiene 5 o 6 dosis, en lugar de
escoger los individuos aleatoriamente se
seleccionan casos graves, ya que si mejoran
será valido para pacientes con menor
gravedad.
Ej: Si hacemos una encuesta
telefónica por la mañana, las
personas que no tienen teléfono o
que están trabajando, no podrán
formar parte de la muestra.
Universidad Colegio Mayor de Cundinamarca
Universidad Colegio Mayor de Cundinamarca
Muestreo Aleatorio Simple -MAS
Todos los individuos tienen la misma probabilidad de ser seleccionados. Supongamos que queremos elegir una muestra de n individuos de una población de N sujetos.
Cada elemento tiene probabilidad n/N de ser elegido en la muestra.

Uno de los métodos más comunes de seleccionar una muestra aleatoria es mediante números aleatorios.
- Numeramos todos los individuos del 1 al N.
- Generamos un número aleatorio usando la tabla.
- El número aleatorio generado indica el elemento que se seleccionará.
- Repetimos este proceso hasta que tengamos la muestra aleatoria de n individuos..

Veamos un ejemplo:

Universidad Colegio Mayor de Cundinamarca


Se tiene a la siguiente población de personas clasificadas como consumidores de drogas:

Seleccione una mas de tamaño n=6 , calcula el parámetro y el


estadístico de personas consumidoras de alcohol .

Universidad Colegio Mayor de Cundinamarca


Muestreo Sistemático
La selección de unidades se halla a través de intervalos regulares en un orden sistemático. La
lista de elementos debe estar realizada al azar al igual que el punto de partida.

Universidad Colegio Mayor de Cundinamarca


Ejemplo: Suponemos que queremos saber la opinión sobre un profesor de una
clase de 60 personas. Dichas personas están ordenadas por orden alfabético en la
lista de alumnos de clase. Para realizar la encuesta, seleccionamos a 12 personas.
Por lo tanto, N=60 y n=12. El intervalo fijo entre sujetos es:

Ahora elegimos al azar un número entre 1 y k=5. Suponemos que nos sale i=2. La
muestra resultado mediante el muestreo sistemático será:

Universidad Colegio Mayor de Cundinamarca


Muestreo Estratificado:
los individuos se dividen en grupos o estratos. Cada elemento pertenece a un único estrato. La muestra se elige
escogiendo en cada estrato un número representativo de individuos. La elección de los elementos en cada estrato se realiza
mediante algún método de MAS.

Por ejemplo, supongamos que hacen una encuesta para las elecciones en
EEUU y se sabe que el candidato demócrata tiene mayor influencia en las
mujeres que el candidato republicano. La muestra de la encuesta debería
estratificarse en hombres y mujeres, puesto que sabemos que la variable
género influye en la votación.

Universidad Colegio Mayor de Cundinamarca


Muestreo por Conglomerados
Se utiliza cuando la población está agrupada en conglomerados naturales. Si la muestra es significativa de la variable que se está estudiando, se
puede seleccionar algunos conglomerados al azar (todos los conglomerados deben tener las mismas probabilidades de ser seleccionados) y
utilizarlos en representación de la población. Se utiliza el muestreo por conglomerados cuando los grupos son muy heterogéneos y no existen
muchas diferencias

Por ejemplo, supongamos que el Ministerio


de Salud quiere aplicar un tratamiento que
ayuda a prevenir el cáncer de colon. Si en los
datos históricos se observa que la incidencia
y comportamiento del cáncer es es parecido
en todas las comunidades, podríamos dividir
el país en comunidades y seleccionar
algunas.

Universidad Colegio Mayor de Cundinamarca


Resuelve:
La facultad de ciencias de la salud de UNICOMAYOR tiene
120 estudiantes en bacteriología en I-semestre y se quiere
extraer una muestra de 30 estudiantes para un estudio
estadístico. Explica como obtener la muestra mediante:
a) Muestreo aleatorio simple (MAS)
b) Muestreo sistemático
 ¿Cómo prepararías un muestra sobre enfermedades de
trasmisión sexual en un municipio? Puedes combinar
varios tipos de muestreo.
 ¿Un centro de salud se puede considerar un
conglomerado? Razona tu respuesta.
Universidad Colegio Mayor de Cundinamarca
Software especializado:
http://www.winepi.net/f204.php
http://www.reactancia.com/programa-para-calculo-de
l-muestreo-aleatorio-simple/

Universidad Colegio Mayor de Cundinamarca


Instrumentos de medición: Los datos se obtienen realizando un conjunto de
preguntas normalizadas dirigidas a una muestra representativa o al conjunto total
de la población estadística en estudio, integrada a menudo por personas, empresas o
entes institucionales, con el fin de conocer estados de opinión, características o
hechos específicos. Entre estas estan:

 La encuesta: Es un instrumento de investigación que consiste en una serie de


preguntas (abiertas y/o cerradas) y otras indicaciones con el propósito de
obtener información de los consultados.
 Cuestionario: consiste de una cantidad de preguntas que el consultado tiene
que responder en un formato determinado.

Medios de captura:

Los medios de captura para realizar una encuesta incluyen


papel, el teléfono, la Internet y los dispositivos móviles.

Universidad Colegio Mayor de Cundinamarca


En papel: el papel sigue siendo el medio más usado a pesar de los
avances tecnológicos de las últimas décadas por su bajo costo,
versatilidad y seguridad. La tasa de rechazos de una encuesta en papel
mediante encuestador es muy baja.

Encuestas telefónicas: Se emplean cuando se desea aplicar un


cuestionario corto, de no más de 10 preguntas, y se desean obtener
resultados inmediatos; se utilizan en encuestas de coyuntura política,
sondeos de opinión, recordación publicitaria y posicionamiento de
marcas. La tasa de rechazo de una encuesta CATI es comparativamente baja.

La Web: Suelen usarse cuando para encuestas autoadministradas, es decir, cuando no


sea requerido un encuestador. El problema de este tipo de encuesta es la baja tasa de
respuestas, dado que habitualmente el sujeto no se motiva a responder.

Dispositivos móviles: Las encuestas mediante dispositivos móviles permiten su


aplicación con encuestador, grabando los datos directamente en algún dispositivo tipo
teléfono celular o tableta, con o sin conexión a la Internet.

Universidad Colegio Mayor de Cundinamarca


Error estadístico:
Errores muéstrales: Son errores causados por el acto
de obtener la información a partir de una muestra, en
lugar de la población completa. Se deben a la variación
existente entre una muestra y otra.
Errores no muestrales: Son errores no asociados al
hecho de obtener información a partir de una muestra.
Por ejemplo, datos faltantes, errores de recolección de
datos, errores de respuesta, errores de transcripción,
errores de proceso.
Sesgo muestral: por omisión y por inclusión

Universidad Colegio Mayor de Cundinamarca


Tablas de Frecuencias
La estadística descriptiva resume un conjunto de datos
proporcionando información mediante tablas,
parámetros y/o gráficos. Esta nos va permitir analizar
el comportamiento de las variables, consideradas una a
una, o la posible relación existente entre ellas.

Corporación Universitaria Republicana


Frecuencias absolutas, relativas, acumuladas y
porcentuales.
Podremos resumir individualmente variables de tipo cualitativo
mediante las frecuencias absolutas y relativas de sus categorías.
 Frecuencias absolutas. Se definen las frecuencias absolutas (fa) de
una variable cualitativa como el número de ocasiones en las que se
ha dado cada una de las categorías de la variable
que queramos resumir.
 Frecuencias relativas. Por otro lado las frecuencias relativas (fr) se
definen como la proporción de veces que se ha dado cada uno de las
categorías de la variable. Por tanto las frecuencias absolutas y relativas
de una variable cumplen la siguiente relación:

Corporación Universitaria Republicana


Universidad Colegio Mayor de Cundinamarca
Tabla de frecuencias para datos no agrupados
Los datos no agrupados son los
datos sin procesar, y las
estadísticas correctas pueden ser
determinadas. Los datos no
agrupados son usualmente el
punto de inicio de los análisis
estadístico.

Datos no agrupados con


variable cualitativa

Corporación Universitaria Republicana


Para datos de tipo cuantitativo a partir del

rango de valores de la variable que queramos


estudiar se crea una división adecuada en
intervalos más pequeños (5 y 10) y se
resume la cantidad de datos que se han
observado en cada uno de esos intervalos. Para cada uno de esos
intervalos, se calcula cuantos valores hay en cada uno de ellos
(frecuencias absolutas) y que proporción sobre el total de los
datos implica esa cantidad de valores (frecuencias relativas) y la
Frecuencia acumulada (Fi) será la suma de frecuencias absolutas
de todos los valores iguales o inferiores al valor considerado.

Corporación Universitaria Republicana


Tabla de frecuencias para datos agrupados
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si
las variables toman un número grande de valores o la variable es continua.

Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A
cada clase se le asigna su frecuencia correspondiente.
Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo
el intervalo para el cálculo de algunos parámetros.

Corporación Universitaria Republicana


Ejemplo 1: Organiza en una tabla de frecuencias la información
recogida a 31 personas de la facultad de ciencias de la salud de
UNICOLMAYOR sobre el color de los ojos y su estatura. Saca dos
conclusiones.

Corporación Universitaria Republicana


Continuación del ejemplo 1: estatura de estudiantes
de la muestra anterior.

Corporación Universitaria Republicana


Variable estadística bidimensional
Dos variables x e y están relacionadas estadísticamente cuando conocida la primera se
puede estimar aproximadamente el valor de la segunda. Ej:
el nº de cigarrillos consumidos y el riesgo de fallo cardiaco..
Producción y ventas de una fábrica.
Gastos en publicidad y beneficios de una empresa.

Una variable bidimensional es una variable en la que cada individuo está definido
por un par de caracteres (x,y). una de las dos variables es la variable independiente y
la otra variable dependiente.

Si representamos cada par de valores como las coordenadas de un punto, el conjunto


de todos ellos se llama nube de puntos o diagrama de dispersión.

Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor
posible, llamada recta de regresión.

Corporación Universitaria Republicana


Corporación Universitaria Republicana
Tabla de contingencia:
La tabla bidimensional recibe el nombre de tabla de
contingencia cuando las características en estudio no
son cuantitativas. Ej:
Doce individuos se clasificaron según el sexo (hombre,
mujer) y su deseo de ver o no una final de campeonato
de fútbol que será televisada, los datos fueron
recogidos, así:

Corporación Universitaria Republicana


GRÁFICOS ESTADÍSTICOS:
Uno de los dilemas clave cuando tenemos una base o
conjunto de datos es:
¿Cómo describir visualmente tales o cuales variables?
¿cuál es el gráfico idóneo para representarlos?
Antes de responder a estas cuestiones es necesario
saber la «oferta» de gráficos disponible para saber
elegir el adecuado

Corporación Universitaria Republicana


La pista esencial para saber que gráfico nos corresponde confeccionar es
“el tipo de variable” que se pretende representar.

Corporación Universitaria Republicana


Gráfico circular o de sectores:
Los gráficos circulares o gráficos de torta son útiles
para comparar datos pues, en general, trabajan con
porcentuales. El área de cada sector representa el
porcentaje que corresponde a la frecuencia de un cierto
valor de la variable. Esta representación es conveniente
cuando el número de sectores es pequeño y sus áreas
están bien diferenciadas. Ejemplos:

Corporación Universitaria Republicana


Ejercicio en clase:
las opiniones que dieron un grupo de pacientes sobre
dos de sus médicos fueron:

Haz un gráfico de sectores para cada médico y


compáralos

Corporación Universitaria Republicana


Diagrama de barras:
Las barras se utilizan generalmente para representar
atributos cualitativos o cuantitativos discreto. La
longitud es igual a la frecuencia de cada observación.
Pueden ser barras simples o múltiples, según se trate
de representar uno o más atributos. Las barras pueden
ser horizontales o verticales. Veamos los ejemplos:

Corporación Universitaria Republicana


Pictograma:
Un pictograma es un tipo de gráfico, que en lugar de
barras, utiliza una figura proporcional a la frecuencia.
Generalmente se emplea para representar variables
cualitativas. Ejemplos:

Corporación Universitaria Republicana


Un histograma es una representación gráfica de
Histograma:

una variable en forma de barras. Se utilizan para variables


continuas o para variables discretas, con un gran número
de datos que se han agrupado en clases.
En el eje abscisas (x) se construyen unos rectángulos que
tienen por base la amplitud del intervalo, y por altura, la
frecuencia absoluta de cada intervalo. Ej:

Corporación Universitaria Republicana


Polígono de frecuencias:
Polígono de frecuencia es el nombre que recibe una
clase de gráfico que se crea a partir de un histograma
de frecuencia. El polígono de frecuencia es realizado
uniendo los puntos de mayor altura de estas columnas.
Ej:

Corporación Universitaria Republicana


Ejercicio 1:
Tomando el ejemplo 8 del taller:
Se han tomado muestras a 40 niños de entre 1 y 5 años del
nivel de cobre en orina, obteniéndose los siguientes valores:

a) Calcula las frecuencias absolutas y relativas de cada tipo de


muestra.
b) Elabora el histograma y polígono de frecuencias respectivo.

Corporación Universitaria Republicana


Ejercicio 2:
La siguiente tabla de frecuencias indica los pesos (kg)
de los bebes nacidos en un fin de semana en una
clínica:

a) Representar los datos en un histograma


b) Elaborar el polígono para la frecuencia acumulada

Corporación Universitaria Republicana


Ojiva:
Se llama ojiva a la gráfica de una distribución de frecuencia
acumulativa. Con las siguientes características:
 En el eje horizontal se colocan las fronteras superiores de cada
intervalo
 Todos los puntos tienen la misma distancia en el eje X
 Las líneas permanecen unidas
 El primer extremo termina sobre el eje horizontal
 Los datos son numéricos o continuos
La forma general de una ojiva es la siguiente:

Corporación Universitaria Republicana


Corporación Universitaria Republicana
Ejercicio:
La siguiente tabla muestra los resultados de un estudio acerca de la cantidad de
cigarrillos que fuman los habitantes de una población:

Edad Número de cigarrillos


10 ≤ x < 30 5
30 ≤ x < 50 4
50 ≤ x < 70 3
70 ≤ x < 90 2
90 ≤ x < 110 2

a) Construye los intervalos con los limites reales


b) Elabora una tabla de frecuencias para f. absoluta, relativa y porcentual acumulada.
c) Construye la ojiva para los 3 tipos de f. acumuladas. Compara los resultados.

Universidad Colegio Mayor de Cundinamarca


Ejercicio en casa:
f
200

180

160

140
N u m b e r o f s tu d e n ts

120

100

80

60

40

20

0
5 10 15 20 25 30 35 40 45 50 55 60
T im e in m in u te s

a) Con la información grafica crea un problema en contexto


b) Elabora la tabla de frecuencias (Intervalos, marca de clase, f. absoluta,
relativa, porcentual acumuladas)
Corporación Universitaria Republicana

Вам также может понравиться