Вы находитесь на странице: 1из 6

Práctica 04

Medidas de resumen para datos cuantitativos:


Medidas de tendencia central y de dispersión

César Gutiérrez V. Julia Piscoyaquiere


Sara

COMPETENCIAS ESPERADAS

 Calcular e interpretar las medidas de tendencia central y dispersión para variables cuantitativas.
 Evaluar un gráfico de cajas e histograma para poder determinar la simetría de una distribución
 Seleccionar las medidas de tendencia central y dispersión más adecuadas al tipo de distribución.

ACTIVIDADES

 Para desarrollar los ejercicios el alumno debe revisar el material publicado en el aula virtual de la
asignatura.
 Propiciar la actitud crítica y la participación del estudiante en la interpretación de las medidas de
tendencia central y dispersión.

ASISTIR A LA PRÁCTICA CON LOS EJERCICIOS RESUELTOS

EJERCICIO 1.-

Los siguientes datos corresponden a la edad al momento del diagnóstico y la hemoglobina de 35


pacientes con endocarditis bacteriana:

Edad (años) Hemoglobina (Hb) g/dL


18 46 40 32 27 9 10 9.6 8 8
22 36 71 37 22 12.8 10 11 10 9
23 20 78 65 43 8.6 9 6.2 10 10
22 23 51 49 76 7.8 10 11.4 12 11.7
78 56 44 62 41 7.6 6.5 12 9.6 10
47 15 66 33 66 10 8.1 13 7 6.8
87 43 42 57 61 10 7 8 10.1 9.6

A. Para las variables edad y hemoglobina determine:

a) Valor mínimo f) Q1
b) Valor máximo g) Q3
c) Media h) Intervalo Intercuartilar (IQ)
d) Mediana i) Percentiles 25, 50 y 75
e) Desviación estándar j) Cuál de las dos variables tienen mayor
variabilidad
EDAD (años) Hemoglobina (Hb) g/dL
VALOR MÍNIMO 15 6.2
VALOR MÁXIMO 87 13
MEDIA 45.6857143 9.41142857
MEDIANA 43 9.6
DESVIACIÓN ESTANDAR 19.8238885 1.75863775
Q1 27 8
Q3 62 10
IQ 35 2
Percentiles 25 27 8
Percentiles 50 57 10
Percentiles 75 62 10

Como podemos observar la desviación estándar mide la variabilidad de los datos, por lo tanto, la variable edad es
la que posee mayor variabilidad.

B. Con los resultados obtenidos ¿cómo describiría las variables edad y la hemoglobina en
cuanto a su distribución?

Podemos notar que con la variable edad su


diistribucion es asimétrica ya que ni la media, ni la
mediana ni la moda coinciden por lo cuál se forma una
campana de gauss incompleta.

Lo mismo sucede con nuestra variable hemoglobina


podemos ver que también ocurre algo similar ya que
no coinciden ninguno de sus tres valores por lo
tanto, no existe una distribución simétrica

Lo
FAC BIOESTADÍSTICA Y EP
MEDICINA/DAMPSP DEMOGRAFÍA - 2019 MEDICINA

EJERCICIO 2.-

a.- A continuación, se presentan el histograma y el gráfico de cajas de las variables edad y


hemoglobina del ejercicio anterior. Observe estos gráficos y mencione si se puede afirmar que las
variables edad y hemoglobina siguen una distribución que se aproxime a la distribución normal.

Edad:

Hemoglobina:

Lo que nosotros podemos observar en los gráficos, es que tanto la variable edad como la variable frecuencia no
presentan los datos distribuidos de manera normal ya que vemos que tanto el histograma como el gráfico de cajas
no coinciden con tal organización, una distribución normal se refiere a un histograma que presenta una campana
de gauss y el grafico de cajas debe tener la mediana a la mitad de este.

b.- Analizando los resultados del Ejercicio 1 y la observación de los gráficos ¿qué medidas de
resumen seleccionaría Ud. para la presentación de estas variables? Por qué.

Como vemos en este caso las medidas de resumen que expresan nuestras variables son precisas nos referimos
a la media y la desviación estándar, están muy de acuerdo a su distribución y dan a entender en gran medida
como es que los datos se disponen.
FAC BIOESTADÍSTICA Y EP
MEDICINA/DAMPSP DEMOGRAFÍA - 2019 MEDICINA
EJERCICIO 3.-

A continuación se presenta parte de los resultados de un estudio que tuvo como objetivo describir
el estado de salud de los recién nacidos en altura:

Tabla 2. Características de los neonatos a término a 3400 m de altura (n=240)

VARIABLE Media DE* Mínimo Máximo


Edad gestacional (semanas) 39 1,2 37 42
Peso (g) 3240 292 2650 3940
Talla (cm) 49,4 1,5 45 53
Perímetro cefálico (cm) 34,2 1,5 31 44,4
Perímetro torácico (cm) 33,4 1,3 30 36,5
Hematocrito de arteria umbilical (%) 48 5,5 33 65
Peso de la placenta(g) 663,8 105,8 370 1000
Índice de peso fetal/placentario 4,9 2,8 3,9 7,2
*DE = Desviación estándar

Analice los resultados e indique si las medidas de tendencia central (media) y dispersión
(desviación estándar) fueron las más apropiadas para realizar esta descripción. Sustente sus
respuestas.
En estos casos como vemos al ser estas variables relativamente de distribución normal, podemos ver que las
medidas de dispersión elegidas están acorde con lo que queremos medir, es decir que dan una muy buena
referencia de la totalidad de la distribución, esto teniendo en cuenta la desviación estándar y media

EJERCICIO 4.-

Se realizó un estudio en una muestra de 20 pacientes diagnosticados de hipertensión arterial.


A continuación se muestra parte del resumen estadístico de algunas de las variables estudiadas

VARIABLE Media DE CV Q1 Mediana Q3


Presión arterial (mm Hg) 114 5,43 4,76 110 114 117
Edad (años) 48,6 2,5 5,14 47 48,50 49,75
Peso (kg) 93 4,29 4,61 89,67 94,15 95,15
Área de la superficie corporal (m2) 1,99 0,14 7,04 1,89 1,98 2,08
Duración de la hipertensión (años) 6,43 2,15 33,44 5,15 6 8
Pulso (latidos por minuto) 70 4 5,71 67 70 72
Medición del estrés 53 37 69,81 15 45 95
*DE = Desviación estándar

Analice el resumen estadístico y responda:


a. ¿Cuáles son las variables más homogéneas y cuáles las más dispersas? ¿Cuál de las
medidas es la que le indica, de una manera rápida, esta condición en el conjunto de
variables?
Podemos notar que las variables presión arterial, peso, pulso y medición del estrés, tienen una varianza
relativamente alta, principalmente última variable, esta variable es que justamente indica con rapidez
como es la variabilidad de los datos; en cuanto a la variable que indica, de una manera rápida, esta
condición es la desviación estándar, este se mide por el cuadrado de la varianza. Las demás medidas
tienen una menor variabilidad.

b. Identifique entre que valores se encuentra el 50% central de la distribución de las variables
pulso y área de la superficie corporal.
FAC BIOESTADÍSTICA Y EP
MEDICINA/DAMPSP DEMOGRAFÍA - 2019 MEDICINA
En esta oportunidad nos piden hallar los valores entre el percentil 25 y 75. En este caso coincidiría con el
Q1 Y el Q3

VARIABLE PULSO: Q3= 72 Q1=67


VARIABLE AREA DE LA SUPERFICIE CORPORAL: Q3=2.08 Q1=1.89

c. Identifique entre que valores se encuentra el 95% central de la distribución la edad y el peso.
Lo que nos pide en este problema lo podemos hallar usando la siguiente formula:

𝝁 ± 𝟐𝝈 𝟗𝟓%
Donde μ es la media y sigma es la varianza:

VARIABLE EDAD: media= 48,6 y varianza= 6.25.


Por lo tanto, esto estaría entre 54.85 y 42.35
VARIABLE PESO: media= 93 y varianza= 18.40
Por lo tanto, esto estaría entre 111.4 y 74.6
d. Indique con qué medidas haría el resumen numérico para cada una de las variables.
VARIABLE MEDIDAS DE RESUMEN
Presión arterial (mm Hg) Media, desviación estándar
Edad (años) Media, desviación estándar
Peso (kg) Media, desviación estándar
Área de la superficie corporal Media, desviación estándar
(m2)
Duración de la hipertensión Media, desviación estándar
(años)
Pulso (latidos por minuto) Media, desviación estándar
Medición del estrés Al ser una variable con amplia
variabilidad ninguna de las
medidas resume con precisión
los valores

e. Para la variable “Duración de la hipertensión (años)” los valores mínimo y máximo son 2,5 y
10,2 respectivamente. Haga el cálculo de los límites de la distribución (cortes) y determine si
estos valores son valores discordantes, atípicos u outliers.

En este caso para hallar los cortes del grafico de cajas de este conjunto de valores se tiene que indicar lo
siguiente
Valor mínimo: 2,5
Q1= 5,15
Q3=8
Valor máximo: 10,2
Calculamos QI=8-5,15= 2.85
Corte 1= Q1 - 1.5 (2,85)=0.875
Corte 2= Q3 + 1.5 (2.85)= 12.275
Como podemos notar en este caso los cortes tanto el alto como el bajo, tienen los valores donde se se
encuentran todos los datos de la distribución con lo cual podemos llegar a la conclusión que no existe
ningún valor outlier.
FAC BIOESTADÍSTICA Y EP
MEDICINA/DAMPSP DEMOGRAFÍA - 2019 MEDICINA

Вам также может понравиться