Вы находитесь на странице: 1из 26

Bioestadística Veterinaria. Capítulo 2.

Benito Lopez Baños-

CAPITULO 2.

ESTADISTICA DESCRIPTIVA.

El objetivo principal de este capítulo es mostrar como: organizar, clasificar,


presentar y describir datos numéricos a partir de un conjunto de ellos obtenidos de
una variable.
Para esto, primero se utilizará un conjunto pequeño de datos, entendiendo como
tal n 30 y posteriormente utilizaremos una cantidad más grande de datos, n 30.

DATOS NO AGRUPADOS.

Supóngase que se tiene la oportunidad de pesar en forma individual 12 cerdos


finalizados antes de su sacrificio en un rastro. Los datos obtenidos en este ejemplo
se presentan en la Tabla 1. Podemos notar que los cerdos fueron pesados de
acuerdo a como subieron a la báscula y que no obedecen a un orden establecido,
de tal manera que si repitiéramos esta acción después de juntarlos de nuevo es
poco probable que suban a la báscula en ese mismo orden. Lo que implica que
debemos ORGANIZAR los datos de alguna manera que facilite su manejo y
comprensión, una manera aceptable de organizar dichos datos es ordenarlos en
forma ascendente, es decir del menor al mayor como se muestra en la Tabla 2.

Tabla 1. Peso de 12 Tabla 2. Peso ordenado,


cerdos, sin ordenar. de 12 cerdos.

Peso Cerdos Orden Cerdos Peso


(Kg.) (Kg)
71 1 1 1 71
106 2 2 7 77
86 3 3 5 84
108 4 4 3 86
84 5 5 11 91
93 6 6 6 93
77 7 7 9 94
107 8 8 10 94
94 9 9 12 100
94 10 10 2 106
91 11 11 8 107
100 12 12 4 108

Ya con los datos ordenados podemos darnos cuenta que el cerdo mas pequeño
de este lote pesó 71kg y el más grande 108 Kg. El lector podrá argumentar que
en el ejemplo anterior es relativamente fácil encontrar los cerdos menor y más
pesado y que no vale la pena perder tiempo en ordenarlos, pero deberá
imaginarse si es igual de fácil encontrarlos en un lote de 120 o mas cerdos.

5
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

Además de que, ordenando los datos se facilita estimar algunas medidas


estadísticas de interés.

Medidas de Tendencia Central.

Las medidas de tendencia central son valores numéricos que tienden a buscar la
parte media o centro de un conjunto de datos. Las principales o más comunes en
la práctica de la Medicina Veterinaria y Zootécnia son: Media Aritmética o
Promedio, Mediana y Moda. Aunque existen otras medidas estadísticas como: la
Media Geométrica y la Armónica que también son consideradas de tendencia
central pero que en Veterinaria son de poco uso. Por lo que solo se describirán las
tres primeras.

Media Aritmética. Es poco usual encontrar un alumno a nivel de licenciatura que


no este familiarizado con el término “Promedio”, que es el nombre común de la
media aritmética y es también la mas popular en cuanto a su uso. Simbólicamente
la podemos expresar como:
n
Xi
i 1
X = ............... (1)
n
Donde:
X = Media Aritmética o Promedio
Xi = Valor numérico de cada medida
n = Total de datos de la muestra
Σ = Sumatoria
i = 1, 2, 3,..., n

Lo que implica que para calcular la Media Aritmética del ejemplo anterior si se
utiliza los datos de la Tabla 2, se tendría que hacer la siguiente operación:

71 77 84 ... 108 1111


X = = = 92.5833 92.6
12 12

Nótese que en la Ecuación 1, Xi es el valor numérico de cada uno de los datos


(peso de los cerdos) donde i denota el orden en que estos se encuentran y va de 1
hasta 12, siendo este último el máximo valor de i = n = 12 . La sumatoria ∑
sustituye al signo +. Por lo que la operación aritmética para calcular el promedio
sería: sumar el primer dato que es 71 mas el segundo que es 77, mas el tercero
que es 84 y así sucesivamente hasta el doceavo dato que es el ultimo y tiene
como valor 108. La sumatoria de los doce datos es 1111 misma que al dividirla
entre el total de datos (n = 12) se obtiene el promedio de aproximadamente 92.6.

6
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

Moda. La moda por definición es el valor que se repite con mayor frecuencia.
Aunque vale la pena mencionar que en un conjunto de datos puede suceder que
ningún dato se repita mas de una vez, o con mayor frecuencia que los otros,
entonces se dice que el conjunto de datos es Amodal o sin Moda. También puede
darse el caso que existan dos o mas valores que se repitan con mayor frecuencia,
entonces se dice que el conjunto de datos es: Bimodal, Trimodal, etc. o Polimodal.
En el caso del ejemplo anterior (ver Tabla 2) se puede observar que el valor que
se repite dos veces es el 94, mientras que los demás solo están presentes una
vez, por lo que la Moda en esta serie de datos es el 94.

Moda = 94

Mediana. La Mediana se ubica en el centro de una serie o conjunto de datos


ordenados, por lo que la Mediana es el valor central si el conjunto de datos es
“non” y el punto medio de los dos valores centrales si es “par”.
En el ejemplo que se ha usado anteriormente, podemos ver que el conjunto de
datos es un número par el 12 y que las dos medidas del centro ya ordenados (ver
tabla 2) son la 6 y la 7 que corresponden a los valores 93 y 94 respectivamente.
Por lo que se asume que el punto medio de estos dos valores corresponde a la
Mediana y es:

Mediana = (93 + 94) / 2 = 93.5

Medidas de Dispersión.

Estas medidas a diferencia de las de tendencia central intentan explicar que tan
dispersos están los datos en un conjunto o serie de ellos. Las principales medidas
de dispersión que se describen en este capítulo son: Rango o Recorrido, Varianza
o Variancia, Desviación Estándar, Error Estándar y Coeficiente de Variación.

Rango o Recorrido. El rango o recorrido de una serie de datos es la distancia que


hay entre el dato mayor y el menor. Así para el ejemplo de los pesos de los cerdos
que se muestra en la tabla 2, se ve que el cerdo más pesado tuvo 108 Kg. y el
menos pesado 71kg. Por lo que el rango en esta serie de datos es:

Rango = 108 – 71 = 37

Varianza. La Varianza en un conjunto de datos, es una expresión cuadrática de la


dispersión que existe entre estos, alrededor de su Media Aritmética y
normalmente se representa con la letra S2, y está definida por la ecuación
siguiente:

n
( Xi X )2
S2 = i 1
............... (2)
n 1

7
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

Donde:
Xi = Cada uno de los datos
X = Media Aritmética
n = Total de datos
Σ = Sumatoria

Y se lee: Varianza es igual a la sumatoria de Xi menos X barra, al cuadrado;


desde que i es igual a 1 hasta n, entre n - 1.

Lo que implica que para estimar la Varianza (S2) del ejemplo del peso de los doce
cerdos habría que desarrollar los pasos que se muestran en la Tabla 3.

Tabla 3. Procedimiento para estimar la Varianza


del Peso Ordenado de 12 cerdos cuyo
Promedio es 92.6 Kg.
.
Orden Cerdos Pesos Xi X ( Xi X ) 2
(Kg)
1 1 71 -21.6 466.56
2 7 77 -15.6 243.36
3 5 84 -8.6 73.96
4 3 86 -6.6 43.56
5 11 91 -1.6 2.56
6 6 93 0.4 0.16
7 9 94 1.4 1.96
8 10 94 1.4 1.96
9 12 100 7.4 54.76
10 2 106 13.4 179.56
11 8 107 14.4 207.36
12 4 108 15.4 237.16
n

i 1
( Xi X ) 2 1512.92
S2 137.54

O lo que es lo mismo:

(71-92.6)2 + (77-92.6) 2 + (84-92.6) 2 +…+ (108-92.6) 2 1512.92


2
S = ------------------------------------------------------------------------ = ------------ = 137.54
12-1 11

8
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

Cabe mencionar que si utilizamos los datos de los cerdos ordenados o no,
llegaremos al mismo resultado y que tan solo la propuesta de ordenarlos es
hacernos de un hábito en el manejo de los mismos.

Otra manera de estimar la Varianza es usar la expresión conocida como ecuación


de mínimos cuadrados, que resulta ser más fácil de usar con la ayuda de una
calculadora:

2
2 X
X n
S2 = ............... (3)
n 1

Tabla 4. Procedimiento para estimar la Varianza


Mediante la ecuación 3.
Orden Cerdos Peso X2
(X)
1 1 71 5041
2 7 77 5929
3 5 84 7056
4 3 86 7396
5 11 91 8281
6 6 93 8649
7 9 94 8836
8 10 94 8836
9 12 100 10000
10 2 106 11236
11 8 107 11449
12 4 108 11664
Σ X2 104373
ΣX 1111

Sustituyendo la ecuación 3 con los datos obtenidos en la tabla 4 se tiene lo


siguiente:

104373 – (1111)2 / 12 104373 – 102860.08 1512.92


2
S = -------------------------------- = ------------------------------ = ------------- 137.54
12 – 1 11 11

Como se puede notar, las dos ecuaciones (2 y 3) llevan al mismo resultado para la
Varianza, solo que la última ecuación es más práctica ya que en su uso no se
requiere conocer la Media Aritmética.

9
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

Desviación Estándar. La Desviación Estándar representada por la letra “S” no es


mas que la raíz cuadrada de la Varianza y puede considerarse como un promedio
de dispersión del conjunto de datos respecto a su Media Aritmética por lo que :

S= S2

Así para el ejemplo de los cerdos, la Desviación Estándar sería:

S= 137.54 11.728

Error Estándar. Se usa el término Error Estándar cuando involucrando el


muestreo aleatorio expresamos la desviación estándar de una distribución de
muestreo, generalmente se representa por las letras mayúsculas E.E. y se estima
con la ecuación siguiente:
E.E. = S
n

Así también para el ejemplo de los cerdos, el Error Estándar sería:

E.E. = 11.728 3.4


12

Coeficiente de Variación. El Coeficiente de Variación (C.V.) es una de las


medidas estadísticas mas comúnmente usada en Medicina Veterinaria y
Zootécnia, ya que permite comparar la variación o variabilidad de diferentes
variables o series de datos independientemente de la unidad de medida y del
tamaño de la muestras, es una medida expresada en porcentaje (%) y se calcula
con la ecuación siguiente:
S
C.V. = 100
X

Con el ejemplo de los cerdos el Coeficiente de Variación sería:

11.728
C.V. = 100 12.7 %
92.6

Deducción algebraica de la ecuación 3 a partir de la 2.

10
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

Tomando la ecuación 2, la podemos expresar:

n
( Xi X )2 n 2
2 i 1 1
S = = Xi X ............... (2.1)
n 1 n 1i 1

2
Así al desarrollar la expresión Xi X se obtiene:

n 2 n 2
1 1
S2 = Xi X = ( Xi 2 2 Xi X X ) ............... (2.2)
n 1i 1 n 1i 1

Al introducir la Σ dentro del paréntesis se tiene:

n n n
1
S2 = Xi 2 2 Xi X X2 ............... (2.3)
n 1 i 1 i 1 i 1

Reordenando la ecuación anterior y considerando que X es una constante,


entonces tenemos:

n n
1
S2 = Xi 2 2 Xi X nX 2 ............... (2.4)
n 1 i 1 i 1

n
Xi
i 1
Sustituyendo X por y considerando que:
n

2 2
n n

n
Xi Xi
2 2 i 1 i 1
(X ) nX n por lo tanto:
i 1 n n

11
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

n 2
n

n n
Xi Xi
2 1 2 i 1 i 1
S = Xi 2 Xi ............... (2.5)
n 1 i 1 i 1 n n

Simplificando esta última ecuación tenemos:

n 2 n 2

n
Xi Xi
2 1 2 i 1 i 1
S = Xi 2 ............... (2.6)
n 1 i 1 n n

La que finalmente sería:

n
2
n 2
n
Xi
n
Xi Xi 2 i 1
1 i 1 n
S2 = Xi 2 i 1
............... (2.7)
n 1 i 1 n n 1

Fácilmente se puede notar que la ecuación 2.7 es igual a la 3, sí la simplificamos.

EJERCICIOS

BOVINOS.

Estime para cada ejercicio: Media Aritmética, Moda, Mediana, Rango, Varianza,
Desviación Estándar, Error Estándar y Coeficiente de Variación.

Compare las cinco variables y ordénelas por su variación.

2.1 Ganancia Diaria de Peso en kg (GDP) de 25 bovinos de engorda entre 300 a


450 kilos de peso vivo.

1.125 1.284 1.252 1.335 1.341


1.247 1.400 0.872 1.113 1.317
1.432 1.444 1.212 1.368 1.100

12
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

1.334 1.203 1.236 1.146 1.208


1.276 1.397 1.335 1.322 1.369

2.2 Consumo de Alimento por día (kg MS) de 20 bovinos de engorda a los 300
Kilos de peso vivo.

6.6 7.0 8.0 7.4 7.1


8.0 7.5 8.1 8.2 7.2
8.0 6.9 5.9 7.0 8.0
7.4 7.2 7.3 7.8 7.6

2.3 Unidades Formadoras de Colonias, (UFC/ml) en la leche de una muestra de


16 vacas lecheras con mastitis subclínica, expresadas en logaritmos naturales (ln).

0.405465 0.693147 1.945910 2.564949


2.639057 3.332205 4.060443 5.117994
5.690359 6.118097 6.771936 7.175489
8.394800 8.610866 9.298809 9.899429

2.4 Intervalo Entre Partos (IEP) en días para una muestra de 16 vacas cebuinas
en zona tropical

309 621 540 434


352 650 609 512
378 749 588 489
407 805 581 456

2.5 Producción de Leche Total (PLT) en la primera lactación, ajustada a 305 días
de 20 vacas Holstein (Kg).

10760.1 8959.2 11216.5 10519.4 9945.9


9715.1 11200.1 11784.3 10366.3 9243.0
10398.8 8606.1 7636.7 7902.1 11404.3
8378.6 10720.4 9196.6 9889.3 11494.3

CERDOS.

Estime para cada ejercicio: Media Aritmética, Moda, Mediana, Rango, Varianza,
Desviación Estándar, Error Estándar y Coeficiente de Variación.

Compare las cinco variables y ordénelas por su variación.

13
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

2.6 Los datos siguientes son el número de partos de 22 cerdas en producción


tomadas al azar de una granja porcina.

Cerdas # de Parto Cerdas # de Parto

1 1 12 3
2 4 13 3
3 2 14 7
4 1 15 6
5 7 16 4
6 3 17 5
7 2 18 3
8 5 19 4
9 6 20 5
10 2 21 2
11 6 22 3

2.7 Se tomó el Intervalo Entre Partos (IEP) de una muestra aleatoria de 15


cerdas los valores están expresados en días.

Cerdas IEP Cerdas IEP Cerdas IEP

1 147 6 149 11 149


2 143 7 148 12 144
3 149 8 167 13 137
4 136 9 138 14 150
5 161 10 145 15 162

2.8 Los siguientes datos son número de Lechones Nacidos Vivos (LNV) al parto,
de 20 cerdas.

8 8 5 10
11 11 9 11
8 8 10 9
6 7 9 9
8 9 9 8
2.9 Los siguientes datos son Lechones Destetados (LD) por 16 cerdas a los 21
días de edad.

7 8 8
9 7 8
8 9 8

14
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

7 8 8
7 7
7 8

2.10 Los siguientes datos son Peso (Kg) de la Camada al Destete de Lechones
(PCD21D) a los 21 días de edad.

56.3 57.5 54.6


56.4 56.0 57.4
53.4 57.4 58.5
56.3 57.1 57.3
55.6 54.4
55.1 51.9

15
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

DATOS AGRUPADOS

Cuando se tiene muestras grandes de datos (n > 30) es necesario utilizar


procedimientos sistematizados que permitan una fácil comprensión de los mismos.
Es decir, se tenga información veraz y oportuna de la población a la que
pertenece dicha muestra, esta información estadísticamente hablando no es tan
solo una tabla de frecuencia, un gráfico, la distribución de los datos, si no también,
el que se puedan obtener fácilmente los estimadores o estadísticos como son: la
media aritmética, la moda, la mediana, la varianza, etc.

El procedimiento habitual en Estadística cuando se tiene una gran cantidad de


datos, aparte de ordenarlos, es agruparlos, esto es, subdividir la variación total de
los datos en variaciones más pequeñas en un número no menor de cinco y no
mayor de veinte. Los grupos que se forman así se llaman Clases. El número total
de clases deberá contener todos los datos de la muestra. Sin embargo, es
comúnmente aceptado el que se construyan de 5 a 20 clases con “n” número de
datos, pero siempre será discutido el que una persona haga 8 clases y otra 14 con
la misma cantidad de datos, para evitar esta polémica se ha adoptado la ecuación
de Sturges, citado por Daniel, (1993). La cual estipula un número “K” de clases
con “n” número de datos:

K = 1 + 3.322 (Log10 n) ............... (4)

Esta ecuación es la usada para construir la tabla 4, que se muestra a


continuación y que permite al lector fijar el número “K” de clases para “n” número
de datos.
Tabla 4. Número de Clases para Tablas
de Frecuencia con diferentes tamaños de
“n” usando la ecuación 4.

Tamaño de "n" K -Clases


<23 5
23 a 45 6
46 a 90 7
91 a 180 8
181 a 361 9
362 a 723 10
724 a 1447 11
1448 a 2895 12
2896 a 5791 13
5792 a 11582 14
11583 a 23165 15
23166 a 46330 16
46331 a 92658 17
92659 a 185315 18
185316 a 370624 19

16
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

>370624 20

Una vez fijado el número K de clases, se procede a construir la llamada “Tabla de


Frecuencias”, como se describe a continuación:

Ordenados los “n” datos, se calcula el Rango o Recorrido tal como se describió
anteriormente, es decir:

Rango = Dato Mayor – Dato Menor

El Rango se divide entre “K” clases para obtener el Intervalo de Clase (I.C.). Este
I.C. será constante en todas las clases que contenga la tabla de frecuencia y así
es como se utilizará en este libro, pero puede usarse diferentes I.C. en una misma
tabla de frecuencia dependiendo del interés de la persona que la construye y de la
variable que se esté midiendo. De tal manera que, una tabla de frecuencia deberá
contener los elementos siguientes:

Tabla 5. Tabla de Frecuencia


Clases Limites de F f F~ ~
f Xi
Clases
1 Li1 – Ls1 F1 F1/n F1 f1 (Li1 + Ls1)/2
2 Li2 – Ls2 F2 F2/n F1+F2 f1+f2 (Li2 + Ls2)/2
3 Li3 – Ls3 F3 F3/n F1+F2+F3 f1+f2+f3 (Li3 + Ls3)/2
. . . . . . .
. . . . . . .
. . . . . . .
K LiK – Ls K Fk Fk/n F1+F2+…+Fk f1+f2+…fk (LiK + Ls K)/2
n 1
Donde: Li = límite inferior Ls = límite superior F = frecuencia absoluta f = frecuencia relativa
F~ ~
= frecuencia absoluta acumulada f = frecuencia relativa acumulada
Xi = marca de clase

Para obtener una mejor comprensión de este concepto se construye la tabla 6,


utilizando los datos de 120 toros de la raza Suizo Pardo, a los cuales se les midió
el perímetro escrotal a los doce meses de edad. Nótese que los datos no están
ordenados y se presentan tal y como se obtienen en el trabajo de campo.

Perímetro Escrotal en cm, de 120 Toros de la raza Suizo Pardo a los doce meses
de edad.

21.6 28.3 30.3 35.7 34.7 33.8


27.4 34.0 34.7 31.2 25.7 37.0
26.5 38.4 29.6 31.8 32.0 28.6
33.5 32.0 30.7 37.0 30.4 25.0

17
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

33.5 26.3 29.6 30.9 30.2 27.1


35.3 34.4 31.1 36.5 28.9 28.0
28.5 30.7 40.2 30.9 30.1 30.2
34.2 32.7 31.8 31.0 30.2 35.2
30.2 32.7 28.1 29.3 36.3 40.8
31.6 33.8 32.6 37.1 27.9 31.6
35.4 29.9 39.7 36.3 34.3 35.9
28.8 37.3 31.5 29.5 29.7 25.5
35.2 31.7 28.8 25.9 33.4 29.6
31.9 31.6 34.6 35.2 31.2 29.9
35.2 37.3 34.5 37.1 30.4 27.4
26.4 30.8 29.4 31.6 28.6 35.2
32.8 36.3 27.6 27.9 30.3 24.7
32.0 31.7 35.7 29.5 31.5 30.8
27.2 30.3 27.3 31.6 32.0 34.8
34.5 23.9 33.1 38.6 28.7 31.7

Aunque los datos se presentan en seis columnas de veinte, se requiere de tiempo


y concentración para encontrar el valor menor y el mayor. Así mismo si se busca,
el dato que mas se repite, se requiere de un mayor esfuerzo. Lo que justifica
perfectamente el que se ordene los 120 datos.

Perímetro Escrotal en cm, de 120 Toros de la raza Suizo Pardo a los doce meses
de edad ordenados en forma ascendente.

21.6 28.3 30.2 31.6 33.4 35.3


23.9 28.5 30.2 31.6 33.5 35.4
24.7 28.6 30.2 31.6 33.5 35.7
25.0 28.6 30.3 31.6 33.8 35.7
25.5 28.7 30.3 31.6 33.8 35.9
25.7 28.8 30.3 31.7 34.0 36.3
25.9 28.8 30.4 31.7 34.2 36.3
26.3 28.9 30.4 31.7 34.3 36.3
26.4 29.3 30.7 31.8 34.4 36.5
26.5 29.4 30.7 31.8 34.5 37.0
27.1 29.5 30.8 31.9 34.5 37.0
27.2 29.5 30.8 32.0 34.6 37.1
27.3 29.6 30.9 32.0 34.7 37.1
27.4 29.6 30.9 32.0 34.7 37.3
27.4 29.6 31.0 32.0 34.8 37.3
27.6 29.7 31.1 32.6 35.2 38.4
27.9 29.9 31.2 32.7 35.2 38.6
27.9 29.9 31.2 32.7 35.2 39.7
28.0 30.1 31.5 32.8 35.2 40.2
28.1 30.2 31.5 33.1 35.2 40.8

18
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

Ahora resulta fácil encontrar el valor menor y el mayor que son 21.6 y 40.8
respectivamente y que el 31.6 es el que más se repite con cinco veces.
Sin embargo, para agrupar los 120 datos en una tabla de frecuencia se requiere
estimar el número de clases que esta contendrá. Por lo que aplicando la Ecuación
4, tenemos que se requiere:

K = 1 + 3.322 (log 120) = 1 + 3.322 (2.079181) =7.90 ≈ 8 Clases.

Este resultado se podría cotejar con la tabla 4. Donde se puede leer que para 91
≤ n ≤ 180 (n mayor o iguala 91 y menor o igual 180) se necesita 8 clases.
El siguiente paso sería estimar el Rango, que es (40.8 – 21.6) = 19.2 mismo que al
dividirlo entre 8 clases tendremos el I.C. (Intervalo de Clase).

R 19.2
I.C. = =2.4 ≈ 2.41
K 8

Aunque existe entre los diferentes autores algunas discrepancias para la


construcción de una tabla de frecuencia, tanto en el inicio de la primera clase, en
el redondeo del intervalo de clase, el inicio de la siguiente clase, etc. En el
presente capítulo se propone una de tantas maneras de construir dicha tabla.
La primera clase tendrá como límite inferior (Li) el valor más pequeño de los 120
datos y sería el 21.6, a este valor se le suma el I.C. es decir 2.41 para obtener el
límite superior (Ls) de esta clase que sería 24.01. La segunda clase tendría como
límite inferior el limite superior de la primera clase es decir 24.01, a este valor se le
suma de nuevo el I.C. de 2.41 para obtener el Ls de la segunda clase, que será
26.42, este valor a su vez será el Li de la tercera clase, mismo que al sumarle el
I.C. se obtendrá el Ls de la tercera clase y así sucesivamente, hasta obtener todos
los limites inferiores y superiores de las 8 clases (ver tabla 6).

Tabla 6. Tabla de Frecuencia construida en 8 clases y que contiene


120 datos del Perímetro Escrotal en cm, de Toros de la raza Suizo
Pardo a los doce meses de edad

Clases Límites de F f F~ ~
f Xi
Clases
Li - Ls
1 21.60 – 24.01 2 0.0167 2 0.0167 22.805
2 24.01 – 26.42 7 0.0583 9 0.0750 25.215
3 26.42 – 28.83 18 0.1500 27 0.2250 27.625
4 28.83 – 31.24 31 0.2583 58 0.4833 30.035
5 31.24 – 33.65 25 0.2083 83 0.6917 32.445
6 33.65 – 36.06 22 0.1833 105 0.8750 34.855
7 36.06 – 38.47 11 0.0917 116 0.9667 37.265
8 38.47 – 40.88 4 0.0333 120 0.1000 39.675

19
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

n = 120 0.9999

La Frecuencia Absoluta, representada simbólicamente por la letra “F”


(mayúscula) y que corresponde a la tercera columna de la tabla 6, se obtiene
contando cuantos datos de los 120 ordenados quedan contenidos dentro de los
límites de cada clase.
Asumiendo que todos los valores iguales a un límite superior de clase, quedaran
contenidos en esa clase y no así en la siguiente, donde ese valor es el límite
inferior de clase, se tiene que, para la primera clase solo hay 2 datos, para le
segunda clase 7 y así sucesivamente hasta la última clase con 4, mismos que se
pueden constatar en los datos ordenados donde se ha subrayado el último valor
contenido en cada clase. Es importante señalar que la suma de todas las “F” será
igual a “n”.

La Frecuencia Relativa, simbólicamente representada por la letra “f” (minúscula)


se encuentra en la cuarta columna de la tabla 6 y resulta de dividir la frecuencia
absoluta de cada clase entre el total de datos “n”. Todos los resultados fueron
redondeados a 4 dígitos después del punto decimal. Por lo que la primera clase
será (2 / 120) igual a 0.0167, la segunda (7 /120) igual a 0.0750, la tercera será
(18 /120) igual a 0.1500 y así sucesivamente hasta la última clase que será (4 /
120) igual a 0.0333. La suma de todas las frecuencias relativas será igual o
aproximadamente 1.

La Frecuencia Absoluta Acumulada, representada simbólicamente por “ F~ ” y se


muestra en la quinta columna de la tabla 6. Esta se obtiene como su nombre lo
indica acumulando (sumando) las frecuencias absolutas, por lo que la primera
será 2, la segunda será (2 + 7) igual a 9, la tercera será (2 + 7 + 18) igual a 27 y
así sucesivamente hasta la última, que deberá contener el total de datos que es en
este caso 120.

La Frecuencia Relativa Acumulada, se muestra en la penúltima columna de la


tabla 6, está representada por “ ~ f ” y se estima en forma similar a la frecuencia
absoluta acumulada, solo que la frecuencia que se acumula es la relativa. Así la
primera, será 0.0167, la segunda será (0.0167 + 0.0583) igual a 0.0750, la tercera
será (0.0167 + 0.0583 + 0.1500) igual a 0.2250 y así sucesivamente hasta la
última que será igual o aproximadamente 1. Otra manera de calcular estas
frecuencias, sería dividir cada una de las frecuencias acumuladas entre el total de
datos por ejemplo: la frecuencia acumulada de la tercera clase es 27, si este
número lo dividimos entre 120 nos dará 0.2250.

La Marca de Clase. Se representa por las literales “Xi” y se muestra en la última


columna de la tabla 6. Aunque esta columna en muchos textos de estadística no la
consideren como parte de una tabla de frecuencia aunque después la incluyan
para hacer algunas estimaciones, en este libro se considera desde el inicio. Se
estima al dividir entre 2 la suma de los limites de cada clase, así la primera marca
de clase ((21.60 + 24.01) / 2) es igual a 22.805, la segunda ((24.01 + 26.42) / 2) es

20
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

igual a 25.215 y así sucesivamente hasta la última marca de clase que es ((38.47
+ 40.88) / 2) igual a 39.675.
Una tabla de frecuencia es en si misma, una manera de codificar la información
que nos ofrece un conjunto de datos (una muestra aleatoria), que por su tamaño
resulta poco práctico el manejo de los mismos, pero que si lo reducimos a una
tabla de no mas de veinte renglones y que se conserve las características básicas,
como es el comportamiento o distribución de los datos con un mínimo de pérdida
de información, entonces tenemos una forma práctica y expedita de la
información y que además nos permitirá sin trabajar con la cantidad de datos
originales, estimar las medidas descriptivas, tanto las de Tendencia Central como
las de Dispersión, así, se tiene que para estimar las medidas de Tendencia
Central como son: la Media Aritmética, la Moda y la Mediana son de relativa
facilidad estimarlas a partir de una tabla de frecuencia. Además se puede
representar la información en un gráfico como se muestra a continuación donde se
usa las Marcas de Clase “Xi” en el eje de las X, y la Frecuencia Absoluta “F” en el
eje de las Y, para formar un Polígono de Frecuencia.

Gráfica 1. Polígono de Frecuencia que se forma con los datos de la tabla


6, que corresponde a el Perímetro Escrotal de 120 toretes de la
raza Suizo Pardo al año de edad.

35

30

25

20
F
15 Pol. De
Frec.

10

0
20.395 22.805 25.215 27.625 30.035 32.445 34.855 37.265 39.675 42.085

Marca de Clase

21
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS.

Media Aritmética. En datos agrupados la madia aritmética se estima con la


siguiente ecuación:
K
XiF
i 1
X = ............... (1.1)
n
Donde:
X = Media Aritmética o Promedio
Xi = Marca de Clase
i = 1, 2, 3,..., K
F = Frecuencia Absoluta
K = Número de Clases
n = Total de datos de la muestra
Σ = Sumatoria

Sí se sustituye la ecuación 1.1 con los datos que se tienen en la tabla 7, entonces
se tendrá:
K
XiF
3797
X = i 1
= = 31.6417 ≈ 31.6
n 120

Tabla 7. Tabla de Frecuencia parcial que muestra los pasos para


Estimar la Media Aritmética. Tomados de la tabla 6.

Clases Límites de F Xi XiF


Clases
Li – Ls
1 21.60 – 24.01 2 22.805 45.610
2 24.01 – 26.42 7 25.215 176.505
3 26.42 – 28.83 18 27.625 497.250
4 28.83 – 31.24 31 30.035 931.085
5 31.24 – 33.65 25 32.445 811.125
6 33.65 – 36.06 22 34.855 766.810
7 36.06 – 38.47 11 37.265 409.915
8 38.47 – 40.88 4 39.675 158.700
n = 120 3797

Nótese que en la tabla 7, se suprimió algunas columnas de la tabla 6 y se agregó


una columna que es el producto de multiplicar la frecuencia absoluta por las
marcas de clase (Xi F) y en el último renglón se muestra la suma de los productos
y la suma de las frecuencias absolutas que son los valores que se utilizan para
sustituir la ecuación 1.1.

22
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

Moda. Para la Moda en datos agrupados, se asume que es la marca de clase de


la clase con mayor frecuencia absoluta y en este caso sí observamos la tabla 7, se
nota que la clase 4 tiene la F mayor que es de 31, por lo que, la marca de clase de
esta (30.035), será una buena aproximación a la moda.

Moda ≈ 30.035

Mediana. La estimación de la mediana en datos agrupados requiere primero,


ubicar en la tabla de frecuencia la clase que contiene la mediana para ello se
divide el total de datos (n) entre 2 y alrededor de este valor estará la posición de la
mediana o “punto mediano” con la salvedad de que si “n” es un número “non” se
utilizará el número entero inmediato superior, pero si “n” es un número “par”
entonces se tienen dos números centrales o puntos medianos, el que arroja la
división y el número inmediato superior. Por lo tanto, sí retomamos el ejemplo de
los 120 datos del Perímetro Escrotal en cm, de Toros de la raza Suizo Pardo a
los doce meses de edad, se tendrá que “n” es igual a 120 y que al dividirlo entre
2 se obtiene el valor de 60 y que el número inmediato superior es el 61, por lo que
se concluye que los dos puntos medianos ocupan la posición 60 y 61 de la serie
de 120 datos ordenados.
Sí asumimos que no tenemos ya los datos, pero si una tabla de frecuencia que los
contiene que en este caso es la tabla 6, entonces podemos ubicar en que clase
quedaron los datos 60 y 61, para ello vasta con ver la columna 5 (Frecuencias
Acumuladas) para darse cuenta que en las primeras cuatro clases tan solo hay 58
datos y que por lo tanto los datos 60 y 61 están contenidos en la clase 5 a la cual
se le llama clase mediana.
Una vez identificada la clase mediana se puede aplicar la siguiente ecuación para
estimar la mediana:
IC
Mediana = ( PM F~ ) Li (1.2)
F

Donde:
IC = Intervalo de Clase, de la clase mediana.
F = Frecuencia absoluta, de la clase mediana.
PM = Punto Mediano.
F~ = Frecuencia acumulada, de la clase anterior a la clase mediana.
Li = Limite inferior, de la clase mediana.

Sustituyendo la ecuación anterior con los datos de la tabla 6, se tendrá:

IC 2.41
Mediana (1) = ( PM F~ ) Li = (60 58) 31.24 = 31.4328
F 25

2.41
Mediana (2) = (61 58) 31.24 = 31.5292
25

23
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

Sí obtenemos el promedio de estas dos estimaciones de la mediana, tendremos


una buena aproximación a la mediana verdadera.

31.4328 31.5292
Mediana = = 31.481 ≈ 31.5
2

MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS.

Varianza. La varianza para datos agrupados se estima usando la ecuación


siguiente:
k
( Xi X )2 F
S2 = i 1
............... (1.3)
n 1

Donde:
S2 = Varianza.
Xi = Marca de clase.
F = Frecuencia absoluta.
K = Número de clases.
X = Media aritmética.
n = total de datos.
i = 1, 2, 3,..., k

Por lo tanto si se usa los datos de la Tabla 8, se tiene que:

Tabla 8. Tabla de Frecuencia parcial que muestra los pasos para Estimar
la Varianza usando como media aritmética 31.6 (Tomados de la tabla 6).

Clases Límites de F Xi Xi - X (Xi - X )2 (Xi - X )2F


Clases
Li –--- Ls
1 21.60 – 24.01 2 22.805 -8.795 77.352 154.704
2 24.01 – 26.42 7 25.215 -6.385 40.768 285.376
3 26.42 – 28.83 18 27.625 -3.975 15.801 284.418
4 28.83 – 31.24 31 30.035 -1.565 2.449 75.919
5 31.24 – 33.65 25 32.445 0.845 0.714 17.850
6 33.65 – 36.06 22 34.855 3.255 10.595 233.090
7 36.06 – 38.47 11 37.265 5.665 32.092 353.012
8 38.47 – 40.88 4 39.675 8.075 65.206 260.824
n = 120 1665.193

24
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

La Varianza será:
k
( Xi X )2 F
1665.193
S2 = i 1
= = 13.993
n 1 120 1

Desviación Estándar. La Desviación Estándar es la raíz cuadrada de la


Varianza, por lo que:

S= S2 = 13.993 = 3.74

Coeficiente de Variación. El Coeficiente de Variación como ya se mencionó,


expresa la variación de un conjunto de datos como un porcentaje (%), por lo que:

S 3.74
CV = 100 = 100 = 11.84 %
X 31.6

Los datos fueron analizados con la Orden: Estadísticas Descriptivas que se


encuentra en Análisis de Datos complemento de Herramientas de la Hoja de
EXCEL.

Perímetro Escrotal (PE) en cm, de 120 Toros de la raza Suizo Pardo a los doce
meses de edad.

Toro PE Columna1
1 21.6
2 27.4 Media 31.6716667
3 26.5 Error típico 0.33264744
4 33.5 Mediana 31.55
. . Moda 31.6
Desviación
. . estándar 3.64397012
Varianza de la
. . muestra 13.2785182
. . Rango 19.2
. . Mínimo 21.6
118 30.8 Máximo 40.8
119 34.8 Suma 3800.6
120 31.7 Cuenta 120

25
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

%
Clase Frecuencia acumulado
21.6 1 .84%
24.01 1 1.68%
26.42 7 7.56%
28.83 18 22.69%
31.24 30 47.90%
33.65 25 68.91%
36.06 22 87.39%
38.47 11 96.64%
40.88 4 100.00%

26
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

EJERCICIOS COMPLEMENTARIOS.

Para los siguientes Ejercicios se recomienda se manejen de preferencia en Tablas


de Frecuencias y se estimen a partir de estas, las medidas de tendencia central y
las de dispersión.

CERDOS.

2.2.1 Los datos siguientes son el número de Lechones Nacidos Vivos de 120
cerdas al parto.

8 9 8 7
11 5 11 7
8 10 7 8
6 9 6 9
8 9 8 8
8 5 8 10
11 9 11 9
8 9 9 9
7 8 9 10
9 9 7 8
5 9 10 10
9 9 10 10
10 9 8 8
9 9 8 9
9 9 10 10
10 9 11 10
11 10 6 8
9 11 10 10
9 8 8 11
8 10 9 8
8 9 8 7
6 8 7 8
8 9 9 7
11 8 7 10
10 6 8 10
10 10 8 8
8 7 10 10
8 11 9 9
9 9 10 11
8 9 8 10

27
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

2.2.2 Los datos siguientes son el Peso (Kg) de 150 Camadas de Lechones al
Destete con 21 días de edad.

56.3 59.7 56.7 51.3


56.4 57.8 57.4 54.5
53.4 55.8 54.6 50.5
56.3 57.0 57.6 54.1
55.6 54.1 58.9 56.5
55.1 60.6 53.3 53.7
57.5 54.8 51.0 50.1
56.0 56.1 60.3 54.2
57.4 57.1 53.4 56.1
57.1 57.9 55.8 57.8
54.4 55.8 62.3 54.8
51.9 60.9 56.1 52.6
54.6 55.5 56.4 51.8
57.4 53.5 52.1 55.3
58.5 55.1 62.0 54.3
57.3 54.0 57.4 56.8
55.7 57.7 56.8 58.0
50.5 56.8 56.0 51.1
53.1 55.8 52.2 49.7
58.1 62.5 53.2 54.5
56.9 55.1 57.5 55.8
63.0 51.3 53.9 58.8
54.3 56.7 59.5 60.3
50.0 50.2 58.0 55.9
56.3 63.0 60.5 50.3
52.2 60.5 50.7 56.2
52.1 53.9 52.8 53.0
58.4 53.5 59.9 65.2
56.5 57.0 54.9 53.4
57.0 55.8 54.4 59.8
56.9 51.3 57.9 57.3
55.9 54.0 56.9 55.0
54.8 52.6 55.9 51.8
54.7 52.8 58.2 55.0
53.8 50.8 55.0 55.3
56.4 46.9 58.2 58.7
56.8 56.1 55.6
57.5 48.4 55.6

28
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

2.2.3 El Indice de Productividad de 85 cerdas al azar fue obtenido y son:

106.1 107.4 100.1 100.2


95.1 84.7 101.6 98.6
100.2 93.0 107.3 89.8
98.9 101.7 102.6 111.5
101.7 98.7 101.8 98.3
95.9 98.7 102.2 97.8
87.2 103.3 89.4 91.3
102.3 99.8 105.9 103.4
100.6 97.5 96.7 89.7
105.0 101.3 101.7 102.4
104.3 104.0 93.2 104.2
93.9 102.0 104.3 101.8
103.3 113.2 106.2 98.8
95.1 108.7 104.3 101.3
99.1 105.2 107.0 93.5
100.1 94.8 94.9 110.3
99.3 112.0 102.8 100.3
96.1 96.3 96.4 97.6
102.4 90.0 113.8 94.7
97.9 103.4 101.2
102.9 114.0 104.3
89.3 101.7 91.9

29
Bioestadística Veterinaria. Capítulo 2. Benito Lopez Baños-

BOVINOS.

2.2.4 Peso en Kg al año de edad de 118 toretes cebuinos cruzados con Bos
taurus.

252 281 217 229


268 243 226 240
221 315 249 258
236 212 262 294
207 248 278 243
170 260 247 207
309 153 295 262
198 245 208 228
218 279 237 244
293 240 207 262
211 207 186 209
267 229 240 190
251 227 269 252
213 246 288 336
197 235 261 163
244 272 320 223
257 309 322 208
237 214 205 205
253 244 228 215
197 224 199 224
228 289 216 230
231 207 219 275
202 260 241 260
265 262 232 249
227 243 269 267
300 305 234 189
214 205 267 192
249 191 245 230
204 254 279
238 232 286

30

Вам также может понравиться