Вы находитесь на странице: 1из 40

Estadística Básica

Lic. Calderón Otoya Carlos


Estadística Básica

4. RELACIÓN ENTRE LOS PROMEDIOS (X, G, H, RMS)

Es un conjunto de números positivos se puede establecer la siguiente


relación de promedios.

𝐑𝐌𝐒 ≥ 𝐗 ≥ 𝐆 ≥ 𝐇

Ejercicios:

 Calcular la relación de los promedios de los números 2, 4 Y 8.

∑ 𝐘𝐢
𝐗=
𝐍
𝟐 +𝟒 +𝟖 𝟏𝟒
= = = 𝟒. 𝟔
𝟑 𝟑

√∑ 𝐋𝐨𝐠𝐍
𝐆=
𝐍

√𝟏.𝟖𝟎𝟔𝟏𝟕𝟗𝟗𝟕𝟒
= = 𝐀𝐧𝐭𝐢𝐥𝐨𝐠. 𝟎. 𝟔𝟎𝟐𝟎𝟓𝟗𝟔𝟐𝟒 = 𝟒
𝟑

∑ 𝒀𝒊𝟐
𝑹𝑴𝑺 = √ = 5.291502622
𝑵

𝐍 𝟑 𝟑 𝟐𝟒
𝐇 = 𝟏 =𝟏 𝟏 𝟏 = 𝟒+𝟐+𝟏 = = 𝟑. 𝟒𝟐𝟖𝟓𝟕𝟏𝟒𝟐𝟗
∑ + + 𝟕
𝐘𝐢 𝟐 𝟒 𝟖 𝟖

Lic. Calderón Otoya Carlos


Estadística Básica

 𝐑𝐌𝐒 > 𝐗 > 𝐆 > 𝐇


 5.2 > 4.6 > 4 > 3.4

 Calcular la relación entre los promedios del siguiente cuadro de


distribución.

L1-L2 Yi ni 𝐘𝐢𝟐 𝐧𝐢𝐘𝐢𝟐 ni.Yi LogYi niLogYi 𝐧𝐢⁄


𝐘𝐢

45-55 50 4 2500 10000 200 1.69897 6.79588 0.08

55-65 60 12 3600 43200 720 1.778151 21.3378 0.2


2
65-75 70 20 4900 98000 1400 1.845098 36.9019 0.28
0
75-85 80 10 6400 64000 800 1.903089 19.0308 0.12
9
85-95 90 4 8100 32400 360 1.954242 7.81697 0.04
5
N= ∑ 𝑌𝑖 2 ∑ 𝑛𝑖𝑌𝑖 2 ∑ 𝑛𝑖𝑌𝑖 ∑ 𝐿𝑜𝑔𝑌𝑖 ∑ 𝑛𝑖𝐿𝑜𝑔𝑌𝑖 = 𝑛𝑖

50 91.88352 𝑌𝑖
= 25500= 247600= 3480 = 9.179551 = 0.73

247600
𝐑𝐌𝐒 = = 70.3744834
50
3480
𝐗 = = 69.6
50
9.88352573
𝐆 = 𝐴𝑛𝑡𝑖𝑙𝑜𝑔. = 𝐴𝑛𝑡𝑖𝑙𝑜𝑔. 1.837970515 = 68.81300359
50

50
𝐇 = = 68.01252296
0.73515873

Lic. Calderón Otoya Carlos


Estadística Básica

 𝐑𝐌𝐒 > 𝐗 > 𝐆 > 𝐇


 𝟕𝟎. 𝟑𝟕 > 𝟔𝟗. 𝟔 > 𝟔𝟖: 𝟖𝟏 > 𝟔𝟖. 𝟎𝟏

4.1 RELACIÓN EMPIRICA ENTRE LOS PROMEDIOS

El cálculo o valor aproximado de la moda puede obtenerse a partir de la siguiente


relación conocida también con el nombre de Relación Empírica de Karl Pearson.

Mo = 3Md - 2x

Nota: se aproxima al valor pero no es el verdadero.

Ejemplo:

 Calcular la relación empírica del siguiente cuadro de distribución de frecuencias.

L1—L2 𝒀𝒊! --Yi Yi ni Ni niYi


45—55 50 4 4 200
55—65 60 12 16 720
65—75 Clase modal 70 20 36 1400
mediana

75—85 80 10 46 800
85--95 90 4 50 360
N = 50 ∑ 𝑁𝑖 ∑ 𝑛𝑖𝑌𝑖

= 152 = 3480

Lic. Calderón Otoya Carlos


Estadística Básica

Solución:

∑ 𝐧𝐢. 𝐘𝐢
𝐗=
𝐍
𝟑𝟒𝟖𝟎
𝑿 = = 𝟔𝟗. 𝟔
𝟓𝟎

𝐍
− (∑ 𝐍𝐢)𝟏
𝐌𝐝 = 𝐋𝟏 + [ 𝟐 ].𝐢
𝐧𝐢𝐌𝐝

𝟐𝟓−𝟏𝟔
𝐌𝐝 = 𝟔𝟓 + [ ] . 𝟏𝟎 = 𝟔𝟗. 𝟓
𝟐𝟎

𝐌𝐨 = 𝟑𝐌𝐝 − 𝟐𝐗

Reemplazar:

Mo = 3(69.5) – 2(69.6)

= 208.5 – 139.2

= 69.3

Lic. Calderón Otoya Carlos


Estadística Básica

4.2. COMPORTAMIENTO DE LOS PROMEDIOS (Md, X, Mo )

En las distribuciones de frecuencias simétricas los valores de la media, la


mediana y la moda son idénticas si la distribución es unimodal, es decir si tiene
un máximo sencillo. En las distribuciones de frecuencia oblicuas o sesgadas, la
media aritmética se encuentra entre la X y la Mo, pudiendo establecerse
relaciones de mayor a menor, que nos indica el sesgo.

 SIMETRICA Y BIEN FORMADA

X = MD = MO

X
Md
Mo

 SESGO POSITIVO O SESGADA A LA DERECHA

+
X >MD > MO

Lic. Calderón Otoya Carlos


Estadística Básica

 SESGO NEGATIVO O SESGADA A LA IZQUIERDA

X < MD < MO

X Md Mo

Ejercicios:

 Determinar el comportamiento Md, X, Mo e indique si tiene sesgo positivo o


negativo ubicando los valores en el histograma y polígono de frecuencia de la
siguiente distribución.

L1—L2 𝒀𝒊! —Yi Yi Ni Ni niYi


45—55 50 4 4 200
55—65 60 12 16 720
65—75 Clase modal 70 20 36 1400
mediana

75—85 80 10 46 800
85--95 90 4 50 360
N = 50 ∑ 𝑁𝑖 ∑ 𝑛𝑖𝑌𝑖

= 152 = 3480

Lic. Calderón Otoya Carlos


Estadística Básica

Solución:

∑ 𝐧𝐢. 𝐘𝐢
𝐗=
𝐍
𝟑𝟒𝟖𝟎
𝐗 = ( ) = 𝟔𝟗. 𝟔
𝟓𝟎

𝐍
− (∑ 𝐍𝐢)𝟏
𝐌𝐝 = 𝐋𝟏 + [ 𝟐 ].𝐢
𝐧𝐢𝐌𝐝

𝟐𝟓 − 𝟏𝟔
𝐌𝐝 = 𝟔𝟓 + [ ] . 𝟏𝟎 = 𝟔𝟗. 𝟓
𝟐𝟎

𝐌𝐨 = 𝟑𝐌𝐝 − 𝟐𝐗

Reemplazar:

Mo = 3(69.5) – 2(69.6)

= 208.5 – 139.2

= 69.3

Lic. Calderón Otoya Carlos


Estadística Básica

Lic. Calderón Otoya Carlos


Estadística Básica

4.3. CUANTILES

Son medidas de posición que se caracterizan por dividir a una distribución en Cuartiles,
Deciles y Percentiles.

4.3.1Cuartiles: (Q1, Q2,... Q3) son aquellos valores que dividen a un conjunto de datos
ordenados según su magnitud en cuatro partes iguales.

4.3.2Deciles: (D1, D2,... D9) son aquellos valores que miden a un conjunto de datos
ordenados según su magnitud en diez partes iguales.

4.3.3 Percentiles: (P1, P2,... P99) son aquellos valores que dividen a un conjunto de
datos ordenados según su magnitud en cien partes iguales.

Md

50 %

1 2 3 4

Q 1 Q 2 Q 3

D1 D2 D3 D4 D5 D6 D7 D8 D9

50 %

P1 P2 P50 P75 P99

Del gráfico anterior podemos deducir que el espacio comprendido entre Q1 y Q3 recibe
el nombre de espacio intercuartílico y contiene generalmente el 50% de las
observaciones.

Podemos deducir:

Md = Q2 = D5 = P50

Q1 = P25

Q3 = P7

Lic. Calderón Otoya Carlos


Estadística Básica

4.4. CALCULO DE CUANTILES

El cálculo de los cuantiles se basa en la fórmula de la mediana:

𝑵
− (∑ 𝑵𝒊)𝟏
𝑴𝒅 = 𝑳𝟏 + [ 𝟐 ].𝒊
𝒏𝒊𝑴𝒅

Con las siguientes variaciones:

𝐍 𝑵 𝟐𝑵 𝟑𝑵
1. Para los cuartiles se cambia o reemplaza 𝟐 por:
𝟒 𝟒 𝟒
Q1 Q2 Q3

𝑵
− (∑ 𝑵𝒊)𝟏
𝑸𝟏 = 𝑳𝟏 + [ 𝟒 ].𝒊
𝒏𝒊𝑸𝟏

𝟐𝑵
− (∑ 𝑵𝒊)𝟏
𝑸𝟐 = 𝑳𝟏 + [ 𝟒 ].𝒊
𝒏𝒊𝑸𝟐

𝟑𝑵
− (∑ 𝑵𝒊)𝟏
𝑸𝟑 = 𝑳𝟏 + [ 𝟒 ].𝒊
𝒏𝒊𝑸𝟑

𝐍 𝑵 𝟐𝑵 ….. 𝟗𝑵
2. Para los deciles se cambia o reemplaza por:
𝟐
𝟏𝟎 𝟏𝟎 𝟏𝟎
D1 D2 ….. D9

𝑵
− (∑ 𝑵𝒊)𝟏
𝑫𝟏 = 𝑳𝟏 + [ 𝟏𝟎 ].𝒊
𝒏𝒊𝑫𝟏

𝟐𝑵
− (∑ 𝑵𝒊)𝟏
𝑫𝟐 = 𝑳𝟏 + [ 𝟏𝟎 ].𝒊
𝒏𝒊𝑫𝟐

𝟗𝑵
− (∑ 𝑵𝒊)𝟏
𝑫𝟗 = 𝑳𝟏 + [ 𝟏𝟎 ].𝒊
𝒏𝒊𝑫𝟗

Lic. Calderón Otoya Carlos


Estadística Básica

𝐍 𝐍 𝟐𝐍 ….. 𝟗𝟗𝐍
3. Para los percentiles se cambia o reemplaza 𝟐 por:
𝟏𝟎𝟎 𝟏𝟎𝟎 𝟏𝟎𝟎
P1 P2 ….. P99

𝑵
− (∑ 𝑵𝒊)𝟏
𝑷𝟏 = 𝑳𝟏 + [𝟏𝟎𝟎 ].𝒊
𝒏𝒊𝑷𝟏

𝟐𝑵
− (∑ 𝑵𝒊)𝟏
𝑷𝟐 = 𝑳𝟏 + [ 𝟏𝟎𝟎 ].𝒊
𝒏𝒊𝑷𝟐

𝟗𝟗𝑵
− (∑ 𝑵𝒊)𝟏
𝑷𝟗𝟗 = 𝑳𝟏 + [ 𝟏𝟎𝟎 ].𝒊
𝒏𝒊𝑷𝟗𝟗

EJERCICIOS:

Del siguiente cuadro de distribución de frecuencia determina:

1. Q1
2. Q2
3. D10
4. P10
5. P25
6. P75
7. P90

L1—L2 Yi Ni Ni
45—55 50 4 4
55—65 60 12 16
65—75 70 20 36

75—85 80 10 46
85—95 90 4 50
N = 50 ∑ 𝑁𝑖 = 152

Lic. Calderón Otoya Carlos


Estadística Básica

𝑵
− (∑ 𝑵𝒊)𝟏
𝟒
1. 𝑸𝟏 = 𝑳𝟏 + [ ].𝒊
𝒏𝒊𝑸𝟏

12.5−4
𝐐𝟏 = 55 + [ ] . 10 = 55 + 7.0833
12

𝐐𝟏 = 𝟔𝟐. 𝟎𝟖𝟑𝟑

2. Datos:
2N⁄ = N⁄ = 25
4 2
L1 = 65

(∑ Ni) 1 = 16

NiQ2 = 20
i = 10
2N
− (∑ Ni)1
Q2 = L1 + [ 4 ].i
niQ2

25 − 16
Q2 = 65 + ( ) . 10
20
Q2 = 65 + 4.5
Q2 = 69.5

3. Datos:
5N/10 = N/2 = 25
L1 = 65

(∑ Ni) 1 = 16

NiD5 = 20
i = 10
5N
− (∑ Ni)1
D5 = L1 + [ 10 ].i
niD5

25 − 16
D1 = 65 + [ ] . 10
20
D5 = 65 + 4.5
D5 = 69.5

Lic. Calderón Otoya Carlos


Estadística Básica

4. Datos:
10N/100 = N/10 = 5
L1 = 55

(∑ Ni) 1 = 4

NiP10 = 12
i = 10
10N
− (∑ Ni)1
P10 = L1 + [ 100 ].i
niP10

5− 4
P10 = 55 + [ ] . 10
12
P10 = 55 + 0.833
P10 = 55.83

5. Datos:
25N/100 = N/4 = 12.5
L1 = 55

(∑ Ni) 1 = 4

NiP10 = 12
i = 10
25N
− (∑ Ni)1
P25 = L1 + [ 100 ].i
niP25

12.5 − 4
P25 = 55 + [ ] . 10
12
P25 = 55 + 7.0833
P25 = 62.083

6. Datos:
75N/100 = 37.5
L1 = 75

(∑ Ni) 1 = 36

NiP75 = 10

Lic. Calderón Otoya Carlos


Estadística Básica

i = 10
75N
− (∑ Ni)1
P75 = L1 + [ 100 ].i
niP75

37.5 − 36
P75 = 75 + [ ] . 10
10
P75 = 75 + 1.5
P75 = 76.5

7. Datos:
90N/100 = 45
L1 = 75

(∑ Ni) 1 = 36

NiP10 = 10
i = 10
90N
− (∑ Ni)1
P90 = L1 + [ 100 ].i
niP90

45 − 36
P90 = 75 + [ ] . 10
10
P90 = 75 + 9
P90 = 84

NOTA:

Dado que el espacio intercuartílico presenta el 50% de las observaciones lo que interesa
saber a partir de qué valor va a medirse la desviación cuartil. La desviación cuartil. La
desviación cuartil se mide a partir del promedio que existe entre el promedio 1 y 3
cuartil.

Lic. Calderón Otoya Carlos


Estadística Básica

½ (Q1 + Q3) + D.G.

½ (62.0833 + 76.5) + 7.2085

½ (138.583) + 7.085

69.2915 - 7.2085 = 62.083

Concluimos en que la desviación cuartil se medirá en el punto 62.08.

Lic. Calderón Otoya Carlos


Estadística Básica

DECILES
Por su parte los Deciles constituyen otro tipo de Medidas de Posición, conformados por
ciertos valores que dividen la sucesión de datos que han sido ordenadas en diez
partes, que son equitativas porcentualmente hablando. Ellos se denotan de la siguiente
forma: D1, D2, D3….D9, aun cuando se leen “primer decil”, “cuarto decil”, etc. De
acuerdo a las fuentes estadísticas son utilizados sobre todo para calcular el
aprovechamiento académico.3

Cómo calcular Deciles

Al igual que con los Cuartiles, los Deciles pueden ser calculados en base a si los datos se
encuentran no agrupados, o por el contrario sí lo están. De esta forma, se tendrían dos
formas de calcularlos:
Cálculo de Deciles de Datos no Agrupados
Si se tiene una serie de números o datos, correspondientes a distintos valores X1, X2…
Xn, se deberán usar las siguientes fórmulas, según si el valor es un número par o impar.
A continuación cada una de las ecuaciones a emplear de acuerdo al caso:
Si n (número que corresponde al número de datos) y es par se deberá emplear la siguiente
fórmula:

Si por el contrario n es impar, entonces se deberá aplicar la fórmula que se expresa a


continuación:

Es importante señalar que en todos los casos A corresponderá al Decil que se desea
calcular.

Lic. Calderón Otoya Carlos


Estadística Básica

Cálculo de Datos Agrupados


Si por el contrario se trata de Datos Agrupados, la fórmula para calcular los

Deciles corresponderá a la siguiente:

En donde cada una de las variables corresponde a los siguientes valores:


Lk: límite real inferior a la clase correspondiente al decil k
n: será el número de datos
Fk: es equivalente a la frecuencia acumulada correspondiente a la clase que antecede a
la que corresponde al decil k
fk: por su parte esta variable corresponde a la frecuencia de la clase del decil k
c: longitud del intervalo correspondiente a la clase del decil k

Lic. Calderón Otoya Carlos


Estadística Básica

Percentiles
Finalmente los percentiles, también conocidos como centiles son otras de las Medidas de
Posición más comunes y empleadas, utilizadas sobre todo para clasificación de datos
correspondientes a las medidas de las personas, como la estatura, el peso, el diámetro
craneal, etc. Igualmente, técnicamente, son definidos como ciertos valores que dividen en
cien partes idénticas porcentualmente hablando los datos que han sido ordenados de
forma sucesiva de menor a mayor. En cuanto a su denotación, ésta corresponde a la forma
P1, P2…. Pn, no obstante son leídas como Percentil 10, Percentil 90, etc.
Cómo calcular Percentiles
Tal como con las otras Medidas de Posición, los percentiles pueden ser medidos en
cuanto a si corresponden a Datos no Agrupados o Agrupados, en cuyo caso se usarán
procedimientos matemáticos distintos. A continuación una descripción de cada uno de
ellos:
Percentiles de Datos no agrupados
Si se trata del cálculo de percentiles de datos no ordenados, se deberá tomar calcular en
base a la siguiente fórmula:

En donde x es el número del percentil, n es equivalente al número total de datos y k


el percentil.

Percentiles de Datos Agrupados


Por otro lado, si se desea calcular el percentil en base a datos que se encuentran
agrupados, se deberá entonces emplear la siguiente fórmula:

Lic. Calderón Otoya Carlos


Estadística Básica

MEDIDAS DE
DISPERSION O DE
VARIABILIDAD

Lic. Calderón Otoya Carlos


Estadística Básica

5. MEDIDAS DE DISPERSION O DE VARIABILIDAD

Se conoce con el nombre de dispersión o variación al grado en que un conjunto de datos


numéricos u observaciones tienden a diseminarse, extenderse o concentrarse alrededor
de su valor central.

Las principales medidas de dispersión son:

1. El rango o amplitud total también llamado horquilla R.

2. La desviación quartil D.Q.

3. La desviación media D.M.

4. La varianza S² o T²

5. La desviación standard o desviación típica S o T.

5.1. RANGO (R)

Se define el rango como la diferencia entre las medidas máximas y mínimas y se


caracteriza por ser la más inestable de las medidas de dispersión pero tienen la ventaja de
ser fácil de interpretar y calcular su valor.

Ejemplo 1: R= Max - Min

a) Determinar el rango de los números: 78, 80, 82, 83, 85, 87, 90, 92.

92 - 78 = 14
R= Max - Min
Ejemplo 2
b) Determinar el rango o amplitud total de los siguientes números:

0.8, 1.2, 2.6, 2.8, 3.3, 3.4, 3.7, 9.2, 7.1, 5.6, 6.4, 2.3 y 5.6

R= Max - Min
9.2 – 0.8 = 8.4

Lic. Calderón Otoya Carlos


Estadística Básica

Ejemplo 3

c) El rango del conjunto 2, 3,3, 5, 5, 5, 8,10 12 es:

R= Max - Min 12 – 2 = 10

5.2.. DESVIACION CUARTIL (D.Q)


Se define la desviación cuartil como la semidiferencia entre el tercer y el primer cuartil y
está asociada generalmente con la mediana y las distribuciones ligeramente asimétricas.

D.Q. = 𝑸𝟑− 𝑸𝟏

Ejemplo:

a) Determinar la desviación cuartil del cuadro de distribución de frecuencias ,


sabiendo que
Q1 =62.083 y Q3 =76.5

5.3. DESVIACION MEDIA

La desviación media, o desviación promedio, de un conjunto de N números X1, X2,…….X


N se abrevia DM y está definido así

∑𝑁
𝑗=1 |𝑌𝑖 − 𝑋 |
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑀𝑒𝑑𝑖𝑎 (𝐷𝑀) =
Dónde:
𝑁

Lic. Calderón Otoya Carlos


Estadística Básica

X = Media aritmética
|Yi – X | = Valor absoluto de la desviación de Xj respecto a X
El valor absoluto de un número es el numero sin signo; el valor absoluto de un
numero se indica por medio de dos barras verticales colocadas a los lados del
número, así |- 4| = 4 , |+3| = 3 , |6| = 6

EJEMPLO:
Encuentre la desviación media del conjunto:
2, 3, 6, 8,11
Paso 1:
Hallar La Media Aritmética
2 + 3 + 6 + 8 + 11
Media aritmética (X) = =5
5

Paso 2:
Hallar la Desviación Media
| 2 – 6 | + | 3 – 6| + | 6 – 6| + |8 – 6 | + | 11 − 6 | 4+3+0+2+5
DM = = = 2.8
5 5

EJERCICIO
Encontrar la desviación media de las estaturas de 100 estudiantes de la universidad
Nacional del Callao.

Estatura Marca de clase Frecuencia (ni) (Yi) .(ni)


(Yi)
60 - 62 61 5 30

63 - 65 64 18 1152

66 - 68 67 42 2814

69 - 71 70 27 1890

72 - 74 73 8 584

N= ∑ 𝑛𝑖 = 100 ∑ 𝑛𝑖. 𝑌𝑖 =
6745

Lic. Calderón Otoya Carlos


Estadística Básica

Hallando la media aritmética:


∑ 𝑌𝑖.𝑛𝑖 6745
Media Aritmética =𝑋= ∑𝑁
= = 67,45
100

Otra manera de hallar la media aritmética con la desviación


Marca de clase (Yi) Desviación d= X - A Frecuencia d.(ni)
61 -6 5 - 30

64 -3 18 - 54

67 0 42 0
70 3 27 81
73 6 8 48
N= ∑ 𝑛𝑖 = 100 ∑ 𝑛𝑖. 𝑑 = 45

∑ 𝑛𝑖.𝑑 45
Media Aritmética = 𝑋 = A+ = 67 + 100 = 67.45
𝑁

Ojo: A= representa la clase con mayor frecuencia


Por último es hallar la desviación media
Estaturas Marca de |Yi – X| =| Yi – 67.45| Frecuencia ni. |Yi – X|
clase (Yi) (ni)
60-62 61 6.45 5 32.25
63-65 64 3.45 18 62.10
66-68 67 0.45 42 18.90
69-71 70 2.55 27 68.85
72-74 73 5.55 8 44.40
N= ∑ = 100 ∑ = 226.50

∑ 𝑛𝑖.|𝑌𝑖−𝑋| 226.50
DM = = = 2.26
𝑁 100

Lic. Calderón Otoya Carlos


Estadística Básica

5.4. La Varianza
Se define como la suma de los cuadrados de los desvíos de las observaciones con respecto
a su medio aritmético dividido entre el total de observaciones menos uno cuando se trata
de muestras.
Se emplea N -1 como denominador de las fórmulas de la varianza muestral porque se
ajusta mejor a la varianza poblacional que por término medio deben ser iguales.
La varianza de un conjunto de datos se define como el cuadrado dela desviación
estándar y, por lo tanto corresponde al valor S2

Varianza
Poblacional

Varianza
Muestral

Lic. Calderón Otoya Carlos


Estadística Básica

Ejercicio 1:
Los datos que se muestran a continuación son los goles que hizo un jugador de futbol
durante 15 temporadas.
15, 7, 8, 9, 10 , 13, 16 , 11 , 10 , 15 , 19 , 16 , 12, 13 , 8
Hallar la variación:
Solución :
Primero se halla la media aritmética:
∑ 𝑋𝑖 182
=
𝑁 15

𝑿 = 12.13

Lic. Calderón Otoya Carlos


Estadística Básica

Xi 𝑿 – Xi (𝑿 – Xi)2

7 5.13 26.3169

8 4.13 17.0569

8 4.13 17.0569

9 3.13 9.7969

10 2.13. 4.5369

10 2.13 4.5369

11 1.13 1.2769

12 0.13 0.0169

13 -0.87 0.7569

13 -0.87 0.7569

15 -2.87 8.2369

15 -2.87 8.2369

16 -3.87 14.9769

16 -3.87 14.9769

19 -6.87 47.1969

Lic. Calderón Otoya Carlos


Estadística Básica

175.7335 175.7335
= = 12.55239286
15−1 14

EJERCICIO 2:
Hallar la varianza y la desviación típica de la siguiente serie de datos:
12, 6, 7, 3, 15, 10, 18, 5.
Hallar la variación y desviación típica.
Solución:
Hallando la media aritmética

Hallando la varianza

Hallando la desviación típica

Lic. Calderón Otoya Carlos


Estadística Básica

MEDIA PONDERADA DE LAS VARIACIONES

Una medida útil para ponderar que tanta variación existe entre dos muestras con N1 datos
y N2 datos, y S1 y S2 desviaciones estándar para la muestra 1 y 2, ambas con la misma
media

𝟐
𝑵𝟏 𝑺𝟐𝟏 + 𝑵𝟐 𝑺𝟐𝟐
𝑺 =
𝑵𝟏 + 𝑵𝟐

Se puede observar que la varianza planteada puede verse como una ponderación de las
desviaciones observadas para las dos muestras. Esta definición se puede extender para
mas de dos muestras, considerando una ponderación sobre el conjunto de muestras, por
lo que la expresión para un conjunto de muestras con una misma media puede ser
representada como:

𝟐
∑ 𝑺𝟐𝟏 𝑵𝟏
𝑺 =
∑ 𝑵𝟏

Donde N1 y S1 son el número de datos y desviación estándar, respectivamente, para la


muestra i

Lic. Calderón Otoya Carlos


Estadística Básica

CORRECCION SHEPPARD PARA LA VARIANZA (S2c)


Cuando en una serie clasificada los límites de clase comprenden varias unidades se
introduce un error al agrupar los datos en clases (llamado error de agrupamiento), debido
a que los puntos medios o marcas no coinciden con los respectivos promedios de los datos
agrupados en cada clase.

Los puntos medios o marcas de clase tienen mayor dispersión que los promedios, lo que
da lugar a un error de la Varianza en exceso. Este error se corrige mediante la corrección
Sheppard con lo cual se obtiene la Varianza ajustada o corregida, para lo cual a la

i2
Varianza calculada se le resta la constante .
12

𝟐
𝒊𝟐 𝟐
𝑺 𝒄=𝑺 −
𝟏𝟐

EJEMPLO:
Calcular la varianza ajustada o corregida del sgte. Cuadro de distribución de frecuencia:

L1 - L2 Yi ni Yi ² niYi² niYi (Yi – X)² /Yi –x/ ni(Yi-x)²

45 - 55 50 4 2500 10000 200 384.16 -196 1536.64

55 - 65 60 12 3600 43200 720 92.16 -9.6 1105.92

65 - 75 70 20 4900 98000 1400 0.16 0.4 3.2

75 - 85 80 10 6400 64000 800 108.16 10.4 108.16

85 - 95 90 4 8100 32400 360 416.16 20.4 416.16

N niYi²= niYi= ni(Yi-x)² =

=50 247600 3480 5392

Lic. Calderón Otoya Carlos


Estadística Básica

SOLUCION

𝑺𝟐 = 𝟏𝟎𝟕. 𝟖

𝟐
𝒊𝟐𝟐
𝑺 𝒄=𝑺 −
𝟏𝟐
𝟐
𝟏𝟎𝟐
𝑺 𝒄 = 𝟏𝟎𝟕. 𝟖𝟒 −
𝟏𝟐
𝑺𝟐 𝒄 = 𝟏𝟎𝟕. 𝟖𝟒 − 𝟖. 𝟑
𝑺𝟐 = 𝟗𝟗. 𝟓𝟎𝟔𝟔𝟔

Ejemplo 2:

Determinar la corrección Sheppard para la varianza, sabiendo que la varianza = 80 y la

amplitud = 6

𝟐
𝒊𝟐𝟐
𝑺 𝒄=𝑺 −
𝟏𝟐
𝟐
𝟔𝟐
𝑺 𝒄 = 𝟖𝟎 −
𝟏𝟐
𝑺𝟐 𝒄 = 𝟕𝟕

Lic. Calderón Otoya Carlos


Estadística Básica

DESVIACION ESTANDAR

Lic. Calderón Otoya Carlos


Estadística Básica

6.1.DESVIACIÓN STANDARD O TIPIFICADA


Se define la desviación Standard como la raíz cuadrada positiva de la varianza y se
caracteriza por ser el estadígrafo de mayor uso en la actualidad.

Se obtiene mediante la aplicación de las siguientes fórmulas dependiendo del tipo de datos
que no han dado:

SERIES UNIVERSOS MUESTRAS


2 2
 
  

  Yi  X 


 Yi  X 

  S
Simples N N 1

 Yi  2
 Yi  2

 Yi 2

N
 Yi 2

N
 S
N N 1
2 2
 
  

 
ni Yi  X 

 
ni Yi  X 

Clasificada  S
N N 1

 niY i  2
 niY i  2

 niYi 2

N
 niYi 2

N
 S
N N 1

Lic. Calderón Otoya Carlos


Estadística Básica

Ejemplo:
Determinar la desviación estándar del siguiente cuadro de distribución:

L1 - L2 YI nI Yi ² niYi² niYi (Yi – X)² /Yi –x/ ni(Yi-x)²

45 - 55 50 4 2500 10000 200 384.16 -196 1536.64

55 - 65 60 12 3600 43200 720 92.16 -9.6 1105.92

65 - 75 70 20 4900 98000 1400 0.16 0.4 3.2

75 - 85 80 10 6400 64000 800 108.16 10.4 108.16

85 - 95 90 4 8100 32400 360 416.16 20.4 416.16

N niYi²= niYi= ni(Yi-x)² =

=50 247600 3480 5392

2 𝛴𝑛𝑖(𝑌𝑖 − 𝑥)2
𝑆 =√
𝑁

𝟓𝟑𝟗𝟑
𝑺=√
𝟓𝟎

S = 10.38460399

Lic. Calderón Otoya Carlos


Estadística Básica

2 (𝛴𝑛𝑖𝑌𝑖)2
√𝛴𝑛𝑖𝑌𝑖²− 𝑁
𝑆 =
50

2 (3480)2
√247 600− 50
𝑆 =
50

𝑆 = 10.38460399

S = 10.38460399

NOTA: La desviación Standard o


desviación típica se aplica solo para
datos agrupados.

PROPIEDADES DE LA DESVIACION ESTANDAR

1. La desviación estándar será siempre un valor positivo o cero, en el caso de que


las puntuaciones sean iguales.

2. Si a todos los valores de la variable se les suma un número la desviación


estándar no varía.

3. Si todos los valores de la variable se multiplican por un número la desviación


estándar queda multiplicada por dicho número.

4. Si tenemos varias distribuciones con la misma media y conocemos sus respectivas


desviaciones estándar se puede calcular la desviación estándar total.

Si todas las muestras tienen el mismo tamaño:

Lic. Calderón Otoya Carlos


Estadística Básica

S i l as m uest ras t i enen di st i nt o t am año :

Obs erva ci ones sobre l a desvi aci ón est án dar:

 La d esvi aci ón están d ar , al i gual que l a m edi a y l a va ri anz a, es


un í ndi ce m u y sensi bl e a l as punt uaci on es ex t rem as

 En l os casos que n o se pu eda h al l ar l a m edi a t am poco s erá


posi bl e hal l ar l a d es vi aci ón están d ar .

 C uant a m ás pequeña sea l a d esvi aci ón están d ar m a yor ser á l a


con cen traci ón d e d atos al reded or de l a med i a

Lic. Calderón Otoya Carlos


Estadística Básica

6.2.CORRECCIÓN SHEPPARD PARA LA DESVIACIÓN ESTANDAR (Sc)


Cuando en una serie clasificada los límites de clase comprenden varias unidades, se
produce un error al agrupar los datos en clase (llamado error de agrupamiento), debido a
que los puntos medios o marcas de clase no coinciden con los respectivos promedios de
los datos agrupados en cada clase.

Se determina mediante la aplicación de la siguiente formula:

𝒊𝟐
𝑺𝒄 = √𝑺𝟐 −
𝟏𝟐

Ejercicio:

Calcular la corrección Sheppard del siguiente cuadro de distribución

L1 - L2 YI nI Yi ² niYi² niYi (Yi – X)² /Yi –x/ ni(Yi-x)²

45 - 55 50 4 2500 10000 200 384.16 -196 1536.64

55 - 65 60 12 3600 43200 720 92.16 -9.6 1105.92

65 - 75 70 20 4900 98000 1400 0.16 0.4 3.2

75 - 85 80 10 6400 64000 800 108.16 10.4 108.16

85 - 95 90 4 8100 32400 360 416.16 20.4 416.16

N niYi²= niYi= ni(Yi-x)² =

=50 247600 3480 5392

Lic. Calderón Otoya Carlos


Estadística Básica

𝒊𝟐
𝑺𝒄 = √𝑺𝟐 −
𝟏𝟐

𝟏𝟎²
𝑺𝒄 = √𝟏𝟎𝟕. 𝟖𝟒 −
𝟏𝟐

𝑺 = √𝟗𝟗. 𝟓𝟎𝟔𝟔𝟔
𝑺 = 𝟗. 𝟗𝟕𝟓𝟑𝟎𝟐

Lic. Calderón Otoya Carlos


Estadística Básica

6.3 SIGNIFICADO E INTERPRETACION DE LA DESVIACION STANDARD


BAJO LA CURVA NORMAL
La desviación estándar ayuda a describir la curva de distribución normal, llamada también
Campana de Gauss, Curva Normal, Curva de Error, Campana o Curva De Moivre, de la
siguiente manera :

1) Una desviación estándar a cada lado de la media incluye un área del 68.26%
del área total, es decir aproximadamente las 2/3 partes de los casos.

̅ ± 𝟏𝝈 = 𝟔𝟖. 𝟐𝟕%
𝑿

Lic. Calderón Otoya Carlos


Estadística Básica

2) El área comprendida entre una y dos desviaciones estándar equivale al


13.59% del área total. El área comprendida entre dos desviaciones estándar a
ambos lados de la media es igual al 95.45% del área total.

̅ ± 𝟐𝝈 = 𝟗𝟓. 𝟒𝟓%
𝑿

3) Entre dos y tres desviaciones estándar resulta otra porción del área igual al
2.15% del área total. El área comprendida entre tres desviaciones estándar a
cada lado de la media es igual al 99.74% del área total.

̅ ± 𝟑𝝈 = 𝟗𝟗. 𝟕𝟑%
𝑿

Lic. Calderón Otoya Carlos

Вам также может понравиться