Вы находитесь на странице: 1из 29

MINISTERIO DE EDUCACIÓN

CENTRO EDUCATIVO MADRE CARIDAD BRADER

TEMA

MATEMATICA

“MEDIDAS DE TENDENCIA CENTRAL”

PROFERSOR CHAYANE

30 OCTUBRE 2019

YOIRA SAMANIEGO

12-1P

1
Introducción

La estadística es una ciencia que s remonta al inicio de las sociedades humanas,


como una necesidad para la realización de actividades elementales, desde una
simple colección de datos hasta la interpretación de los mismos. Las primeras
sociedades que se formaron en la historia, necesitaban saber cuántos habitantes
formaban cada tribu, la cantidad de bienes poseían, etc. de esa manera planificaban
mejor la asignación de los recursos. La estadística:

- La primera parte de la definición: recopilar, organizar e interpretar conjuntos


de datos se llama “Estadística Descriptiva”.

- La segunda parte: interpretar datos de manera que pueda llevar a


conclusiones válidas se llama “Estadística Inferencial”.

En este trabajo abarcaré el proceso de evolución y desarrollo de la estadística.


Presentaré las diferentes escuelas que surgieron, cada una con una tendencia y
punto de vista diferente, ampliando con el paso del tiempo el campo de acción de la
estadística. La estadística consiste en recolectar, organizar, resumir y analizar
datos, a partir de los cuales se deducen conclusiones que validen decisiones
razonables. De la estadística se derivan varias ramas, dependiendo del área de
estudio de la misma. También están las medidas que resumen los datos
recolectados: las medidas de tendencia central, que permiten la comparación de
datos cuantitativos, promediándolos. Las medidas de variabilidad y dispersión, que
determinan la variación de datos en un periodo y otro.

2
INDICE .

ESTADÍSTICA

Introducción
1. Medidas de Tendencia Central……………………………………………………..4
1. Organización de los datos de un conjunto……………………………………4
1. Distribuciones de frecuencias…………………………………………………….4
1.3.1 Definición de distribución de frecuencia. Terminología
1.3.2 Reglas generales para formar distribuciones de frecuencia
1.3.3 Ejercicios
1.4 Representación grafica de los datos de un conjunto………………………………7
1.4.1 Variables Cualitativas
1.4.2 Variables Cuantitativas Discretas
1.4.3 Variables Cuantitativas Continuas
1.4.4 Ejercicios
1.5 Medidas de tendencia central………………………………………………………12
1.5.1 La media aritmética (Media Ponderada)
1.5.2 La moda
1.5.3 La mediana
1.5.4 Ejercicios
1.6 Medidas de dispersión ……………………………………………………………..15
1.6.1 Amplitud (recorrido o rango)
1.6.2 Desviación típica (o estándar).Varianza
1.6.3 Ejercicios
1.7 Medidas de Posición ………………………………………………………………20
1.7.1 Cuantiles(cuartiles, deciles y percentiles)
1.7.2 Ejercicios
1.8. Bibliografia…………………………………………………………………….26.
1.9 Conclusion………………………………………………………………………28.

3
MEDIDAS DE TENDENCIA CENTRAL

1. INTRODUCCION

La estadística se puede definir como la ciencia encargada de


recopilar, organizar e interpretar conjuntos de datos, de manera
que pueda llevar a conclusiones válidas. Los datos se obtienen (de
una muestra o población) observando o experimentando.

- La primera parte de la definición: recopilar, organizar e


interpretar conjuntos de datos se llama “Estadística
Descriptiva”.

- La segunda parte: interpretar datos de manera que pueda


llevar a conclusiones válidas se llama “Estadística
Inferencial”.

Nos ocuparemos de la Estadística Descriptiva.


Cuando el número de datos es relativamente grande, resulta
conveniente, para facilitar su interpretación, primero organizarlos
y luego representarlos gráficamente.

2. ORGANIZACIÓN DE LOS DATOS DE UN CONJUNTO

Los datos recopilados se analizan de acuerdo con una


característica: “CUALITATIVA”, por ejemplo, el estado civil, sexo
y nacionalidad de una persona; calidad de un plaguicida, como
dañino o no dañino para la salud. Cuando la característica es
“CUANTITATIVA” se distinguen dos casos: características
discretas, como el número de hijos en la familia. En este caso la
variable toma valores aislados, 0, 1, 2, 3, etc. Características
continuas, como el peso y la estatura de una persona. Aquí la
variable en consideración toma todos los valores reales en un
intervalo.

3. DISTRIBUCIONES DE FRECUENCIAS

DEFINICION DE FRECUENCIA Y TERMINOLOGÍA

4
Definición:
Las distribuciones de frecuencias son disposiciones tabulares de
los datos, por clases con sus respectivas frecuencias absolutas.

Terminología:
CLASES. (Para una característica continua): Son intervalos
abiertos o cerrados. Deben ser exhaustivos y excluyentes; es
decir, tales que se elimine la posibilidad

de que un dato dado no corresponda a clase alguna o que pueda


quedar incluido en más de una.
FRECUENCIA ABSOLUTA: Es el número de datos que pertenecen
a la clase.
Ejemplo 1.
Distribución de frecuencias de puntajes obtenidos por 120
estudiantes en un examen de matemática.

Clase Puntajes (x) Frecuencias


Absolutas
1ra. 28 - 32 10
2da. 33 - 37 15
3ra. 38 – 42 20
4ta. 43 – 47 35
5ta. 48 – 52 19
6ta. 53 – 57 12
7ma. 58 - 62 9
Total 120

- Los números que definen una clase: 28-32, 33-37, etc. se


llaman Límites de Clase.
- Los valores a la izquierda: 28, 37, etc. se llaman Limites
Inferiores aparentes, los valores a la derecha: 32, 37, etc.
son los Limites Superiores aparentes de la clase.
- La diferencia entre el límite superior (l s) y el límite inferior (li),
más 1, es un Intervalo de Clase (o Amplitud de Clase); y
se denota por ic . En símbolos:
ic = l s – l i + 1
- Marca de clase o punto medio: Es la mitad de la suma
de los límites

5
de la clase.
Los datos que corresponden a una variable continua,
generalmente no son medidas exactas. Así decimos por ejemplo
que 58 es un valor que está entre 57.5 y 58.5; el primero es el
límite real inferior y el segundo es el límite real superior.
Para estas distribuciones ic = lrs – lri.
A continuación se presenta la distribución de frecuencias del
ejemplo anterior, con límites reales.
Ejemplo 2.
Clase Puntajes Frecuencias
Absolutas
1ra. 27.5 a menos de 10
32.5
2da. 32.5 a menos de 15
37.5
3ra. 37.5 a menos de 20
42.5
4ta. 42.5 a menos de 35
47.5
5ta. 47.5 a menos de 19
52.5
6ta. 52.5 a menos de 12
57.5
7ma. 57.5 a menos de 9
62.5
Total 120

En general, la distribución de frecuencias para una muestra de


tamaño n y un número k de clases, con frecuencias fk,
respectivamente, se representa así:

Clase Frecuencia Absoluta


clase 1 F1
clase 2 F2

clase i Fi

clase k Fk
6
Total n
k

La frecuencia relativa es fi/n, donde 0 ≤ f i/n ≤ 1 y “  fi / n =


i 1

1.
Cuando fi/n se multiplica por 100, se llama frecuencia
porcentual. La frecuencia acumulada menor que fi se denota
por Fi y es la suma de las frecuencias absolutas que van desde la
clase 1 hasta la clase i. En símbolos:
Fi = f1 +f2 + f3 +…+ fi
Ejemplo 3.
Distribución de frecuencias porcentuales y acumuladas, basada en
los datos que aparecen en la ejemplo 1.

Puntajes Frecuencia Frecuencia fa Fia menor Fia más que


(x) s absolutas porcentual que
28 - 32 10 8.33 10 8.33 100
33 - 37 15 12.50 25 20.83 91.67
38 - 42 20 16.67 45 37.50 79.17
43 - 47 35 29.17 80 66.67 62.50
48 - 52 19 15.83 99 82.50 33.33
53 - 57 12 10.00 11 92.50 17.50
1
58 - 62 9 7.50 12 100.00 7.50
0

Con ésta distribución de frecuencias podemos tener, entre otras,


las siguientes informaciones:

- El 29.17 % de los estudiantes obtuvieron puntaje entre 43 y


47.
- El 61.67 % sacaron puntajes entre 38 y 52.
- La Fa, 45, que aparece en la tercera clase significa que 45
estudiantes sacaron puntajes de 42 o menos.
- El 17.5 % de estudiantes obtuvieron 53 y más puntos.

7
REGLAS GENERALES PARA FORMAR DISTRIBUCIONES DE
FRECUENCIAS

1. Determinar el mayor y el menor de todos los datos,


hallando así el rango (diferencia entre ambos).
2. Dividir el rango en un número adecuado de intervalos de
clase del mismo tamaño (de igual amplitud).
3. Mediante una hoja de recuentos, determinar el numero de
datos que caen dentro de cada intervalo de clase; esto es
hallar la frecuencia de clases.

4. REPRESENTACION GRAFICA DE LOS DATOS DE UN


CONJUNTO

La selección apropiada de una gráfica puede relacionarse con el


carácter de la variable en estudio. Los principales tipos de gráficas
que corresponden a las variables cualitativas , cuantitativas
discretas y continuas, se pueden ver en el cuadro siguiente:

Variable Tipo de Gráfica


Barras separadas
Cualitativa Circular o de Pastel
Barras
Cuantitativa discreta Circular o de Pastel
Histograma
Cuantitativa continua Polígono de frecuencias

VARIABLES CUALITATIVAS.

BARRAS SEPARADAS.

Ejemplo 4.
Una pequeña encuesta estudiantil sobre preferencias de bebidas
gaseosas produjo los siguientes resultados:

Pepsi coca fanta coca fanta coca pepsi salva pepsi

8
Salva coca fanta coca pepsi pepsi pepsi salva sprite
Sprite fanta pepsi fanta coca salva coca pepsi
Sprite pepsi coca pepsi sprite sprite salva coca
salva salva coca coca fanta pepsi salva coca
coca coca pepsi coca coca fanta coca fanta

Después del conteo, la distribución en clases y frecuencias queda


como sigue:

i bebida fi fri % Fi %
1 Coca 17 34 34%
2 Fanta 8 16 50%
3 Pepsi 11 22 72%
4 Salva 8 16 88%
5 Sprite 6 12 100%
total 50

Grafica de barras separadas para las compras de bebidas


gaseosas.

CIRCULAR

Grafica circular para las compras de bebidas gaseosas.

9
VARIABLES CUANTITATIVAS DISCRETAS

Ejemplo 5.
Distribución de frecuencias del número de maestros en una
muestra de escuelas públicas, en Chalatenango.

Número de Cantidad de
maestros escuelas
5 6
6 8
7 10
8 12
9 8
10 11
11 7
12 4

10
VARIABLES CUANTITATIVAS CONTINUAS

Un histograma es una gráfica constituida por barras verticales


no separadas(límites reales).
Para construirlo se marcan en el eje horizontal las clases y en el
eje vertical las frecuencias. Sobre el intervalo correspondiente a
cada clase se dibuja una barra de área proporcional a su
frecuencia.

Ejemplo 6.
Clasificación de 40 alumnos de una escuela rural de acuerdo a su
peso en libras.

Frecuencia
Clases Frecuencia Puntos acumulada Frecuencia
medios “menos de” relativa
29.5 – 34.5 1 32 1 0.025
34.5 – 39.5 3 37 4 0.075
39.5 – 44.5 8 42 12 0.200
44.5 – 49.5 9 47 21 0.225
49.5 – 54.5 7 52 28 0.175
54.5 – 59.5 4 57 32 0.100
59.5 – 64.5 3 62 35 0.075
64.5 – 69.5 3 67 38 0.075
69.5 – 74.5 2 72 40 0.050
Total 40 1.000

11
La comparación de dos o mas distribuciones de frecuencias
resulta fácil, si en lugar de levantar una barra sobre el intervalo
correspondiente al la clase, se marca un punto con abscisa el
punto medio y como ordenada la frecuencia. Luego los puntos se
une con segmentos de recta y la figura resultante se denomina
polígono de frecuencias. El área bajo el polígono de be ser
igual al área comprendida por el histograma. Para lograr esto,
usualmente el polígono se prolonga tal como puede apreciarse en
la gráfica siguiente, procediendo como si existiera una clase
adicional al principio y otra al final, ambas con frecuencia de cero.

12
5. MEDIDAS DE TENDENCIA CENTRAL

Medidas de Posición: son aquellos valores numéricos que nos permiten o


bien dar alguna medida de tendencia central, dividiendo el recorrido
de la variable en dos, o bien fragmentar la cantidad de datos en partes
iguales. Las más usuales son la media, la mediana, la moda, los
cuartiles, quintiles, deciles y percentiles. Pueden ser de dos tipos: de
tendencia central o de tipismo.

Medidas de Dispersión: se llaman medidas de dispersión aquellas que


permiten retratar la distancia de los valores de la variable a un cierto
valor central, o que permiten identificar la concentración de los datos
en un cierto sector del recorrido de la variable. Se trata de coeficientes
para variables cuantitativas. Las más usuales son el desvío estándar y
la varianza.

LA MEDIA ARITMETICA

13
Entre las medidas de tendencia central, la mas popular es la
“media aritmética”, que comúnmente se llama “promedio”

DEFINICION: La media aritmética de un conjunto de N datos:


x1, x2, ….., xN, se denota por x y se define así:
N

Suma de todos los datos


x = x1  x 2  .....x N x i

Número total de datos  i 1

N N

NOTA: El símbolo  es la letra griega “sigma mayúscula” que


corresponde a la letra S.

EJEMPLO 1: Calcular la media de 8, 16, 4, 12 y 10

SOLUCION:
8  16  4  12  10 50
x   10
5 5
Advierta: la media es uno de los datos.

EJEMPLO 2: Calcular la media de 8, 16, 4, 12 y 5

SOLUCION:
8  16  4  12  5 45
x  9
5 5
La media, 9, no es uno de los datos
Si los números x1  x 2  .....x N ocurren f 1 , f 2 ,....., f N veces,
respectivamente (o sea con frecuencias f1 , f 2 ,....., f N ), la media
N N

f x  f x  ........f N x N  fi x i f x i i
x 1 1 2 2  i 1
 i 1
f1  f 2 ..........f N N
N
f
i 1
i

aritmética es
EJEMPLO 3: 5,8,6 y 2 ocurren con frecuencias 3,2,4 y 1
respectivamente. Hallar la media.
SOLUCION:
3(5)  2(8)  4(6)  2 15  16  24  2 57
x    5.7
3  2  4 1 10 10

14
A veces asociamos con los números x1 , x 2 ,....,.x N , unas
ponderaciones (o pesos) w1 , w2 ,....., w N , dependiente de la
relevancia asignada a cada número (no a su frecuencia). En este
caso:
N

w x  w2 x 2  .....wN x N w x i i
x 1 1  i 1

w1  w2  .....wN N

w
i 1
i

Se llama “media aritmética ponderada” con pesos w 1, w2,......, wn

EJEMPLO 4: El primer examen parcial vale el 20%, el segundo


parcial, el 25%, las tareas el 30% y el examen final el 25% de la
nota final. Si un estudiante tiene las calificaciones 1er. P: 3.0; 2º.P:
5.8; tareas: 8.0 y EF: 6.4, ¿Cuál es la media aritmética ponderada
(nota final)?SOLUCION:

(0.2)(3.0)  (0.25)(5.8)  (0.3)(8.0)  (0.25)(6.4)


x  6.05
0.2  0.25  0.30  0.25

VERIFICANDO SU COMPRENSIÓN

1. Calcule la media aritmética para el conjunto de datos.


a) 6,8,3,9 y 5 b) 6,6,8,8,3,9,9,9,5 y 5

2. Calcule la media aritmética ponderada para el conjunto de


datos 3.0, 2.0, 6.5 y 8.4 con los pesos: 20%, 20%, 30% y 30%
respectivamente.

LA MODA

DEFINICION: La moda de un conjunto de números es el valor que ocurre con


mayor frecuencia (valor más frecuente)

NOTA: La moda de un conjunto puede no existir, e incluso no ser


única, en caso de existir.
15
EJEMPLO 5. El conjunto 1,2,3,3 y 4 tiene moda 3
EJEMPLO 6. El conjunto 1,2,3, y 4 no tiene moda
EJEMPLO 7. El conjunto 1,1,2,2,3 y 4 tiene dos modas: 1 y 2; se
dice que es bimodal.

LA MEDIANA

DEFINICION: La mediana (med) de un conjunto de números ordenados en


sentido creciente (decreciente) es: el valor central, si el número de datos es impar;
o la media de los valores centrales, si el número de datos es par.

EJEMPLO 8. El conjunto de números 3,4,4,5,6,8,8,8 y 10 tiene


mediana 6
EJEMPLO 9. El conjunto de números 5,5,6,8,9 y 10 tiene mediana
68
x 7
2
EJEMPLO 10. Calcular la mediana del conjunto: 8,5,10,7,6,9,2,2,5 y
6

SOLUCION:
Primero se ordenan los números (orden creciente):
2,2,5,5,6,6,7,8,9 y 10. Como hay un número impar de datos, la
mediana es 6 (la mediana es uno de los datos)
EJEMPLO 11. Calcular la mediana del conjunto:
7,4,7,4,5,5,6,6,6,3,3,2,1 y 1
SOLUCION:
Primero se ordenan los números (orden creciente):
1,1,2,3,3,4,4,5,5,6,6,6,7 y 7. Como hay un número par de datos, la
45
mediana es 2
 4.5 (la mediana no es

MEDIDAS DE DISPERSION

La localización o tendencia central no necesariamente proporciona


información para describir datos de manera adecuada. Para el
caso, consideramos los siguientes ejemplos.

EJEMPLO 1.

16
Suponga que en un hospital, el nivel de azúcar en la sangre de
cada paciente se mide tres veces por semana. En cierta semana
los registros de dos pacientes indican:

Paciente A: 90, 100 y 110 miligramos por decilitro


Paciente B: 40, 100 y 160 miligramos por decilitro
El promedio de ambos pacientes es 100.

En efecto:
90  100  110 300
Paciente A: 3

3
 100
40  100  160 300
Paciente B: 3

3
 100

Observe la diferencia en variabilidad. Mientras que el paciente A


es bastante estable, el nivel del paciente B fluctúa ampliamente.
Este resultado deberá tomarse en cuenta cuando se prescriba su
tratamiento.

COMENTARIO: Un paciente con un nivel de azúcar en la sangre


de 40 mg/dl, convulsiona; con un nivel de 160 mg/dl podría ser
diabético.

EJEMPLO 2.
Se va a seleccionar a un atleta para que represente a la
Universidad en los juegos estudiantiles, en la prueba de los 100
metros. Se tienen dos candidatos: A y B. Para decidir por uno de
ellos se les toman los tiempos que se tardan en recorrer los 100
metros en cinco ocasiones. A continuación de detallan:

Atleta A: 11.0, 11.8, 11.6, 11.3 y 12.3 segundos


Atleta B: 11.5, 11.6, 11.6, 11.8 y 11.5 segundos

El tiempo promedio de ambos atletas es 11.6 segundos


(verificarlo) pero el grado de variabilidad del atleta B es menos
que el del atleta A. Por tener menos altibajos, el atleta B tendría
que ser el seleccionado.

Casos como los anteriores (medicina, deportes) muestran la


necesidad de descripciones estadísticas que midan el grado en
que se dispersan (o varían) los

17
datos, respecto a su centro; es decir; la necesidad de las medidas
de dispersión. Dos de ellas son: la amplitud (o rango) y la
desviación típica.

AMPLITUD (RECORRIDO O RANGO)

DEFINICION: La amplitud (recorrido o rango) de un conjunto de datos


numéricos es la diferencia entre el mayor y el menor de todos ellos.

EJEMPLO 3.
En el ejemplo 1, el rango para el nivel de azúcar en la sangre del
paciente A es 110 – 90 = 20 y de 160 – 40 = 120, para el
paciente B.

En el ejemplo 2, el rango para el tiempo del atleta A es de 12.3 –


11.0 = 1.3 segundos, y de 11.8 – 11.5 = 0.3 segundos, para el
atleta B.

DESVIACION TIPICA (O ESTANDAR)

El rango se utiliza principalmente como indicación fácil y rápida de


la variabilidad, pero por lo general, no es medida de dispersión
útil. Su principal inconveniente radica en que nada se dice acerca
de la dispersión de los valores que están entre el mayor y el
menor valor.
Por ejemplo, cada uno de los conjuntos de datos siguientes:
Conjunto A: 3,4,5,6,11,16,17,18 y 19
Conjunto B: 3,8,9,10,11,12,13,14 y 19.

Tiene un rango de 19 - 3 = 16 ( y una media de 11); pero la


dispersión (como se ve en el diagrama adjunto) es
completamente distinta en cada caso.
media
Conjunto A:
3 4 5 6 11 16
17 18 19

media
Conjunto B:
18
3 8 9 10 11 12 13 14
19

Observamos que la dispersión en un conjunto de datos:

 Es pequeña si los datos están ubicados muy cerca alrededor


de su media aritmética y
 Es grande si los datos están ubicados distantes alrededor de
su media.

Por lo tanto, parece razonable tener una medida para la dispersión


de un conjunto de datos, en términos de las cantidades por las
que difieren de su

media aritmética. A estas cantidades les asignaremos un nombre,


en la siguiente definición.

DEFINICION: Si un conjunto de datos x1 , x 2 ,.....,.x N tiene la media x , las


diferencias x1  x, x 2  x,........,.x N  x , se llaman “desviaciones de la media”.

DEFINICION: La desviación típica de una población de N datos: se denota por


 , (letra griega sigma) y se define como
N

 (x i  x) 2
 i 1

N
Si ocurren con frecuencias
x1 , x 2 ,.....,.x N f 1 , f 2 ,..... f N respectivamente, la
desviación típica puede expresarse como
N

 f (x i i  x) 2
donde N =
N

f i
 i 1
i 1
N

En palabras:  es la raíz cuadrada de la media aritmética de los


cuadrados de las desviaciones.
DEFINICION: La desviación típica de una muestra de N datos: se denota por S
y se define como
N

 (x i  x) 2
para datos sin agrupar
S i 1

N 1

19
N

 f (x i i  x) 2
para datos agrupados en tablas de frecuencia
S i 1

N 1
NOTA: “Muestra” es el conjunto de datos que se pueden
utilizar, en forma razonable, para hacer generalizaciones acerca
de la población de la cual provienen.

ADVIERTA: Las fórmulas para S se obtienen escribiendo N-1 en


el denominador de las formulas para  .

CASO 1: Desviación típica para datos sin agrupar


EJEMPLO 1. Considérese cada una de las siguientes muestras:
Muestra A: 3,4,5,6,11,16,17,18 y 19
Muestra B: 3,8,9,10,11,12,13,14 y 19

Obtenga la desviación típica de cada muestra e indique cuál de


ellas es la que presenta mayor dispersión.

SOLUCION.
Para la muestra A.
3  4  5  6  11  16  17  18  19 99
Paso 1. x
9

9
 11
9

El cálculo de S   ( xi  x)
2
Paso 2. se facilita con una tabla como
i 1

la que sigue:
Variable x Desviación Cuadrado de la
( xi  x ) desviación ( xi  x) 2
3 -8 64
4 -7 49
5 -6 36
6 -5 25
11 0 0
16 5 25
17 6 36
18 7 49
19 8 64

20
9
S   ( xi  x ) 2 = 64 + 49 + 36 + 25 + 0 + 25 + 36 + 49 + 64 = 348
i 1

y
9

 (x i  x) 2
=
348
=
348
= 6.6
S i 1
9 1 9 1
N 1

Para la muestra B
3  8  9  10  11  12  13  14  19 99
Paso 1. x
9

9
 11
9

Paso 2. Calculamos  (x
i 1
i  x) 2

Variable x Desviación ( xi  x ) Cuadrado de la


desviación ( xi  x) 2
3 -8 64
8 -3 9
9 -2 4
10 -1 1
11 0 0
12 1 1
13 2 4
14 3 9
19 8 64

 (x
i 1
i  x) 2 = 64 + 9 + 4 + 1 + 0 + 1 + 4 + 9 + 64 = 156 y
9

 (x i  x) 2
=
3156
=
3156
= 4.4
S i 1
9 1 9 1
N 1

Puesto que la desviación típica del conjunta A es mayor que la del


conjunto B, concluimos que la muestra A es la más dispersa.

DEFINICION: La varianza de un conjunto de datos se define como el cuadrado de


la desviación típica, de modo que  2 y S 2 representan la varianza de la población
y la varianza de la muestra, respectivamente.

VERIFICANDO SU COMPRENSION
21
1. Determine cuál de las siguientes muestras es la más dispersa.
a) 6,3,12,5,8 y 9 b) 3,5,6,7,4,10 y 8
2. Determine cuál de las siguientes muestras es la menos
dispersa
a) 7,9,3,6,5,4 y 2 b) 8,7,4,11,2 y 5

3. Hallar, en cada caso, la desviación típica y la varianza


a) 3,6,2,1,7 y 5 b) 3,2,4,6,5 y 8

CASO 2: Desviación típica para datos agrupados


EJEMPLO 2. Supóngase que en 9º grado hay 40 alumnos, cuyas
edades se resumen en la siguiente tabla de frecuencias

Edades x No. de alumnos (f)


14 6
15 15
16 16
17 3
Hallar el valor de S.

SOLUCION
Para facilitar los cálculos usamos la siguiente tabla

X f f (x ) ( xi  x ) 2 f ( xi  x) 2 f ( xi  x ) 2
14 6 84 -1.4 1.96 11.76
15 15 225 -0.4 0.16 2.40
16 16 256 0.6 0.36 5.76
17 3 51 1.6 2.56 7.68
TOTAL 40 616 27.60
4 N

 f i xi
616  f ( x  x)
i i
2
27.6
x i 1
  15.4 S i 1
  0.84
N 40 N 1 39

22
MEDIDAS DE POSICIÓN

CUANTILES

Para muchos propósitos, es importante obtener valores que


dividen un conjunto de datos ordenados, en fracciones
especificas. LA mediana es un ejemplo de éste tipo de medida;
ella divide al conjunto en dos partes iguales: La mitad de los
valores son inferiores a la mediana y la otra mitad superiores. En
forma similar se pueden calcular:
- Los cuartiles, que son valores de la variable que dividen a
conjunto en cuartas partes.

Así, el primer cuartil, Q1, es un valor tal que una cuarta parte de
los datos son menores que él y tres cuartas partes son mayores.
Q2, es igual a la mediana y Q3, supera a los tres cuartos de los
datos y solo es superado por un cuarto de ellos.
Además de la mediana y los cuartiles pueden calcularse también
lo deciles: D1, D2, ......D9, los cuales dividen al conjunto en
décimas. Los percentiles: P1, P2,....P99, que lo dividen en
centésimos. Todos éstos valores reciben el nombre de cuantiles y
pueden resultar muy apropiados para apreciar la posición de los
datos de un conjunto y su posición.
Tanto la mediana como los cuartiles y los deciles constituyen
casos particulares de los percentiles y pueden expresarse como
percentiles.

Por ejemplo: Mediana = P50, Q3 = P75, D4 = P40, etc.


Resulta entonces que teniéndose una fórmula para el calculo de la
posición de los percentiles, puede obtenerse con ella, la posición
de cualquier cuantil.

Para el calculo de la posición de los percentiles se debe, en primer


lugar, ordenar los datos.
Una vez hecho esto, puede aplicarse la fórmula siguiente:

23
n
La posición de k-ésimo percentil se encuentra calculando ( 100 )k,
donde n es el número de datos. Sí el resultado es un número
decimal, seleccione como indicador del orden al entero próximo
superior y el percentil a localizar es Pi.
Si el resultado es un entero seleccione como indicadores de orden
al entero obtenido i y al siguiente i + 1. El percentil se obtiene
xi  ( xi  i)
haciendo Pk =
2
Ejemplo.
Calcular Q2 y la mediana. Considérense para ello, los siguientes
datos, que se refieren a los pesos de 40 estudiantes de una
escuela rural y que se presentan en el orden en que fueron
pesado los alumnos:

49 60 45 37 54
44 59 40 62 47
46 52 55 41 66
45 36 50 51 48
42 53 53 68 56
35 74 43 47 60
51 67 40 70 49
41 46 32 57 43

Así como están los datos resulta difícil sacar una conclusión, por lo
tanto, como no son muchos, puede iniciarse el análisis haciendo
una ordenación en forma creciente.

32 42 47 52 60
35 43 47 53 60
36 43 48 53 62
37 44 49 54 66
40 45 49 55 67
40 45 50 56 68
41 46 51 57 70
41 46 51 59 74
La posición de Q2 es igual a la posición de P50, la cual se obtiene
40
así: x 50 = 20 Los datos a localizar son: X20 y X21. El valor de Q2
100
es:
Lic. Mauro H. Henríquez Rauda
24
X 20  X 21 50  53
Q2 =  = 51.5
2 2
La mediana es igual a P50 = Q2 = 51.5

25
Conclusión

La estadística es una ciencia con un amplio campo de acción. Mediante esta, se


recolecta, se ordena, se resume, y se interpretan datos, obtenidos utilizando ciertas
técnicas, como lo es la encuesta.

Es utilizada a partir de la formación de las sociedades humanas, hasta en al Biblia,


se menciona un censo, que no es más que un estudio o un conteo donde se
determinan la cantidad de habitantes de un país.

La estadística se divide en dos grandes ramas, y de estas se subdividen otras. Estas


son la descriptiva y la inferencial. La primera solo se ocupa de describir y analizar
un conjunto determinando de datos.; y la segunda permite inferir a la población, o
conjunto de valores cuantificables, observando una parte representativa de ella.

Para el resumen y distribución se usan un sin número de índices y fórmulas. Se


representan estas distribuciones en gráficos de frecuencias, en donde el más
utilizado es el histograma y el polígono de frecuencias. Existen ciertas similitudes
en ambos, pero se diferencian en que el histograma se representa mediante
rectángulos que representan las frecuencias de clases, y en el polígono de
frecuencia se unen los puntos medios de las frecuencias de clases, con una línea.

En adicción, se cuenta con una gran variedad de medidas centrales, de simetría, de


variabilidad, dispersión, índices compuestos, etc., cuyo uso dependerá del estudio
de que se trate. Son de gran utilidad, especialmente en el área económica, ya que
permiten determinar la variación de determinados datos, en un periodo determinado
y así corregir errores en un presente. Algunas de estas medidas se pueden

26
considerar como indicadores económicas, por su función en el desempeño de la
economía.

27
Bibliografía

 Pérez P., Víctor F. Manual básico de Estadística Descriptiva. 2000.


 Sarramona, Jaime. Estadística Aplicada a la Administración
 Spiegel, Murria. Estadística Aplicada. 2da Edición.
 Stevenson, William J. Estadística para Administración y Economía.

28
29

Вам также может понравиться