Вы находитесь на странице: 1из 20

Contenido Unidad 1

ESTADSTICA DESCRIPTIVA.............................................................................1
1.1 INTRODUCCIN, NOTACIN SUMATORIA...........................................................................1
Introduccin............................................................................................................................. 1
Estadstica Descriptiva............................................................................................................ 2
Notacin Sumatoria................................................................................................................. 4
1.2 DATOS NO AGRUPADOS........................................................................................................ 7
1.2.1 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIN............................................8
Media aritmtica...................................................................................................................... 8
Media ponderada..................................................................................................................... 9
Media armnica..................................................................................................................... 10
Media geomtrica.................................................................................................................. 10
1.2.2 MEDIDAS DE DISPERSIN......................................................................................11
Varianza................................................................................................................................. 11
Desviacin Estndar.............................................................................................................. 11
1.3 DATOS AGRUPADOS............................................................................................................ 12
Media Aritmtica.................................................................................................................... 12
Moda...................................................................................................................................... 12
Mediana................................................................................................................................. 12
Percentil................................................................................................................................. 14
Cuartiles................................................................................................................................ 15
1.3.1 TABLA DE FRECUENCIA.........................................................................................15
Tallo de Hojas........................................................................................................................ 15
Histograma............................................................................................................................ 16

Ingeniera Industrial
Ing. Alejandro Rosete Notario

I.T.S. de Tepeaca

Probabilidad y estadstica.
2011.

ESTADSTICA DESCRIPTIVA
1.1 INTRODUCCIN, NOTACIN SUMATORIA.
Introduccin.
La estadstica descriptiva se ocupa de la organizacin y resumen de datos
estadsticos. Esto incluye el clculo y la interpretacin de medidas numricas
como la media, la mediana y la desviacin estndar, al igual que la elaboracin y
empleo de representaciones grficas, como las distribuciones de frecuencia.

La probabilidad es utilizada con estas tcnicas como una forma de saber


cun posible es que ocurra un evento. Estos mtodos descriptivos se emplean de
dos maneras; ya sea como un fin en s mismas en cuyo caso el propsito es
aclarar, visualizar o comunicar un concepto o idea -, o como una etapa inicial en el
proceso de inferencia.1
ESTADSTICA: Es el arte de reunir, analizar, presentar e interpretar datos .2
La estadstica se divide en tres ramas:

Estadstica descriptiva
ESTADSTICA

Teora de probabilidad
Estadstica inferencial

1 STEVENSON William J. Estadstica para Administracin y Economa. Pg. 523


2 ANDERSON David R. Estadstica para Administracin y Economa. Pg. 16.
3 STEVENSON, William J. Op. Cit. Pg. 5.

Ingeniera Industrial
Ing. Alejandro Rosete Notario

I.T.S. de Tepeaca

Probabilidad y estadstica.
2011.

Estadstica Descriptiva.
Estadstica descriptiva: Cualquier tratamiento de datos que est diseado
para resumir o describir algunas de sus caractersticas ms importantes sin
intentar deducir nada que escape al alcance de los datos. 4
Proceso de la estadstica descriptiva:
Recoleccin Organizar y resumir en:
de datos
Procesamiento de datos
Estadsticos.

- Grficos
- Tablas

Continuos
Discretos
5

DATOS
Nominales
Jerarquizados
Datos: Se debe aprender a identificar y manejar cuatro tipos de datos:
continuos, discretos, nominales y jerarquizados.6
De este modo, tambin se emplean variables en estadstica, las cuales pueden
asumir virtualmente cualquiera o determinado tipo de datos (valores); por lo que
en estadstica se manejarn 2 tipos de variables: variables discretas y variables
continuas.
Variables continuas: pueden asumir cualquier valor en un intervalo
continuo de valores o datos. Caractersticas que se miden: altura, peso, longitud,
espesor, velocidad, viscosidad y temperatura, por mencionar algunas .7

4 Ibd.; Pg. 7.
5 Ibd.; Pg. 15.
6 dem.
7 dem.
2

Ingeniera Industrial
Ing. Alejandro Rosete Notario

I.T.S. de Tepeaca

Probabilidad y estadstica.
2011.

Variables discretas: adquieren valores enteros. Bsicamente surgen al


contar un nmero de elementos u objetos.8
Datos nominales: se obtienen cuando se defienden las categoras y se
cuenta el nmero de observaciones que quedan en cada una; tales como sexo,
color de ojos, campo de estudios, calificaciones. Estos datos se cuentan y pueden
pasar a ser datos discretos.9
Datos jerarquizados: constan de valores relativos asignados para denotar
orden: 1, 2, 3, 4 y as sucesivamente.10 Ejemplos de jerarquas: aceptable o
no aceptable, muy desordenado, poco desordenado. Por lo regular pueden ser
rangos un tanto subjetivos.
EJERCICIOS:
Identifique los siguientes en trminos del tipo de datos:

a. 17 gramos
b. 25 segundos
c. 3 canastas
d. 3 incorrectas, 7 correctas
e. Tallas de camisas
f. Kilmetros por litro
g. Ms lento
h. 2 helados
i. El ms encantador

RESPUESTAS:
Contnuos: a. b, f;

Discretos: c, h;

Nominales: d, e;

Jerarquizados: g, i.

8 Ibd.; Pg. 16.


9 dem
10 Ibd.; Pg. 17.
3

Ingeniera Industrial
Ing. Alejandro Rosete Notario

I.T.S. de Tepeaca

Probabilidad y estadstica.
2011.

Notacin Sumatoria.11
CASO 1: La mayor parte de los procedimientos en estadstica emplean
sumas de datos y estas se representan por la letra griega sigma . De aqu que
ciertas operaciones sean representadas como sumatorias o tambin conocidas
como "notacin sumatoria".
Ejemplo:
1. La letra sigma denota una suma y "x" es una variable de cualquier tipo.
2. Los siguientes datos pertenecen a la variable "x": 1, 5, 6 y 9. Obtenga la
=21
3.

Si los valores de y son 2, 4 5, y 9, encuentre

CASO 2: Si slo se van a sumar algunos de los valores, se utilizan


subndices para indicar dichos valores del siguiente modo:

Lo anterior indica la suma de los valores de la variable x, empezando con el primer


dato (i=1) y terminando con el quinto (i=5).
Ejemplo:
Utilizando los datos que se indican, calcule a)

11 Ibd.; P. P. 18-20.
4

Ingeniera Industrial
Ing. Alejandro Rosete Notario

I.T.S. de Tepeaca

Probabilidad y estadstica.
2011.

CASO 3: Cuando cada valor de una variable va a ser multiplicada o dividida


por una constante; dicha constante se puede aplicar despus de que los valores
se hayan sumado.

Ejemplo:
Hallar la sumatoria siguiente usando los datos de la tabla del CASO 2.

CASO 4: La adicin de una suma (o diferencia) de dos variables es igual a


la suma (o diferencia) de sumatorias individuales de las dos variables.

Ejemplo:
a) Realizar la sumatoria

con los siguientes datos:

CASO 5: Los subndices i y j se emplean para designar la fila, (i) y la


columna (j), y la letra se utiliza para simbolizar el de filas y k para el de columnas.
Ejemplo:
Se requiere examinar datos acerca del kilometraje por unidad de consumo de
Gasolina segn diferentes combinaciones de autos y conductores.
Automvil
1
2
3
sumas

Conductor
1
22.3
20.4
23.4
66.1

2
23.5
20.1
25.6
69.2

3
20.5
19.0
19.6
59.1

4
19.8
20.8
21.7
62.3

sumas
86.1
80.3
90.3
256.7
5

Ingeniera Industrial
Ing. Alejandro Rosete Notario

I.T.S. de Tepeaca

Probabilidad y estadstica.
2011.

La notacin general para esta tabla de muestra a continuacin:

1.
a)
b)
c)
d)

Escriba las siguientes sumas con la notacin sumatoria:


x, + x2 + ... + xn
(x, + X2+- ... + xn)2
Xi + X2 + X3 + X4 + X5 +X6+ X7
[(o, - e,)2 / e,] +[(o2 e2)2 e2] + [(o3 - e3)2 / e3] + [(o* - e4)a / e4]

2. Calcule cada una de las siguientes cantidades sirvindose de los


datos proporcionados. (Nota: n es el de datos).

y = 15, 10, 5, 9, 14, 20, 6, 17


3. Calcule las siguientes cantidades, utilizando la informacin de la tabla que se
presenta.

Ingeniera Industrial
Ing. Alejandro Rosete Notario

I.T.S. de Tepeaca

Probabilidad y estadstica.
2011.

1.2 DATOS NO AGRUPADOS.


Cuando los datos estadsticos se recolectan, estos se encuentran
desordenados y por tanto debern ser asociados de tal forma que puedan
interpretarse.
Los datos estadsticos se van a identificar en dos formas, como poblacin y como
muestra.
POBLACIN: El conjunto de todos los elementos de inters en determinado
estudio.12
MUESTRA: Un subconjunto de la poblacin.13

12 ANDERSON, David R. Op. Cit. Pg. 16.


13 Idem.
7

Ingeniera Industrial
Ing. Alejandro Rosete Notario

I.T.S. de Tepeaca

Probabilidad y estadstica.
2011.

Con lo anterior se va a clasificar la forma de medir los datos:

Medidas de
tendencia
central

Media de la Poblacin.
Varianza.

Poblacin
Medidas de
dispersin

Desviacin Estndar.
Error estndar.

Datos
Estadsticos
Medidas de
tendencia
central
Muestra

Media de la muestra.

Varianza de la muestra.
Medidas de
dispersin

Desviacin estndar de la
muestra.
Error estndar de la muestra.

1.2.1 MEDIDAS DE TENDENCIA CENTRAL Y DE POSICIN.


Media aritmtica.
La media aritmtica tambin llamada media de la muestra, esperanza
matemtica o tan conocida por todos como promedio: esta es la suma de los datos
y dividida entre la cantidad de datos que se estn sumando. 14 La frmula de esta
es:
Para la Poblacin:

14 STEVENSON, William J. Op. Cit. Pg. 23.


8

Ingeniera Industrial
Ing. Alejandro Rosete Notario

Probabilidad y estadstica.
2011.

I.T.S. de Tepeaca

Para la Muestra:

EJEMPLO:
Se tienen las siguientes calificaciones de alumnos, obtenga la media aritmtica:
Matemticas Fsica Dibujo

tica

Taller de H. Fundamentos de investigacin.

70

95

90

71

85

83

La media aritmtica es: 82.33


NOTA: Ya sea media de la poblacin y media de la muestra, el procedimiento
sigue siendo el mismo para obtener el resultado.
Media ponderada.
La media ponderada es muy similar a la anterior con la diferencia de que se
maneja un grado de importancia o ponderacin para cada dato. 15 La frmula es la
siguiente:

En este caso w es la ponderacin i-sima. Que se le aplica a cada dato.


EJEMPLO:
Con las siguientes calificaciones obtenga un promedio ponderado:

15 ANDERSON, Sweeney William. Op. Cit. Pg. 66.

Ingeniera Industrial
Ing. Alejandro Rosete Notario

I.T.S. de Tepeaca

Probabilidad y estadstica.
2011.

Media armnica.
Esta se define como n divida entre la suma de los recprocos de los n s; o n.16
Bien:
Ejemplo:
Si un avin
Millas/hora.

La media armnica tiene una utilidad limitada, pero es adecuada.


vuela 100 millas a 300 millas/hora y las siguientes 100 millas a 600

Ha recorrido 400 millas/hora en promedio

Media geomtrica.
Se aplica a un conjunto de n s positivos y es la raz n-sima de su producto.
Si todos los s son iguales, la media geomtrica es igual a la media aritmtica; pero ,
en caso contrario, la media geomtrica es siempre menor que la aritmtica. 17
La frmula es:

Ejemplo:
Obtenga la media geomtrica de las siguientes calificaciones:
16 dem
17 STEVENSON, William J. Op. Cit. Pg. 34.

10

Ingeniera Industrial
Ing. Alejandro Rosete Notario

Probabilidad y estadstica.
2011.

I.T.S. de Tepeaca

Examen (n) Calificacin (x,)


No. 1
80
No. 2
90
Final
96

1.2.2 MEDIDAS DE DISPERSIN.


Varianza.
La varianza o tambin conocida como variancia, es la desviacin promedio
de valores obtenidos a partir de la media, elevada al cuadrado y calculada
mediante n-1 en lugar de n.18 Las frmulas que se emplean son las siguientes:

Para la Poblacin:

Para la Muestra:

Desviacin
Estndar.
La desviacin estndar de un conjunto de s se define como la raz cuadrada
positiva de la variancia.19
Es simplemente la raz cuadrada positiva de la variancia. De este modo si la
variancia es 81, la desviacin estndar es 9; si la variancia es 10, la desviacin
18 dem
19 Ibd.; Pg. 36.

11

Ingeniera Industrial
Ing. Alejandro Rosete Notario

I.T.S. de Tepeaca

Probabilidad y estadstica.
2011.

estndar es 10= 3.16. Para obtener la desviacin estndar, se debe calcular la


variancia y hallar su raz cuadrada.

Las frmulas para la desviacin estndar son:

(x

x) 2

n 1

Como se hizo anteriormente, sustituir (n-1) por n las convierte en frmulas para
calcular la desviacin estndar de la poblacin.

1.3 DATOS AGRUPADOS.


Las medidas fundamentales en lo que a datos agrupados se refieren, son las
mismas que para los pequeos conjuntos de datos, principalmente la media,
mediana y moda como medidas de tendencia central y la desviacin estndar,
variancia y amplitud de variacin como medidas de dispersin.

Media Aritmtica.
La media aritmtica es lo que viene a la mente de las personas cuando se
menciona la palabra promedio. Como este trmino tiene ciertas caractersticas
matemticas deseables, es la ms importante de las tres medidas.
La media aritmtica se calcula al sumar los valores de un conjunto y al
dividir el producto de esta suma entre el de valores del mismo. 20

Ejemplo:

70 80 120 270

90
3
3

Moda.
Es el valor que con ms frecuencia se presenta en un conjunto. 21
20 Ibd. Pg. 23.
21 dem.
12

Ingeniera Industrial
Ing. Alejandro Rosete Notario

Probabilidad y estadstica.
2011.

I.T.S. de Tepeaca

Ejemplo:
En el conjunto 10, 10, 8, 6 y 10, el 10 se presenta tres veces en tanto que uno de
los otros valores, solo una vez. El valor ms frecuente, la moda, es 10.

Mediana.
Es el valor intermedio, cuando los valores de los datos se ordenan en forma
ascendente. Si hay una cantidad impar de elementos, la mediana es el valor del
elemento intermedio, cuando todos los elementos estn ordenados de manera
ascendente.
Si hay una cantidad par de elementos, la mediana es el valor promedio de
los dos elementos intermedios, cuando todos se ordenan en forma ascendente. 22
Ejemplo:
Sueldos mensuales iniciales para una muestra de 12 egresados de una escuela
de administracin.
Egresado

Sueldo
mensual ($)

Egresado

Sueldo
mensual ($)

1
2
3
4
5
6

2350
2450
2550
2380
2255
2210

7
8
9
10
11
12

2390
2630
2440
2825
2420
2380

Al disponer los cinco valores de datos en orden ascendente, se obtiene la


siguiente lista ordenada.
32 42 46 46 54
Como n = 5 es impar, la mediana es el elemento intermedio de la lista ordenada.
As, la mediana del tamao de clase es 46 alumnos. Aun cuando hay dos valores
46, cada uno se maneja como artculo.
Calculemos la mediana del salario inicial de los egresados de la escuela de
administracin. Ordenamos los 12 elementos de la tabla
2210 2255

2350 2280 2380

2390 2420 2440 2450 2550 2630 2825

Dos valores intermedios


22 ANDERSON, Sweeney William. Op. Cit. Pg. 66.
13

Ingeniera Industrial
Ing. Alejandro Rosete Notario

I.T.S. de Tepeaca

Probabilidad y estadstica.
2011.

Como n = 12 es par, identificamos los dos elementos intermedios. La mediana es


la media de esos dos valores.
Mediana

2390 2420
2405
2

Percentil.
El p-simo percentil es un valor tal que por lo menos un p por ciento de los
elementos tienen dicho valor o menos y. al menos, un (100p) por ciento de los
elementos tienen este valor o ms.23
Para calcular el p-simo percentil se aplica el siguiente mtodo.
Paso 1. Ordenar los datos de manera ascendente.
Paso 2. Calcular un ndice i

i =

100

En donde:
p es el percentil de inters
n es la cantidad de elementos.
Paso 3.
(a) Si i no es entero, se redondea. El valor entero inmediato mayor que i indica la posicin del p-simo percentil.
(b) Si i seis entero, el p-simo percentil es el promedio de los valores de
los datos ubicados en los lugares i e i + 1.

23 ANDERSON, Sweeney William. Estadstica para Administracin y Economa. Pg. 65.

14

Ingeniera Industrial
Ing. Alejandro Rosete Notario

Probabilidad y estadstica.
2011.

I.T.S. de Tepeaca

Como ejemplo de este procedimiento, determinemos el 85o percentil de los datos


de salario inicial en la tabla
Paso 1. Disponer los 12 valores de los datos en orden ascendente.
2210

2255 2350

2380 2380 2390 2420 2440 2450 2550 2630 2825

Paso 2.
P
85
n
12 10.2
100
100

Paso 3. Como i no es entera, redondeamos. El lugar del 85o percentil es el


siguiente entero mayor que 10.2, o sea el lugar 11.
Regresando a los datos, vemos que el 85o percentil corresponde al 1 lo
lugar en los datos, que es 2630.
Cuartiles.
La mediana (ya sea de una poblacin o de una muestra) divide los datos en
dos partes iguales. Tambin es posible dividir los datos en ms de dos partes.
Cuando se divide un conjunto ordenado de datasen cuatro partes iguales, los
puntos de divisin se conocen como cuartiles24.
El primer cuartil o cuartil inferior, q1, es un valor que tiene aproximadamente
la cuarta parte (25%) de las observaciones por debajo de l, y el 75% restante, por
encima de l. El segundo cuartil, q2, tiene aproximadamente la mitad (50%) de las
observaciones por debajo de l. Es segundo cuartil es exactamente igual a la
mediana. El tercer cuartil, o cuartil superior, q3, tiene aproximadamente las tres
cuartas partes (75%) de las observaciones por debajo de l. Al igual que en el
caso de la mediana, es posible que los cuartiles no sean nicos. Por simplicidad,
si ms de una observacin satisface la definicin de un cuartil, entonces se utiliza
el promedio de ellas como cuartil.
1.3.1 TABLA DE FRECUENCIA.
Tallo de
Hojas.
Las tcnicas del anlisis exploratorio de datos consisten en operaciones
aritmticas sencillas y representaciones fciles de trazar, que pueden emplearse
para resumir con rapidez los datos. 25
24 MONTGOMERY, Douglas C. Probabilidad y Estadstica aplicadas a la ingeniera. Pg. 20
15

Ingeniera Industrial
Ing. Alejandro Rosete Notario

I.T.S. de Tepeaca

Probabilidad y estadstica.
2011.

Sin embargo, hay una que se llama diagrama de tallo y hojas, que todava se
usa mucho para mostrar tanto el orden de rangos como La forma de un conjunto
de datos, en forma simultnea.
Ejemplo:
La informacin es resultado de un examen de aptitudes de 150 preguntas,
aplicado a 50 personas durante un proceso de seleccin de personal en Haskens
Manufacturng. Los datos indican el de respuestas correctas.
A) Ordenamos, de acuerdo con los dgitos iniciales de cada uno, en el lado
izquierdo de una lnea vertical.
B) A la derecha de esa recta se anota el ltimo dgito de cada dato,
conforme se recorren las calificaciones en el orden en que fueron anotadas.
C) El ltimo dgito de cada dato se coloca en el rengln de los primeros
dgitos del correspondiente.

6
7

9
2

8
3

0 4 5

1 5 8 854

10

6 6 0 6

11

5 9

12

13

14

D) Con esta organizacin de los datos, es fcil clasificar los dgitos de cada
rengln en su rango (magnitud) correspondiente. Al hacerlo se llega al diagrama
de tallo y hojas que vemos a continuacin:
6
7
8
9
10
11
12

8
2
0
1
0
2
4

9
3
1
2
0
3
6

3
1
2
2
5
7

5
2
2
4
5
8

6
3
4
6
8

6
4
5
6
9

5 6
5 6 7
6 7 8
9

25 ANDERSON, Sweeney William. Op. Cit. Pg. 40.

16

Ingeniera Industrial
Ing. Alejandro Rosete Notario

13 2
14 1

Probabilidad y estadstica.
2011.

I.T.S. de Tepeaca

E) Cada lnea de este diagrama se denomina como tallo, y cada dgito en el


tallo es una hoja.
Histograma.
Es la representacin grfica comn de datos cuantitativos este resume
grafico se puede preparar con datos que sean resumido anteriormente en una
distribucin de frecuencia porcentual. 26
Se traza colocando la variable de inters sobre el eje horizontal y la
frecuencia porcentual de cada clase trazando un rectngulo, cuya base es el
intervalo de la clase sobre el eje horizontal y cuya altura es la frecuencia
correspondiente.
Pasos para la elaboracin de un histograma.
1.- La raz de todos los s cualitativos.
n
K=
Nota: Los rangos deben de ser de 5 k 15.
2.- De cuntos valores va a constar cada clase?
Amplitud de clase = (valor mximo valor mnimo )
o rango
k
3.- Crear las clases o rangos.
4.- Contabilizar las frecuencias de cada clase.
5.- Con los datos obtenidos al contabilizar las frecuencias
el histograma.

elaboraremos

Ejemplo:
Los siguientes datos son resultado de una encuesta realizada a alumnos de
segundo ao de secundaria. Obtendremos su histograma.

Calificaciones

26 Idem. Pg. 33

17

Ingeniera Industrial
Ing. Alejandro Rosete Notario
7
0
8
0
9
0
7
5
8
4
9
6
8
5
7
5
9
6
7
2

I.T.S. de Tepeaca

88

94

88

88

96

84

92

90

90

90

95

90

92

85

82

94

86

80

90

85

72

80

72

80

96

70

85

95

90

83

70

78

78

80

86

85

76

70

96

77

80

76

72

70

80

72

80

75

70

82

74

94

70

80

Probabilidad y estadstica.
2011.

92
85
82
70Frecuencia
84
90 Frecuencia
92
75
90Frecuencia
Clases
(Calificaciones
(Absoluta)
(Relativa)
Absoluta
83
77
90
72 86
75
90
80
90
)
Acumulada
73
72
70
90 88
86
88
70
75(ascendente)
z
77
85
96
75
90
90
86
75
80
50 - 54
14
14%
14
55 - 59
6
6%
20
60 - 64
11
11%
31
65 - 69
11
11%
42
70 - 74
6
6%
48
75 - 79
11
11%
59
80 - 84
7
7%
66
85 - 89
14
14%
80
89
90 - 94
9%
9
100
95 - 99
11%
11

Frecuencia
Absoluta
Acumulada
(descendente)
100
86
80
69
58
52
41
34
20
11
0

18

Ingeniera Industrial
Ing. Alejandro Rosete Notario

I.T.S. de Tepeaca

Probabilidad y estadstica.
2011.

19

Вам также может понравиться