Descriptiva

Capı́tulo 1
Estadı́stica descriptiva
1.1. Qué estudia la estadı́stica?

Según Montgomery. Tiene que ver con la recopilación, presentación, anális y uso de datos
para tomar decisiones y resolver problemas. Como los cientificos e ingenieros analizan datos
de manera rutinaria, el conocimiento de la estadı́stica tiene una importacia especial en estos
campos. La estadı́stica ayuda a los ingenieros y cientı́ficos a:
Diseñar nuevos productos y sistemas.
Perfeccionar los existentes.

Diseñar, desarrollar y mejorar procesos de producción.
Aumentar la calidad de los productos
La estadı́stica surge de la necesidad de describir y comprender la variabilidad , la cual

es el el resultado de cambios en las condiciones bajo las cuales se hacen las observaciones,
por ejemplo: diferencias en las propiedades de los materiales, en la forma que trabajan los
obreros, en variables del proceso como temperatura, presión, tiempo, factores ambientales
como humedad. La variabilidad tambien se presenta por los sistemas de medición utilizados
y debido al esquema de muestreo.
Aproximación a una definición. La estadı́stica trata del diseño de experimentos o encues-
tas mediante muestras, para obtener una cantidad determinada de información a un costo
mı́nimo, y del uso de esta información para hacer inferencias con respecto a una población.
Otra posible definición: Ciencia que crea, desarrolla y aplica técnicas de modo que pueda
evaluarse la incertidumbre de inferencias inductivas.
La estadı́stica ayuda al investigador a contestar preguntas como:
¿Qué técnicas uso para recolectar datos?
¿Cómo registro y presento mis datos?
¿Qué modelos uso para analizar mis datos?

¿Cómo pruebo determinada hipótesis?
1
Notas de clase: Probabilidad y Estadı́stica
¿Cómo diseño un experimento de tal forma que los datos obtenidos sean susceptibles
de analizar con métodos estadı́sticos?
1.2. Escalas de medición

Medir es asignar números o atributos a individuos o cosas de acuerdo con reglas previamente
establecidas. Existen básicamente cuatro escalas de medidas: nominal, ordinal, intervalo y
razón.
1.2.1. Escala Nominal

Es el nivel más bajo de medición y se utiliza para clasificar, etiquetar o nominar a los
individuos u objetos por medio de atributos que pueden ser nombres o números. Cuando se
asignan números estos no son susceptibles de operaciones matemáticas puesto que el objetivo
es mostrar un código que indique diferencias. Esta escala establece una relación equivalencias
entre objetos o individuos con igual caracterı́stica.
Ejemplo 1. a. El carácter de sexo puede clasificarse en hembras y varones y puede asignarse

el número uno (1) para hembras y el (2) para varones.
b. El estado civil, en el cual los individuos pueden clasificarse en solteros, casados, viudos y
separados; también puede asignarse a los cuatro estados los números 1, 2, 3 y 4.
En esta escala se pueden hacer algunas operaciones estadı́sticas como sacar frecuencias, por-
centajes, modas, y también aplicar algunas pruebas de hipótesis como la chi cuadrado (χ2 )
en el caso de tablas de contingencia.
1.2.2. Escala Ordinal

En esta escala se asignan números, que además de establecer relación de equivalencia, po-
seen una relación de orden (menor que o mayor que) de manera que se asignan números
más grandes a los elementos que posean más de la caracterı́stica estudiada. Estos núme-
ros no son susceptibles de operaciones matemáticas ya que solo permiten diferenciación y el
ordenamiento de las categorı́as de la variable.
Ejemplo 2. a. El nivel económico de las personas puede medirse con los atributos alto,
medio, bajo y pobre con los números 4, 3, 2, y 1 de tal forma que se puede establecer la
relación de orden 4 > 3 > 2 > 1.
b. El escalafón de los docentes universitarios, los cuales poseen las categorı́as auxiliar, asisten-
te, asociado y titular, también podrı́an señalarse con los números 1, 2, 3, 4 respectivamente
o también usar los números 2, 4, 6 y 8 sin que pierda sentido o calidad la clasificación.
Para analizar este tipo de datos la medida estadı́stica de tendencia central más apropiada es la
mediana (sección 1.5.1), y se pueden aplicar todos los métodos estadı́sticos no paramétricos.
Página 2 Mario A. Morales R. mmorales@sinu.unicordoba.edu.co

1.2.3. Escala de Intervalo

La escala de intervalo utiliza números que además de clasificar y ordenar agrega la posibilidad
de interpretar la diferencia entre dos medidas, mediante el ordenamiento de intervalos iguales.
En esta escala es arbitraria tanto la unidad de medida como el punto cero da la escala. Su
propiedad más importante es que distancias numéricamente iguales representan distancias
empı́ricamente iguales (lo cual no necesariamente ocurre en la escala ordinal, donde interesa
el orden más que la distancia).
Ejemplo 3. La temperatura en grados centı́grados es un ejemplo tı́pico de la escala de
intervalo. La relación que podemos establecer entre dos intervalos es independiente de la
unidad de medida usada y del punto cero (o sea, la unidad de medida y el cero son arbitrarios).
Esto se advierte bien cuando comparamos dos escalas distintas de temperatura (Fahrenheit
y Celsius), pudiendo transformarse una en otra mediante fórmulas de conversión a pesar de
tener distintas unidades de medida y distinta ubicación del punto cero. Por lo tanto la relación
de las diferencias en una de las escalas es igual a la relación de las diferencias equivalentes
en la otra escala:
Celsius 0 10 30 100
Fahrenheit 32 50 86 112
Nótese que
30 − 10 86 − 50
= =2
10 − 0 50 − 32
pero las razones son distintas, por ejemplo
30 86
6=
10 50
1.2.4. Escala de Razón

Presenta todas las propiedades anteriores, más un punto cero verdadero en su origen. Estamos
en una escala de razón cuando se pueden establecer cuatro tipos de relaciones: equivalencia,
mayor o menor que, relación entre dos intervalos cualesquiera, y relación entre dos valores
cualesquiera de la escala. Sólo es arbitraria la unidad de medida, pero no el cero.
Ejemplo 4. La longitud y el peso son ejemplos tı́picos de medidas de razón.
1.3. Tipos de variables.

Cualquier caracterı́stica que cambie (o varı́e) de un individuo, unidad experimental o unidad
de observación a otro(a) es una variable. Las variables pueden ser cualitativas o cuantitativas
1.3.1. Variables Cualitativas

Aquellas en las que no es posible hacer mediciones en escalas numéricas sino que sus valores
corresponden a clases o categorı́as. Ejemplo: Sexo, estado civil, el color de los ojos, tipo
documento (publico o privado), el estrato de una familia, etc.

Empresa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
tipo 1 2 2 3 1 2 3 2 1 2 3 1 1 2 3
clasi 1 2 3 2 4 2 3 2 1 2 3 4 2 3 1
Empresa 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
tipo 3 2 1 2 3 2 3 1 3 2 2 3 1 2 3
clasi 2 3 2 1 4 4 1 2 4 1 2 3 1 4 4
Empresa 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
tipo 1 2 3 1 3 2 1 3 2 3 1 2 3 1 2
clasi 2 3 2 1 4 2 3 1 4 2 1 3 2 1 4
Empresa 46 47 48 49 50
tipo 1 2 3 1 2
clasi 1 2 3 2 1
Tabla 1.1: Calificación de 50 organizaciones en cuanto a su conciencia social
1.3.2. Variables Cuantitativas

Son las que se pueden hacer corresponder a valores numéricos. Ejemplo: Peso, longitud, tem-
peratura, ingreso mensual, el gasto promedio mensual de una familia, el número de kilovatios
de energı́a consumido en una fabrica, el ı́ndice de pobreza o desempleo de un municipio, el
número de hijos por familia.
Las variables cuantitativas se clasifican en: continuas y discretas.
Continuas
Son las que pueden tomar cualquier valor dentro de un intervalo numérico, son ejemplos de
variables continuas el tiempo, peso, longitud, temperatura, Humedad relativa entre otras.
Discretas
Son las que pueden tomar un número finito o infinito contable de valores.
1.4. Presentación de datos

Existen múltiples formas de representar datos. El tipo de gráfico a usar depende de la natu-
raleza (cualitativa o cuantitativa) de la variable medida. Para variables cualitativas los más
gráficos más populares son el diagrama de barras y el de sectores; para datos cuantitativos
se usan los histogramas, Box Plot , diagramas de tallos y hojas, entre otros.

1.4.1. Presentación de datos cualitativos

Diagrama de barras
Para construir el diagrama de barras se ubican las categorı́as en el eje horizontal y sobre
éstas se dibujan barras (rectángulos) de un alto proporcional a la frecuencia de la categorı́a,
definida como el número de observaciones que pertenecen a ella. En la figura 1.1 se muestran
las barras apiladas (izquierda) y las barras múltiples (derecha) construidas a partir de los
datos del ejemplo 5
Ejemplo 5. En una escala de 1 a 4, siendo 4 el mejor, un grupo de consumidores clasifica
la “conciencia social” de 50 organizaciones clasificadas como publicas, indicadas con un “1”
en los datos mostrados en la tabla 1.1, privadas; indicadas con un “2”, o controladas por
el gobierno; indicadas con un “3”. Una forma de resumir estos datos numéricamente es
mediante una tabla de contingencia, la cual se muestra en la tabla 1.2. La última fila y la
última columna, identificadas en la tabla con Sum, se conocen como marginales de columna y
de fila, respectivamente, el valor 15 en la marginal de fila, indica el número de organizaciones
que son públicas en los datos. De manera análoga se observa en la marginal de columnas que
17 organizaciones fueron clasificadas como de conciencia social 2. El valor 7 en la primera fila
y primera columna indica que 7 organizaciones públicas fueron calificadas con 1 en conciencia
social.
Clasificación
Tipo 1 2 3 4 Sum
1 7 5 1 2 15
2 3 7 5 4 19
3 3 5 4 4 16
Sum 13 17 10 10 50
Tabla 1.2: Tabla de contingencia a partir de los datos de la tabla 1.1
Diagrama de sectores
Es un gráfico que se basa en una proporcionalidad entre la frecuencia y el ángulo central de
una circunferencia, de tal manera que a la frecuencia total le corresponde el ángulo central
de 360◦ . Para determinar el ángulo que corresponde a cada categorı́a se aplica la siguiente
fórmula
fi × 360
θi = P
fi
donde fi es la frecuencia de la i−ésima categorı́a.
Ejemplo 6. La tabla 1.3 muestra los resultados de un sondeo a cerca de la preferencia de
algunos clientes con respecto al sabor del yogur. Representar los datos en un diagrama de
sectores. P
Las frecuencias son: f1 = 210, f2 = 80 y f3 = 120 y fi = 410. Los ángulos correspondientes
son entonces:

Barras Apiladas Barras Multiples
20
10
Publicas Privadas Controladas Publicas Privadas Controladas
8
15
6
10
4
5
2
0
0
Clase 1 Clase 2 Clase 3 Clase 4 Clase 1 Clase 2 Clase 3 Clase 4
Figura 1.1: Diagramas de barras construidos a partir de los datos de la tabla 1.1 .
Sabor No. Personas

Fresa 210
Melocotón 80
Pasas 120
Tabla 1.3: Preferencia de los clientes en cuanto al sabor del yogur
Sabor Ángulo en grados (θi )

210×360
Fresa 410
= 184,39
80×360
Melocotón 410
= 70,24
120×360
Pasas 410
= 105,36
Una vez se tienen los ángulos se procede a dividir el circulo según estos, como se muestra en
la figura 1.2.
1.4.2. Presentación de datos cuantitativos

Distribuciones de frecuencia
La distribución de frecuencia es una tabla que divide un conjunto de datos en un número
de clases o categorı́as apropiadas, mostrando también el número de elementos de la case. La
tabla sacrifica parte de la información contenida en los datos; en lugar de conocer el valor
exacto del elemento, solo sabemos que pertenece a una clase determinada. Por otra parte,
este tipo de agrupamiento hace resaltar caracterı́sticas importantes de los datos.
El procedimiento para construir una tabla de frecuencia es el siguiente:

Fresa 51.22 %
Melocotón 19.51 %
Pasas 29.27 %
Figura 1.2: Diagrama de sectores
1. Se establece cierto número de clases (intervalos) para agrupar los valores observados,
en general el número de clases que usemos depende del número de observaciones, pero
tiene muy poca utilidad usar menos de 5 o mas de 15. Para unificar criterios usaremos
la siguiente formula empı́rica para determinar el número de clases
K ≈ 1 + 3,3 log(n)
donde K es el número de clases, log es el logaritmo en base 10 y n es el número de

datos
2. Se obtiene el rango o amplitud (R), que es la diferencia entre el valor mas grande y el
más pequeño.
3. Se define el ancho de clase dividiendo el rango entre el número de clases, A = R/K.
4. El limite inferior del primer intervalo (clase) es el menor de los datos, el limite su-
perior del primer intervalo se obtiene sumando al dato menor el ancho de clase. El
segundo intervalo se obtiene sumando el ancho de clase al limite superior del primero
y ası́ sucesivamente.
5. A cada clase se hace corresponder el número de observaciones incluidas en ellas, el cual

constituye la frecuencia de clase.
Ejemplo 7. La demanda diaria, en kilogramos, de un producto industrial durante 30 dı́as

fue:

38 35 76 58 48 59
67 63 33 69 53 51
28 25 36 32 61 57
49 78 48 42 72 52
47 66 58 44 44 56
Construir una tabla que contenga la distribución de frecuencia relativa y frecuencia relativa
acumulada.
Solución:
1. Determinamos el número de clases mediante la formula
1 + 3,3 log(30) = 5,8745 ≈ 6 = K
2. Se obtiene el rango o amplitud R = 78 − 25 = 53
3. Se obtiene el ancho de clase dividiendo la amplitud entre el número de clases ası́:

A = 53/6 = 8,83
4. El limite inferior de la primera clase es el menor de los datos (25), para obtener el limite
superior de la primera clase, al dato menor se le suma el ancho de clase: 25+8,83 = 33,83
de esa forma la primera clase es [25 − 33,83). El limite inferior de la segunda clase es el
superior de la primera y el superior es: 33,83 + 8,83 = 42,66 ası́ que la segunda clase es
[33,83 − 42,66) con ese procedimiento se continua hasta agotar las seis clases. Se debe
tener en cuenta que el limite superior de la última clase es el mayor de los datos.
5. Una vez se tienen todas las clases se cuenta el número de datos que pertenecen a cada
intervalo. La tabla se muestra a continuación
Li Ls Frec Frec Acum Frec Rel Frec Rel Acum

25 33,83 4 4 0,133 0,13
33,83 42,66 4 8 0,133 0,27
42,66 51,49 7 15 0,233 0,50
51,49 60,32 7 22 0,233 0,73
60,32 69,15 5 27 0,166 0,90
69,15 78.00 3 30 0,100 1,00
Representación Gráfica
La forma más común de representar una distribución de frecuencias es el histograma. Para
construir el histograma de una distribución de frecuencia se colocan los intervalos de clase
en el eje horizontal de un plano cartesiano y sobre estos se dibujan rectángulos cuyas alturas
son las frecuencias de clase.

Frecuencia
4
33.83
42.66
51.49
60.32
69.15
78.00
25.00 Clases
Figura 1.3: Histograma de frecuencias
Diagramas de tallos y hojas.

Es una forma rápida de obtener una representación visual ilustrativa del conjunto de datos.
Para construir un diagrama de tallo y hoja primero se debe seleccionar uno ó más dı́gitos
iniciales para los valores de tallo, el dı́gito o dı́gitos finales se convierten en hojas, luego se
hace una lista de valores de tallo en una columna vertical. Prosiguiendo a registrar la hoja
por cada observación junto al valor correspondiente de tallo. Este se usa para listas grandes y
es un método resumido de mostrar los datos, posee la desventaja que no proporciona sino los
datos, y no aparece por ningún lado información sobre frecuencias y demás datos importantes.
El diagrama de tallos y hojas para los datos de nuestro ejemplo se muestra a continuación.
2 5 8
3 2 3 5 6 8
4 2 4 4 7 8 8 9
5 1 2 3 6 7 8 8 9
6 1 3 6 7 9
7 2 6 8
Figura 1.4: Diagrama de tallos y hojas
Diagrama de caja y bigotes.

Este tipo de gráfico también llamado box and whisker plot, facilita la lectura sobre localización,
variabilidad, simetrı́a y presencia de datos atı́picos (outliers según la literatura estadı́stica

inglesa). Este diagrama de consiste en una caja y guiones con una linea a través de la caja
que representa la mediana (segundo cuartil Q2 ). El extremo inferior de la caja es el primer
cuartil Q1 y el superior es el tercer cuartil Q3 .
El bigote superior se extiende desde el tercer cuartil hasta la observación más grande
que es menor o igual que Q3 + 1,5 × (Q3 − Q1 )1 . El bigote inferior se extiende hasta
la observación más pequeña que es mayor o igual que Q1 − 1,5 × (Q3 − Q1 ) 2 Las
observaciones que sean mayores que el cerco interno superior o menores que el cerco interno
inferior se clasifican como datos atı́picos y se marcan en el diagrama. Supongase que se tienen
n datos, los cuales se han ordenado previamente:
3
X El segundo cuartil es el dato que ocupa la posición
n+1
si n es impar
2
o el promedio de las observaciones que ocupan las posiciones
n n
y + 1 si n es par
2 2
.
X El primer cuartil es el segundo cuartil de la primera mitad de los datos después de

ordenarlos.
X El tercer cuartil es el segundo cuartil de la segunda mitad de los datos

Para construir el diagrama de caja siga los siguientes pasos:
a. Dibujar y marcar un eje de medida vertical (eje de coordenadas).
b. Construir un rectángulo cuyo borde inferior se ubica en el cuartil inferior (Q1 ) y cuyo
borde superior se ubica en el cuartil superior (Q3 ).
c. Dibujar un segmento de recta horizontal dentro de la caja justo en el segundo cuartil

(mediana).
d. Prolongar una recta (el bigote) desde el extremo superior de la caja hasta la observación
más grande que es menor o igual que Q3 + 1,5 × (Q3 − Q1 ).
e. Prolongar una recta (el otro bigote) desde el extremo inferior de la caja hasta la observación
más pequeña que es mayor o igual que Q1 − 1,5 × (Q3 − Q1 )
f. Dibujar un ◦ para ubicar (e identificar) cada observación que queden fuera del alcance de
los bigotes.
Ejemplo 8. Los datos que se muestran en la siguiente tabla corresponden a el peso (en
kilogramos) de 25 niños al momento de nacer
1
Q3 + 1,5 × (Q3 − Q1 ) se conoce como cerco interno superior
2
Q1 − 1,5 × (Q3 − Q1 ) se conoce como cerco interno inferior
3
Es la mediana que veremos más adelante

2.536 2.505 2.652 2.573 2.382

2.443 2.617 2.556 2.489 2.415
2.434 2.491 2.345 2.350 2.536
2.577 2.464 2.571 2.550 2.437
2.472 2.580 2.436 2.200 2.851
Representar estos datos mediante un diagrama de caja.
Solución: Lo primero que hay que hacer es ordenar los datos de menor a mayor, con el fin
de obtener los cuartiles. Los datos ordenados se muestran en la tabla 1.4.
1 2 3 4 5 6 7 8 9 10
2.200 2.345 2.350 2.382 2.415 2.434 2.436 2.437 2.443 2.464
11 12 13 14 15 16 17 18 19 20
2.472 2.489 2.491 2.505 2.536 2.536 2.550 2.556 2.571 2.573
21 22 23 24 25
2.577 2.580 2.617 2.652 2.851
Tabla 1.4: Datos del ejemplo 8 ordenados
El Segundo cuartil (Q2 ) Como n = 25 es impar entonces el segundo cuartil (la mediana)
es la observación que ocupa la posición
n+1 25 + 1
= = 13
2 2
es decir
Me = 2,491
Cuartil inferior El cuartil inferior es la mediana de la primera mitad de los datos (los que
están antes de Q2 ) que son 12 luego se calcula como el promedio de las observaciones
que ocupan las posiciones
12 12
=6y +1=7
2 2
2,434 + 2,436
Q1 = = 2,435
2
Cuartil superior El cuartil superior es la observación que está en la posición las mismas
posiciones 6 y 7 pero contando del final de los datos hacia atrás es decir el promedio
de las observaciones 19 y 20
2,571 + 2,573
Q3 = = 2,572
2

El bigote superior debe extenderse hasta la observación más grande que sea menor o igual
a
Q3 + 1,5 × (Q3 − Q1 ) = 2,572 + 1,5 × (2,572 − 2,435) = 2,777
es decir hasta la observación 24. La observación 25 queda por fuera de este lı́mite, por
eso debe marcarse en el diagrama con una ◦
El bigote inferior debe extenderse hasta la observación más pequeña que sea mayor o igual
a
Q1 − 1,5 × (Q3 − Q1 ) = 2,435 − 1,5 × (2,572 − 2,435) = 2,229
es decir hasta la observación 2. La observación 1 queda por fuera de este lı́mite, por eso
debe marcarse en el diagrama con una ◦. El boxplot se muestra en la figura 1.5
2.9–
◦
2.8–
2.7–
2.6–
2.5–
2.4–
2.3–
2.2– ◦
Figura 1.5: Diagrama de caja y bigotes (boxplot) del ejemplo ejemplocuartiles
1.5. Medidas descriptivas.

1.5.1. Medidas de tendencia central
Media aritmética.
La media aritmética de un conjunto de n observaciones y1 , y2 , y3 · · · yn es igual a la suma de
las observaciones dividida entre n (el número de datos). Se indica con y
n
P
yi
i=1 y1 + y2 + y3 + · · · + yn
y= = (1.1)
n n
Ejemplo 9. Considere las siguientes 15 mediciones

8 10 4 3 8
5 6 8 7 6
7 7 5 11 7
Calcular la media
Solución:
8+5+7+···+8+6+7 102
y= = = 6,8
15 15
Media ponderada.
Útil cuando se deben promediar diferentes medias que provienen de muestras con diferente
número de observaciones, donde es conveniente usar ponderaciones que dependen del número
de observaciones, se calcula con la siguiente fórmula:
P
wi y
yw = P i (1.2)
wi
Ejemplo 10. Promediar las siguientes medias y 1 = 45, y 2 = 32, y 3 = 60, provenientes de
muestras de tamaño 25, 12 y 21 respectivamente.
3
P
Solución: wi = 58,
i=1
25 × 45 + 32 × 12 + 21 × 60 2769
yw = = = 47,74
58 58
Mediana
Como se definió en la sección 1.4.2, la mediana de un conjunto de valores y1 , y2 , y3 , · · · ,

yn es el valor que se ubica en el centro cuando las observaciones están colocadas en orden
de magnitud. Cuando el número es par la mediana se obtiene promediando los dos valores
centrales.
Ejemplo 11. Obtener la mediana de los siguientes valores 8, 3, 2, 4, 5, 6, 9.
Solución: Ordenando se obtiene 2, 3, 4, 5, 6, 8, 9. La mediana es 5.
Ejemplo 12. Obtener la mediana de los siguientes valores 9, 2, 7, 11, 14, 6.
Solución: Ordenando se obtiene 2, 6, 7, 9, 11, 14. Como el número de observaciones es par

y las dos observaciones centrales son 7 y 9, la mediana es 7+9
2
= 16
2
= 8.

Moda.
Es el valor (si existe) que ocurre con mayor frecuencia. Si es un valor único se dice que la
distribución es unimodal, si en los datos se tienen tienen dos o mas valores con la misma
frecuencia máxima, se dice que la distribución es bimodal, trimodal, etc.
Ejemplo 13. Los tamaños de las camadas de una estación porcı́cola fueron los siguientes:
4, 5, 6, 8, 10, 9, 8, 8. Hallar la moda.
Solución: 8 es la moda porque es el valor que se repite con mayor frecuencia. Mo = 8.
La moda puede no existir cuando los valores se presentan todos con la misma frecuencia.
En una tabla de frecuencias resulta útil para propósitos descriptivos, indicar
la clase modal, que es la clase con mayor frecuencia. Para calcular la moda se
usa el punto medio de la clase modal .
1.5.2. Medidas de dispersion.

Las medidas de dispersión indican el grado de variabilidad entre las observaciones, las mas
comunes son la varianza, el rango o amplitud, la desviación estándar y el coeficiente de
variación.
Rango.
Se obtiene como la diferencia entre el mayor y el menor de los valores del conjunto de
observaciones, esta medida de dispersión tiene la desventaja de dejarse influenciar por valores
extremos. Resulta útil cuando no se conoce la varianza de distribuciones normales, para
estimar de manera aproximada la desviación estándar.
Ejemplo 14. En el punto 2 del ejemplo 7 (página 7) se calculó el rango de los datos corres-
pondientes a la demanda diaria de un producto industrial.
Varianza.
La varianza (s2 ), de un conjunto de observaciones se define como la suma de cuadrados de las
desviaciones de las observaciones respecto a su media, dividida por el número de observaciones
menos uno.
n
(yi − y)2
P
S 2 = i=1 (1.3)
n−1
una fórmula alternativa para calcular la varianza es
n
yi2 − ny 2
P
i=1
S2 = (1.4)
n−1

Desviación estándar.
Se define como la raı́z cuadrada de la varianza
√
S = S2 (1.5)
Ejemplo 15. Calcular la varianza y la desviación estándar del siguiente conjunto de datos.
4 7 3 6 5
Solución: Para estos datos tenemos que n = 5 y y = 5.

Varianza
(4 − 5)2 + (7 − 5)2 + (3 − 5)2 + (6 − 5)2 + (5 − 5)2
s2 =
4
(−1) + 2 + (−2) + 1 + 02
2 2 2 2
1+4+4+1+0 10
= = = = 2,5
4 4 4
Desviación Estándar p
S= 2,5 = 1,58114
Una forma práctica para calcular la varianza es por medio de una tabla como la siguiente
i yi yi − y (yi − y)2
1 4 −1 1
2 7 2 4
3 3 −2 4
4 6 1 1
5 5 0 0
Sumas 25 0 10
Ejemplo 16. Se ilustrará el uso de la formula alternativa (1.4) para calcular la varianza,
usaremos los datos del ejemplo 15.
Solución: En este caso ny 2 = 5 × 52 = 5 × 25 = 125, calculamos los cuadrados de cada uno

de los datos y sumamos, como se muestra en la siguiente tabla:
i yi yi2
1 4 16
2 7 49
3 3 9
4 6 36
5 5 25
Sumas 25 135

5
yi2 = 135 por lo tanto
P
se tiene que
i=1
135 − 125 10
S2 = = = 2,5
4 4
que como se esperaba coincide con el resultado del ejemplo 15.
Coeficiente de variación.
El coeficiente de variación (CV ) de un conjunto de datos se define como el cociente entre la
desviación estándar y la media.
S
CV = (1.6)
y
El coeficiente de variación es una medida de la dispersión relativa de un conjunto de datos.
Con frecuencia esta relación se indica en porcentajes. Resulta de gran utilidad para comparar
la variabilidad de diferentes conjuntos de datos.
Ejemplo 17. El coeficiente de variación de los datos del ejemplo 15 es

S 1,58114
CV = = = 0,3162 ≡ 31,62 %
y 5
1.6. Ejercicios.
1. La siguiente tabla muestra el número de artı́culos rechazados por control de calidad
discriminados según las causas de rechazo:
Causa de rechazo Número de artı́culos

Falla eléctrica 210
Falla mecánica 110
Mal acabado 80
Representar los datos en un diagrama de sectores y en un diagrama de barras.
2. Para el siguiente conjunto de datos
10.0 9.1 9.9 8.7 10.5 9.8 11.4 9.4

10.1 10.3 9.5 10.8 10.1 9.9 9.7 11.2
(a) Agrupe los datos en una tabla de frecuencias (Use 5 clases)

(b) represente los datos por medio de un histograma de frecuencias.
(c) Calcule la media, moda, mediana de los datos.
(d) Calcule la varianza, desviación estándar, el rango y CV

3. Para decidir acerca del número de mostradores de servicio que serán necesarios en las
tiendas que se construirán en el futuro, una cadena de supermercados querı́a obtener
información sobre el tiempo (en minutos) requerido para atender a los clientes. Para
obtener información acerca de la distribución de los tiempos de atención de los clientes,
se obtuvo una muestra de 60 clientes y se registró el tiempo empleado en atender a
cada uno de ellos, los datos se muestran a continuación.
3.6 1.0 0.3 0.8 0.4 0.6 0.4 0.8 1.1 1.8
1.9 1.4 1.1 1.7 2.3 2.8 1.3 1.0 2.2 0.3
2.1 1.8 0.5 1.4 1.8 2.5 0.8 0.9 1.6 1.1
0.3 1.6 1.2 0.2 4.5 1.1 1.3 0.7 1.9 0.6
0.8 1.1 0.6 1.3 0.9 0.4 1.1 3.1 5.2 0.7
0.2 1.8 1.1 3.1 0.7 1.2 1.2 1.7 0.5 0.6
(a) Construya una tabla de frecuencias relativas de los datos.

(b) Construya un histograma de frecuencias relativas de los datos.
(c) Construya un diagrama de tallos y hojas.
(d) Construya un diagrama de caja (BoxPlot)
(e) Calcule la media, la mediana, la moda (si existe)
(f) Calcule el rango, la varianza, la desviación estándar y el coeficiente de variación de
los datos.
4. Los siguientes datos son los números de torsiones requeridas para 12 barras de cierta
aleación:
33 24 39 48 26 35
38 54 23 34 29 37
(a) Calcular la media, la mediana y la moda.

(b) calcular la varianza, la desviación estándar, el rango, y el CV
5. Los siguientes datos son el número de minutos que en 15 dı́as laborales una persona
tiene que esperar el autobús que la llevará a su trabajo
10 1 13 9 5 9 2 10 3 8 6 17 2 10 15
(a) Calcular la media, la mediana y la moda.

(b) calcular la varianza, la desviación estándar, el rango, y el CV
6. Los siguientes datos son 12 lecturas de temperatura en varios puntos de un gran horno
(en grados Fahrenheit):

475 500 460 425 460 410 470 475 460 510 450 415
a) Calcular la media, la mediana y la moda.

b) calcular la varianza, la desviación estándar, el rango, y el CV

Descriptiva

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Descriptiva

Загружено:

Авторское право:

Доступные форматы

Capı́tulo 1

1.1. Qué estudia la estadı́stica?

Diseñar nuevos productos y sistemas.

Perfeccionar los existentes.

Aumentar la calidad de los productos

La estadı́stica surge de la necesidad de describir y comprender la variabilidad , la cual

¿Cómo registro y presento mis datos?

¿Qué modelos uso para analizar mis datos?

1.2. Escalas de medición

1.2.1. Escala Nominal

Ejemplo 1. a. El carácter de sexo puede clasificarse en hembras y varones y puede asignarse

1.2.2. Escala Ordinal

Página 2 Mario A. Morales R. mmorales@sinu.unicordoba.edu.co

1.2.3. Escala de Intervalo

1.2.4. Escala de Razón

1.3. Tipos de variables.

1.3.1. Variables Cualitativas

Página 3 Mario A. Morales R. mmorales@sinu.unicordoba.edu.co

Tabla 1.1: Calificación de 50 organizaciones en cuanto a su conciencia social

1.3.2. Variables Cuantitativas

1.4. Presentación de datos

Página 4 Mario A. Morales R. mmorales@sinu.unicordoba.edu.co

1.4.1. Presentación de datos cualitativos

Tabla 1.2: Tabla de contingencia a partir de los datos de la tabla 1.1

Página 5 Mario A. Morales R. mmorales@sinu.unicordoba.edu.co

Barras Apiladas Barras Multiples

Sabor No. Personas

Tabla 1.3: Preferencia de los clientes en cuanto al sabor del yogur

Sabor Ángulo en grados (θi )

1.4.2. Presentación de datos cuantitativos

Página 6 Mario A. Morales R. mmorales@sinu.unicordoba.edu.co

Figura 1.2: Diagrama de sectores

donde K es el número de clases, log es el logaritmo en base 10 y n es el número de

3. Se define el ancho de clase dividiendo el rango entre el número de clases, A = R/K.

5. A cada clase se hace corresponder el número de observaciones incluidas en ellas, el cual

Ejemplo 7. La demanda diaria, en kilogramos, de un producto industrial durante 30 dı́as

Página 7 Mario A. Morales R. mmorales@sinu.unicordoba.edu.co

1. Determinamos el número de clases mediante la formula

1 + 3,3 log(30) = 5,8745 ≈ 6 = K

2. Se obtiene el rango o amplitud R = 78 − 25 = 53

3. Se obtiene el ancho de clase dividiendo la amplitud entre el número de clases ası́:

Li Ls Frec Frec Acum Frec Rel Frec Rel Acum

Página 8 Mario A. Morales R. mmorales@sinu.unicordoba.edu.co

Figura 1.3: Histograma de frecuencias

Diagramas de tallos y hojas.

Figura 1.4: Diagrama de tallos y hojas

Diagrama de caja y bigotes.

Página 9 Mario A. Morales R. mmorales@sinu.unicordoba.edu.co

X El primer cuartil es el segundo cuartil de la primera mitad de los datos después de

X El tercer cuartil es el segundo cuartil de la segunda mitad de los datos

a. Dibujar y marcar un eje de medida vertical (eje de coordenadas).

c. Dibujar un segmento de recta horizontal dentro de la caja justo en el segundo cuartil

Página 10 Mario A. Morales R. mmorales@sinu.unicordoba.edu.co

2.536 2.505 2.652 2.573 2.382

Tabla 1.4: Datos del ejemplo 8 ordenados

Página 11 Mario A. Morales R. mmorales@sinu.unicordoba.edu.co

Figura 1.5: Diagrama de caja y bigotes (boxplot) del ejemplo ejemplocuartiles

1.5. Medidas descriptivas.

Página 12 Mario A. Morales R. mmorales@sinu.unicordoba.edu.co

Como se definió en la sección 1.4.2, la mediana de un conjunto de valores y1 , y2 , y3 , · · · ,

Ejemplo 11. Obtener la mediana de los siguientes valores 8, 3, 2, 4, 5, 6, 9.

Solución: Ordenando se obtiene 2, 3, 4, 5, 6, 8, 9. La mediana es 5.

Ejemplo 12. Obtener la mediana de los siguientes valores 9, 2, 7, 11, 14, 6.