Вы находитесь на странице: 1из 44

ESTADÍSTICA

DESCRIPTIVA
ESTADÍSTICA DESCRIPTIVA
•  Los orígenes de la estadís.ca, aunque no se sabe con
exac.tud cuándo se comenzó a u.lizar, pueden estar
ligados al an.guo Egipto como a los censos chinos que
se realizaron hace unos 4.000 años, aproximadamente.
•  Sin duda, fueron los romanos, maestros de la
organización polí.ca, quienes mejor supieron ocupar la
estadís.ca. Cada cinco años realizaban un censo de la
población, cuyos datos de nacimientos, defunciones y
matrimonios eran esenciales para estudiar los avances
del imperio; sin olvidar los recuentos de ganancias y las
riquezas que dejaban las .erras.
ESTADÍSTICA DESCRIPTIVA
•  Para poder comprender mejor este .po de
estudio es importante que conozcas los
siguientes términos básicos:
Población: Es un conjunto de
personas, eventos o cosas de
las cuales se desea hacer un
estudio, y tienen una
característica en común.
ESTADÍSTICA DESCRIPTIVA
Muestra: Es un subconjunto cualquiera
de la población; es importante escoger la
muestra en forma aleatoria (al azar),
pues así se logra que sea representativa
y se puedan obtener conclusiones más a
fines acerca de las características de la
población.
ESTADÍSTICA DESCRIPTIVA
Todo estudio estadís.co debe considerar
diferentes .pos de variables:


Variables

Variables cualita-vas
Variables Cuan-ta-vas
ESTADÍSTICA DESCRIPTIVA
Variables cualitativas:
R e l a c i o n a d a s c o n
características no numéricas
de un individuo (por ejemplo:
atributos de una persona,
nacionalidad, color de la piel,
sexo).
ESTADÍSTICA DESCRIPTIVA
Variables Cuantitativas: Relacionadas
con características numéricas del
individuo por ejemplo: edad, precio
de un producto, ingresos anuales.
Las variables cuantitativas se dividen
en discretas (aquellas que pueden
tomar solo algunos valores en un
intervalo y no valores intermedio,
ejemplo: edad, número de hermanos
que puede ser 1, 2, 3....,etc, pero,
por ejemplo, nunca podrá ser 3,45) o
continuas (aquellas que pueden
tomar cualquier valor en un intervalo
real, ejemplo: alturas, la velocidad
de un vehículo puede ser 80,3 km/h,
94,57 km/h...etc.).

Estadís7ca Descrip7va: Es la parte de la estadís.ca que trata solamente de
describir y analizar un grupo dado sin sacar conclusiones o inferencias de
un grupo mayor, a par.r de ella. La estadís.ca descrip.va incluye las
técnicas que se relacionan con el resumen y la descripción de datos
numéricos. Estos datos pueden ser gráficos o pueden incluir análisis
computacional.

Estadís7ca Inferencial: Cuando una muestra es representa.va de una
población se pueden deducir importantes conclusiones acerca de esta, a
par.r de su análisis. La inferencia estadís.ca comprende aquellas técnicas
por medio de las cuales se toma decisiones sobre una población estadís.ca
basadas solo en la muestra observada. Debido a que dichas decisiones se
toman en condiciones de incer.dumbre, entonces estas serán confiables
con cierto grado de probabilidad. Considerando que las caracterís.cas
medidas de una muestra se denominan estadís.cas de la muestra, las
caracterís.cas medidas de una población estadís.ca, o universo se llaman
parámetros de la población.

ESTADÍSTICA DESCRIPTIVA
Ordenando la Información
Al ordenar datos muy numerosos, es
usual agruparlos en clases o categorías.
Al determinar cuántos pertenecen a
cada clase, establecemos la frecuencia.
Construimos así una tabla de datos
llamada tabla de frecuencias.
ESTADÍSTICA DESCRIPTIVA

¿Para qué se construyen las tablas


de frecuencias ?

1.  ORDENAR
2.  AGRUPAR
3.  RESUMIR información
ESTADÍSTICA DESCRIPTIVA
El formato general de una tabla estadística , llamada también
TABLA DE FRECUENCIAS O TABLA DE DISTRIBUCIÓN DE
FRECUENCIAS es la siguiente:

Nombre de la Frecuencia
variable
Categorías o Frecuencias
Recorrido de la Observadas
variable
TOTAL n
ESTADÍSTICA DESCRIPTIVA
En la siguiente tabla se presenta el motivo de la
consulta médica, durante una semana.

Motivo Consulta Número de pacientes


Bronquitis 19
Otitis 13
Heridas 7
Fracturas 18
Vacunas 20
ESTADÍSTICA DESCRIPTIVA
TIPOS DE FRECUENCIAS

a) Frecuencia o Frecuencia Absoluta: Es el número de veces


que se presenta un valor o categoría de una variable. Se
representa por fi. 

b) Frecuencia Relativa: La frecuencia relativa se puede expresar


en términos de porcentaje o de proporción y se representa por
fr. (Es la razón entre la frecuencia absoluta y el total de datos)
ESTADÍSTICA DESCRIPTIVA
Los siguientes datos brutos corresponden al número de
pasajeros de una aerolínea en los últimos 50 días:
Intervalos y Límites de Clase
•  DATOS SUELTOS
–  Se les llama datos sueltos o brutos a los datos
recolectados que no han sido organizados
numéricamente. Un ejemplo es el conjunto de
pasajeros de la aerolinea.
•  ORDENACIÓN
–  Una ordenación es un conjunto de datos numéricos
en orden creciente o decreciente de magnitud. A la
diferencia entre el número mayor y el menor se le
conoce como Rango de los datos. Por ejemplo, si la
estatura mayor de los 100 estudiantes es 1,94 mts y la
menor es 1,50 mts el rango es 1,94 – 1,50 = 0,44 mts.
Los siguientes datos ordenados en orden creciente,
corresponden al número de pasajeros de una aerolínea en
los últimos 50 días:
Intervalos y Límites de Clase
•  La siguiente tabla es una distribución de frecuencias de las
estaturas de 100 estudiantes hombres de la Universidad Estatal:
Estatura en pulgadas Número de estudiantes
60 – 62 5
63 – 65 18
66 – 68 42
69 – 71 27
72 – 74 8
Total 100
•  A los datos organizados y reunidos en clases, como la anterior
distribución de frecuencias, se les llama datos agrupados. Aunque
el proceso de agrupamiento generalmente quita detalles originales
en los datos, es muy ventajosa pues proporciona una visión muy
amplia y clara, además de que se ob.enen relaciones evidentes.
Intervalos y Límites de Clase
•  El símbolo que define a una clase, como 60-62 de la tabla
anterior, se llama intervalo de clase.
•  A los números 60 y 62 se les conoce como límites de clase;
–  el número mas pequeño (60) es el límite inferior de clase,
–  mientras que el mas grande (62) es el límite superior de clase.

•  A un intervalo de clase que, por lo menos teóricamente, no
.ene límite de clase inferior o superior se le llama Intervalo
de Clase Abierto.
–  Por ejemplo, en grupos de edades de individuos, el intervalo de
clase “65 años o más” es un Intervalo de Clase Abierto.
Intervalos y Límites de Clase
•  Se llama frontera de clase (superior ó inferior) al verdadero
límite de la clase, y en la prác.ca se ob.ene promediando
los limites superiores e inferiores de dos clases con.guas.
•  A los números 60 y 62 se les conoce como límites de clase;
–  el número mas pequeño (60) es el límite inferior de clase,
–  mientras que el mas grande (62) es el límite superior de clase.
–  La Frontera Inferior de ésta clase sería (59+60)/2 +59,5 y la
frontera superior sería (62+63)/2=62,5
•  Se llama tamano o amplitud o longitud de clase, a la
diferencia entre LAS FRONTERAS DE CLASE INFERIOR Y
SUPERIOR.
•  Se llama Marca de Clase, al punto medio del intervalo de
clase, y se ob.ene promediando los limites inferior y
superior de una clase
HISTOGRAMAS Y POLIGONOS DE
FRENCUENCIA
•  Un histograma consiste en un conjunto de
rectangulos que .enen:
A- sus bases en el eje X horizontal, sus centros
en las marcas de clase y longitudes iguales a
los tamanos de los intervalos de clase.
B- Áreas proporcionales a las frecuencias de
clase.
•  Un poligono de frecuencias es una grafica de
linea de las frecuencias de clase dibujada con
respecto a la marca de clase.
Distribuciones de Frecuencia
•  FRECUENCIAS RELATIVAS
–  La Frecuencia Rela7va de una clase es su frecuencia
dividida entre la frecuencia total de todas las clases y se
expresa generalmente como un porcentaje.
–  Por ejemplo, la frecuencia rela.va de la clase 66-68 de la
tabla de estaturas de estudiantes del tema anterior es
42/100 = 42%.
–  Es claro que la suma de todas las frecuencias rela.vas de
las clases es 1, o sea 100%.
–  Si se sus.tuyen las frecuencias de esa tabla por las
correspondientes frecuencias rela.vas, a la tabla
resultante se le llama Distribución de Frecuencias
Rela7vas, Distribución de Porcentajes o Tabla de
Frecuencias Rela7vas.
Distribuciones de Frecuencia
•  FRECUENCIAS ACUMULADAS.
–  La frecuencia total de todos los valores menores que la
frontera de clase superior de un intervalo de clase dado se
conoce como Frecuencia acumulada hasta ese intervalo de
clase.
–  Por ejemplo, la frecuencia acumulada, incluyendo hasta el
intervalo de clase 66 -68 de la tabla de estudiantes es
5+18+42=65, lo que significa que 65 estudiantes .enen
estaturas por debajo de 69 plg.
–  Una tabla que presenta tales frecuencias acumuladas se
llama Distribución de Frecuencias Acumuladas, Tabla de
Frecuencias Acumuladas o, brevemente, una Distribución
Acumulada.
OJIVAS
•  La frecuencia total de todos los valores menores que la
frontera de clase superior de un intervalo de clase dado se
llama frecuencia acumulada hasta ese intervalo inclusive.
•  Un grafico que recoja las frecuencias acumuladas por debajo
de cualquiera de las fronteras de clase superiores respecto de
dicha frontera se llama un polígono de frecuencias acumuladas
u ojiva.
•  A ciertos efectos, es deseable considerar una distribución de
frecuencias acumuladas de todos los valores mayores o iguales
que la frontera de clase inferior de cada intervalo de clase, se
le suele llamar una distribución acumulada << o más >>.
•  La correspondiente ojiva se conoce como ojiva << o más >>,
siempre que nos refiramos a distribuciones acumuladas u
ojivas sin más, estaremos hablando del caso << menor que >>.

Distribuciones de Frecuencia
•  En la siguiente tabla se muestra una tabla de distribuciones
acumuladas para las estaturas de los estudiantes:

Frecuencia
Número de Frecuencia
Estatura Frecuencia rela7va
estudiantes acumulada
porcentual
60 – 62 5 5% Menor que 59,5 0
63 – 65 18 18% Menor que 62,5 5
66 – 68 42 42% Menor que 65,5 23
69 – 71 27 27% Menor que 68,5 65
72 – 74 8 8% Menor que 71,5 92
Total 100 100% Menor que 74,5 100
Construcción de Tablas de Frecuencias
•  Criterios para la determinación del número
de clases
–  Es recomendable que no sean pocos los intervalos
ó clases debido a que al condensar la pérdida de
información sería importante con relación a los
datos originales.
–  Por otra parte, el número excesivo de clases, si
bien produce poca pérdida de la información no
simplifica el trabajo.
Construcción de Tablas de Frecuencias
•  Un criterio para determinar el número de clases es el
propuesto por Ryan en 1982 presentado en la
siguiente tabla:
No. de datos No. de clases
8 a 16 4
17 a 32 5
33 a 64 6
65 a 128 7
129 a 256 8
257 a 512 9
513 a 1024 10
Ejercicios
•  Se .ene un conjunto de 50 datos que
representan el peso en kilogramos de los
bebes nacidos en un hospital durante el mes
de febrero y se desea representar mediante
una tabla de frecuencias. Determine el
número de clases que se requieren para
construir dicha tabla.
•  Solución: 6 clases, de acuerdo a la tabla de
Ryan.
Nro. De Pasajeros Nro. De Pasajeros Nro. De Pasajeros

50 a 59 46 a 55 40 a 43
44 a 47
60 a 69 56 a 65 48 a 51
70 a 79 66 a 75 52 a 55
56 a 59
80 a 89 76 a 85 60 a 63
90 a 99 86 a 95 64 a 67

100 a 109 96 a 105 68 a 71


72 a 75
76 a 79
Nro. De Pasajeros 80 a 83
50 a 59 Nro. De Pasajeros 84 a 87
59 a 69 Menos de 69 88 a 91
67 a 79 70 A 79 92 a 95
96 a 99
80 a 89 80 A 89 100 a 103
90 a 99 Más de 90
100 a 109
Nivel de colesterol en la sangre de una muestra de hombres
estadounidenses que tienen entre 25 y 34 años de edad , que fueron
atendidos en centros médicos de New York y sufren de hipertensión
arterial , en el año 2001

Nivel de Colesterol Cantidad de


(mg/100 ml) hombres
81-120 13
121-160 15
161-200 44
201-240 29
241-280 9
ESTADÍSTICA DESCRIPTIVA
Ejemplo:
Consideremos los siguientes datos, expresados en metros,
correspondientes a las estaturas de 80 estudiantes de Cuarto
año de Educación Media.

1,67 1,72 1,81 1,72 1,74 1,83 1,84 1,88


1,92 1,75 1,84 1,86 1,73 1,84 1,87
1,83 1,81 1,77 1,73 1,75 1,78 1,77
1,67 1,83 1,83 1,72 1,71 1,85 1,84 1,93
1,82 1,69 1,70 1,81 1,66 1,76 1,75 1,80
1,79 1,84 1,86 1,80 1,77 1,80 1,76 1,88
1,75 1,79 1,87 1,79 1,77 1,67 1,74
1,75 1,78 1,77 1,74 1,73 1,83 1,76
1,83 1,77 1,75 1,77 1,77 1,84 1,83
1,79 1,82 1,76 1,76 1,76 1,79 1,88 1,66
1,80 1,72 1,75 1,79 1,77
ESTADÍSTICA DESCRIPTIVA
Estatura Mayor: 1,93 metros
Estatura Menor: 1,66 metros
Rango: 1,93 metros - 1,66 metros = 0,27 metros = 27 cm.

Formaremos 6 intervalos. Para calcular el tamaño de intervalo de


cada uno dividimos 27 y 6, obteniendo finalmente 4,5 ≈ 5

Luego los intervalos de la tabla son:


Intervalo Marca de Clase Frecuencia Absoluta

1,65 – 1,69

1,70 – 1,74

1,75 – 1,79

1,80 – 1,84

1,85 – 1,89

1,90 – 1,94
ESTADÍSTICA DESCRIPTIVA
Representaciones Gráficas

Para hacer más clara y evidente la


información que nos dan las tablas se
utilizan los gráficos. Existen múltiples tipos
de gráficos, pero aquí trataremos solamente
de los usados más frecuentemente, que son:
histograma, polígono de frecuencias, la ojiva
ESTADÍSTICA DESCRIPTIVA

Días N° ArOculos Frecuencia Frecuencia


Rela7va rela7va
porcentual
Lunes 3 0,129 12,9
Martes 5,2 0,224 22,4
Miércoles 4,8 0,206 20,6
Jueves 6 0,258 25,8
Viernes 4,2 0,181 18,1
Total 23,2 0,998 99,8
MEDIDAS DE RESUMEN
Entre las medidas que permiten
resumir información proveniente de
una población, podemos
considerar las medidas de
posición, medidas de dispersión y
medidas de forma.
Medidas de Posición
Tienen por objeto, obtener un valor
que resuma en sí todas las
mediciones. La mayoría de ellas trata
de ubicar el centro de la distribución,
razón por la cual, se llaman
MEDIDAS DE TENDENCIA
CENTRAL; estas son: Media,
Mediana y Moda.
MEDIDAS DE TENDENCIA CENTRAL

Media aritmética o promedio: Es una de


las medidas de tendencia central de
mayor uso. La media muestral se
simboliza por X y la media poblacional
de denota por µ.
PROMEDIO PARA DATOS NO TABULADOS

Sea X una variable cuantitativa y x1, x2,…, xn una muestra


de tamaño "n" de valores de la variable, se define la media
aritmética de X como: n
x1 + x2 + x3 + ..... + xn ∑x i
X= X = i =1
n n
PROMEDIO PARA DATOS TABULADOS

Para calcular la media aritmética de un conjunto de datos, se suma cada uno de los
valores y se divide entre el total de casos.
Sea X una variable estadística que toma los valores , con frecuencias absolutas ,
respectivamente, la media viene dada por:
n

x1 f 1 + x 2 f 2 + ... + x n f n
∑x
i =1
i ⋅ fi
x= = n
f 1 + f 2 + ... + f n
∑f
i =1
i
Ejemplo N°1

Consideremos la edad en años de ocho personas

10 18 25 32 12 5 7 7

En este ejemplo el promedio , media o media aritmética de la edad de


estas personas está dada por:

10 + 18 + 25 + 32 + 12 + 5 + 7 + 7
x=
8

Es decir la edad promedio de estas personas es de 14,5 años.


Mediana (Me)

Sea X una variable por lo menos ordinal y sea x1, x2,…xn una muestra de
tamaño n de observaciones de la variable, se define como Mediana "Me" un
valor tal que supera a no más del 50% de las observaciones y es superado
por no más del 50% de las observaciones, cuando estas han sido
ordenadas según magnitud.

MEDIANA PARA DATOS NO TABULADOS

Ejemplo: Consideremos la edad en años de ocho personas


10 18 25 32 12 5 7 7

Para calcular la mediana , previamente se deben ordenar las


observaciones. En este caso lo haremos en forma creciente:

5 7 7 10 12 18 25 32
Como la cantidad de datos es par, entonces la mediana
corresponde al promedio de los datos centrales, por lo tanto la
mediana es 11.
MEDIANA PARA DATOS TABULADOS

En casos de datos agrupado es un poco más complejo


y requiere de la utilización de la siguiente fórmula
N
− Fi −1
M = Li + c ⋅ 2
fi
Li = límite inferior de la clase mediana
c= amplitud del intervalo
N = número total de datos
Fi −1 = frecuencia absoluta acumulada de la clase anterior a la mediana
f i = frecuencia absoluta de la clase mediana
Moda o Modo (Mo) para datos no tabulados
La moda se identifica al observar el valor que se presenta con más
frecuencia en la distribución.
Si consideramos el ejemplo del peso de una muestra de
personas:
65 76 48 48 68 78 90 87 67 72 78
Mo = 48 kilos
Mo = 78 kilos.
Esto significa que la mayoría de estas personas pesa 48 kilos y 78 kilos.
Esta distribución es bimodal.
Moda o Modo (Mo) para datos tabulados
Ahora bien, en el caso de datos agrupados en intervalos, es fácil determinar la clase modal
(clase con mayor frecuencia), pero el valor dentro del intervalo que se presume tenga mayor
frecuencia se obtiene a partir de la siguiente expresión:

límite inferior de la clase modal.


amplitud de los intervalos.
diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase
anterior.
diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase
siguiente.
Moda o Modo (Mo) para datos tabulados

Ahora bien, en el caso de datos agrupados en


intervalos, es fácil determinar la clase modal (clase
con mayor frecuencia), pero el valor dentro del
intervalo que se presume tenga mayor frecuencia se
obtiene a partir de la siguiente expresión:

límite inferior de la clase modal.


amplitud de los intervalos.
diferencia entre la frecuencia absoluta de la clase
modal y la frecuencia absoluta de la clase anterior.
diferencia entre la frecuencia absoluta de la clase
modal y la frecuencia absoluta de la clase siguiente.
Cuantiles

La mediana divide a la distribución en dos partes iguales, los cuantiles son parámetros que
dividen los datos de la distribución en partes iguales.

Los más usados son:

Cuartiles:
Se llaman cuartiles a tres valores que dividen a la serie de datos en cuatro partes iguales.
( cuartil primero, cuartil segundo y cuartil tercero )

Quintiles:
Se llaman quintiles a cuatro valores que dividen a la serie en cinco partes iguales.
( quintil primero,... )

Deciles:
Nueve valores iguales que dividen la distribución en 10 partes iguales.
( decil primero,...)

Percentiles:
Noventa y nueve valores que dividen la serie en 100 partes iguales.
( percentil primero,... )

El cálculo es análogo al de la mediana.

Вам также может понравиться