Вы находитесь на странице: 1из 8

METODOS ESTADISTICOS UNIDAD 2: ANALISIS

DESCRIPTIVO

Unidad 2: Análisis descriptivo

Distribución de frecuencia: Es un agrupamiento de datos en categorías mutuamente


excluyentes dando el número de observaciones de cada categoría.

Distribución de frecuencia relativa: Convierte la distribución en porcentaje.

Diagrama de tallo y hoja: Es una técnica estadística para representar un conjunto de


datos. Cada valor numérico se divide en dos partes. El o los dígitos principales forman
el tallo y los dígitos secundarios las hojas. Los tallos están colocados a lo largo del eje
vertical, y las hojas de cada observación a lo largo del eje horizontal.

Histograma: Gráfica en la que las clases se indican en el eje horizontal y las frecuencias
en el eje vertical. Las frecuencias de clase se representan por la altura de las barras, y
las barras se trazan adyacentes una a otra.

Polígono de frecuencia: Consiste de segmentos de línea que conectan los puntos


formados por la intersección del punto medio de clase y la frecuencia de la clase. El
polígono de frecuencia es semejante a un histograma.

Frecuencia acumulada: La frecuencia acumulada es la suma de las frecuencias


absolutas de todos los valores inferiores o iguales al valor considerado.

Polígono de frecuencias acumuladas: Consiste de segmentos de línea que conectan


los puntos formados por la intersección del punto medio de clase y la frecuencia
acumulada de la clase.

Medidas descriptivas

Importante: Éstas medidas resumen se pueden calcular a partir de una población o de


una muestra. Si se calculan a partir de una población se llama Parámetro, si se calcula
con datos muestrales se lo conoce como Estadístico.

Medidas de tendencia central (O medidas de posición)

Son valores alrededor de que las observaciones tienden a agruparse, y permiten ubicar
lo que en algún sentido pudiera llamarse el “centro” de un conjunto de datos.

DOCENTE: TELMO MATIAS -155497513/2432656 Página 11


METODOS ESTADISTICOS UNIDAD 2: ANALISIS
DESCRIPTIVO

La media aritmética

 Media poblacional:  
x  x 1  x 2  x3    x n

 fx
N N N

 Media muestral: X 
x  x 1  x 2  x3    x n

 fx
n n n

Propiedades de la media
1. Todo conjunto de datos, de intervalo o de razón tiene una media.
2. Para calcular la media se toman todos los valores.
3. Un conjunto de datos solo tiene una media, es decir, la media es única.
4. La media es útil para comparar dos o más poblaciones.
5. La media aritmética es la única medida de posición en la que la suma de las
desviaciones de los valores con respecto a la media siempre será cero. Es decir;
 x - x   0
Desventajas de la media aritmética
1. La media se ve afectada en exceso por valores demasiado grandes o demasiado
pequeños.
2. No se puede determinar la media de una distribución de frecuencia en la que hay
clases abiertas.

La mediana
Es la observación central de los valores una vez que éstos han sido ordenados desde el
más pequeño hasta el más grande, o desde el más grande hasta el más pequeño.

Propiedades de la mediana
1. La mediana es única, hay solo una mediana para cada conjunto de datos.
2. La mediana no se ve afectada por valores extremos (ni demasiado grandes, ni
demasiado pequeños), por esto es una valiosa medida de tendencia central cuando
hay presencia de éstos valores.
3. Se puede calcular para distribuciones de frecuencia con una clase abierta, siempre
que la media no se encuentre en una clase abierta.
4. Se puede calcular para datos de nivel ordinal, de intervalo y de razón. Es decir, se
puede terminar para datos de todos los niveles, excepto del nominal.
5. Acumula antes de su valor él %50 de las observaciones, y anti-acumula el %50
restante después de su valor. Es decir;
xmin ; x2 ;...; x j ;...; xn1 ; xmax

%50 Mediana %50

DOCENTE: TELMO MATIAS -155497513/2432656 Página 12


METODOS ESTADISTICOS UNIDAD 2: ANALISIS
DESCRIPTIVO

Mediana de orden: No es la mediana. Indica el orden o la posición en la cual encontrar


n 1
la mediana. Es el paso previo a calcular la mediana. Su fórmula es: Mna 
2

Observación: Para obtener el valor de la mediana se utilizan ciertas reglas:


1. Si la posición obtenida es un número entero, se elige como mediana la observación
numérica especificada en ese lugar.
2. Si la posición obtenida se encuentra justo en medio de dos enteros, se selecciona el
promedio de sus valores correspondientes.

n 1
F
Mediana de datos agrupados: Mna  Li  2 .w
f
Donde:
 Li es el límite inferior del intervalo mediana
 f es la frecuencia del intervalo mediana
 F es el número de frecuencia acumulada del intervalo anterior al intervalo
mediana
 w es la amplitud del intervalo mediana

El modo
Es el valor que se presente con más frecuencia, es decir, el valor con mayor frecuencia.

d1
Modo para datos agrupados: Mo  Li  w
d1  d 2
Donde:
 Li es el límite inferior del intervalo modal
 w es la amplitud del intervalo modal
 d1 es la diferencia entre la frecuencia del intervalo modal y el anterior
 d 2 es la frecuencia entre la frecuencia del intervalo modal y el posterior

DOCENTE: TELMO MATIAS -155497513/2432656 Página 13


METODOS ESTADISTICOS UNIDAD 2: ANALISIS
DESCRIPTIVO

Simetría

 Una distribución se considera simétrica si las tres medidas de posición (media,


mediana y modo) son iguales.
 Una distribución se considera aproximadamente simétrica si las tres medidas de
posición son similares.
 Una distribución se considera asimétrica si las tres medidas de posición son
considerablemente diferentes.

Distribución asimétrica Distribución asimétrica


Distribución simétrica Por izquierda Por derecha

Media
Mediana
Modo Modo Modo Media
Media
Mediana Mediana

Cuartiles
Los cuartiles o cuartilos son las medidas de posición “no central” que se utilizan con
mayor frecuencia y se emplean sobre todo para resumir o describir las propiedades de
conjuntos grandes de datos numéricos. Son medidas descriptivas que parten los datos
ordenados en cuatro cuartos. Es decir;
xmin ;...; Q1;...; Q2 ;...; Q3 ;...; xmax

%25 %25 %25 %25


Segundo
Primer Tercer
cuartil
cuartil cuartil

Observación: El segundo cuartil ( Q2 ) coincide con la mediana (Mna), por lo que su


cálculo es idéntico.

DOCENTE: TELMO MATIAS -155497513/2432656 Página 14


METODOS ESTADISTICOS UNIDAD 2: ANALISIS
DESCRIPTIVO

Cuartiles de orden:
n 1 n 1 n 1
Q1   Q2   Q3   3 
4 2 4

Observación: Para obtener los valores de los cuartiles se utilizan ciertas reglas:
1. Si la posición obtenida es un número entero, se elige como cuartil la observación
numérica especificada en ese lugar.
2. Si la posición obtenida se encuentra justo en medio de dos enteros, se selecciona el
promedio de sus valores correspondiente.
3. Si la posición obtenida no es un número entero o el valor medio entre dos números
enteros, una regla sencilla para aproximar el cuartil específico consiste en
redondear hacia arriba o hacia abajo a la posición entera más cercana y elegir el
valor numérico de ésa posición.

Cuartiles de datos agrupados:

n 1 n 1 n 1
F F 3 F
Q1  Li  4 .w Q2  Li  2 .w Q3  Li  2 .w
f f f

Medidas de dispersión

También conocidas como medidas de variabilidad. Son números que indican la


diseminación o dispersión de observaciones, es decir, muestran la magnitud en que los
valores individuales de un conjunto de datos difieren de otros, y por ello, de su
ubicación central.

El rango
Es la medida de dispersión más simple. Es la diferencia entre el valor mayor y el menor.
Es decir; Rango  xmax  xmin

Desviación media
Es la media aritmética de los valores absolutos de las desviaciones de la media
aritmética.

DM 
 xx
n

DOCENTE: TELMO MATIAS -155497513/2432656 Página 15


METODOS ESTADISTICOS UNIDAD 2: ANALISIS
DESCRIPTIVO

Variancia (o Varianza)
La media aritmética de las desviaciones de la media elevadas al cuadrado.

 Variancia poblacional:  2

 (x  ) 2


x 2
 N 2
N N

 x  x  x  nx 2
2 2

 Variancia muestral: S 2
 
n 1 n 1

Desvío estándar (o Desviación estándar)


Es la raíz cuadrada positiva de la variancia.

 Desvío estándar poblacional:  


 (x  ) 2


x 2
 N 2
N N

 x  x  x  nx 2
2 2

 Desvío estándar muestral: S  


n 1 n 1

Rango intercuartil
Es la diferencia entre el tercer y primer cuartil en un conjunto de datos.
RIQ  Q3  Q1

Dispersión relativa

Una medida de dispersión relativa muy conocida (y muy útil) es el coeficiente de


variación. Se define como: la relación entre la desviación estándar y la media,
expresada como un por ciento.

S
 Coeficiente de variación poblacional: CV  100
x


 Coeficiente de variación muestral: CV  100

Observación 1: El Coeficiente de variación es útil cuando:


1. Los datos están en unidades diferentes
2. Los datos están en la misma unidad, pero las medias son muy diferentes
Observación 2: Al calcular los coeficientes de variación de dos distribuciones, aquella
distribución que posea el menor coeficiente de variación será la distribución más
homogénea.

DOCENTE: TELMO MATIAS -155497513/2432656 Página 16


METODOS ESTADISTICOS UNIDAD 2: ANALISIS
DESCRIPTIVO

Diagrama de caja y bigote (o Box-plot)

xmin Q1 Mediana Q3 xmax


Q2
Observación: Los Box-plot sirven para comparar la simetría y la homogeneidad entre
dos distribuciones, de la siguiente forma;

Homogeneidad:

Más homogéneo

Menos homogéneo

Simetría:

Distribución
simétrica

Distribución asimétrica
Por izquierda

Distribución asimétrica
Por derecha

DOCENTE: TELMO MATIAS -155497513/2432656 Página 17


METODOS ESTADISTICOS UNIDAD 2: ANALISIS
DESCRIPTIVO

Consideraciones importantes

 ¿Cómo saber qué medida de posición utilizar?


 La media aritmética es la medida de posición más apropiada para variables
cuantitativas, cuando la distribución es simétrica.
 La mediana se utiliza como medida de posición para variables cuantitativas
cuando la distribución no es simétrica.
 El modo se utiliza como medida de posición cuando la variable es
cualitativa.

 ¿Cómo saber qué medida de dispersión utilizar?


 La media se acompaña con la Variancia o el Desvío estándar, siendo más
común el Desvío estándar.
 La mediana se acompaña con el Rango o el Rango Intercuartil, siendo más
común el Rango Intercuartil.
 El modo no posee medida de dispersión.
 ¿Cómo saber qué gráfico usar para las distribuciones de frecuencia?
 Variable cualitativa: Se realiza un gráfico de sectores o un gráfico de barras
verticales.
 Variable cuantitativa discreta: Se realizan siempre dos gráficos:
1. Gráfico de barras verticales o gráfico de bastones
2. Gráfico escalonado
 Variable cuantitativa continua: Se realizan siempre dos gráficos:
1. Histograma
2. Polígono de frecuencia acumuladas

DOCENTE: TELMO MATIAS -155497513/2432656 Página 18

Вам также может понравиться