Вы находитесь на странице: 1из 7

la estadistica es.

concepto

En el caso de la estad�stica descriptiva se sustituye o reduce el conjunto de datos


obtenidos por un peque�o n�mero de valores descriptivos, como pueden ser: el
promedio, la mediana, la media geom�trica, la varianza, la desviaci�n t�pica, etc

�Qu� es la estad�stica descriptiva?


La estad�stica descriptiva es la rama de la estad�stica que recolecta, analiza y
caracteriza un conjunto de datos (peso de la poblaci�n, beneficios diarios de una
empresa, temperatura mensual,�) con el objetivo de describir las caracter�sticas y
comportamientos de este conjunto mediante medidas de resumen, tablas o gr�ficos.

Variables estad�sticas
ANUNCIOS

Una variable estad�stica es el conjunto de valores que puede tomar cierta


caracter�stica de la poblaci�n sobre la que se realiza el estudio estad�stico y
sobre la que es posible su medici�n. Estas variables pueden ser: la edad, el peso,
las notas de un examen, los ingresos mensuales, las horas de sue�o de un paciente
en una semana, el precio medio del alquiler en las viviendas de un barrio de una
ciudad, etc.

Las variables estad�sticas se pueden clasificar por diferentes criterios. Seg�n su


medici�n existen dos tipos de variables:

Cualitativa (o categ�rica): son las variables que pueden tomar como valores
cualidades o categor�as.
Ejemplos:

Sexo (hombre, mujer)


Salud (buena, regular, mala)

Cuantitativas (o num�rica): variables que toman valores num�ricos.


Ejemplos:

N�mero de casas (1, 2,�). Discreta.


Edad (12,5; 24,3; 35;�). Continua.

Medidas de posici�n central


Las medidas de tendencia central (o de centralizaci�n) son medidas que tienden a
localizar en qu� punto se encuentra la parte central de un conjunto ordenado de
datos de una variable cuantitativa.

Media
Definimos media (tambi�n llamada promedio o media aritm�tica) de un conjunto de
datos (X1,X2,�,XN) al valor caracter�stico de una serie de datos resultado de la
suma de todas las observaciones dividido por el n�mero total de datos.

F�rmula de la Media
Es decir:

F�rmula de la Media desarrollada


Dibujo de la media de las alturas de seis personas
Visto desde un punto de vista m�s conceptual, la media aritm�tica es el centro de
los datos en el sentido num�rico, ya que intenta equilibrarlos por exceso y por
defecto. Es decir, si sumamos todas las diferencias de los datos a la media da
cero.

F�rmula de la propiedad de la media aritm�tica como medida centralizadora que


equilibra los datos
Mediana
La mediana (Me(X)) es el elemento de un conjunto de datos ordenados (X1,X2,�,XN)
que deja a izquierda y derecha la mitad de valores.

Dibujo de la mediana de las alturas de siete personas


Si el conjunto de datos no est� ordenado, la mediana es el valor del conjunto tal
que el 50% de los elementos son menores o iguales y el otro 50% mayores o iguales.

Moda
La moda (Mo(X)) es el valor m�s repetido del conjunto de datos, es decir, el valor
cuya frecuencia relativa es mayor. En un conjunto puede haber m�s de una moda.

Dibujo de la moda de las alturas de siete personas


Media geom�trica
La media geom�trica (MG) de un conjunto de n�meros estrictamente positivos (X1,
X2,�,XN) es la ra�z N-�sima del producto de los N elementos.

F�rmula de la media geom�trica


Todos los elementos del conjunto tienen que ser mayores que cero. Si alg�n elemento
fuese cero (Xi=0), entonces la MG ser�a 0 aunque todos los dem�s valores estuviesen
alejados del cero.

Dibujo de la media geom�trica


Media arm�nica
La media arm�nica (H) de un conjunto de elementos no nulos (X1, X2,�,XN) es el
rec�proco de la suma de los rec�procos (donde 1/Xi es el rec�proco de Xi))
multiplicado por el n�mero de elementos del conjunto (N).

F�rmula de la media arm�nica


Media cuadr�tica
La media cuadr�tica o RMS (Root Mean Square) de un conjunto de valores (X1,
X2,�,XN) es una medida de posici�n central. Esta se define como la ra�z cuadrada
del promedio de los elementos al cuadrado.

Formula de la media cuadr�tica


Dibujo de los datos y el c�lculo de la media cuadr�tica
Media ponderada
La media ponderada (MP) es una medida de centralizaci�n. Consiste en otorgar a cada
observaci�n del conjunto de datos (X1,X2,�,XN) unos pesos (p1,p2,�,pN) seg�n la
importancia de cada elemento.

Formula de la media ponderada


Cuanto m�s grande sea el peso de un elemento, m�s importante se considera que es
�ste.

Relaci�n entre medias


Existe una relaci�n de orden entre cuatro tipos de media. En esta relaci�n se
excluye la media ponderada porque depende de los pesos. Sean:

H la media arm�nica
MG la media geom�trica
x la media aritm�tica
RMS la media cuadr�tica
Entonces:
F�rmula de la relaci�n entre la media arm�nica, media geom�trica, media aritm�tica
y media cuadr�tica
En esta relaci�n, solamente se cumple la igualdad cuando todos los datos sean
iguales, es decir si: x1 = x2 = x3 = � = xN.

Medidas de posici�n no central


Las medidas de posici�n no central (o medidas de tendencia no central) permiten
conocer puntos caracter�sticos de una serie de valores, que no necesariamente
tienen que ser centrales. La intenci�n de estas medidas es dividir el conjunto de
observaciones en grupos con el mismo n�mero de valores.

Cuartiles
Los cuartiles son los tres valores que dividen una serie de datos ordenada en
cuatro porciones iguales. El primer cuartil (Q1) deja a la izquierda el 25% de los
datos. El segundo (Q2) deja a izquierda y derecha el 50% y coincide con la mediana.
El tercero (Q3) deja a la derecha el 25% de valores. Los tres cuartiles son:

Formula de los cuartiles


Percentiles
El percentil es una medida de posici�n no central. Los percentiles Pi son los 99
puntos que dividen una serie de datos ordenada en 100 partes iguales, es decir, que
contienen el mismo n�mero de elementos cada una. El percentil 50 es la mediana.

Sea (X1, X2,�,XN) una muestra de N elementos. El percentil Pi es:

Formula de los percentiles


Donde Pi es la posici�n del percentil buscado en la serie ordenada de datos.

Los percentiles est�n pensados para conjuntos de elementos de m�s de cien


elementos.

Medidas de dispersi�n
Las medidas de dispersi�n o medidas de variabilidad muestran la variabilidad de un
conjunto de datos, indicando la mayor o menor concentraci�n de datos respecto a las
medias de centralizaci�n.

Rango
El rango (R) o recorrido estad�stico es la diferencia entre el valor m�ximo y el
m�nimo de un conjunto de elementos.

F�rmula del Rango


Rango intercuart�lico
El rango intercuart�lico (IQR) (o rango intercuartil) es una estimaci�n estad�stica
de la dispersi�n de una distribuci�n de datos. Consiste en la diferencia entre el
tercer y el primer cuartil. Mediante esta medida se eliminan los valores
extremadamente alejados. El rango intercuart�lico es altamente recomendable cuando
la medida de tendencia central utilizada es la mediana (ya que este estad�stico es
insensible a posibles irregularidades en los extremos).

F�rmula del Rango intercuart�lico


Varianza
La varianza (S2) mide la dispersi�n de los datos de una muestra respecto a la
media, calculando la media de los cuadrados de las distancias de todos los datos.

F�rmula de la Variaci�n muestral


Al elevar las diferencias al cuadrado se garantiza que las diferencias absolutas
respecto a la media no se anulan entre si. Adem�s, resaltan los valores alejados.
Desviaci�n t�pica
La desviaci�n t�pica es la medida de dispersi�n (S) asociada a la media. Mide el
promedio de las desviaciones de los datos respecto a la media en las mismas
unidades de los datos.

F�rmula de la Desviaci�n t�pica


El cuadrado de la desviaci�n t�pica es la varianza.

Coeficiente de variaci�n de Pearson


El coeficiente de variaci�n de Pearson (r) mide la variaci�n de los datos respecto
a la media, sin tener en cuenta las unidades en la que est�n.

F�rmula del Coeficiente de variaci�n de Pearson


El coeficiente de variaci�n toma valores entre 0 y 1. Si el coeficiente es pr�ximo
al 0, significa que existe poca variabilidad en los datos y es una muestra muy
compacta. En cambio, si tienden a 1 es una muestra muy dispersa.

Para interpretar f�cilmente el coeficiente, podemos multiplicarlo por cien para


tenerlo en tanto por cien.

Asimetr�a y curtosis
La asimetr�a y curtosis informan sobre la forma de la distribuci�n de una variable.
Estas medidas permiten saber las caracter�sticas de su asimetr�a y homgeneidad sin
necesidad de representarlos gr�ficamente.

Asimetr�a
La asimetr�a es la medida que indica la simetr�a de la distribuci�n de una variable
respecto a la media aritm�tica, sin necesidad de hacer la representaci�n gr�fica.
Los coeficientes de asimetr�a indican si hay el mismo n�mero de elementos a
izquierda y derecha de la media.

Existen tres tipos de curva de distribuci�n seg�n su asimetr�a:

Asimetr�a negativa: la cola de la distribuci�n se alarga para valores inferiores a


la media.
Sim�trica: hay el mismo n�mero de elementos a izquierda y derecha de la media. En
este caso, coinciden la media, la mediana y la moda. La distribuci�n se adapta a la
forma de la campana de Gauss, o distribuci�n normal.

Asimetr�a positiva: la cola de la distribuci�n se alarga para valores superiores a


la media.
Dibujo de los tres tipos de asimetr�a
Curtosis
La curtosis (o apuntamiento) es una medida de forma que mide cu�n escarpada o
achatada est� una curva o distribuci�n.

Este coeficiente indica la cantidad de datos que hay cercanos a la media, de manera
que a mayor grado de curtosis, m�s escarpada (o apuntada) ser� la forma de la
curva.

Dibujo de la forma de las curvas de distribuci�n seg�n su curtosis


La curtosis se mide promediando la cuarta potencia de la diferencia entre cada
elemento del conjunto y la media, dividido entre la desviaci�n t�pica elevado
tambi�n a la cuarta potencia. Sea el conjunto X=(x1, x2,�, xN), entonces el
coeficiente de curtosis ser�:

F�rmula de la curtosis
Frecuencias
Dibujo del diagrama circular de frecuencias.
La frecuencia es una medida que sirve para comparar la aparici�n de un elemento Xi
en un conjunto de elementos (X1, X2,�, XN). Mediante tablas de distribuciones de
frecuencia se puede presentar organizadamente el recuento de datos.

Las frecuencias de cada elemento se pueden expresar tanto absolutas (n�mero total
de apariciones) como relativas (proporci�n de apariciones).

Frecuencia absoluta
La frecuencia absoluta (ni) de un valor Xi es el n�mero de veces que el valor est�
en el conjunto (X1, X2,�, XN).

La suma de las frecuencias absolutas de todos los elementos diferentes del conjunto
debe ser el n�mero total de sujetos N. Si el conjunto tiene k n�meros (o
categor�as) diferentes, entonces:

F�rmula de la suma de las frecuencias absolutas que tiene como resultado el n�mero
total de elementos N.
Frecuencia absoluta acumulada
La frecuencia absoluta acumulada(Ni) de un valor Xi del conjunto (X1, X2,�, XN) es
la suma de las frecuencias absolutas de los valores menores o iguales a Xi, es
decir:

F�rmula de la frecuencia absoluta acumulada.


Frecuencia relativa
La frecuencia relativa (fi) de un valor Xi es la proporci�n de valores iguales a Xi
en el conjunto de datos (X1, X2,�, XN). Es decir, la frecuencia relativa es la
frecuencia absoluta dividida por el n�mero total de elementos N:

F�rmula de Frecuencia relativa


Las frecuencias relativas son valores entre 0 y 1, 0 = fi = 1. La suma de las
frecuencias relativas de todos los sujetos da 1. Supongamos que en el conjunto
tenemos k n�meros (o categor�as) diferentes, entonces:

F�rmula de la suma de frecuencias relativas igual a 1


Si se multiplica la frecuencia relativa por cien se obtiene el porcentaje (tanto
por cien %).

Frecuencia relativa acumulada


Definimos la frecuencia relativa acumulada (Fi) de un valor Xi como la proporci�n
de valores iguales o menores a Xi en el conjunto de datos (X1, X2,�, XN). Es decir,
la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividida por
el n�mero total de sujetos N:

F�rmula de frecuencia relativa acumulada


La frecuencia relativa acumulada de cada valor siempre es mayor que la frecuencia
relativa. De hecho, la frecuencia relativa acumulada de un elemento es la suma de
las frecuencias relativas de los elementos menores o iguales a �l, es decir:

F�rmula de frecuencia relativa acumulada a partir de la suma de las frecuencias


relativas de los elementos menores o iguales al estudiado.
Gr�ficos
ANUNCIOS

Un gr�fico (o gr�fica) es el recurso de representar los datos num�ricos por medio


de l�neas, diagramas, dibujos, etc. La representaci�n gr�fica es un importante
suplemento al an�lisis y estudio estad�stico.

Gr�ficos
Los gr�ficos llaman la atenci�n del lector y hacen que de un vistazo �ste tenga una
mayor comprensi�n de los datos. Un buen gr�fico puede captar al lector para que a
continuaci�n lea todo el estudio. Si un estudio se compone �nicamente de texto y
tablas, posiblemente no todos los lectores lean el estudio.

Existen muchas clases de gr�ficas. Se pueden destacar los siguientes tipos:

Gr�fico lineal
El gr�fico lineal (gr�fico de l�neas o diagrama lineal) se compone de una serie de
datos representados por puntos, unidos por segmentos lineales. Mediante este
gr�fico se puede comprobar r�pidamente el cambio de tendencia de los datos.

El diagrama lineal se suele utilizar con variables cuantitativas, para ver su


comportamiento en el transcurso del tiempo. Por ejemplo, en las series temporales
mensuales, anuales, trimestrales, etc.

Dibujo del gr�fica lineal o diagrama lineal


Diagrama
Un diagrama es un tipo de representaci�n gr�fica que sirve para representar un
conjunto de datos.

Seg�n la RAE (Real Academia Espa�ola), un diagrama es un dibujo geom�trico que


sirve para demostrar una proposici�n, resolver un problema o representar de una
manera gr�fica la ley de variaci�n de un fen�meno.

Existen diferentes tipos de diagramas, de los que se pueden destacar los


siguientes:

Diagrama de barras
El diagrama de barras es un gr�fico que se utiliza para representar datos de
variables cualitativas o discretas. Est� formado por barras rectangulares cuya
altura es proporcional a la frecuencia de cada uno de los valores de la variable.

Dibujo del diagrama de barras


Diagrama circular
El diagrama circular (tambi�n llamado diagrama de sectores o diagrama de pastel)
sirve para representar variables cualitativas o discretas. Se utiliza para
representar la proporci�n de elementos de cada uno de los valores de la variable.

Consiste en partir el c�rculo en porciones proporcionales a la frecuencia relativa.


Enti�ndase como porci�n la parte del c�rculo que representa a cada valor que toma
la variable.

Dibujo del diagrama circular.


Diagrama de Pareto
El diagrama de Pareto (tambi�n llamado diagrama ABC) fue creado por Vilfredo
Pareto, para representar datos cualitativos. El italiano comprob� que el 20% de la
poblaci�n italiana acaparaban el 80% de riquezas y propiedades.

El principio de Pareto afirma que el 20% de las causas vitales originan alrededor
del 80% de los efectos. O visto desde el punto de vista matem�tico, que el 20% de
las categor�as representan el 80% de las observaciones.

El diagrama de Pareto se construye siguiendo estos dos pasos:


Ordenar los datos por frecuencia relativa o absoluta.
Representar cada una de las categor�as de la variable mediante un rect�ngulo
proporcional a su frecuencia (como en el diagrama de barras).
Dibujo del diagrama de Pareto.
Diagrama de caja
El diagrama de caja es un gr�fico utilizado para representar una variable
cuantitativa (variable num�rica). El gr�fico es una herramienta que permite
visualizar, a trav�s de los cuartiles, c�mo es la distribuci�n, su grado de
asimetr�a, los valores extremos, la posici�n de la mediana, etc. Se compone de:

Un rect�ngulo (caja) delimitado por el primer y tercer cuartil (Q1 y Q3). Dentro de
la caja una l�nea indica d�nde se encuentra la mediana (segundo cuartil Q2)
Dos brazos, uno que empieza en el primer cuartil y acaba en el m�nimo, y otro que
empieza en el tercer cuartil y acaba en el m�ximo.
Los datos at�picos (o valores extremos) que son los valores distintos que no
cumplen ciertos requisitos de heterogeneidad de los datos.
Dibujo del diagrama de caja.
Diagrama de tallo y hojas
El diagrama de tallo y hojas (Stem-and-Leaf Diagram) es un semigr�fico que permite
presentar la distribuci�n de una variable cuantitativa. Consiste en separar cada
dato en el �ltimo d�gito (que se denomina hoja) y las cifras delanteras restantes
(que forman el tallo).

Dibujo del tallo y la hoja de un dato


Es especialmente �til para conjuntos de datos de tama�o medio (entre 20 y 50
elementos) y que sus datos no se agrupan alrededor de un �nico tallo. Con �l
podemos hacernos la idea de qu� distribuci�n tienen los datos, la asimetr�a, etc.

Dibujo del diagrama de tallo y hoja


Histograma
Un histograma es una representaci�n gr�fica de datos agrupados mediante intervalos.
Los datos provienen de una variables cuantitativas continuas. Gracias a �l puedes
hacerte r�pidamente una idea de la distribuci�n de los datos o muestra.

Tambi�n cabe emplear variables cualitativas ordinales, siendo necesario que el


n�mero de datos sea alto.

Un histograma es un conjunto de rect�ngulos que representan las frecuencias


absolutas de cada uno de los intervalos. Los intervalos abarcan todo el conjunto
sin cortarse, de manera que un elemento est� solo en un intervalo.

Dibujo del histograma


Pol�gono de frecuencias
El pol�gono de frecuencias es un gr�fico que permite la r�pida visualizaci�n de las
frecuencias de cada una de las categor�as del estudio.

Normalmente se utiliza el pol�gono de frecuencias con frecuencias absolutas, pero


tambi�n se utiliza con frecuencias relativas.

Pol�gono de frecuencias.
Pictograma
Un pictograma es un tipo de gr�fico que representa mediante dibujos la
caracter�stica estudiada. �stos representan las frecuencias relativas o absolutas
de una variable cualitativa o discreta.

Pictograma

Вам также может понравиться