Вы находитесь на странице: 1из 33

Qu es estadstica?

La estadstica es un conjunto de mtodos


para planificar y realizar experimentos,
obtener datos y luego analizar, interpretar,
y formular una conclusin basada en esos
datos.
Es la ciencia encargada de recopilar,
organizar, analizar e interpretar
informacin numrica o cualitativa, de
manera que pueda llevar a conclusiones
vlidas.
La estadstica es una ciencia que analiza series de datos (por ejemplo, edad de
una poblacin, altura de los estudiantes de una escuela, altura del fuste de
quebrachos, concentracin de sales de aguas, etc) y trata de extraer
conclusiones sobre el comportamiento de estas variables.

Poblacin: Universo a estudiar.


Conjunto de todos los individuos (personas, plantas, animales, etc.) que
porten informacin sobre el fenmeno que se estudia. Por ejemplo, si
estudiamos la acidez de cierto producto lcteo la poblacin ser el total de
los productos lcteos de un lote.

Muestra:
Subconjunto que seleccionamos de la poblacin. As, no se estudiar todo el
lote, sino que se seleccionar una muestra que sea representativa, que tenga:
Aleatoriedad: Igual probabilidad de seleccin
Proporcionalidad: Cada parte importante de la poblacin est representada.
Atributo o propiedad que puede ser medida
Ejemplos de variables: La longitud, la masa, concentracin de sales, absorbancia,
color, pH, sexo, sangre tipo, etc.

Cualitativas: cualidad o atributo, no numricas: no se pueden medir


(por ejemplo: color, sexo, ).
Cuantitativas: Caractersticas numricas. Medible.

Discreta: X N. Enteros, ncolonias, n renovales

Continua: X R. Nros reales, T, concentracin, altura


Distribuciones
Serie Simple: N reducido de datos y se refiere a variables discretas

La distribucin de frecuencia es la representacin estructurada, en forma de tabla, de


toda la informacin que se ha recogido sobre la variable que se estudia.

Cada valor de la variable se denomina observacin (xi)


El total de observaciones o tamao muestral o tamao de la muestra es n

La sumatoria de las frecuencias absolutas debe ser igual a n


Valores de x:
Medimos la altura de los nios de una clase y obtenemos los siguientes resultados
(cm): tabla de frecuencia simple

Alumno Estatura Alumno Estatura Alumno Estatura

x x x x x x

Alumno 1 1,25 Alumno 11 1,23 Alumno 21 1,21

Alumno 2 1,28 Alumno 12 1,26 Alumno 22 1,29

Alumno 3 1,27 Alumno 13 1,30 Alumno 23 1,26

Alumno 4 1,21 Alumno 14 1,21 Alumno 24 1,22

Alumno 5 1,22 Alumno 15 1,28 Alumno 25 1,28

Alumno 6 1,29 Alumno 16 1,30 Alumno 26 1,27

Alumno 7 1,30 Alumno 17 1,22 Alumno 27 1,26

Alumno 8 1,24 Alumno 18 1,25 Alumno 28 1,23

Alumno 9 1,27 Alumno 19 1,20 Alumno 29 1,22

Alumno 10 1,29 Alumno 20 1,28 Alumno 30 1,21


Si presentamos esta informacin estructurada obtendramos la siguiente
tabla de frecuencia :

Variable Frecuencias absolutas Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada

x fi Fi=fi=n hi=Fi/n Hi=hi=1

1,20 1 1 0,033 0,033

1,21 4 5 0,133 0,166

1,22 4 9 0,133 0,30

1,23 2 11 0,066 0,366

1,24 1 12 0,033 0,40

1,25 2 14 0,066 0,466

1,26 3 17 0,10 0,566

1,27 3 20 0,10 0,666

1,28 4 24 0,133 0,80

1,29 3 27 0,10 0,90

1,30 3 30 0,10 1
Lo primero es determinar el n de intervalos=

Luego calculamos la amplitud del intervalo=


Variables continuas-Distribuciones de
frecuencia agrupada

Habitant Habitant Habitant


Estatura Estatura Estatura
e e e

x x x x x x

Habitante Habitante Habitante


1,15 1,53 1,21
1 11 21

Habitante Habitante Habitante


1,48 1,16 1,59
2 12 22

Habitante Habitante Habitante


1,57 1,60 1,86
3 13 23

Habitante Habitante Habitante


1,71 1,81 1,52
4 14 24

Habitante Habitante Habitante


1,92 1,98 1,48
5 15 25

Habitante Habitante Habitante


1,39 1,20 1,37
6 16 26

Habitante Habitante Habitante


1,40 1,42 1,16
7 17 27

Habitante Habitante Habitante


1,64 1,45 1,73
8 18 28

Habitante Habitante Habitante


1,77 1,20 1,62
9 19 29

Habitante Habitante Habitante


1,49 1,98 1,01
10 20 30
Si presentramos esta informacin en una tabla de frecuencia simple obtendriamos una tabla de 30 lneas (una para
cada valor), cada uno de ellos con una frecuencia absoluta de 1 y con una frecuencia relativa del 3,3%. Esta tabla nos
aportara escasa imformacin. En lugar de ello, preferimos agrupar los datos por intervalos, con lo que la informacin
queda ms resumida, es ms manejable e informativa:
Tabla de Frecuencia Agrupada- variable continua:
Estatura Frecuencias absolutas Frecuencias relativas

Cm Simple Acumulada Simple Acumulada

x x x x x
1,01 - 1,10 1 1 3,3% 3,3%

1,11 - 1,20 3 4 10,0% 13,3%

1,21 - 1,30 3 7 10,0% 23,3%

1,31 - 1,40 2 9 6,6% 30,0%

1,41 - 1,50 6 15 20,0% 50,0%

1,51 - 1,60 4 19 13,3% 63,3%

1,61 - 1,70 3 22 10,0% 73,3%

1,71 - 1,80 3 25 10,0% 83,3%

1,81 - 1,90 2 27 6,6% 90,0%

1,91 - 2,00 3 30 10,0% 100,0%


UNIDAD N2

REPRESENTACIN DE DATOS
Tablas:

Ttulo
Encabezado
cuerpo
Notas, fuente
DATOS NUMRICOS DISCRETOS
Tablas de frecuencia

Graficamente
DATOS NUMRICOS CONTINUOS

HISTOGRAMA DE F:
Puede ser de f abs, f rel o %

POLIGONO DE F
OJIVAS:
F acumuladas, rel o %

- DATOS CATEGRICOS
GRFICO DE BARRAS
DIAGRAMA DE PASTEL
UNIDAD N 3:

MEDIDAS DE POSICIN

Las medidas de posicin nos facilitan informacin sobre la serie de datos que
estamos analizando. Estas medidas permiten conocer diversas caractersticas de
esta serie de datos.

Las medidas de posicin son de dos tipos:

a) Medidas de posicin central: informan sobre los valores medios de la serie de


datos.
b) Medidas de posicin no centrales: informan de como se distribuye el resto de
los valores de la serie.
a) Medidas de posicin central
Las principales medidas de posicin central son las siguientes:
1.- Media (o promedio): es el valor medio ponderado de la serie de datos.
a) Media aritmtica: se calcula multiplicando cada valor por el nmero de
veces que se repite. La suma de todos estos productos se divide por el total
de datos de la muestra:

(X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn * nn)
Xm = ---------------------------------------------------------------------------------------
n

2.- Mediana: es el valor de la serie de datos que se sita justamente en el


centro de la muestra (un 50% de valores son inferiores y otro 50% son
superiores).
No presentan el problema de estar influido por los valores extremos, pero en
cambio no utiliza en su clculo toda la informacin de la serie de datos (no
pondera cada valor por el nmero de veces que se ha repetido).

3.- Moda: es el valor que ms se repite en la muestra.


Moda

La moda es el valor de la variable que ms veces se repite, en una distribucin de


frecuencias, es el valor de la variable que tiene la mxima frecuencia. En distribuciones
no agrupadas en intervalos se observa la columna de las frecuencias absolutas, y el valor
de la variable correspondiente ser la moda. A veces aparecen distribuciones de
variables con ms de una moda (bimodales, trimodales, etc)

En el caso de tener la variable agrupada en intervalos de la misma amplitud, el intervalo


modal ser el que posea una mayor frecuencia absoluta ( ni )
Estatura Frecuencias absolutas Frecuencias relativas

Cm Simple Acumulada Simple Acumulada

x x x x x
1,01 - 1,10 1 1 3,3% 3,3%

1,11 - 1,20 3 4 10,0% 13,3%

1,21 - 1,30 3 7 10,0% 23,3%

1,31 - 1,40 2 9 6,6% 30,0%

1,41 - 1,50 6 15 20,0% 50,0%

1,51 - 1,60 4 19 13,3% 63,3%

1,61 - 1,70 3 22 10,0% 73,3%

1,71 - 1,80 3 25 10,0% 83,3%

1,81 - 1,90 2 27 6,6% 90,0%

1,91 - 2,00 3 30 10,0% 100,0%

Mo = 1,41 + 0,09 . 6 - 2 __ = 1,47


(6-2) + (6-4)
Mediana ( Me )

a) Variables discretas no agrupadas:

1) Se calcula N / 2 y se construye la columna de las Ni ( frecuencias acumuladas )

2) Se observa cual es la primera Ni que supera o iguala a N / 2 , distinguindose dos casos:

- Si existe un valor de Xi tal que , entonces

- Si existe un valor i tal que , entonces

Ejemplo primer y segundo caso:

xi ni Ni
1 3 3
2 4 7
5 9 16
7 10 26
10 7 33
13 2 35
n = 35

lugar que ocupa

como se produce que ,por lo tanto Me = 7


xi ni Ni
1 3 3
2 4 7
5 9 16
7 10 26
10 6 32
n= 32

Lugar que ocupa = 32/2 = 16 ==>

Notar que en este caso se podra haber producido que hubiera una frecuencia
absoluta acumulada superior a 16. En este caso se calculara como en el ejemplo
anterior.
b) Variables agrupadas por intervalos
Cada intervalo Ii vendr expresado segn la notacin Ii = ( Li-1 , Li ]; observando la
columna de las frecuencias acumuladas, buscaremos el primer intervalo cuya Ni sea
mayor o igual que N / 2

1) Si existe Ii tal que entonces si el intervalo mediano es el


( Li-1 , Li ] y la mediana es:

2) Anlogamente si existe un Ii tal que la mediana es

Ejemplo:
N / 2 = 671/2 = 335.5 ; Me estar en el intervalo (30 35).

( Li-1, Li] ni Ni
[20 , 25] 100 100
(25 , 30] 150 250
(30 , 35] 200 450
(35 , 40] 180 630
(40 , 45] 41 671
N = 671
Variable Frecuencias absolutas Frecuencias relativas

(Valor) Simple Acumulada Simple Acumulada

x x x x x

1,20 1 1 3,3% 3,3%

1,21 4 5 13,3% 16,6%

1,22 4 9 13,3% 30,0%

1,23 2 11 6,6% 36,6%

1,24 1 12 3,3% 40,0%

1,25 2 14 6,6% 46,6%

1,26 3 17 10,0% 56,6%

1,27 3 20 10,0% 66,6%

1,28 4 24 13,3% 80,0%

1,29 3 27 10,0% 90,0%

1,30 3 30 10,0% 100,0%


1.- Media aritmtica:
(1,20*1) + (1,21*4) + (1,22 * 4) + (1,23 * 2) + ......... + (1,29 * 3) + (1,30 * 3)
Xm =--------------------------------------------------------------------------------------------------
30
Xm =1,253
la estatura media de este grupo de alumnos es de 1,253 cm.

2.- Mediana:
La mediana de esta muestra es 1,26 cm, ya que por debajo est el 50% de los valores y por
arriba el otro 50%. Esto se puede ver al analizar la columna de frecuencias relativas
acumuladas.

4.- Moda:
Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo tanto esta seria
cuenta con 3 modas.
Medidas de posicin no centrales
Las medidas de posicin no centrales permiten conocer otros puntos
caractersticos de la distribucin que no son los valores centrales. Entre
otros indicadores, se suelen utilizar una serie de valores que dividen la
muestra en tramos iguales:

Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma


creciente o decreciente, en cuatro tramos iguales, en los que cada uno de
ellos concentra el 25% de los resultados.

Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma


creciente o decreciente, en diez tramos iguales, en los que cada uno de
ellos concentra el 10% de los resultados.

Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de


forma creciente o decreciente, en cien tramos iguales, en los que cada uno
de ellos concentra el 1% de los resultados.
MEDIDAS DE DISPERSIN

Estudia la distribucin de los valores de la serie, analizando si estos se encuentran


ms o menos concentrados, o ms o menos dispersos.
Existen diversas medidas de dispersin, entre las ms utilizadas:
1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia
entre el mayor valor ms y el menor valor.

2.- Varianza: Mide la distancia entre los valores y la media. Se calcula como sumatorio
de las diferencias al cuadrado entre cada valor y la media, multiplicadas por f. La
sumatoria se divide por n.

La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms


concentrados estn los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, ms dispersos estn.
3.- Desviacin tpica-estandar: Se calcula como raz cuadrada de la varianza.

4.- Coeficiente de variacin: se calcula como cociente entre la desviacin tpica y


la media.

C.V = S/Media *100

Вам также может понравиться