Вы находитесь на странице: 1из 15

ESTADISTICA

ESTADISTICA. DEFINICIONES Y CONCEPTOS PREVIOS


I.1. Qu es la Estadstica? La estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos, siempre y cuando la variabilidad e incertidumbre sea una causa intrnseca de los mismos; as como realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones.

I.2 Clasificacin de la Estadstica Desde el punto de vista del anlisis de los datos, podemos clasificar la estadstica en:

a) Estadstica Descriptiva.- Cuando describe, analiza y representa un grupo de datos utilizando mtodos numricos y grficos que resumen y presentan la informacin contenida en ellos. O lo que es lo mismo, cuando los resultados del anlisis estadstico no pretenden ir mas all del conjunto de datos investigados.

b)

Estadstica Inferencial.- Es aquella que apoyndose en el clculo de probabilidades y a partir de datos maestrales, efecta estimaciones, decisiones, predicciones y otras generalizaciones sobre un conjunto mayor de datos.

I.3

Aplicaciones de la Estadstica Las tcnicas estadsticas pueden servir para obtener un conocimiento amplio sobre la realidad socio econmica en la que se desempea una persona dedicada a la administracin y gestin de recursos materiales y humanos, as por ejemplo:

i)

Recursos Humanos.- Para una seleccin adecuada del personal, se suele usar test de aptitudes y conocimientos deseables en la persona a contratar. Las tcnicas descriptivas son instrumentos adecuados para el tratamiento de las puntuaciones numricas alcanzados en dichos test.

ii)

Marketing.- Los estudios de mercado dirigidos al conocimiento de la demanda de productos, productos competidores, efectos de campaas publicitarias, etc., tienen una gran ayuda en las tcnicas estadsticas, las cuales permiten inferir valores de parmetros poblacionales a partir de la informacin muestral, considerando un cierto grado de incertidumbre, la cual puede ser cuantificada en trminos de probabilidad.

iii)

Educacin.- Para quienes estn dedicados al quehacer educativo, la estadstica se constituye en herramienta fundamental para el anlisis de los factores y variables que inciden en el acto educativo y que permiten aplicar los correctivos necesarios para analizar, por ejemplo, los ndices de analfabetismo, desercin escolar, de rendimiento, de desaprobacin de asignaturas, de repeticin, etc.

I.4

Conceptos Bsicos Establecemos a continuacin algunas definiciones y conceptos bsicos, fundamentales para el trabajo estadstico, a los cuales haremos referencia continua.

Individuos o elementos.- Personas objetos que contienen cierta informacin que se desea estudiar.

Poblacin.- Conjunto de individuos o elementos que cumplen ciertas propiedades comunes. Esta puede ser: Poblacin finita.- Cuando el nmero de individuos o elementos puede ser asociado o relacionado uno a uno con un subconjunto de los nmeros naturales.

Poblacin Infinita.- Cuando el nmero de individuos esta asociado con un proceso que se repite un nmero indefinido de veces.

Muestra.- Es un subconjunto representativo de una poblacin.

Parmetro.- Funcin definida sobre los valores numricos de caractersticas medibles de una poblacin.

Estadstico.- Funcin definida sobre los valores numricos de una muestra.

Ejemplo: Si se considera la poblacin formada por todos los estudiantes de secundaria del colegio Vctor M. Maurtua , de la que queremos medir la caracterstica medible altura, entonces: La altura media de todos los estudiantes es un parmetro que denotaremos por cuyo valor en particular r puede ser

=1,63m.

El conjunto formado por los estudiantes del 2do. Ao del colegio mencionado es una muestra de dicha poblacin y la altura media de esta muestra es un estadstico, que denotaremos por x, cuyo valor en particular puede ser x =1,60m

Caracteres.- Propiedades, rasgos o cualidades de los elementos de la poblacin. Estos caracteres pueden dividirse en cualitativos y cuantitativos.

Modalidades.- Diferentes situaciones posibles de un carcter. Las modalidades deben ser a la vez exhaustivas y mutuamente excluyentes. (Cada elemento posee una y solo una de las modalidades posibles).

Clases.- Conjunto de una o ms modalidades en el que se verifica que cada modalidad pertenece a una y slo una de las clases.

I.5

Variables Estadsticas En estadstica, cuando hablamos de variables, hacemos referencia a un smbolo tal como: X, Y, A, B, ... Que se refiere a un carcter y puede tomar cualquier modalidad de un conjunto determinado, que llamaremos dominio de la variable o rango.

Clasificacin de las variables En funcin del tipo de dominio, las variables se clasifican del siguiente modo.

a) Variables cualitativas o atributos.- Cuando las modalidades posibles son de tipo nominal.

Ejemplo: Sea la variable A: color Esta puede tomar, por ejemplo, seis modalidades Rojo oscuro, azul oscuro, verde oscuro Rojo claro, azul claro, verde claro Es claro que A es una variable de tipo cualitativa, que toma seis modalidades y que puede agruparse en dos clases: Color oscuro, Color claro

b) Variables Cuasi cuantitativas.- Son las que, aunque sus modalidades sean de tipo nominal, es posible establecer un orden entre ellas.

Ejemplo: Si en una competencia de veinte participantes, se estudia la llegada a la meta de los corredores. Su clasificacin C ser una variable cuasicuantitativa con veinte modalidades (en el caso de que todos llegaran a la meta) y existe un orden implcito entre ellos:

{1ro., 2do., 3ro., . . . ,19vo., 20vo.}

Una posible agrupacin en clases de esta variable es: Subir al podium = {1ro., 2do., 3ro.} No subir al podium = {4to.,5to., . . . , 20vo.} Obviamente existe una ordenacin natural.

c)

Variables Cuantitativas.- Son las que tienen cantidades numricas (valores) por

modalidades con las que podemos hacer operaciones aritmticas. Dentro de este tipo de variables podemos distinguir dos grupos:

i.

Discretas.- Cuando las modalidades son valores numricos enteros (0,1,2,3, ...) no admitiendo siempre una modalidad intermedia entre dos cualesquiera de ellas.

Ejemplo: El nmero de hijos, X, de una familia. Es evidente que cada valor de la variable X

{0,1, 2,3,L} es un nmero natural.

En este caso los valores coinciden con el concepto de modalidad y clase (cada clase est constituida por una nica modalidad). Tambin podramos haber definido dos clases: Familias numerosas, Familias no numerosas.

ii.

Continuas.- Cuando las modalidades del carcter son todas las clases de valores posibles definidas por los extremos de clase. En este caso, se verifica que entre dos modalidades cualesquiera siempre existen modalidades intermedias.

Ejemplo: La variable altura, X, de un grupo de personas, es una variable continua, puesto que esta toma valores que estn entre la altura de la persona mas baja y la altura de la persona mas alta. Notemos que los valores de la variable son nmeros reales.

MEDIDAS DE TENDENCIA CENTRAL


(Medidas de Posicin de Localizacin) Definicin.- Son "Valores Numricos" (estadgrafos), que representan la tendencia de todo el conjunto de datos estadsticos. Son los promedios valores alrededor de los cuales se agrupan todos los dems. Clases de Medidas de Tendencia Central Las medidas de tendencia central ms conocidas importantes son: 1.- La Media Aritmtica 2.- La Mediana 3.- La Moda y otos como: Cuartiles, Deciles y Percentiles.

LA MEDIA ARITMTICA

Definicin.- Es el promedio de los valores observados de la variable. Es el centro de gravedad de la distribucin.

Clculo de la Media Aritmtica ( x ) PARA DATOS SIN TABULAR (Datos no Agrupados). La ( x ) se calcula dividiendo la suma de los valores de la variable entre el nmero de observaciones. Si x1 ; x 2 ; x3 ; . ; x N son los valores de las N variables, entonces la Frmula es:

x!
Ejemplos:

xi
N

1. La estatura de Los integrantes de un equipo de Basket son: 1,69; 1,72; 1,81; 1,75; 1,83; mt. Encontrar la talla promedio de los citados jugadores. Resolucin: Aplicando la frmula: x!

xi
N

1,69  1,72  1,81  1,75  1,83 8,8 ! ! 1,76 5 5

Rpta: La talla promedio de los 5 jugadores es 1,76 mt.

2. Hallar ( x ) de la serie: 5;5;5;7;7;8;8;8;8 Resolucin: Observamos que el valor 5 se repite 3 veces, el valor 7 se repite 2 veces y el valor 8 se repite 4 veces, entonces la media ser: x! 5 3  7 2  8 4 15  14  32 61 ! ! } 6,8 9 9 9

Rpta.: La media aritmtica de la serie es 6,8 La media aritmtica as calculada se llama "Media Aritmtica Ponderada" el ejemplo clsico de ponderacin se refiere al llamado "coeficiente" "peso" en ciertos exmenes, por ejemplo: En un examen las pruebas presentan los siguientes coeficientes ( y y y Prueba Oral (3) Prueba Escrita (2) Prctica (1)

f)
i

Si las calificaciones obtenidas por un alumno son: -Prueba Oral (09)

-Prueba Escrita (12) -Prctica (14) Aplicando la ponderacin, la nota promedio" ser:

x!

09 3  12 2  14 1 ! 27  24  14 ! 65 $ 10,8 } 11
6 6 6

Rpta.: La nota promedio es 11 FORMULA DE LA MEDIA ARITMETICA PONDERADA

x!
Ejemplo:

x f
i i

3. Las notas finales de un estudiante en Matemtica, Qumica, Ingles y Educacin Fsica son respectivamente: 11, 13, 12, y 15. Si la importancia que se asigna a estas asignaturas es de 4, 3, 2 y 1 respectivamente. Determinar el promedio ponderado. Resolucin: Ordenando los datos en una TABLA, tenemos:

Asignaturas

Notas xi 11 13 12 15

Ponderacin 4 3 2 1 10

x f
i

Matemticas Qumica Ingles Ed. Fsica

44 39 24 15 122

Aplicando la Frmula:

x!
PARA DATOS TABULADOS

x f ! 122 ! 12,2
i i

10

Tabla de datos cuantitativos discretos (sin intervalos) (Se usa la frmula de la x Ponderada)

x!

x f
i i

N
6

Tabla de datos cuantitativos continuos (con intervalos) En la parte de la Media Aritmtica a partir de tabla con intervalos se usa la Mcl. (Marca de clase) para reportar el valor de cada elemento incluido en su respectivo intervalo. Las frmulas a usar son: I) METODO PONDERADO
k

f Mcl
x!
i !1

Donde: f : frecuencia Mcl : marca de clase de cada intervalo

II) METODO ABREVIADO


k

f d
x ! A
i !1

C ; donde d !

Mcl  A C

Donde:

A : Marca de clase del intervalo de mayor frecuencia


Z d : Desviacin con respecto a " A " (N1 Z diferenciados en una unidad). N : Suma de frecuencias C : Tamao amplitud del intervalo de clase. Ejemplo: 4. La siguiente muestra corresponde a los pesos (en Kg.) de un grupo de estudiantes. Elabore la TDF y hallar la media aritmtica por los dos mtodos. 44 45 50 46 47 41 47 46 51 46 56 46 47 45 53 68 53 55 54 46 47 61 51 47 51 52 59 58 62 49 65 46 45 47 58 47 50 53 49 54 63 49 51 45 40 57 50 53 42 49 N=53 Resolucin: 11 Segn la frmula de H. STURGES. k ! 1  3,3 log N 61 50 53

k ! 1  3,3 log 53 ! 1  3,3 ,7242 ! 1  5.68986 } 6,69 1


k ! 7 (Tabla con 7 intervalos de clase). 21 R ! M m R ! 68  40 ! 28 R ! 28

31 41

C!

R k

C!

28 !4 7

C!4 D ! 28  28 ! 0

D ! kC  R , entonces D ! 7 4  28

(" k " y " C " son nmeros satisfactorios para elaborar la tabla). Intervalo de clase (peso en Kg) <40-44> 44-48 48-52 52-56 56-60 60-64 64-68 N1 de alumnos f 3 18 12 9 5 4 2 53 L L
i

Mcl. 42 46 50 54 58 62 66

f*Mcl 126 828 600 846 290 248 132 2710

D -1 0 1 2 3 4 5

f*d -3 0 12 18 15 16 10 68

Mcl !

40  44 84 ! ! 42 2 2

A ! 46 (Marca de clase del intervalo de mayor frecuencia) d! Mcl  A C d! 42  46 ! 1 4

C!4 I) Mtodo Ponderado


k

II) Mtodo Abreviado


k

f Mcl
x!
x!
i !1

f d
x ! A
i !1

C N 68 v 4 } 46  5,13 ! 51,13 Kg. 53

2710 } 51,13 Kg 53

x ! 46 

Importancia de la x .- Es importante porque: -La x es el centro de la gravedad de la distribucin -Es la medida de tendencia central ms estable -Es el valor preferido en los clculos estadsticos por ser el ms fiable -Es el promedio que representa mejor al grupo. LA MEDIANA (Md) Definicin.- Es el valor que divide al total de las observaciones distribucin en dos partes iguales. Esto significa que cada parte equivale al 50% del total de datos. Clculo de la Mediana

DATOS SIN TABULAR Si x1 ; x 2 ; x3 ; - ; x n son los datos muestrales o poblacionales tales que x1 e x 2 e x3 e - e x n (se ordena la serie en forma ascendente descendente). Se presentan dos casos.

; Si n es impar x n1 2 Md ! 1 x  x ; Si n es par 2 n2 n 2 2

CUANDO EL N1 DE DATOS ES IMPAR: La Mediana ser el dato que ocupa el centro de la serie distribucin. Ejemplo: 5. Determinar la mediana de los datos siguientes. 7, 19, 20, 16, 18, 9, 12 Resolucin: Tenemos que n ! 7 (nmero impar), luego: Md ! x
n 1 2

!x

7 1 2

!x !x
8 2

Ordenamos los datos de menor a mayor:

q
x
1

12

16

18

19

q
x
2

q
x
3

q
x
4

q
x
5

q
x
6

20

q
x
7

Md = 16 Porque ocupa el Trmino Central de la Serie. CUANDO EL N1DE DATOS ES PAR:

La Mediana es igual al promedio de los Valores Centrales. Ejemplo: 6. Determinar la mediana de los datos siguientes. 15, 13, 12, 9, 19, 7, 17, 16 Resolucin: Ordenando, tenemos que:

q
x
1

12

13

15

16

17

19

q
x
2

q
x
3

q
x
4

q
x
5

q
x
6

q
x
7

q
x
8

Aqu n ! 8 (nmero par), luego:

Md !

1 1 1 1 1 x n  x n  2 ! x 8  x 8  2 ! x 4  x5 ! ?  15A! v 28 ! 14 13 2 2 2 2 2 2 2 2 2

q
x1

12

13

15

16

17

19

q
x2

q
x3

q
x4

q
x6

q
x7

q
x8

14

x5

Md = 14 Note que en el caso de un nmero de datos impar, la mediana no pertenece al conjunto de datos. Ejemplo: 7. Los sueldos de 6 trabajadores son: 300, 400, 500, 250, 400, 600 nuevos soles Cul es la mediana de los sueldos? Resolucin: Ordenando, tenemos que: 250 300

q
x
1

q
x
2

400

q
3

400

500

600

q
4

q
x
5

q
x
6

Aqu n ! 6 (nmero par), luego: Md ! 1 1 1 1 1 x n  x n  2 ! x 6  x 6  2 ! x3  x 4 ! ?400  400A! v 800 ! 400 Nuevos soles 2 2 2 2 2 2 2 2 2

Interpretacin: Significa que del total de trabajadores que son 6, hay tres de ellos o sea el 50% tienen sueldos inferiores a S/.400 y el otro 50% tienen sueldos superiores a S/.400. DATOS TABULADOS: Se presentan dos casos, segn que los datos se distribuyan en TDF sin intervalos (datos discretos) y TDF con intervalos (datos continuos). Tabla sin intervalos Las frmulas a emplear son: 1. Si N no coincide con algn 2

Fi o , entonces:

Md ! X

Donde

Fi o es la menor frecuencia acumulada que supera por primera vez a


N coincide con 2

N 2

2.

Si

F o , entonces:
j 1

Md !

X j 1  X j 2

Ejemplo: 8. Dada la siguiente tabla de datos discretos:

10

Xi f
i

25 13

35 9

55 22

65 19

75 16

85 12

95 10

Determinar la mediana de los datos. Resolucin:

X
i

Fo
i

Usando la condicin 2.

25 35 55 65 75 85 95

13 14 23 15 16 12 7 100

13 27 50 65 81 93 100
100 2

!F o
4 1

Entonces la mediana es:

X X Md !
3 4

55  65 ! 60 2

Ejemplo: 9. Dada la siguiente tabla de datos discretos:

X
i

15 10

28 13

33 20

46 17

58 16

65 12

82 10

Determinar la mediana de los datos. Resolucin:

Xi
15 28 33 46 58 65 82

fi
10 13 20 17 16 12 10 98

Fi o
10 23 43 60 76 88 98
98 2

Usando la condicin 1.

" F o! 43
41

Entonces la mediana es:

Md ! X 4 ! 46

Este valor de la mediana supera a 43 observaciones que no es ms de la mitad de los datos y es superado por 98 60 = 38 observaciones que tampoco es ms de la mitad. Tabla con intervalos Clase Mediana.- Es el intervalo de clase cuya frecuencia absoluta acumulada alcanza la mitad del nmero total de datos o supera por primera vez esa mitad. Las frmulas a emplear son:

11

Si

N no coincide con algn 2

F o , entonces la mediana esta dada por:


m
N 2

Md ! Lm  C m
Donde:

 Fm 1 fm

: Lmite inferior de la clase mediana : Ancho de clase de la clase mediana : Nmero total de datos : Frecuencia absoluta de la clase mediana

C
m

N f
m

Fm 1 : Frecuencia absoluta acumulada hasta la clase inmediata anterior a la clase mediana


Si N coincide con 2

F o entonces :
m1

Md ! Lm
Ejemplo: 10. Hallar la mediana del ejemplo 4 anterior. Resolucin: PESO Kg. (X) N1 DE ALUMNOS

Ii

Fo
i

?40  44?
Lm

3 18 12

3 21 33

m 1

?44  48? ?48  52?


C l a s e M e d i a n a

?52  56?

9 5 4 2 53

42

?56  60? ?60  64? ?64  68A

47 51 53

12

Se halla

N 53 ! ! 26,5 No coincide con algn F o ; Tambin: C ! 52  48 ! 4 m 2 2


N 2

Se aplica la frmula:

Md ! L  C m m

F f
m

m1

! 48  4 26,5  21 ! 48  1,83 ! 49,83 Kg. 12

Interpretacin: El 50% de estudiantes en dicha distribucin tienen pesos menores a 49,83Kg y el otro 50% sus pesos son mayores a 49,83Kg. Importancia de la (Md): Es importante porque: y Da a conocer el punto medio exacto de distribucin o sea el punto correspondiente al 50% de la serie; cuando entre los datos hay valores extremos, ya que estos afectan el valor de la media aritmtica. y Los valores extremos no la alteran. LA MODA (Mo) Definicin.- Se define como el valor que se presenta con mayor frecuencia en una serie distribucin de datos. O tambin, la moda localiza el valor cuya frecuencia es mxima. La moda no siempre existe y si existe no siempre es nica. Un conjunto de datos que tiene dos modas, se llama bimodal; si tiene tres modas, se llama trimodal; etc. Clculo de la Moda DATOS NO TABULADOS o NO CLASIFICADOS Si

x ; x ; x ; - ; x es un conjunto de datos, tales que x


1 2 3 n

x , entonces la moda es el
n

dato que se repite con mayor frecuencia. Ejemplo: 11. Determinar la moda del conjunto de datos Resolucin: Ordenando los datos:

_ ;7;6;6;9;16;14;6;6;7;11a 4

4;6;6;6;6;7;7;9;11;14;16 6 (Se repite 4 veces), por lo tanto: Mo ! 6

Vemos que el valor que ms se repite es:

DATOS TABULADOS o CLASIFICADOS Tabla sin intervalos Es una tabla de frecuencia sin intervalo de clase. La Moda es el dato que tiene la mayor frecuencia de la tabla.

Ejemplo:

13

12. Determinar la moda de los datos de la tabla siguiente:

X
i

9 12 15 18 21 24

26 34 21 48 31 17

Resolucin:

Xi
9 12 15 Moda 18 21 24

fi
26 34 21 48 31 17 Mayor Frecuencia

Luego: Mo = 18 Tabla con intervalos Si el Polgono de Frecuencias correspondiente tiene un solo mximo (mximo absoluto), se dice que la distribucin es unimodal. Si tiene ms de un mximo (mximos relativos), se dice que la distribucin es multimodal (Bimodal, Trimodal, etc) Clase Modal.- Es aquel intervalo de clase que contiene la frecuencia mxima. Para hallar la Moda en una tabla con intervalo de clase se aplica la siguiente frmula:

( 1 Mo ! LMo  C Mo ( ( 1 2
Donde:

Mo

: Lmite inferior de la clase Modal (Intervalo de clase que tiene la mayor frecuencia). : Ancho de clase de la clase Modal.

C
Mo

(1 ! f Mo  f Mo1 : Diferencia de la frecuencia simple de la clase modal y la frecuencia de la


clase inmediata Inferior.

14

( ! f
2

Mo

f

Mo 1

: d2 = Diferencia de la frecuencia de la clase modal y la frecuencia de la clase inmediata superior.

Del ejemplo anterior tenemos:

PESO (Kg.)

N1 DE ALUMNOS (

Ii

f)
i

Mo

?40  44 ?44  48
C l a s e M o d a l

13 18 12 9

f f f

Mo 1

Mo

?48  52 ?52  56 ?56  60 ?60  64 ?64  68A

Mo 1

C
Mo

! 48  44 ! 4

5 4 2

(1 ! 18  13 ! 5 ( 2 ! 18  12 ! 6

Reemplazando en la frmula tenemos:

Mo ! L

Mo

( 1 ! 44  4 5 ! 44  20 ! 504 } 45,82 Kg. C Mo (  ( 11 11 5 6 2 1

Interpretacin: En dicha distribucin la mayora de estudiantes tienen un peso aproximado de 45,82Kg. Importancia de la (Mo): Es importante porque: Da a conocer en forma inmediata que dato (puntaje, peso, talla, etc.) es el ms frecuente. Observaciones: 1.- La Moda no siempre existe en una distribucin de frecuencias. 2.- Puede existir 2 ms Modas para una distribucin de frecuencia.

15

Вам также может понравиться