Вы находитесь на странице: 1из 45

1

ESTADSTICA

Qu es la Estadstica? Procedimientos para clasificar, calcular, analizar y resumir informacin numrica que se obtiene de manera sistemtica. Proporcionan informacin emprica para la toma de decisiones.
* Conseguir los nmeros de manera estructurada, ordenada. * Emprica (comprobable). * Tomar buenas decisiones para intervenir en lo social.

Fenmenos Determinstico y No Determinstico

Fenmenos Determinstico: Siempre se conoce el resultado, porque hay una respuesta posible (no hay ms opciones). Fenmenos no Determinstico: Son aquellos aleatorios o de aza, no se pueden anticipar sus efectos o resultados. (Estadstica).

Las Variables

Una variable es una propiedad que puede variar y cuya variacin es susceptible de medirse u observarse. Ejemplo: Variable: Sexo Valores de la variable: a) Mujer b) Hombre. Variable: Edad Valores de la variable: 20, 30, 40, 50 aos

Clasificacin de las variables:

1 Criterio: Segn su naturaleza.

CUALITATIVAS

CUANTITATIVAS

El nmero es artificial El nmero es real Es solo para codificar, nombrar, ordenar. Las variables se expresan mediante cantidades numricas. Ejemplo: Estado Civil. Ejemplo: N de dormitorios: 1, 2, 3 1) Soltera 2) Casada 3) Divorciada

* Para cada uno hay una formula. Ejemplo en la Cuantitativa puedo sacar promedios, en la cualitativa no. * Cualitativas: Son identificatorios.

2 Criterio: Segn sus valores (solo para cuantitativas). DISCRETA O CATEGRICA CONTINUA

Sus valores no admiten fraccionamiento Variables que en sus valores pueden (nmeros enteros) tener nmeros decimales o fracciones. Ejemplo: Cantidad de miembros de la Ejemplo: Peso, talla, ingresos. familia

3 Criterio: Nivel de Medicin de la Variable:

CUALITATIVAS Nominales
Los valores no tienen orden ni jerarqua

CUANTITATIVAS Intervalar
Por lo general son respuestas abiertas.

Ordinales
Las Categoras mantienen un orden y jerarqua. Nivel Educacional: 1) Sin escolaridad. 2) Pre-bsica. 3) Bsica. 4) Media 5) Superior

Razn
El cero es real, es decir que el cero implica ausencia de esa variable Esta clasificacin es ms comn para las ciencias sociales.

El nmero categorizar es identificatorio.

para solo

Ejemplo Sexo 1) 2)Hombre

mujer

El cero es arbitrario, es decir, es un valor ms, no implica que haya ausencia de la variable. Se puede hacer operaciones aritmticas bsicas Ejemplo: 0 La temperatura, existe hace frio.

Ejemplo: 0, no tiene hijos

Estado Civil: 1) Soltero 2) Casado

Ejercicio en Clases: Clasifique las variables segn los 3 criterios vistos. RUT 16.646.949-0 10.947.833-3 18.938.745-0 EDAD 20 33 96 76 26 32 Cuantitativa, continua, razn. Continua, porque hay meses y das asociado a los aos (no es un numero entero). PROVINCIA a) Valparaso b) Marga-Marga c) San Antonio d) Los Andes e) San Felipe f) otro Cualitativa, nominal.

Cualitativa, ordinal (tiene un orden)

Aplicando un cuestionario a 27 personas obtengo los siguientes datos: Cul es su sexo? 1) Hombre 2) Mujer N = Total FRECUENCIA ABSOLUTA Ni: Es la cantidad de casos por cada categora. Sexo Mujer Hombre Total (N) Ni 15 12 27

* Es la frecuencia que existe por cada categora * Conteo de casos por cada una de las categoras. * N: Significa poblacin, en este caso el total.

FRECUENCIA RELATIVA (Pi = Ni/N): Es la proporcin de la frecuencia absoluta con respecto al tamao de la muestra. Sexo Mujer Hombre Total (N) Ni 15 12 27 Pi 15/27= 0.6 12/27= 0.4 27/27= 1 % = Pi * 100 60% 40% 100%

La frecuencia relativa es Pi, para lograr el Pi debo dividir el Ni (Frecuencia absoluta) con el N total y anotarlo al lado. Para lograr el porcentaje, debo tener el resultado de Pi y multiplicarlo por 100. Pi = Ni/N divido cada Ni por el total N. El Pi en la ltima tabla siempre debe terminar en 1 y 1*100= 100% de los casos.

5
* Esta tabla me sirve para analizar una variable cualitativa nominal. Con esta variable llego hasta ac en la tabla (hasta el Pi *100) y puedo hacer un grafico pero nada ms, no puedo hacer la siguiente tabla con la variable cualitativa nominal. * Con la variable cualitativa ordinal (que viene ms abajo) puedo avanzar ms en la tabla como se muestra a continuacin.

FRECUENCIA ACUMULADA NIA: Son las frecuencias que se van acumulando (sumando) en cada categora, desde arriba hacia abajo. Se ocupa cuando hay una Variable Cualitativa Ordinal.
Asistencia Nunca A veces Siempre Total (N) Ni 20 30 10 60 Pi 20/60=0.3 30/60=0.5 10/60=0.2 60/60= 1 % (Pi*100) 30% 50% 20% 100% Nia 20 50 60 Pia 0.3 0.8 1 %a 30% 80% 100%

Nia Frecuencia absoluta acumulada: Implica acumular la categora. Se obtiene por ejemplo en la primera tabla de Nia poner el numero de Ni en este caso 20, luego ese 20, lo sumo por el Ni que viene a continuacin en este caso es 30, me da resultado 50, que pongo en la segunda fila de la tabla Nia, luego a ese resulta do, le sumo el de la tercera fila del Ni, en este caso 10. Entonces 50+10 es 60, ese resultado lo pongo en la tercera fila de Nia Y ESO ES. Pia Frecuencia relativa Acumulada: En la primera tabla de Pia copio el resultado de la primera tabla de Pi, en este caso 0.3, a este nmero le sumo el resultado de la segunda tabla de Pi, en este caso 0.5, como resultado me da 0.8 que pego en la segunda tabla de Pia, a este 0.8 le sumo el resultado que sigue de la tabla de Pia, 0.2 y el resultado de 0.8+0.2 es 1. (Siempre debe dar 1). %a: Porcentaje Acumulado: Mismos pasos anteriores pero con la tabla de porcentaje.

EJERCICIO EN CLASES

Frente a la variable: Nivel de Escolaridad. a) Sin Escolaridad. b) Educacin Bsica c) Educacin Media d) Educacin Superior. Aplico un cuestionario a 30 personas obteniendo los siguientes resultados.

acaabbaabcccbbdbbbcbbbcbbcbdbb
a) 5 b) 16 c) 7 d) 2
Escolaridad

Ni 5 16 7 2 30

Pi (Ni/N) 5/30= 0.167 16/30=0.533 7/30=0.233 2/30=0.067 1

% (Pi*100) 16.7% 53.3% 23.3% 6.7% 100%

Nia 5 21 28 30

Pia 0.167 0.7 0.933 1

%a 16.7% 70 93.3% 100

Sin escolaridad

Ed. Bsica Ed.Media Ed.Superior Total (N)

* Siempre trabajar con 3 decimales, en caso de por ejemplo obtener este resultado: 0.16666666 (infinito), el tercer decimal, si es mayor a 5, aproximarlo, en este ejemplo quedara 0.167.- Otro ejemplo 1.77777777, 0.178. Si por ejemplo quedara 0.33333333, es 0.33, ya que el decimal infinito es menor a 5.

Grafico de Barras o Diagrama de Barras: Corresponde a barras rectangulares proporcionales a su frecuencia. Idealmente se usa para variables nominales y ordinales. Ejemplo de Grfico de Barras (ideal para variables cualitativas).
120

100

80

60

110

40 67 20

62,15%

37,85%

0 Femenino Masculino

* Al ser variables cualitativas las barras deben ser separadas.

GRAFICO DE SECTORES: Un grafico representa el 100% de los casos lo que a 360. Ideal para variables cualitativas o de pocas categoras. Masculino 62% Femenino 38% Masculino: Femenino: 100% = 360 100% = 360% 62% = X 38% = X X = 223 X = 127 * Se multiplica 62*360 y se divide por 100, * Se multiplica 38*260 y se divide por 100, as se obtiene el resultado de X. as se obtiene el resultado de X.

Gnero
223 137 Femenino Masculino

* Otra frmula: La torta siempre es 3.6 (dividir 360/100), como la torta siempre va a ser 3.6 de inmediato lo multiplico. Ejemplo de lo anterior 3.6*62= 223 (hombre) 3.6*38= 137 (mujer)

PICTOGRAMAS: Se utilizan proporcionados a la frecuencia. Generalmente se emplea para representar variables cualitativas.

TABLA DE CONTINGENCIA: Puede ser para cualquier variable. Sexo donante Hombre Mujer Total Si 10 18 28 No 15 12 27 Total 25 30 55

DONANTES
30 25 20 15 10 5 0 Hombre Mujer Si No

10

ESTADSTICA

TABLA DE FRECUENCIA PARA VARIABLE DISCRETA: Elaboracin de Intervalos (para datos numricos no agrupados). Ejemplo: Cantidad de votantes en cada Junta de Vecinos de una provincia. 3-10- 3-20-35-45-8-5-7-35-6-56-45-45-7-19-12-34-67-8-7-6 -12- 34- 6- 18- 38- 6- 18- 38- 665- 54- 43-2-4-24-17-15-13-7-8-8-5-7-9 AT= Amplitud Total

1.- Determinar la amplitud Total: AT= (mxima mnima) + 1 unidad Ejemplo: (67 - 2) + 1 = 66

2.- Determinar el ancho del intervalo: i = AT/N de intervalo. Ejemplo: 66/5 = 13,2 = 14 14. Siempre debemos subir a un entero, nuestro ancho va a ser

3.- Confeccionar los Intervalos: Para el primer intervalo Lmite Inferior (Li) = el valor mnimo. En este caso 2. Al Li se le suma (i 1) = 15.13

Entonces Li= 2 y Ls = 15 La distancia entre cada uno es 13.

11

Variable Discreta, limites aparentes (porque son nmeros enteros). Li 2 16 30 44 58 Ls 15 29 43 57 71

Ahora confecciono Tabla:

Li 2 16 30 44 58 N

Ls 15 29 43 57 71

Ni 25 5 6 5 2 43

Pi 0.581 0.116 0.140 0.116 0.047 1

% 58.1% 11.6% 14% 11.6% 4.7% 100%

Nia 25 30 36 41 43

Pia 0.581 0.697 0.837 0.953 1

%a 58.1 69.7 83.7 95.3 100

Se puede graficar en Grfico de Barras y de Sectores (igual que las cualitativas).

12

TABLA DE FRECUENCIA PARA VARIABLE CONTINUA Elaboracin de intervalos para datos numricos no agrupados. Ejemplo peso en adolescentes: 52,23 67,8 45,32 77,2 76,59 65,73 82 65,68 71,45 60,7 48,25 59,85 63,27 57,5 68,3 73,2 55,74.

1.- Determinar la amplitud total: AT = (mxima mnima) + 1 unidad AT = (82 - 45,32) + 0,01 = 36,69

Unidad 1 entero 1 decimal 2 decimales 3 decimales

Le sumo 1 0,1 0,01 0,001

*El decimal depende de cuantos decimales me den en la informacin, en este ejemplo el mayores decimales no sobrepasan los 2.

2.- Determinar el ancho de los intervalos: i = AT/N de intervalos. Ejemplo: 36,69/3 = 12,23 = 13
Nuevamente a numero entero para que no me falte en el intervalo.

3.- Confeccionar los Intervalos: Para el primer intervalo Lmite inferior: mnimo, en este ejemplo 45,32. Lmite superior: mnimo + i (no se resta 1 como el anterior). Entonces: Ls = 45,32 + 13 = 58,32.-

13

Ahora confecciono la tabla: Li 45,32 58,32 71,32 N Ls 58,32 71,32 84,32 Ni 5 7 5 17 Pi 0.294 0.412 0.294 1 % 29.4% 41,2% 29,4% 100% Nia 5 12 17 Pia 0.294 0.706 1 %a 29.4% 70.6% 100%

Variable continua Limites reales Se repite el Ls con el Li siguiente. * Si sale un numero que est en ambos limites (Li Ls) no se cuenta 2 veces, solo se suma en el intervalo del Li.

14

EJERCICIO EN CLASES

Con las siguientes observaciones respecto al porcentaje PSU de un grupo de estudiantes. 455,0 770,56 345,6 654,8 450,3 273,99 457,89 636,90 688,7 623,8 545,8 432,1 564,9 345,9 657,8 456,6 456,34 348,98.Clasifique la Variable: Cuantitativa continua. Elabore una tabla de frecuencia con 3 intervalos. Qu porcentaje tiene entre 439,99 y 605,99 puntos? Respuesta 66.7%

1.- Determinar la amplitud total: AT = (mxima mnima) + 1 unidad. (770,56 273,99) + 0,01 = 496,58.- AT

2.- Determinar el nmero de intervalos: i = AT/N i = 496,58 / 3 = 165,527 = 166.- i.

3.- Confeccionar los intervalos. Li: 273,99 Ls: (mnimo + i) = 439,99 Ahora a elaborar la tabla: Li 273,99 439,99 605,99 N Ls 439,99 605.99 771,99 Ni 5 7 6 18 Pi 0,278 0.389 0.333 1 % 27,8% 38,9% 33.3 100 Nia 5 12 18 Pia 0.278 0.667 1 %a 27.8% 66.7% 100%

15

CLASE N5

Segmento de tallo y hoja. Polgono de frecuencia e Histograma. Ejemplo: 16 40 122 1001. La ltima unidad es la hoja. La profe va a determinar el punto de corte en este caso en unidad. Tallo 1 4 12 100 Hoja 6 0 2 1 ESQUEMA DE TALLO Y HOJA

Cantidad de votantes por Junta de Vecinos: 3-10-3-20-34-45-8-5-7-35-6-56-45-45-7-19-12-34-67-8-7-6-12-34-6-18-38-6-65-54-43-2-424-17-15-13-7-8-8-5-7-9.1.- Ordenar las observaciones de menor a mayor. 2.- Elegimos un nmero de dgitos a la derecha (hojas). Ejemplo 1 digito. 3.- Separamos el nmero y lo que antecede el tallo. 2-3-3-4-5-5-6-6-6-6-7-7-7-7-7-8-8-8-8-9-10-12-12-13-15-17-18-19-20-24-34-34-34-35-3843-45-45-45-54-56-65-67.Tallo 0 1 2 3 4 5 6 Hoja 2-3-3-4-5-5-6-6-6-6-7-7-7-7-7-8-8-8-8-9 0-2-2-3-5-7-8-9 0-4 4-4-4-5-8 3-5-5-5 4-6 5-7

16

HISTOGRAMA

Sirve para variables numricas (cuantitativas) continuas. En el eje vertical se encuentran las frecuencias y en el horizontal las categoras (generalmente en intervalos) Cuando se unen los puntos medios (marca de clase) es un polgono de frecuencia.

Grafico ideal para variables cuantitativas continuas. Van pegadas, porque son variables continuas. El polgono de frecuencia se logra cuando marco el punto medio de la barra.

17

MEDIA ARITMTICA

FRMULAS MEDIA:

1.- Media para datos agrupados:

X = NiMc N

Li Ls 2-4 5-7 8 - 10

Ni 4 3 2 N9

Mc (Li+Ls/2) 3 6 9

Ni * Mc 12 18 18 48/9 = 5,3 (la media)

= Sumatoria X = Promedio Xi = Sumatorio de casos. Mc = Marca de Clases * La media y el promedio aritmtico es lo mismo. * Se le llama datos agrupados porque estn ordenados en intervalos. * El Mc es el punto medio, es como el promedio del intervalo.

Para hacer la tabla: Debo tener listos los intervalos con el Ni. El Mc es la suma de Li + Ls / 2. Por cada intervalo. Luego la segunda tabla debo multiplicar el Ni * Mc y el total dividirlo por el N.

18

Media para datos NO agrupados:

X = Xi N
Ejemplo: 4 + 5 + 5 + 10 = 24 / 4 = promedio = 6 (es por ejemplo cuando saco el promedio de mi nota, sumo todas y despus las divido).

* Depende de la variable si dejo decimal. * Si tengo muchos casos debo hacer intervalos.

EJERCICIO EN CLASES

Li Ls 273,99 439,99 439,99 605,99 605,99 771,99 N

Ni 5 7 6 18

Mc (Li + Ls / 2) 356,99 522,99 688,99

Ni * Mc 1784,95 3660,93 4133.94 9579,82 / 18 = 532,212 (la media)

* Resultado final con 3 dgitos.

19

FORMULA MODA

Para datos no agrupados es el valor que ms se repite. Para datos agrupados:

Mo = Li + i

d1 d1 + d2

1.- Buscar el Intervalo Modal: Donde est el Ni ms alto. Li = Limite real inferior del intervalo modal (si es lmite aparente se le resta 0.5. * Los limites reales son los lmites de la variable continua, a los limites reales se les debe dejar tal como estn. A los que
se les resta el 0.5 son a las Variables Discretas (nmeros enteros).

i = Ancho del intervalo. Ls Li +1 (para variable discreta). d1 = Diferencia (resta) entre la frecuencia absoluta del intervalo modal y del intervalo anterior. d2 = Diferencia (resta) entre la frecuencia absoluta del intervalo modal y del intervalo posterior.

20

Ejemplo: Li Ls 24 5-7 8 - 10 N Ni 4 3 2 9

Li = 1,5. Le rest 0.5 ya que la variable es discreta. i = 3. (Ls Li + 1) o con las manos en las variables discretas parto con el mismo numero 2-3-4 = 3 (hay 3 nmeros). d1 = 4. Se toma el Ni del intervalo modal y se le resta el anterior intervalo. En este caso no hay por eso pongo el mismo. d2 = 4 3 = 1. Se le resta el intervalo de abajo del modal.

AHORA CONFECCIONO LA MODA:

Mo = Li + i

d1 d1 + d2

Mo = 1,5 + 3

4 4+1

Mo = 1,5 + 3 4/5 Mo = 1,5 + 3 * 0.8 Mo = 1,5 + 2,4 Mo = 3.9 = La moda es 3.9.

21

FORMULA MEDIANA

La Mediana indica donde est el dato central (la mitad). El 50% menor a ese dato y el 50% mayor a ese dato. 1.- Identificar el intervalo donde se encuentra la Mediana. N/2. Debo mirar en la Nia. Frmula para datos agrupados:

Me = Li + i Ni

N - Nia 2

Li = Limite real inferior del intervalo de la mediana. Al lmite aparente (variable discreta) se le resta 0.5. Si la variable es continua se deja igual. i = Ancho del intervalo. Ni = Frecuencia absoluta del intervalo de la Mediana. N/2 = Total de casos dividido por 2. Nia = Frecuencia acumulada anterior al intervalo de la Mediana.

* En datos no agrupados se busca el 50% en Nia (deben estar ordenados de menor a mayor).

22

Ejemplo: Variable discreta Li Ls 24 57 8 - 10 N Ni 4 3 2 9 Nia 4 7 9

La mediana es 9/2 = 4,5.- La mediana est en el segundo intervalo, con ese voy a trabajar (intervalo mediana). Se busca donde el 4,5 alcance en la Nia. Li= 4,5. Le rest 0.5 al 5, ya que la variable es discreta. i = 3. Ls Li + 1. La variable es discreta as que puedo hacer esa frmula. Ni = 3. Frecuencia absoluta del intervalo de la mediana. N/2 = 4.5. Total de casos dividido por 2. Nia= 4. Frecuencia acumulada (Nia) anterior a mi intervalo mediana.

Formula:

Me = Li + i Ni

N - Nia 2

Me = 4,5 + 3 3 Me= 4,5 + 3 3

94 2 4,5 -4

Me = 4,5 + 1 * 0.5 Me = 4,5 + 0,5 Me = 5.- La mediana es 5.-

23

Ejercicio: Beneficios Estatales que tienen los Adultos Mayores. Calcule Moda y Mediana. Li Ls 15 6 10 11 - 15 N La variable es discreta Moda El rojo es mi Intervalo Modal porque tiene ms Ni (ms casos). Se trabaja con el NI Moda: Mo = Li + i d1 d1 + d2 Ni 29 28 6 63

Li= 0.5. (La variable es discreta, por lo tanto es Lmite aparente, le resto 0.5). i = 5 (Ls Li +1) porque la variable es discreta. Para la variable continua solo (Ls-Li), no le resto el 1. d1= 29. No le rest nada porque arriba no hay nada es 0. Recordar que en la Moda es el Ni. d2= 1. Resta del 29 y 28 (Ni).

Mo = 0.5 + 5

29 29 + 1

Mo = 0.5 + 5

29 30

Mo = 0,5 + 5 * 0.967 Mo = 0,5 + 4,835 Mo = 5.335 = LA MODA. La mayora de los adultos mayores tienen en promedio 5 beneficios estatales. Como la variable es discreta, debo responder as. Cierro el decimal porque la variable es discreta.

24

Ahora calculo la MEDIANA de la misma tabla anterior. Debo sacar el Nia. Li Ls 15 6 10 11 - 15 N Ni 29 28 6 63 Nia 29 57 63

1.- Identificar el Intervalo donde se encuentra la mediana. Esto se logra dividiendo el N/2. En este caso da como resultado 31.5. Que debo buscarlo en el Nia.

Me = Li + i Ni

N - Nia 2

Li= 5.5. Lmite inferior de la Mediana. Si es variable discreta resto 0,5. i = 5. (Ls Li + 1). Ni = 28. Frecuencia absoluta Ni del intervalo de la mediana. Nia = 29. Frecuencia Acumulada Nia del intervalo anterior de la mediana.

Me = 5.5 + 5 63 29 28 2 Me= 5,5 + 0.179 31.5 29 Me = 5,5 + 0,179 * 2,5 Me = 5,5 + 0, 448 Me = 5,948.- La Mediana es igual a 6 porque la variable es discreta. El 50% de los adultos tienen menos de 6 beneficios estatales y el otro 50% tiene ms de 6 beneficios.

25

GUIA DE TRABAJO EN CLASES

En base a las observaciones de edades de los hijos de mujeres temporeras de la ciudad de Rinconada. Calcule e interprete la MEDIA Y LA MODA. Li Ls 15 59 9 13 13 17 17 21 N Ni 26 25 22 14 8 95 Mc 3 7 11 15 19 Ni * Mc 78 175 242 210 152 857/95=0,921 La media

La variable es continua. LA MEDIA ES 0,921. MODA: Mo = Li + i d1 d1 + d2 Buscar el intervalo modal, donde est el Ni ms alto. Li= 1. Es lmite real porque la variable es continua, si fuera discreta se le resta 0.5. i = 4 (Ls Li). La variable es continua, no se le resta nada. d1 = 26. No hay con que restarlo arriba. d2 = 1.- Resta de 26 25.

Mo = 1 + 4

26 26 + 1

Mo = 1 + 4 26/27 Mo = 1 + 4 * 0.963 Mo = 1 + 3,852 Mo = 4,852.- La mayora de los hijos tiene 4,852 aos.- Se deja en decimal porque la variable es continua.

26

2.- En base a las siguientes observaciones de cantidad de miembros por hogar de las mujeres temporeras de la ciudad de Rinconada, calcule e interprete la media y la mediana. 2-1-3-4-1-10-15-12-2-4-3-4-5-4-3-8-7-6-5-3 La media: 102 / 20 = 5.1= 5 LA MEDIA. Como la variable es discreta. Debo decir que el promedio de miembros por hogar de las temporeras de la ciudad de Rinconada en 5.- Debo cerrar la variable porque es discreta.

LA MEDIANA Para calcular la mediana de datos no agrupados, inevitablemente debo agruparlos en intervalos. Frmula para elaborar intervalos de variables discretas. AT :(15 1) + 1 14 + 1 = 15 i : 15/3 = 5 Ls = Li + (5-1) 1 + 4 = 5 (limite superior del Primer intervalo) La Mediana: Li Ls 1-5 6 10 11 - 15 N Ni 14 4 2 20 Nia 14 18 20

Lo primero que debo hacer es N/2 es 10. Y buscar la mediana en la Nia Me = Li + i Ni N - Nia 2

27

Li= 0,5. Como la variable es discreta le resto 0.5. i = 5. Como la variable es discreta es Ls Li + 1. Ni = 14. Frecuencia absoluta (Ni) del intervalo de la mediana. N/2 = 10. Total de casos dividido por 2. Nia = 0. Arriba de la frecuencia acumulada del intervalo de la mediana NO HAY NADA, por lo tanto es 0. OJO no confundir, no es como la moda que se restan, ac se copia la frecuencia acumulada anterior.

Me = 0.5 + 5 14 Me = 0.5 + 5 14

20 - 0 2 20 2

Me = 0,5 + 0.357 * 10 Me = 0,5 + 3.57 Me = 4,07 = 4 porque la variable es discreta.

El 50% de las personas tiene bajo 4 miembros por hogar y el otro 50% tiene sobre 4 miembros por hogar.

28

FORMULA PERCENTILES (PORCENTAJES)

Pk = Li + i Ni

K*N 100

- Nia
Esta frmula se usa cuando se da el porcentaje (percentil) y se necesita sacar el valor exacto dentro del intervalo.

1 es buscar el intervalo donde est el percentil (se busca en %a). K = Esto es el percentil (porcentaje) que me dan. El resto de la frmula es igual a la Mediana. Li = Limite real inferior del intervalo del percentil (restar 0,5 si es aparente). i = Ancho del intervalo. Ni = Frecuencia absoluta del intervalo del percentil. N = Total de casos. Nia = Frecuencia absoluta anterior a la del percentil.

29

EJEMPLO: Cuntos novios ha tenido el 38% de los casos? N de Novios 13 46 79 10 12 13 15 N Ni 20 40 80 40 20 200 Nia 20 60 140 180 200 % 10 20 40 20 10 100 %a 10 30 70 90 100

* El 38% debo buscar donde me alcanza en el porcentaje acumulado (%a). Frmula: Pk = Li + i Ni K*N 100 - Nia

Li = 6,5 (limite aparente del intervalo del porcentaje i = 3 Ancho del intervalo, variable discreta (Ls Li + 1). Ni = 80, del intervalo del porcentaje. K = 38. Porcentaje que me dan.N = 200, nmero de casos. Nia = 60. Frecuencia acumulada anterior al intervalo percentil.

P38 = 6,5 + 3 80 P38 = 6,5 + 3 80

38 * 200 - 60 100 7600 - 60 100

P38 = 6,5 + 0,038 76 60 P38 = 6,5 + 0,038 * 16 P38 = 6,5 + 0,608 P38 = 7,108 =

Debo dejar numero entero porque la variable es discreta.

Respuesta: El 38% de los casos ha tenido hasta 7 novios.-

30

K=

X Li i N

Ni + Nia * 100

Esta frmula sirve cuando nos dan el valor (dato exacto) y necesitamos sacar el porcentaje.

N de Novios 13 46 79 10 12 13 15 N

Ni 20 40 80 40 20 200

Nia 20 60 140 180 200

% 10 20 40 20 10 100

%a 10 30 70 90 100

QU PORCENTAJE DE CASOS HA TENIDO HASTA 11 NOVIOS?

1 Se ubica el intervalo donde est el valor que me interesa en LOS INTERVALOS. X = 11 (valor que me dan). * Todo lo dems sacar igual al anterior, pero esta vez del intervalo de casos.

K=

11 9,5 * 40 + 140 3 200 * 100

K=

1,5 * 40 + 140 3 200 * 100

K=

0,5 * 40 + 140 200 * 100

K = 20 * 140 200 * 100

31

K = 160 20

* 100

K = 0,8 * 100 K = 80% Respuesta: Las personas que han tenido hasta 11 novios corresponden al 80% del total (mirar en %a).

Ejercitacin en base a edades de los hijos de mujeres temporeras de la ciudad de Rinconada.Li Ls 15 59 9 13 13 17 17 - 21 N Ni 26 25 22 14 8 95 Nia 26 51 73 87 95 % 27,4 26,3 23,2 14,7 8,4 100 %a 27,4 53,7 76,9 91,6 100

Hasta qu edad tiene el 60% de los hijos? Pk = Li + i Ni K*N 100 - Nia

Pk = 9 + 4 22 Pk = 9 + 4 22

60 * 95 51 100 5700 - 51 100

Pk = 9 + 0,182 57 51 Pk = 9 + 0,182 * 6 Pk = 9 + 1,092 Pk = 10,092 aos. El 60% de los hijos tiene hasta 10,092 aos.

32

Los hijos que tienen 18 aos En qu porcentaje se encuentran? Li Ls 15 59 9 13 13 17 17 - 21 N Ni 26 25 22 14 8 95 Nia 26 51 73 87 95 % 27,4 26,3 23,2 14,7 8,4 100 %a 27,4 53,7 76,9 91,6 100

K=

X Li i N

Ni + Nia * 100

K=

18 17 4 95

8 + 87 * 100

K = 0,25 * 8 + 87 95 K = 2 + 87 95 K = 89 95 K = 0,937 * 100 K = 93,7% * 100 * 100

* 100

Los hijos que tienen hasta 18 aos corresponden al 93,7% de los casos.

33

MEDIDAS DE VARIABILIDAD

Indican la dispersin de los datos en la escala de medicin.

Poblacin A: Promedio 19 20 18 20 18 Menor dispersin. Menor variabilidad Mayor homogeneidad

Poblacin B: Promedio 19 22 16 16 22 Mayor dispersin Mayor variabilidad Mayor heterogeneidad.

* Cuando hay tendencia central debemos acompaarlo de una medida de variabilidad. * Cuando saco promedio debo sacar medidas de variabilidad.

EL RANGO Es la diferencia entre la puntuacin mayor y la puntuacin menor. MAX MIN 14 15 16 16 17 20 20 14 = 6 (Rango).

34

LA DESVIACION ESTANDAR O DESVIACION TIPICA

Para datos NO AGRUPADOS:

1.- Se calcula la media (promedio) para la variable. En este ejemplo 6 aos. 2.- Se determina la desviacin de cada dato con respecto a la media. 3.- Se eleva al cuadrado cada desviacin. La media de este caso es 5,7. Pero la Profesora quiere que trabajemos Nmeros enteros en este ejemplo por lo tanto la MEDIA ES 6. X 9 7 6 6 5 4 3 X-X 96=3 76=1 66=0 66=0 5 -6=1 46=2 36=3

3 = 9 1= 1 0 = 0 0 = 0 1 = 0 2 = 4 3 = 9 = 24

* Ac no hay nmeros negativos, los que salgan negativos, hay que cambiarlos a POSITIVOS. Ejemplo en este caso 5 6 = -1.- Debo transformarlo a 1. * Siempre la desviacin tpica va acompaado a la media. 4.- Se obtiene la sumatoria de las desviaciones elevadas al cuadrado. = 24.5.- Se aplica la formula.

S=

35

S= S= Hasta ac se llama Varianza. Cuando aun no aplico raz cuadrada. 7.- Luego saco la raz cuadrada. S= = 1,852.- Esta es la desviacin tpica.

Se interpreta como: Las edades de los casos se desvan, en promedio 1,852 aos, respecto a la media.

La desviacin no debera ser ms del 20% de la media o sino representara una alta dispersin y escasa representatividad de la media. Para verificar si la desviacin est dentro del 20% o es mayor, hay que hacer lo siguiente: X=6 S = 1,852 aos (desviacin tpica). 20% = 1,2 aos. La desviacin tpica debera haber sido como mximo 1,2 aos por lo tanto, no es representativo, porque 1,852 es ms que 1,2.- NO REPRESENTATIVO. Para lograr el 20% se debe multiplicar la media por 0,2.- 6 * 0,2 = 1,2. Hay que sacar el 20% al promedio SIEMPRE.

36

DESVIACIN TPICA

Para DATOS AGRUPADOS: 1.- Se obtiene la marca de clase de cada intervalo. 2.- Se calcula Ni * Mc.3.- Se obtiene la marca de clase elevada al cuadrado Mc. 4.- Se multiplica Ni * Mc. 5.- Se calcula la media (para datos agrupados). En el siguiente ejemplo 12. 6.- Se eleva la media al cuadrado. Ejemplo 12 = 144.7.- Se aplica la formula.

Li Ls 79 10 - 12 13 - 15 16 18 N

Ni 5 4 6 2 17

Mc 8 11 14 17

Ni * Mc 40 44 84 34 202 / 17 = 11,882 (la media)

Mc 64 121 196 289

Ni * (Mc) 320 484 1176 578 = 2558. Sumatoria de todos los Ni * Mc

* Nota: La media la profesora la redonde a 12, ya que quiere que trabajemos con nmeros enteros y en la prueba ella nos dar la media. Al hacer la tabla anterior ya tenemos todo listo, es slo traspasar los datos a la frmula por eso debemos saber bien como hacerla para despus solo traspasar los datos. * Tener presente que el que el promedio X se eleva al cuadrado para traspasar a la frmula, en este caso 12 = 12 * 12 = 144

37

Desviacin Tpica para datos agrupados:

S=

S= S= S= Varianza

S = 2, 544 = DESVIACIN TIPICA.

Ahora debo calcular el 20% para verificar si es representativa. X = 12. S = 2,544 20% = 2,4.- No es representativo, es disperso. Ojo: Para lograr el 20%. Debo multiplicar el promedio (la media) por 0,2.- 12 * 0,2 = 2,4.-

Ejemplo dado en clases: Se supone que los chilenos en promedio tenemos un sueldo de $800.000.X = 800.000.S = 350.000.20% = 160.000.No es representativo porque no debera pasar los 160.000.- y en este caso es casi el doble (350.000.-)

38

COEFICIENTE DE VARIACION

Me sirve para comparar 2 grupos (cual es el ms representativo). Calcule la variabilidad relativa de unos datos con respecto a otros.

Grupo A: Promedio = 4,3 Desviacin tpica de 2,5 CV= 58,1 CV = 2,5 * 100 4,3 CV = 58,1

Grupo B: Promedio = 4,3 Desviacin tpica de 1,2. CV= 27,9 CV = 1,2 * 100 4,3 CV = 27,9

Frmula: CV = S X * 100

La distribucin del grupo B es ms representativo porque tiene menor coeficiente de variabilidad (el de menor valor es SIEMPRE el ms representativo).

39

EJERCICIOS EN CLASES

En base a edades de los hijos de las temporeras de la ciudad de Rinconada. Li - Ls 15 59 9 13 13 17 17 - 21 N Ni 26 25 22 14 8 95 Mc 3 7 11 15 19 Mc * Ni 78 175 242 210 152 857 / 95 = 9,021 La media Mc 9 49 121 225 361 Ni * (Mc) 234 1225 2662 3150 2888 = 10159.

* Nota: La profesora pide trabajar con la media de 9 (entero).

Cul es la desviacin tpica de este grupo? 1.- Calcular la media, y elevarla al cuadrado. 9 = 81.-

S=

S= S= S= Varianza = Desviacin tpica.

X=9 S = 5,093.20% = 1,8.- NO ES REPRESENTATIVO.

40

Calcular el Coeficiente de variacin. * Slo para aprender, ya que no hay otra muestra para compararla. CV = S X CV = 5,093 * 100 9 CV = 56,6 * 100

41

GUIA EN CLASES

1.- En una encuesta para determinar el rendimiento acadmico de los alumnos de Aiep Via del Mar, se les consult por el promedio de notas obtenidos el 1 semestre. Frente a las siguientes notas calcule e interprete: MEDIA, RANGO Y DESVIACION TIPICA. Datos no agrupados, por lo tanto se hace esta tabla: Profesora pide trabajar con media de 5.X 3,4 3,6 4,3 4,4 4,5 4,5 4,8 4,9 4,9 4,9 5,0 5,0 5,1 5,4 5,5 6,5 6,6 1,6 1,4 0,7 0,6 0,5 0,5 0,2 0,1 0,1 0,1 0 0 0,1 0,4 0,5 1,5 1,6 X 2,56 1,96 0,49 0,36 0,25 0,25 0,04 0,01 0,01 0,01 0 0 0,01 0,16 0,25 2,25 2,56 = 11,17

Frmula para datos NO AGRUPADOS:

S=

S=

42

S= S = 0,811 Desviacin tpica. Ahora debo calcular el 20%. =5 S = 0,811 20% = 1 Es representativa.

2.- Frente a los problemas de obesidad en los escolares, se procedi a consultar por los pesos de un grupo de alumnos de 5 bsico, obteniendo la siguiente distribucin. a) Calcule la desviacin tpica. b) Qu porcentaje de escolares pesa hasta 50 Kg? c) El 75% de los escolares Hasta qu peso tienen? RANGO = 3,2 * Profesora da promedio de 43. Li Ls 25,6 35,6 35,6 45,6 45,6 55,6 55,6 65,6 N Ni 10 25 13 5 53 Nia 10 35 48 53 % 18,9 47,2 24,5 9,4 100 %a 18,9 66,1 90,6 100 Mc 30,6 40,6 50,6 60,6 Ni * Mc 306 1015 657,8 303 Mc 936,36 1648,36 2560,36 3672,36 Ni * Mc 9363,6 41209 33284,68 18361,8 =102219,08

Desviacin tpica: Frmula para datos AGRUPADOS.

43

S= S= S= S = 8,925 Desviacin tpica.

Calcular el 20% = 43 S = 8,925 20% = 8,6 No es representativo.

b) Qu porcentaje de escolares pesa hasta 50 Kg? K= X Li i N K= 50-45,6 10 53 K = 0,44 * 13 + 35 * 100 53 K = 5,72 + 35 53 K = 40,72 53 K = 0,768 * 100 = 76,8% * 100 * 100 13 + 35 * 100 Ni + Nia * 100

Los escolares que pesan hasta 50 kilos corresponden al 76,8% de los casos.

44

c) El 75% de los escolares Hasta qu peso tienen?

Pk = Li + i Ni

K*N 100

- Nia

Pk = 45,6 + 10 13 Pk = 45,6 + 0,769

75 * 53 - 35 100 39,75 35

Pk = 45,6 + 0,769 * 4,75 Pk = 45,6 + 3,653 Pk = 49,253.El 75% de los escolares pesa hasta 49,253 kilos.

3.- En relacin a la variable ingreso per cpita. Valparaso Promedio Desviacin Tpica $46780,87 $3450,004 Via del Mar $255600,9 $70089,87 Quilpu $120987 35008,98

a) Es representativo el promedio de ingreso per cpita en la ciudad de Valparaso? = 46780,87 S = 3450,004 20% = 9356,174 El promedio es representativo.-

45

b) Cul de las 3 comunas tiene la distribucin ms representativa? Valparaso CV = 3450,004 * 100 46780,87 CV = 0,074 * 100 CV = 7,4 Via del Mar CV = 70089,87 * 100 255600,9 CV= 0,274 * 100 CV = 27,4 Quilpu CV = 35008,98 * 100 120987 CV = 0,289 * 100 CV= 28,9

Valparaso tiene la distribucin ms representativa.

Вам также может понравиться