Вы находитесь на странице: 1из 35

1

Una compaa desea hacer predi cciones del val or anual de sus ventas

total es en cierto pa s a parti r de la rel acin de stas y l a renta nacional.


Para i nvestigar la rel aci n cuenta con los si guientes datos:

189

190

208

227

239

252

257

274

293

308

316

402

404

412

425

429

436

440

447

458

469

469

X representa l a renta naci onal en mil lones de euros e Y representa l as


ventas de la compa a en mi les de euros en el periodo que va desde 1990
hasta 2000 (ambos inclusi ve). Cal cul ar:
1

La recta de r egr esi n de Y sobre X.

El coefici ente de corr elacin lineal e i nterpretarl o.

Si en 2001 la renta naci onal del pa s fue de 325 mill ones de euros. Cul ser l a

predi ccin para las ventas de l a compa a en este ao?


S olucin
2

La i nformaci n estad sti ca obteni da de una muestra de tamao 12 sobre

l a rel acin exi stente entre l a i nversi n real izada y el rendimiento obteni do
en cientos de mil es de euros para explotaci ones agr colas, se muestra en el
si guiente cuadro:

Inversin
(X)

11

14

16

15

16

18

20

21

14

20

19

11

Rendimient
o (Y)

10

10

Cal cul ar:


1

La recta de r egr esi n del rendimiento respecto de l a i nver si n.

La previ si n de inversin que se obtendr con un rendimiento de 1 250 000 .


S olucin
3

El

nmero

de

horas

dedi cadas

al

estudi o

de

una asi gnatura y

cali fi cacin obteni da en el examen correspondiente, de ocho personas es:

la

Horas (X)

20

16

34

23

27

32

18

22

Calificacin (Y)

6.5

8.5

9.5

7.5

Se pi de:
1

Recta de regresi n de Y sobre X.

Cal ifi caci n estimada para una persona que hubi ese estudi ado 28 horas.
S olucin
4

En l a tabl a si guiente se indi ca l a edad (en aos) y l a conducta agresi va

(medida en una escal a de cero a 10) de 10 ni os.

Edad

6.7

7.4

7.9

8.2

8.5

8.9

Conducta agresiva

Obtener l a recta de regresin de la conducta agresi va en funci n de l a edad.

parti r

de

di cha

recta,

obtener

el

val or

de

la

conducta

agresi va

que

corresponder a a un ni o de 7.2 aos.


S olucin
5

Los val ores de

dos vari abl es X e Y se di stri bu yen

segn

la tabl a

si guiente:

Y/X

Se pi de:

100

50

25

14

18

22

Cal cul ar la covarianza .

Obtener e interpretar el coefi ci ente de corr elacin lineal .

Ecuaci n de la recta de r egr esi n de Y sobre X.


S olucin
6

Las puntuaciones obtenidas por un grupo de al umnos en una bater a de

test que mide la habi lidad verbal (X) y el razonamiento abstracto (Y) son
l as si gui entes:

22>Y/X

22>20

22>30

22>40

22>50

22>(25-35)

22>(35-45)

22>(45-55)

22>(55-65)

Se pi de:
1

Exi ste corr elacin entre ambas vari abl es?

Segn l os datos de la tabla, si uno de estos al umnos obtiene una puntuaci n de

70 puntos en razonami ento abstracto, en cunto se esti mar su habil idad verbal ?
S olucin
7

Se sabe que entre el consumo de papel y el nmero de litros de agua

por metro cuadrado que se recogen en una ciudad no exi ste rel acin.
1 Cul es el valor de l a covarianza de estas vari ables?
2

Cunto val e el coefi ciente de cor relacin lineal ?

Qu ecuaci ones tienen las dos rectas d e reg re sin y cul es su posi cin en el

pl ano?
S olucin

8
de

En una empresa de transportes trabajan cuatro conductores. Los aos


anti gedad

de

permi sos

de

conduci r

el

nmero

de

infracci ones

cometi das en el ltimo ao por cada uno de ellos son l os si gui entes:

Aos (X)

Infracciones (Y)

Cal cul ar el co eficiente de cor relacin lineal e interpretarl o.


S olucin
9

Una persona rell ena semanal mente una qui ni el a y un boleto de loter a

primiti va anotando el nmero de aciertos que ti ene. Durante las cuatro


semanas del mes de febrero, los aci ertos fueron:

Quiniela (X)

Primitiva (Y)

Obtener el co eficiente de cor relacin lineal e i nterpretarl o. Ofrecer an


confi anza l as previ siones hechas con l as rectas de regresi n?

UNIDAD III
TEORIA DE PEQUEAS MUESTRAS O TEORIA EXACTA DEL
MUESTREO
En las unidades anteriores se manej el uso de la distribucin z, la
cual se poda utilizar siempre y cuando los tamaos de las muestras
fueran mayores o iguales a 30 en muestras ms pequeas si la
distribucin o las distribuciones de donde proviene la muestra o las
muestras son normales.
En esta unidad se podrn utilizar muestras pequeas siempre y
cuando la distribucin de donde proviene la muestra tenga un

comportamiento normal. Esta es una condicin para utilizar las tres


distribuciones que se manejarn en esta unidad; t de student, X2 jicuadrada y Fisher.
A la teora de pequeas muestras tambin se le llama teora exacta
del muestreo, ya que tambin la podemos utilizar con muestras
aleatorias de tamao grande.
En esta unidad se ver un nuevo concepto necesario para poder
utilizar a las tres distribuciones mencionadas. Este concepto es
"grados de libertad".
Para definir grados de libertad se har referencia a la varianza
muestral:

Esta frmula est basada en n-1 grados de libertad (degrees of


freedom). Esta terminologa resulta del hecho de que si bien s2 est
basada en n cantidades
...,
stas suman cero, as
que especificar los valores de cualquier n-1 de las cantidades
determina el valor restante. Por ejemplo, si n=4 y
;
tenemos
estn libremen

, entonces automticamente

, as que slo tres de los cuatro valores de


te determinamos 3 grados de libertad.

Entonces, en esta unidad la frmula de grados de libertad ser n-1 y


su simbologa
DISTRIBUCION "t DE STUDENT"
Supngase que se toma una muestra de una poblacin normal con
media
y varianza
Si
es el promedio de
las n observaciones que contiene la muestra aleatoria, entonces la

distribucin

es una distribucin normal estndar.

Supngase que la varianza de la poblacin

es desconocida.

Qu sucede con la distribucin de esta estadstica si se


reemplaza
por s? La distribucin t proporciona la respuesta a
esta pregunta.
La media y la varianza de la distribucin t son
para >2, respectivamente.

La siguiente figura presenta la grfica de varias distribuciones t. La


apariencia general de la distribucin t es similar a la de la distribucin
normal estndar: ambas son simtricas y unimodales, y el valor
mximo de la ordenada se alcanza en la media Sin embargo,
la distribucin t tiene colas ms amplias que la normal; esto es, la
probabilidad de las colas es mayor que en la distribucin normal. A
medida que el nmero de grados de libertad tiende a infinito, la forma
lmite de la distribucin t es la distribucin normal estndar.

Propiedades de las distribuciones t


1. Cada curva t tiene forma de campana con centro en 0.

2. Cada curva t, est ms dispersa que la curva normal estndar z.


3. A medida que aumenta, la dispersin de la curva t
correspondiente disminuye.
4. A medida que

, la secuencia de curvas t se

aproxima a la curva normal estndar, por lo que la curva z recibe


a veces el nombre de curva t con gl =

La distribucin de la variable aleatoria t est dada por:

Esta se conoce como la distribucin t con

grados de libertad.

Sean X1, X2, . . . , Xn variables aleatorias independientes que son todas


normales con media
y desviacin estndar
. Entonces la
variable aleatoria

tiene una distribucin t con

= n-1

grados de libertad.
La distribucin de probabilidad de t se public por primera vez en 1908
en un artculo de W. S. Gosset. En esa poca, Gosset era empleado
de una cervecera irlandesa que desaprobaba la publicacin de
investigaciones de sus empleados. Para evadir esta prohibicin,
public su trabajo en secreto bajo el nombre de "Student". En
consecuencia, la distribucin t normalmente se llama distribucin t de
Student, o simplemente distribucin t. Para derivar la ecuacin de esta
distribucin, Gosset supone que las muestras se seleccionan de una
poblacin normal. Aunque esto parecera una suposicin muy
restrictiva, se puede mostrar que las poblaciones no normales que
poseen distribuciones en forma casi de campana an proporcionan
valores de t que se aproximan muy de cerca a la distribucin t.

La distribucin t difiere de la de Z en que la varianza de t depende del


tamao de la muestra y siempre es mayor a uno. Unicamente cuando
el tamao de la muestra tiende a infinito las dos distribuciones sern
las mismas.
Se acostumbra representar con

encuentra un rea igual a

el valor t por arriba del cual se

. Como la distribucin t es simtrica

alrededor de una media de cero, tenemos

el valor t que deja un rea de

; es decir,

a la derecha y por tanto un rea

de

a la izquierda, es igual al valor t negativo que deja un rea

de

en la cola derecha de la distribucin. Esto es, t0.95 = -t0.05,

t0.99=-t0.01, etc.
Para encontrar los valores de t se utilizar la tabla de valores crticos
de la distribucin t del libro Probabilidad y Estadstica para Ingenieros
de los autores Walpole, Myers y Myers.
Ejemplo:
El valor t con
= 14 grados de libertad que deja un rea de 0.025 a la
izquierda, y por tanto un rea de 0.975 a la derecha, es
t0.975=-t0.025 = -2.145

Si se observa la tabla, el rea sombreada de la curva es de la cola


derecha, es por esto que se tiene que hacer la resta de
. La
manera de encontrar el valor de t es buscar el valor de

en el

primer rengln de la tabla y luego buscar los grados de libertad en la


primer columna y donde se intercepten
y
se obtendr el
valor de t.
Ejemplo:
Encuentre la probabilidad de t0.025 < t < t0.05.
Solucin:

Como t0.05 deja un rea de 0.05 a la derecha, y t0.025 deja un rea de


0.025 a la izquierda, encontramos un rea total de 1-0.05-0.025 =
0.925.
P( t0.025 < t < t0.05) = 0.925
Ejemplo:
Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra
aleatoria de tamao 15 que se selecciona de una distribucin normal.
Solucin:

Si se busca en la tabla el valor de t =1.761 con 14 grados de libertad


nos damos cuenta que a este valor le corresponde un rea de 0.05 a
la izquierda, por ser negativo el valor. Entonces si se resta 0.05 y
0.045 se tiene un valor de 0.005, que equivale a
Luego se
busca el valor de 0.005 en el primer rengln con 14 grados de libertad
y se obtiene un valor de t = 2.977, pero como el valor de
est
en el extremo izquierdo de la curva entonces la respuesta es t = -2.977
por lo tanto:
P(-2.977 < t < -1.761) = 0.045
Ejemplo:
Un ingeniero qumico afirma que el rendimiento medio de la poblacin
de cierto proceso en lotes es 500 gramos por milmetro de materia
prima. Para verificar esta afirmacin toma una muestra de 25 lotes
cada mes. Si el valor de t calculado cae entre t0.05 y t0.05, queda
satisfecho con su afirmacin. Qu conclusin extraera de una
muestra que tiene una media de 518 gramos por milmetro y una
desviacin estndar de 40 gramos? Suponga que la distribucin de
rendimientos es aproximadamente normal.
Solucin:
De la tabla encontramos que t0.05 para 24 grados de libertad es de
1.711. Por tanto, el fabricante queda satisfecho con esta afirmacin si
una muestra de 25 lotes rinde un valor t entre 1.711 y 1.711.
Se procede a calcular el valor de t:

Este es un valor muy por arriba de 1.711. Si se desea obtener la


probabilidad de obtener un valor de t con 24 grados de libertad igual o
mayor a 2.25 se busca en la tabla y es aproximadamente de 0.02. De
aqu que es probable que el fabricante concluya que el proceso
produce un mejor producto del que piensa.
INTERVALO DE CONFIANZA PARA

Si

; CON

DESCONOCIDA

y s son la media y la desviacin estndar de una muestra

aleatoria de una poblacin normal con varianza

, desconocida,

un intervalo de confianza de
(
)100% para
es:

donde

un rea de

/2

es el valor t con

= n-1 grados de libertad, que deja

/2 a la derecha.

Se hace una distincin entre los casos de

conocida y

desconocida al calcular las estimaciones del intervalo de confianza. Se


debe enfatizar que para el primer caso se utiliza el teorema del lmite
central, mientras que para
desconocida se hace uso de la
distribucin muestral de la variable aleatoria t. Sin embargo, el uso de

la distribucin t se basa en la premisa de que el muestreo se realiza


de una distribucin normal. En tanto que la distribucin tenga forma
aproximada de campana, los intervalos de confianza se pueden
calcular cuando la varianza se desconoce mediante el uso de la
distribucin t y se puede esperar buenos resultados.
Con mucha frecuencia los estadsticos recomiendan que aun cuando
la normalidad no se pueda suponer, con
desconocida y n
30, s puede reemplazar a

y se puede utilizar el intervalo de

confianza:

Por lo general ste se denomina como un intervalo de confianza de


muestra grande. La justificacin yace slo en la presuncin de que con
una muestra grande como 30, s estar muy cerca de la
real y de
esta manera el teorema del lmite central sigue valiendo. Se debe
hacer nfasis en que esto es solo una aproximacin y que la calidad
de este enfoque mejora a medida que el tamao de la muestra crece
ms.
Ejemplos:
1. El contenido de siete contenedores similares de cido sulfrico
son 9.8, 10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Encuentre un
intervalo de confianza del 95% para la media de todos los
contenedores si se supone una distribucin aproximadamente
normal.
Solucin:
La media muestral y la desviacin estndar para los datos dados
son:
10 y s= 0.283

En la tabla se encuentra que t0.025=2.447 con 6 grados de


libertad, de aqu, el intervalo de confianza de 95% para
es:

Con un nivel de confianza del 95% se sabe que el promedio del


contenido de los contenedores est entre 9.47 y 10.26 litros.
2. Un artculo publicado en el Journal of Testing and
Evaluation presenta las siguientes 20 mediciones del tiempo de
combustin residual en segundos de especmenes tratados de
ropa de dormir para nios:
9.85 9.93 9.75 9.77 9.67
9.87 9.67 9.94 9.85 9.75
9.83 9.92 9.74 9.99 9.88
9.95 9.95 9.93 9.92 9.89
Se desea encontrar un nivel de confianza del 95% para el
tiempo de combustin residual promedio. Supngase que el
tiempo de combustin residual sigue una distribucin normal.
Solucin:
La media muestral y la desviacin estndar para los datos dados son:
9.8525 y s= 0.0965

En la tabla se encuentra que t0.025=2.093 con 19 grados de libertad, de


aqu, el intervalo de confianza de 95% para
es:

Por lo tanto, se tiene una confianza del 95% de que el tiempo de


combustin residual promedio se encuentra entre 9.8073 y 9.8977
segundos.
PRUEBA DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION NORMAL, VARIANZA
DESCONOCIDA

Ciertamente sospechamos que las pruebas sobre una media


poblacional con
desconocida, debe incluir el uso de la
distribucin t de Student. La estructura de la prueba es idntica a la
del caso de
conocida, con la excepcin de que el valor
en la
estadstica de prueba se reemplaza por la estimacin de s calculada y
la distribucin normal estndar se reemplaza con una distribucin t.
Ejemplos:
1. El Instituto Elctrico Edison publica cifras del nmero anual de
Kilowatt-hora que gastan varios aparatos elctrodomsticos. Se
afirma que una aspiradora gasta un promedio de 46 kilowatthora al ao. Si una muestra aleatoria de 12 hogares que se
incluye en un estudio planeado indica que las aspiradoras
gastan un promedio de 42 kilowatt-hora al ao con una
desviacin estndar de11.9 kilowatt-hora, esto sugiere con un
nivel de significancia de 0.05 que las aspiradoras gastan, en
promedio, menos de 46 kilowatt-hora anualmente? Suponga que
la poblacin de kilowatt-hora es normal.
Solucin:
1. Datos:
= 46 kilowatt-hora

s= 11.9 kilowatt-hora
= 42 kilowatt-hora
n = 12
= 0.05
3. Ensayo de hiptesis
Ho;

= 46 kilowatt-hora

H1;

< 46 kilowatt-hora

4. Regla de decisin:
Si tR

-1.796 No se rechaza Ho

Si tR < -1.796 Se rechaza Ho


5. Clculos:

6. Justificacin y decisin:
Como 1.16 > -1.796, por lo tanto no se rechaza Ho y se
concluye con un nivel de significancia del 0.05 que el nmero
promedio de kilowwatt-hora que gastan al ao las aspiradoras
no es significativamente menor que 46.
Solucin por el otro mtodo:

Regla de decisin:
Si
Si

39.83 No se Rechaza Ho
< 39.83 Se rechaza Ho

Como la = 42 y este valor no es menor que 39.83 por lo tanto no se


rechaza Ho.
Se puede aprovechar este ejemplo para calcular el valor de P , como
el valor de t calculada es de 1.16, se busca en la tabla y se ve que el
area a la izquierda de este valor es de 0.135 con 11 grados de
libertad, por lo tanto no se rechaza Ho., ya que sera un valor alto para
un nivel de significancia.

1. Un artculo publicado en la revista Materials


Engineering describe los resultados de pruebas de resistencia a
la adhesin de 22 especmenes de aleacin U-700. La carga
para la que cada especmen falla es la siguiente en MPa:
19.8

18.5

17.6

16.7

15.8

15.4

14.1

13.6

11.9

11.4

11.4

8.8

7.5

15.4

15.4

19.5

14.9

12.7

11.9

11.4

10.1

7.9

Sugieren los datos que la carga promedio de falla es mayor


que 10Mpa? Supngase que la carga donde se presenta la falla
tiene una distribucin normal, y utilicese
= 0.05. Calcule el
valor de P.
Solucin:
1. Datos:
= 10
s = 3.55
= 13.71
n = 22
= 0.05
3. Ensayo de hiptesis
Ho;

= 10

H1;

> 10

4. Regla de decisin:
Si tR

1.721 no se rechaza Ho.

Si tR> 1.721 se rechaza Ho.


5. Clculos:

6. Justificacin y decisin.
Como 4.90 >1.721 se rechaza Ho y se concluye con un nivel de
significancia del 0.05 que la carga de falla promedio es mayor
que 10Mpa.
Existe otra manera de resolver este ejercicio, tomando la decisin en
base al estadstico real, en este caso la media de la muestra. De la
frmula de la distribucin muestral de medias se despeja la media de
la muestra:

Regla de decisin:
Si

Si

11.30 No se rechaza Ho

> 11.30 Se rechaza Ho

Como la media de la muestral es de 13.71 MPa y es mayor al valor de


la media muestral lmite de 11.30 por lo tanto se rechaza Ho y se llega
a la misma conclusin.
Para calcular el valor de P se va a la tabla y se busca en 21 grados de
libertad el valor de t = 4.90. Se obseva que el valor mayor de t que se
encuentra en la tabla con 21 grados de libertad es de 3.819 el cual le
corresponde un rea a la derecha de 0.0005, por lo que para el valor
de 4.90 el valor de P es practicamente cero, y esto apoya la decisin
de rechazar Ho.
3. Los pesos en libras de una muestra aleatoria de bebs de seis
meses son: 14.6, 12.5, 15.3, 16.1, 14.4, 12.9, 13.7 y 14.9. Haga
una prueba con nivel de 5% de significancia para determinar si
el peso promedio de todos los bebs de seis meses es distinto a
14 libras, suponga que sus pesos se distribuyen normalmente y
calcule el valor de P.
Solucin:
1. Datos:
= 14 libras
s = 1.21 libras
= 14.3 libras

n=8
= 0.05
2. Ensayo de hiptesis
Ho;

= 14 libras

H1;

14 libras

3. Regla de Decisin:
Si 2.365

tR

2.365 No se rechaza Ho

Si tR < -2.365 si tR > 2.365 Se rechaza Ho


4. Clculos:

5. Justificacin y decisin:
Como 2.365

0.7012 2.365 por lo tanto, no se rechaza

Ho y se concluye con un nivel de significancia del 0.05 que el


peso promedio de todos los bebs de seis meses es de 14
libras.
Solucin por el otro mtodo:

12.98 y 15.01

Regla de decisin:
Si 12.98
Si

15.01 No se rechaza Ho

< 12.98

Como la

> 15.01 se rechaza Ho

= 14.3 libras, entonces no se rechaza Ho .

Para calcular el valor de P se busca en la tabla el valor de 0.7012 con


7 grados de libertad. Se obseva que este valor no se encuentra pero
se puede interpolar entre los valores de 0.549 y 0.896 con reas de
0.30 y 0.20 respectivamente. Interpolando linealmente se obtiene el
valor de 0.2561.

Error tipo II

El error tipo II se calcula de la misma forma en la que se calcul con la


distribucin z. Se realizarn algunos ejercicios en los cuales se
determinar la probabilidad de cometer el error tipo II, utilizando la
tabla de la distribucin.
Existen curvas caractersticas de operacin en los libros con diferentes
grados de libertad para determinar los tamaos de muestra
correspondientes segn el grado de error que se quiera, recordando
que entre mayor sea el tamao de muestra menor ser el error.
1. Se sabe que los voltajes de una marca de pilas tamao C se
distribuyen normalmente, se prob una muestra aleatoria de 15
y se encontr que la media es de 1.4 volts con una desviacin
estndar de 0.21 volts. En el nivel de significancia de 0.01:
a. Indica esto que la media de los voltajes es menor que 1.5
volts?
b. Calcular la probabilidad de cometer el error tipo II si el voltaje
promedio real de las pilas es de 1.3 volts.
Solucin:
1. Datos:
= 1.5 volts.
s= 0.21 volts
= 1.4 volts.
n = 15
= 0.01
2. Ensayo de hiptesis
Ho;

= 1.5 volts

H1;

< 1.5 volts

3. Regla de decisin:
Si tR

-2.624 No se rechaza Ho

Si tR < -2.624 Se rechaza Ho


5. Clculos:

6. Justificacin y decisin:
Como 1.84 > -2.624, por lo tanto no se rechaza Ho y se
concluye con un nivel de significancia del 0.01 que los voltajes
de las pilas tamao C no son menores a 1.5.
Para calcular el error tipo II se tiene que obtener el valor de
siguiente forma:

de la

Para encontrar el valor de


se busca en la tabla de la distribucin t el
valor de 1.05 con 14 grados de libertad. Como este valor no se
encuentra en la tabla se interpola entre 0.868 y 1.076 con un rea de
0.20 y 0.15 respectivamente. Al interpolar se obtiene un rea de
0.15612 y esta es la probabilidad de cometer el error tipoII cuando la
media verdadera es de 1.3 volts y un tamao de muestra de 15.
2. Para el ejercicio del peso de los bebs de 6 meses, calcular el
error tipo II, si los pesos verdaderos hubieran sido de 11 y 14.5
libras.
Solucin:
Primero se calculan los valores de

En este ltimo clculo para


se tendr que analizar las reas de los
dos extremos, pues estas no estn dentro de la regin de aceptacin,
por lo tanto no se deben de tomar en cuenta para el error tipo II.
Se busca en la tabla el valor de 3.55 con 7 grados de libertad, y al
interpolar nos da un rea de 0.00475. El rea correspondiente a 1.19
con 7 grados de libertad es de 0.1479. Por lo que =1(0.00475+0.1479)= 0.8473
3. Para el ejercicio en donde se dan los resultados de pruebas de
resistencia a la adhesin de 22 especmenes de aleacin U700., encontrar la probabilidad de cometer el error tipo II si la
carga promedio de falla es igual a 11.
Solucin:
Primero se obtendr el valor del estadstico lmite:

FRMULA

Donde
n = nmero de datos.
f = frecuencia de celda.
fx = frecuencia de la variable X.
fy = frecuencia de la variable Y.
dx = valores codificados o cambiados para los intervalos de la variable X, procurando que al intervalo
central le corresponda dx = 0, para que se hagan ms fciles los clculos.
dy = valores codificados o cambiados para los intervalos de la variable X, procurando que al intervalo
central le corresponda dy = 0, para que se hagan ms fciles los clculos.

EJEMPLOS ILUSTRATIVOS
N 1
Con los siguientes datos sobre los Coeficientes Intelectuales (X) y de las calificaciones en una prueba
de conocimiento (Y) de 50 estudiantes:

N
de estudiante

N de
estudiante

76

28

26

88

40

77

24

27

88

31

78

18

28

88

35

79

41

29

88

26

79

43

30

89

30

80

45

31

89

24

80

34

32

90

18

80

18

33

90

11

82

40

34

90

15

10

82

35

35

91

38

11

83

30

36

92

34

12

83

21

37

92

31

13

83

22

38

93

33

14

83

23

39

93

35

15

84

25

40

93

24

16

84

11

41

94

40

17

84

15

42

96

35

18

85

31

43

97

36

19

85

35

44

98

40

20

86

26

45

99

33

21

86

30

46

100

51

22

86

24

47

101

54

23

86

16

48

101

55

24

87

20

49

102

41

25

88

36

50

102

45

1) Elaborar una tabla de dos variables


2) Calcular el coeficiente de correlacin
Solucin:
1) En la tabla de frecuencias de dos variables, cada recuadro de esta tabla se llama una celda y
corresponde a un par de intervalos, y el nmero indicado en cada celda se llama frecuencia de celda.
Todos los totales indicados en la ltima fila y en la ltima columna se llaman totales marginales o
frecuencias marginales, y corresponden, respectivamente, a las frecuencias de intervalo de las
distribuciones de frecuencia separadas de la variable X y Y.
Para elaborar la tabla se recomienda:
- Agrupar las variables X y Y en un igual nmero de intervalos.
- Los intervalos de la variable X se ubican en la parte superior de manera horizontal (fila) y en orden
ascendente.
- Los intervalos de la variable Y se ubican en la parte izquierda de manera vertical (columna) y en orden
descendente.
Para elaborar los intervalos se procede a realizar los clculos respectivos:
En la variable X:
Calculando el Rango se obtiene:

Calculando el nmero de intervalos se obtiene:

Calculando el ancho se obtiene:

En la variable Y:
Calculando el Rango se obtiene:

Calculando el nmero de intervalos se obtiene:

Calculando el ancho se obtiene:

Nota: Para la variable X se tomar un ancho de intervalo igual a 5 y para la variable Y un ancho de
intervalo igual a 8 para obtener un nmero de intervalos igual a 6 para cada variable.
Contando las frecuencias de celda para cada par de intervalos de las variables X y Y se obtiene la
siguiente tabla de frecuencias de dos variables:

Interpretacin:
- El nmero 5 es la frecuencia de la celda correspondiente al par de intervalos 86-90 en Coeficiente
Intelectual y 19-26 en Calificacin obtenida en la prueba de conocimiento.
- El nmero 8 en la fila de fx es el total marginal o frecuencia marginal del intervalo 76-80 en Coeficiente
Intelectual.
- El nmero 14 en la columna de fy es el total marginal o frecuencia marginal del intervalo 35-42 en
Calificacin obtenida en la prueba de conocimiento.
- El nmero 50 es total de frecuencias marginales y representa al nmero total de estudiantes.
2) Realizando los clculos respectivos se obtiene la siguiente tabla:

Nota:
Los nmeros de las esquinas de cada celda en la anterior tabla representan el producto fdxdy, as por
ejemplo, para obtener el nmero el nmero -8 de los intervalos 76-80 en X y 43-50 en Y se obtiene
multiplicando 2(-2)(2) = -8. Para obtener el nmero 6 de los intervalos 96-100 en X y 51-58 en Y se
obtiene multiplicando 123 = 6.
Los nmeros de la ltima columna (24, -2, 7, 0, 5 y 12) se obtienen sumando los nmeros de las esquinas
en cada fila, as por ejemplo, para obtener el nmero 24 se suma 6 + 18 = 24.
Los nmeros de la ltima fila (0, 5, 0, 2, 12 y 27) se obtienen sumando los nmeros de las esquinas en
cada columna, as por ejemplo, para obtener el nmero 27 se suma 18 + 6 + 3 = 27.
Para obtener el nmero 2 de la antepenlmina columna se obtiene sumando los resultados de fydy, es
decir, representa la ? fydy
Para obtener el nmero 2 de la antepenlmina fila se obtiene sumando los resultados de fxdx, es decir,
representa la ? fydy
Para obtener el nmero 96 de la penltima columna se obtiene sumando los resultados de fydy2, es
decir, representa ? fydy2
Para obtener el nmero 106 de la penltima fila se obtiene sumando los resultados de fxdx2, es decir,
representa ? fxdx2
Para obtener ltimo nmero de la ltima columna se obtiene sumando los resultados de la ltima columna
(46=24-2+7+0+5+12), es decir, representa ?fdxdy.
Para obtener ltimo nmero de la ltima fila se obtiene sumando los resultados de la ltima fila
(46=0+5+0+2+12+27), y tiene que ser igual al ltimo nmero de la ltima columna como comprobacin
que los clculos de la tabla han sido correctos.
Observando los datos en la tabla anterior se reemplaza los valores en la ecuacin del Coeficiente de
Correlacin de Pearson para datos agrupados se obtiene:

Existe una correlacin positiva moderada


N 2
Dada la siguiente tabla de frecuencias de dos variables, con los datos sobre los pesos en kilogramos de
habitantes de dos barrios diferentes en una ciudad, determinar el tipo de correlacin que existe entre ellas
mediante el coeficiente de Pearson.

Solucin:

Correlacin positiva moderada de 0,688


N 3
Dada la siguiente tabla de frecuencias de dos variables, con los datos sobre las calificaciones obtenidos
en un curso de 100 estudiantes en la asignatura de Matemtica (X) y en la asignatura de Estadstica (Y),
determinar el tipo de correlacin que existe entre ellas mediante el coeficiente de Pearson para datos
agrupados.

N de
estudiante

N de
X
estudiante

40

60

26

57 73

51

71 86

76

84 83

41

50

27

58 78

52

72 88

77

84 84

42

55

28

60 79

53

72 89

78

85 86

43

59

29

61 60

54

72 70

79

86 88

44

40

30

62 61

55

73 71

80

86 89

45

42

31

63 62

56

74 72

81

86 70

45

49

32

64 63

57

74 73

82

87 78

45

60

33

64 64

58

74 74

83

87 79

45

62

34

65 65

59

75 75

84

88 78

10

48

66

35

65 66

60

76 76

85

88 77

11

49

69

36

66 67

61

76 77

86

88 79

12

50

50

37

66 69

62

77 78

87

88 78

13

50

52

38

66 50

63

77 79

88

89 78

14

56

54

39

66 52

64

78 60

89

89 60

N de
X
estudiante

N de
X
estudiante

15

56

56

40

67 55

65

78 67

90

89 69

16

56

59

41

68 56

66

78 65

91

90 90

17

56

59

42

68 57

67

78 68

92

91 96

18

56

40

43

68 59

68

79 69

93

92 97

19

57

45

44

69 40

69

79 50

94

93 99

20

57

47

45

69 45

70

79 59

95

94 80

21

57

48

46

69 47

71

80 90

96

95 81

22

57

49

47

69 49

72

81 94

97

96 82

23

57

80

48

70 90

73

82 96

98

97 83

24

57

70

49

70 99

74

82 99

99

98 89

25

57

72

50

70 80

75

83 80

100

99 70

Solucin:

Correlacin positiva moderada de 0,62

Leer ms: http://www.monografias.com/trabajos86/correlacion-pearson-datos-agrupadosintervalos/correlacion-pearson-datos-agrupados-intervalos.shtml#ixzz3ORf6gpnh

Вам также может понравиться