Вы находитесь на странице: 1из 25

1

Captulo 1
Estadstica Descriptiva
Estadstica
Datos Estadstica Informacin
Estadstica Descriptiva
Mtodos para recopilar, codificar, clasificar,
tabular, graficar, sintetizar y presentar datos.
Estadstica Inferencial
Mtodos para generalizar la informacin
obtenida de un subconjunto de datos.
Poblacin
Conjunto de todos los elementos en estudio.
Muestra
Subconjunto de la poblacin.
2
Variable estadstica
Funcin que tiene como dominio a la poblacin.
Mide una caracterstica, segn una escala.
Rango de la variable
Conjunto de valores posibles de la variable.
Dato
Medida de un elemento.
Censo
Mide los elementos de una poblacin.
Encuesta
Mide los elementos de una muestra.
Parmetro
Medida de una variable en la poblacin.
3
Estadstico
Medida de una variable en la muestra.
Variable Cualitativa
Mide una cualidad.
Variable Cuantitativa
Mide una cantidad.
Es discreta si su rango es numerable.
Es continua si su rango no es numerable.
Escalas de medicin
1) Escala Nominal.
2) Escala Ordinal.
3) Escala de Intervalo.
4) Escala de Razn.
Escala Nominal
Los valores asignados son denominaciones.
Escala Ordinal
Los valores asignados indican un orden
entre las categoras.
4
Escala de Intervalo
Los valores asignados indican distancias
entre las categoras.
(El cero es relativo)
Escala de Razn
Los valores asignados indican razones.
(El cero es absoluto)
Propiedad. Escala de Intervalo
Si la medida de un elemento en una escala de
intervalo es X y en otra escala de intervalo es Y,
entonces . : , b mX Y IR b m + =
Propiedad. Escala de Razn
Si la medida de un elemento en una escala de
razn es X y en otra escala de razn es Y,
entonces . : mX Y IR m =
Ejemplo
Si 10 C son 50 F y 20 C son 68 F ,
encontrar cuantos F son X C .
F
Y
68
50
10 20 X C
32
5
9
50 68
50
10 20
10
+ =

X Y
Y X
5
Distribucin de frecuencias
Cuadro donde se clasifica los datos en categoras
n: nmero de datos.
k: nmero de categoras.
x
1
, x
2
,, x
k
:
las categoras, si la variable no es continua.
las marcas de clase, si la variable es continua.
Frecuencia absoluta
n
i
: nmero de datos en la categora i.
(i=1, 2,, k)

=
=
k
i
i
n n
1
) (
Frecuencia relativa
f
i
: proporcin de datos en la categora i.
(i=1, 2,, k)
) (
n
n
f
i
i
=

=
=
k
i
i
f
1
) 1 (
Distribucin de frecuencias.
Variable Cualitativa
1 n
f
k
n
k
x
k
f
2
n
2
x
2
f
1
n
1
x
1
Fre. Relativa Fre. Absoluta Categoras
Ejemplo. Tabla 1
1 50
0.10 5 Matemticas
0.60 30 Qumica
0.30 15 Fsica
Fre. Relativa Fre. Absoluta Especialidad
Grfico de Barras
Cada categora se representa con una barra
de altura proporcional a su frecuencia
6
Ejemplo
0
5
10
15
20
25
30
35
Fsica Qumica Matemticas
Especialidad
N


d
e

A
l
u
m
n
o
s
Ejemplo
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
Fsica Qumica Matemticas
Especialidad
%

d
e

A
l
u
m
n
o
s
Grfico Circular
Cada categora se representa con un sector
circular de ngulo proporcional a su frecuencia
) * 360 (
i i
f =

=
=
k
i
i
1
) 360 (
Ejemplo
30%
60%
10%
Fsica
Qumica
Matemticas
Frecuencia absoluta acumulada
)
`

= + =
=

k i n N N
n N
i i i
,..., 3 , 2 ,
1
1 1

=
= =
i
j
j i
k i n N
1
,..., 2 , 1 ,
Frecuencia relativa acumulada
)
`

= + =
=

k i f F F
f F
i i i
,..., 3 , 2 ,
1
1 1

=
= =
i
j
j i
k i f F
1
) ,..., 2 , 1 , (
. ,..., 2 , 1 , k i
n
N
F
i
i
= =
7
Distribucin de frecuencias.
Variable Cuantitativa Discreta
F
k
N
k
f
k
n
k
X
k
F
2
N
2
f
2
n
2
x
2
F
1
N
1
f
1
n
1
x
1
Fre. Rel.
Acumulada
Fre. Abs.
Acumulada
Fre.
Rel.
Fre.
Abs.
Cate_
goras
Ejemplo. Tabla 2
1.00 200 0.10 20 6
0.90 180 0.35 70 5
0.55 110 0.30 60 4
0.25 50 0.20 40 3
0.05 10 0.05 10 2
Fre. Rel.
Acumulada
Fre. Abs.
Acumulada
Fre.
Rel.
Fre.
Abs.
N
cursos
Grfico de Bastones
Se marcan los puntos:
. ,..., 2 , 1 , ) , ( k i f x
i i
=
Ejemplo
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0 2 4 6 8
N de Cursos
%

d
e

A
l
u
m
n
o
s
Grfico de Escalones
Se marcan los puntos:
. ,..., 2 , 1 , ) , ( k i F x
i i
=
Ejemplo
0
0.2
0.4
0.6
0.8
1
1.2
0 2 4 6 8
N de Cursos
%

A
c
u
m
u
l
a
d
o

d
e

A
l
u
m
n
o
s
8
Distribucin de frecuencias.
Variable Cuantitativa Continua
El menor de los datos: m
El mayor de los datos: M
El Rango de los datos: R= M m
El nmero de categoras: k
La Amplitud de los intervalos: A = R / k
Las categoras son los intervalos:
I
1
= [ m , m + A ]
I
2
= ] m+A , m + 2A ]
:
I
k
= ] m + (k-1)A , m + kA ]
El lmite inferior de I
i
: L
i
El lmite superior de I
i
: U
i
La Marca de Clase de I
i
: X
i
= (L
i
+ U
i
) / 2
F
k
N
k
f
k
n
k
X
k
I
k
F
2
N
2
f
2
n
2
X
2
I
2
F
1
N
1
f
1
n
1
X
1
I
1
Fre. Rel.
Acu.
Fre. Abs.
Acu.
Fre.
Rel.
Fre.
Abs.
Marca
de Clase
Cate_
goras
Ejemplo. Tabla 3
1.00 500 0.04 20 120 ]110,130]
0.96 480 0.16 80 100 ]90,110]
0.80 400 0.32 160 80 ]70 , 90]
0.48 240 0.41 205 60 ]50 , 70]
0.07 35 0.07 35 40 [30 , 50]
F. R. Acu. F. A. Acu. F. Rel. F. Abs. M. C. Tiempo
Histograma de frecuencias
Serie de rectngulos que tienen como bases
los intervalos y alturas proporcionales a las
frecuencias de cada categora.
9
Ejemplo
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0 20 40 60 80 100 120 140
Tiempo (horas)
%

d
e

f
o
c
o
s
Polgono de frecuencias
Se unen los puntos:
( L
1
, 0 )
( U
k
, 0 )
. ,..., 2 , 1 , ) , ( k i f x
i i
=
Ejemplo
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0 20 40 60 80 100 120 140
Tiempo (horas)
%

d
e

f
o
c
o
s
Ojiva de frecuencias
Se unen los puntos:
( L
1
, 0 )
. ,..., 2 , 1 , ) , ( k i F U
i i
=
Ejemplo
0
0.2
0.4
0.6
0.8
1
1.2
0 20 40 60 80 100 120 140
Tiempo (horas)
%

A
c
u
m
u
l
a
d
o

d
e

f
o
c
o
s
Variables discretas como
variables continuas
Si la variable es discreta pero tiene muchos
valores posibles, se puede construir la
distribucin de frecuencias como si fuera
continua.
10
Percentiles
P
C
el percentil C, es el menor de los datos
tal que por lo menos el C % de los datos son
menores o iguales que l.
Ejemplo: P
90
el percentil 90, es el valor mnimo
que supera al 90 % de los datos.
Percentiles
en un listado de datos
Dado un listado ordenado de n datos:
,
n
x x x ...
2 1
)
, 1 ] [
,
[ ] (
)
`

=
Z a a
Z a a
a
[ 100 / ] n C C
x P =
Ejemplo
Dado el listado ordenado de 10 datos:
5, 7, 8, 9, 9, 12, 14, 16, 16, 20.
P
25
= x
3
= 8.
P
50
= x
5
= 9.
P
75
= x
8
= 16.
Percentiles
en una distribucin de frecuencias
de una variable cuantitativa discreta
Dada una distribucin de frecuencias de una
variable cuantitativa discreta,
i i i C
F
C
F x P < =

100
/
1
Ejemplo
En la Tabla 2:
P
25
= 3.
P
50
= 4.
P
75
= 5.
P
20
= 3.
P
80
= 5.
Percentiles
en una distribucin de frecuencias de
una variable cuantitativa continua
F
1.0
C / 100
P
C
X
11
Dada una distribucin de frecuencias de una
variable cuantitativa continua,
) )(
100
(
1
i
i i C
f
A
F
C
L P

+ =
)
100
(
1 i i
F
C
F <

Ejemplo
En la Tabla 3:
P
25
= 50 + (0.25 0.07)(20 / 0.41) = 58.78
P
50
= 70 + (0.50 0.48)(20 / 0.32) = 71.25
P
75
= 70 + (0.75 0.48)(20 / 0.32) = 86.875
Cuartiles
Primer Cuartil: Q
1
= P
25
.
Segundo Cuartil: Q
2
= P
50
.
Tercer Cuartil: Q
3
= P
75
.
F
1.00
0.75
0.50
0.25
0.00
Q
1
Q
2
Q
3
X
Cuarto inferior Cuarto superior
Sea X una variable cuantitativa continua, con Ojiva:
Diagrama de Cajas
m Q
1
Q
2
Q
3
M X
Medidas de tendencia central
(Promedios)
Miden el Centro o el Medio de un conjunto de datos.
Promedios

Cuadrtica
Geomtrica
Armnica
Aritmtica
Media
Mediana
Moda
12
Moda
Dato mas frecuente.
(La moda puede no ser nica)
Ejemplo
Especialidad de 7 alumnos de Ciencias:
Fsica, Qumica, Qumica, Matemticas,
Qumica, Fsica, Qumica.
Moda = Quimica.
Mediana
Mediana = P
50
= Q
2
.
Ejemplo
a) Nmero de cursos de 7 alumnos:
2, 2, 2, 3, 5, 5, 6.
Moda = 2.
Mediana = 3.
b) Nmero de cursos de 8 alumnos:
2, 2, 2, 3, 5, 5, 5, 6.
Moda1 = 2.
Moda2 = 5
Mediana = 3.
Propiedad. Mediana
Dados n datos: x
1
, x
2
,, x
n
.
tiene mnimo absoluto en

=
=
n
i
i
c x c S
1
| | ) (
mediana c =
Media Aritmtica
Dados n datos: x
1
, x
2
,, x
n
.
La media aritmtica de los datos es:
n
x
x
n
i
i
=
=
1
__
13
Ejemplo
Sueldos (en dlares) de 6 trabajadores:
165, 165, 240, 260, 270, 4900.
Moda = 165.
Mediana = 240.
Media = 1000.
Propiedad. Media Aritmtica
1)
2)
3)
tiene mnimo absoluto en

=
=
n
i
i
c x c S
1
2
) ( ) (
__
1
x n x
n
i
i
=

=
__
x c =
b x m y entonces b x m y Si
i i
+ = + =
__ __
* , *
Desviaciones a la media
Dados n datos: x
1
, x
2
,, x
n
.
Las desviaciones a la media son:
. ,..., 2 , 1 , ) (
__
n i x x d
i i
= =
Propiedad.
Desviaciones a la media
Dados n datos: x
1
, x
2
,, x
n
.
Si
son las desviaciones a la media, entonces
. ,..., 2 , 1 , n i d
i
=
. 0
1
=

=
n
i
i
d
Ejemplo
Notas de 4 alumnos. x
i
: 6, 11, 15, 16.
d
i
: -6, -1, 3, 4.
Si y
i
= (1.10)x
i
+ (2), entonces
. 12
4
48
__
= = x
2 . 15 2 ) 12 ( * ) 10 . 1 (
__
= + = y
Media aritmtica ponderada
Dados n datos: x
1
, x
2
,, x
n
con pesos: w
1
,w
2
,, w
n
la media aritmtica ponderada
de los datos es:

=
=
=
n
i
i
n
i i
i i
p
w
x w
x
1
__
14
Ejemplo
Curso Nota Crditos
A 12 5
B 15 3
C 11 4
D 16 3
133 . 13
3 4 3 5
) 16 ( 3 ) 11 ( 4 ) 15 ( 3 ) 12 ( 5
__
=
+ + +
+ + +
= p x
Propiedad.
Media aritmtica ponderada
Si todos los pesos son iguales, entonces
__ __
x x p =
Media Armnica
Dados n datos: x
1
, x
2
,, x
n
.
La media armnica de los datos es:

=
=
n
i i
x
n
A M
1
1
. .
Ejemplo
Un auto va de Lima a Chosica con una
velocidad constante de 20 Km/h y regresa con
una velocidad constante de 40 Km/h.
Encontrar la velocidad promedio del auto.
66 . 26
40
1
20
1
2
40 20
2 1
2 1
=
+
=
+
+
=
+
+
= =
e e
e e
t t
e e
t
e
V
T
T
p
Ejemplo
Un tren va un da con una velocidad constante
de 20 Km/h y otro da con una velocidad
constante de 40 Km/h.
Encontrar la velocidad promedio del tren.
15
00 . 30
2
40 20
24 24
) 40 ( 24 ) 20 ( 24
2 1
2 1
=
+
=
+
+
=
+
+
= =
t t
e e
t
e
V
T
T
p
Media Geomtrica
Dados n datos: x
1
, x
2
,, x
n
.
La media geomtrica de los datos es:
n
n
i
i
x G M
1
1
) ( . .

=
=
Ejemplo
La poblacin de una ciudad ha crecido en las
ltimas tres dcadas con tasas de 2, 1.8 y 1.2
Encontrar la tasa promedio de crecimiento por
dcada.
628 . 1 ) 2 . 1 * 8 . 1 * 2 (
3
1
= =
p
T
Media Cuadrtica
Dados n datos: x
1
, x
2
,, x
n
.
La media cuadrtica de los datos es:
n
x
C M
n
i
i
=
=
1
2
. .
Propiedad. Medias
Si todos los datos son positivos, entonces
. . . . . .
__
C M X G M A M
Clculo de los promedios a partir de
una distribucin de frecuencias.
Variable Cuantitativa Discreta
Moda = x
i
/ f
i
es mximo.
Mediana = x
i
/ F
i-1
< 0.50 F
i

=
=
k
i
i i
f x x
1
__
16
Ejemplo. Tabla 2
1.00 200 0.10 20 6
0.90 180 0.35 70 5
0.55 110 0.30 60 4
0.25 50 0.20 40 3
0.05 10 0.05 10 2
Fre. Rel.
Acumulada
Fre. Abs.
Acumulada
Fre.
Rel.
Fre.
Abs.
N
cursos
Ejemplo
En la Tabla 2:
Moda = 5.
Mediana = 4.
25 . 4
) 10 . 0 * 6 ( ) 35 . 0 * 5 ( ) 30 . 0 * 4 ( ) 20 . 0 * 3 ( ) 05 . 0 * 2 (
__
=
+ + + + = x
Clculo de los promedios a partir de
una distribucin de frecuencias.
Variable Cuantitativa Continua
.
) 50 . 0 ( , ) )( 50 . 0 (
1 1 2 i i
i
i i
F F
f
A
F L Q < + =

) ( , )
) ( ) (
(
1 1
1
mximo es f A
f f f f
f f
L Moda
i
i i i i
i i
i
+

+ =

=
=
k
i
i i
f x x
1
__
Ejemplo. Tabla 3
1.00 500 0.04 20 120 ]110,130]
0.96 480 0.16 80 100 ]90,110]
0.80 400 0.32 160 80 ]70 , 90]
0.48 240 0.41 205 60 ]50 , 70]
0.07 35 0.07 35 40 [30 , 50]
F. R. Acu. F. A. Acu. F. Rel. F. Abs. M. C. Tiempo
Ejemplo
En la Tabla 3:
81 . 65 20 * )
09 . 0 34 . 0
34 . 0
( 50 =
+
+ = Moda
25 . 71 )
32 . 0
20
( * ) 48 . 0 50 . 0 ( 70
2
= + = Q
80 . 73
) 04 . 0 ( * 120 ) 16 . 0 ( * 100 ) 32 . 0 ( * 80 ) 41 . 0 ( * 60 ) 07 . 0 ( * 40
__
=
+ + + + = x
Medidas de Dispersin
Miden la dispersin de los datos.
Medidas de dispersin

estndar Desviacin
absoluta Desviacin
ercuartil Rango
Rango
int
17
Rango y Rango intercuartil
Rango = Mayor menor
Rango intercuartil = Q
3
Q
1
Desviacin Absoluta
Dados n datos: x
1
, x
2
,, x
n
.
La desviacin absoluta de los datos es:
n
x x
A D
n
i
i
=

=
1
__
| |
. .
La desviacin absoluta es
la media de los valores absolutos
de las desviaciones a la media.
Desviacin estndar
Dados n datos: x
1
, x
2
,, x
n
.
La desviacin estndar de los datos es:
n
x x
sd
n
i
i
x

=
1
2
__
) (
La desviacin estndar de los datos es
la media cuadrtica
de las desviaciones a la media.
Ejemplo
Notas de 4 alumnos. x
i
: 6, 11, 15, 16.
d
i
: -6, -1, 3, 4.
. 12
4
48
__
= = x
937 . 3
4
) 1 ( ) 3 ( ) 1 ( ) 6 (
2 2 2 2
=
+ + +
=
x
sd
18
Propiedad. Desviacin estndar
1)
2)
.
0
x
sd
x y i i
sd m sd entonces b x m y Si * | | , * = + =
Ejemplo
Notas de 4 alumnos.
x
i
: 6, 11, 15, 16.
Si y
i
= (1.10)x
i
+ (2), entonces
. 12
4
48
__
= = x
937 . 3 =
x
sd
33 . 4 ) 937 . 3 ( * ) 10 . 1 ( = =
y
sd
2 . 15 2 ) 12 ( * ) 10 . 1 (
__
= + = y
Desigualdad de Chebyshev
Si ,
la proporcin de datos en el intervalo
es mayor o igual que
)
1
1 (
2
k

) 0 ( > k
] * [
__
x
sd k x
Ejemplo
En el intervalo
estn por lo menos el 75% de los datos.
En el intervalo
estn por lo menos el 88.88% de los datos.
] * 2 [
__
x
sd x
] * 3 [
__
x
sd x
Varianza
Dados n datos: x
1
, x
2
,, x
n
.
La Varianza de los datos es:
n
x x
sd
n
i
i
x

=
1
2
__
2
) (
Propiedad. Varianza
1)
2)
2
2
) (
x x
sd sd =
2
1 1
2
2
|
|
|
|

\
|

|
|
|
|

\
|
=

= =
n
x
n
x
sd
n
i
i
n
i
i
x
19
Coeficiente de variacin
Mide que proporcin de la media
es la desviacin estndar.
|
|

\
|
=
__
x
sd
CV
x
x
Ejemplo
Las notas en un horario X :
Las notas en un horario Y :
Las notas en el horario X son ms heterogneas.
Las notas en el horario Y son ms homogneas.
3 , 13
__
= =
y
sd y
2 , 8
__
= =
x
sd x
23 . 0
13
3
, 25 . 0
8
2
= = = =
y x
CV CV
Datos estandarizados
Si los datos son:
entonces los datos estandarizados son:
. ,..., 2 , 1 , n i x
i
=
. ,..., 2 , 1 ,
__
n i
sd
x x
z
x
i
i
=

=
Propiedad.
Datos estandarizados
Si los datos estandarizados son:
entonces
. ,..., 2 , 1 , n i z
i
=
1 ) 2
0 ) 1
__
=
=
z
sd
z
Ejemplo
Las notas en un horario X :
Las notas en un horario Y :
La nota de un alumno J del horario X: 10.
La nota de un alumno K del horario Y: 15.
J tiene una nota relativa mayor que la de K.
2 , 8
__
= =
x
sd x
3 , 13
__
= =
y
sd y
66 . 0
3
13 15
, 0 . 1
2
8 10
=

= =

=
k J
z z
Clculo de la desviacin estndar
a partir de una distribucin de frecuencias
.

=
=
k
i
i i x
f x x sd
1
2
__
2
) (
2
__
1
2 2
) ( x f x sd
k
i
i i x
=

=
2
x x
sd sd =
20
Ejemplo. Tabla 2
1.00 200 0.10 20 6
0.90 180 0.35 70 5
0.55 110 0.30 60 4
0.25 50 0.20 40 3
0.05 10 0.05 10 2
Fre. Rel.
Acumulada
Fre. Abs.
Acumulada
Fre.
Rel.
Fre.
Abs.
N
cursos
Ejemplo
En la Tabla 2:
245 . 0
0428 . 1
25 . 4
__
=
=
=
x
x
CV
sd
x
Ejemplo. Tabla 3
1.00 500 0.04 20 120 ]110,130]
0.96 480 0.16 80 100 ]90,110]
0.80 400 0.32 160 80 ]70 , 90]
0.48 240 0.41 205 60 ]50 , 70]
0.07 35 0.07 35 40 [30 , 50]
F. R. Acu. F. A. Acu. F. Rel. F. Abs. M. C. Tiempo
Ejemplo
En la Tabla 3:
259 . 0
1196 . 19
8 . 73
__
=
=
=
x
x
CV
sd
x
Distribucin Simtrica
Una distribucin es simtrica, si
... , , ,
2 3 1 2 1
= = =
k k k
f f f f f f
Coeficiente de Asimetra
Mide la asimetra de la distribucin.
x
x
sd
Q x
CA
) ( 3
2
__

=
21
Ejemplo. Tabla 2
1.00 200 0.10 20 6
0.90 180 0.35 70 5
0.55 110 0.30 60 4
0.25 50 0.20 40 3
0.05 10 0.05 10 2
Fre. Rel.
Acumulada
Fre. Abs.
Acumulada
Fre.
Rel.
Fre.
Abs.
N
cursos
Ejemplo
En la Tabla 2:
7192 . 0
0428 . 1
) 4 25 . 4 ( * 3
0428 . 1
4
25 . 4
2
__
=

=
=
=
=
x
x
CA
sd
Q
x
Ejemplo. Tabla 3
1.00 500 0.04 20 120 ]110,130]
0.96 480 0.16 80 100 ]90,110]
0.80 400 0.32 160 80 ]70 , 90]
0.48 240 0.41 205 60 ]50 , 70]
0.07 35 0.07 35 40 [30 , 50]
F. R. Acu. F. A. Acu. F. Rel. F. Abs. M. C. Tiempo
Ejemplo
En la Tabla 3:
4001 . 0
1196 . 19
) 25 . 71 8 . 73 ( * 3
1196 . 19
25 . 71
8 . 73
2
__
=

=
=
=
=
x
x
CA
sd
Q
x
Correlacin y Regresin
La correlacin mide la asociacin
entre las variables X e Y.
La regresin encuentra una relacin
entre las variables X e Y.
Diagrama de dispersin
Dados n datos: (x
1
, y
1
), ( x
2
, y
2
),, ( x
n
, y
n
).
El diagrama de dispersin es la grfica
de los datos.
Y
X
22
Covarianza
Dados n datos: (x
1
, y
1
), ( x
2
, y
2
),, ( x
n
, y
n
).
La covarianza es:
n
y y x x
sd
n
i
i i
xy

=

=
1
__ __
) )( (
Propiedad.
Covarianza
.
2
1 1 1
) 2
) 1
x xx
n
i
i
n
i
i
n
i
i i
xy
sd sd
n
y
n
x
n
y x
sd
=
|
|
|
|

\
|
|
|
|
|

\
|

|
|
|
|

\
|
=

= = =
Coeficiente de correlacin lineal
Dados n datos: (x
1
, y
1
), ( x
2
, y
2
),, ( x
n
, y
n
).
El coeficiente de correlacin lineal es:
y x
xy
sd sd
sd
r
*
=
Propiedad.
Coeficiente de correlacin lineal
1)
2)
) 1 0 (
1 1
2


r
r
0 , 1
0 , 1
1
2
< + = =
> + = =
+ = =
b bx a y r
b bx a y r
bx a y r
Regresin lineal simple
Dados n datos: (x
1
, y
1
), ( x
2
, y
2
),, ( x
n
, y
n
).
La regresin lineal simple encuentra una recta
L: y = a + bx
que modela los datos,
para estimar un valor de la variable Y
dado un valor de la variable X.
Coeficiente de regresin
El coeficiente de regresin es la pendiente
de la recta de regresin.
23
Mtodo de mnimos cuadrados
Dados n datos: (x
i
, y
i
)
(i = 1, 2,, n.)
x
i (i = 1, 2,, n.)
: valor observado de X.
y
i (i = 1, 2,, n.)
: valor observado de Y.
Si L: y = a + bx es la recta de regresin,
(i = 1, 2,, n.)
: valor esperado de Y
dado X = x
i
(i = 1, 2,, n.)
: error
i i
bx a y + =

i i i
y y e

=
Sea
La recta de regresin de mnimos cuadrados
de Y sobre X, es la recta L: y = a + bx
que minimiza

= = =
+ = = =
n
i
i i
n
i
i i
n
i
i
bx a y y y e SCE
1
2
1
2
1
2
)) ( ( )

(
SCE
Los valores de b y a que minimizan ,
son:
SCE
x
y
sd
sd
r b =
__ __
x b y a =
Propiedad. Recta de regresin
Si L: y = a + bx es la recta de regresin de
mnimos cuadrados de Y sobre X.
1)
2)
3)
L y x ) , (
__ __
0
__
= e
__ __

y y =
Ejemplo
Durante 8 semanas se observa la relacin,
entre el nmero de comerciales contratados
y el valor de las ventas (en miles de soles)
de un artculo.
281 104 8
275 98 7
220 70 6
206 62 5
126 35 4
253 85 3
171 51 2
208 58 1
Ventas (Y) Comerciales (X) Semanas
24
a) Encontrar una recta de regresin de las
ventas sobre el nmero de comerciales.
b) Si en una semana se contratan 75
comerciales, estimar las ventas esa
semana.
0
50
100
150
200
250
300
0 20 40 60 80 100 120
Comerciales
V
e
n
t
a
s
a)
x y L
a b
r
sd
sd sd
y x
xy
y x
171 . 2 698 . 64 :
698 . 64 , 171 . 2
981 . 0
187 . 1074
196 . 49 , 242 . 22
5 . 217 , 375 . 70
__ __
+ =
= =
=
=
= =
= =
0
50
100
150
200
250
300
0 20 40 60 80 100 120
Comerciales
V
e
n
t
a
s
b)
5 . 227 ) 75 (

75 = + = = b a y x Si
0
50
100
150
200
250
300
0 20 40 60 80 100 120
Comerciales
V
e
n
t
a
s
25
Descomposicin de la varianza
Varianza Total:
Varianza No Explicada:
Varianza Explicada
por la Regresin:
n
y y
sd VT
n
i
i
y

= =
1
2
__
2
) (
n
y y
n
e e
sd VNE
n
i
i i
n
i
i
e

= =

= =
1
2
1
2
__
2
) ( ) (
n
y y
sd VER
n
i
i
y

= =
1
2
__
2

) (
Propiedad.
Descomposicin de la varianza
.
VER VNE VT + =
) (
2

2 2
y e y
sd sd sd + =
Coeficiente de determinacin
El coeficiente de determinacin es:
Mide que proporcin de la VT es la VER
VT
VER
R =
Propiedad.
Coeficiente de determinacin
.
) 1 0 (
2

=
R
r R
Ejemplo
En el ejemplo anterior:
% 96 96 . 0
981 . 0
2
= = =
=
r R
r

Вам также может понравиться