Вы находитесь на странице: 1из 43

INTRODUCCION

A LA
ESTADISTICA
PSI C. MI SAEL LI MA CARDENAS
1
2
Estadstica
Introduccin
Qu es la estadstica?
Es una Ciencia que explica y provee de herramientas para trabajar con datos, ha
experimentado un gran desarrollo a lo largo de los ltimos aos.

En qu reas se aplica la estadstica?
Actualmente se aplica en todas las reas del saber, por ejemplo en Sociologa,
Educacin, Psicologa, Administracin, Economa, Medicina, Ciencias Polticas,
entre otras.

Ejemplos de su aplicacin son:

1) En Administracin de Empresas: la estadstica se utiliza para evaluar un producto
antes de comercializarlo.

2) En Economa: para medir la evolucin de los precios mediante nmeros ndice o para
estudiar los hbitos de los consumidores a travs de encuestas de presupuestos
familiares.
3
Estadstica
Introduccin
Ejemplos de su aplicacin son:

3) En Ciencias Polticas: para conocer las preferencias de los electores antes de una
votacin mediante sondeos y as orientar las estrategias de los candidatos.

4) En Sociologa: para estudiar las opiniones de los colectivos sociales sobre temas de
actualidad.

5) En Psicologa: para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano (por ejemplo los test que se aplican a los candidatos para un
cargo en una empresa).

6) En Medicina: uno entre muchos usos de la estadstica, es para determinar el estado de
salud de la poblacin.

En general en las Ciencias Sociales, la estadstica se emplea para medir las relaciones
entre variables y hacer predicciones sobre ellas.
4
Estadstica
Introduccin
Etapas de un estudio estadstico

Un anlisis estadstico se lleva a cabo siguiendo las etapas habituales en el llamado
mtodo cientfico cuyas etapas son:
1) Planteamiento del problema: consiste en definir el objetivo de la investigacin y
precisar el universo o poblacin.

2) Recogida de la informacin: consiste en recolectar los datos necesarios
relacionados al problema de investigacin.

3) Anlisis descriptivo: consiste en resumir los datos disponibles para extraer la
informacin relevante en el estudio.

4) Inferencia estadstica: consiste en suponer un modelo para toda la poblacin
partiendo de los datos analizados para obtener conclusiones generales.

5) Diagnstico: consiste en verificar la validez de los supuestos del modelo que nos
han permitido interpretar los datos y llegar a conclusiones sobre la poblacin
5
Estadstica
Introduccin
Esquema de las etapas de un estudio estadstico
AREA DE INTERES
DATOS
Tema de Investigacin
-Antecedentes Previos
-Objetivos
-Preguntas de Investigacin
-Posibles Hiptesis
-Unidad de Anlisis
-Poblacin
-Variables
ORGANIZAR Y RESUMIR
ESTADSTICA DESCRIPTIVA
(Tablas, Grficos, Medidas
Descriptivas, etc.)
INTERPRETACIN
INFERENCIA ESTADSTICA
Poblacin o Muestra?
CONCLUSIONES
Poblacin
Muestra
Probabilidad
INFORMACIN
6
Estadstica
Introduccin
Ejemplos de algunos problemas a estudiar
1) Se quiere estudiar si en cierto colectivo existe discriminacin salarial debida al sexo de
la persona empleada.

2) Se quiere determinar el perfil de los trabajadores en trminos de condiciones
econmicas y sociales en diferentes comunidades.

3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a
vestuario, alimentacin, ocio y vivienda.

4) Se quiere determinar las tallas estndar en vestuario para mujeres espaolas.

5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de
distintas empresas del pas.

6) Se quiere determinar el perfil sociodemogrfico de los estudiantes de una Universidad.

7) Se quiere estudiar el gasto en telfono mvil mensual de los estudiantes de una
Universidad, y si ste tiene alguna relacin con su edad u otras caractersticas.
7
VARIABLE: es lo que se va a medir y representa una caracterstica de la UNIDAD DE ANLISIS.
QUINES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Anlisis de una
Poblacin o una Muestra
POBLACIN : Es el total de unidades de anlisis que son tema de estudio.
Muestra: 60 trabajadores de empresas de comunicacin
Unidad de anlisis: Trabajador de empresa de comunicacin
Variables: sexo, edad, salario, N de horas de trabajo, etc.
Poblacin:
Las personas que
trabajan en empresas de
comunicacin
Estadstica
MUESTRA: Es un conjunto de unidades de anlisis provenientes de una poblacin.
Muestra
Resumen de algunos conceptos planteados en la Introduccin
8
TIPOS DE VARIABLES
Variables Cuantitativas
Variable: corresponde a la caracterstica de la Unidad de Anlisis
Intervalo
DISCRETA
Variables Cualitativas
CONTINUA
Toma valores enteros
Ejemplos: Nmero de Hijos, Nmero de
empleados de una empresa, Nmero de
asignaturas aprobadas en un semestre, etc.
Toma cualquier valor dentro de un intervalo
Ejemplos: Peso; Estatura; Temperatura, etc.
Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura
ORDINAL NOMINAL
Caracterstica o cualidad
cuyas categoras no tienen
un orden preestablecido.
Ejemplos: Sexo, Deporte
Favorito, etc.
Caracterstica o cualidad cuyas
categoras tienen un orden
preestablecido.
Ejemplos: Calificacin (S, N, A);
Grado de Inters por un tema, etc.
Estadstica
9
Frecuencia: desde un conjunto de unidades, corresponde al Nmero o Porcentaje de veces que se
presenta una caracterstica.
DISCRETA
CONTINUA
ORDINAL
NOMINAL
TIPO FRECUENCIA
Frecuencia Absoluta (F) Frecuencia Relativa (f)
Frecuencia Absoluta
Acumulada (FAA)
Frecuencia Relativa
Acumulada (fra)
DISCRETA
CONTINUA
NOMINAL
ORDINAL
Variable
Cuantitativa
Variable
Cualitativa
Variable
Cuantitativa
Variable
Cualitativa
Estadstica
TIPOS DE FRECUENCIAS
La frecuencia es el nmero de veces que se repite un valor o dato de
anlisis en una tabla.
Hay dos tipos de frecuencia: la absoluta y la relativa.
La frecuencia absoluta (n
i
) es el nmero de veces que se repite cada
dato y la frecuencia relativa se obtiene dividendo la frecuencia absoluta
entre el total de registro.
La frecuencia relativa ( f
i
) nos ayuda a identificar tendencias. El nmero
cuya frecuencia se acerque ms a la unidad es el que tiene mayores
probabilidades de salir.



10
11

En la tabla de frecuencias absolutas es sencillo visualizar
cmo se distribuyen los datos.
La columna de las frecuencias absolutas nos indica el
nmero de veces que ocurre un mismo dato.

Frecuencia absoluta acumulada (N
i
), es el nmero de
veces n
i
en la muestra N.

Frecuencia relativa acumulada (F
i
), es el cociente entre la
frecuencia absoluta acumulada y el total de la muestra.


TIPOS DE FRECUENCIAS
Estatura Frecuencias
1.60 m 1
1.55 m 2
1.50 m 10
1.45 m 15
1.40 m 2
1.35 m 3
1.30 m 1
1.25 m 1
Total 35
12
Ejemplo:
La frecuencia de los alumnos que miden 1.60 m es 1; la frecuencia
de los alumnos que miden 1.55 m es 2, etctera.
13
Variables
- Tipo de Industria: se clasifica en industria tipo A, B, C o D. (cualitativa nominal)
- N de Empleados: se refiere al nmero de empleados en las lneas de produccin. (cuantitativa discreta)
- Superficie: se refiere a los metros cuadrados (unidad de medida) disponibles para las reas de
produccin. (cuantitativa continua)
- Calificacin: calificacin realizada por una institucin pblica sobre cumplimiento de ciertos estndares
(Muy Bien, Bien, Regular, Mal). (cualitativa ordinal)
Industria n Tipo N Empleados Superficie Calificacin
1 A 100 1000,6 Muy Bien
2 B 150 1200,4 Bien
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
299 D 250 800,3 Mal
300 C 300 4000,2 Regular
Problema de Investigacin: Se quiere establecer el perfil de las industrias
de conserva en funcin de algunas caractersticas.
Unidad de Anlisis: Industria de Conserva
Poblacin: Industrias de Conservas del pas
Datos
EJEMPLO
Estadstica
14
EJEMPLO
TABLAS DE
FRECUENCIA
Tipo de
Industria
Frecuencia
Absoluta (F
j
)
Frecuencia
Relativa (f
j
)
Porcentaje
(%)
A
B
C
D
Total 300 1 100
Calificacin
Frec.
Absoluta (F
j
)
Frec.Relativa
(f
j
) o %
Frec. Absol.
Acum. (FAA
j
)
Frec. Relat.
Acum. (fra
j
) o %
Muy Bien
Bien
Regular
Mal 300 1 (o 100)
Total 300 1 (o 100)
Numero de
Empleados
Frec.
Absoluta (F
j
)
Frec.Relativa
(f
j
) o %
Frec. Absol.
Acum. (FAA
j
)
Frec. Relat.
Acum. (fra
j
) o %
<100
[100-150[
.
.
[950-1000] 300 1 (o 100%)
Total 300 1 (o 100%)
Superficie
(mt
2
)
Frec.
Absoluta (F
j
)
Frec.Relativa
(f
j
) o %
Frec. Absol.
Acum. (FAA
j
)
Frec. Relat.
Acum. (fra
j
) o %
<200
[200-400[
.
.
[50000-5200] 300 1 (o 100%)
Total 300 1 (o 100%)
(1)
(2)
(3)
(4)
Problema de Investigacin: Se quiere establecer el perfil de las industrias de conserva en
funcin de algunas caractersticas.
Unidad de Anlisis: Industria de Conserva
Poblacin: Industrias de Conservas del pas
Estadstica
15
Elementos de una tabla de frecuencia cuando la variable es continua (x)
Intervalo
Centro
de clase Amplitud F f FAA fra
I
1
c
1
a
1

I
2
c
2
a
2

.
.
I
k
c
k
a
k
n 1
Total n 1

[L
I1
; L
S1
[
[L
I2
; L
S2
[
[L
Ik
; L
Sk
]
a
j
= (L
Sj
L
Ij)
) c
j
= (L
Ij)
+ L
Sj
)/2
Estadstica
16
Ejercicio: confeccin de una tabla de frecuencia para una variable continua
10,5 10,7 9,5 10,5 11,8 11,2
12,0 10,3 13,5 12,3 10,6 9,8
10,7 11,5 11,1 10,6 9,3 12,9
10,4 7,5 10,2 8,7 10,9 9,9
11,7 10,3 10,6 10,5 11,9 11,0
13,9 10,6 10,0 10,8 10,6 -
7,3 8,0 8,5 12,5 9,7 -

Los datos corresponden a la edad de los
hijos de los trabajadores de una empresa
7,3 9,7 10,4 10,6 11,1 12,3
7,5 9,8 10,5 10,6 11,2 12,5
8,0 9,9 10,5 10,7 11,5 12,9
8,5 10,0 10,5 10,7 11,7 13,5
8,7 10,2 10,6 10,8 11,8 13,9
9,3 10,3 10,6 10,9 11,9 -
9,5 10,3 10,6 11,0 12,0 -

Datos ordenados de menor a mayor
1) Construya un Diagrama de Tallo y Hoja
2) Cul es la variable?; Cul es la Unidad de
anlisis?; Cunto vale n?; Cul es el rango
de la variable?.
3) Sobre una Tabla de frecuencia: Cuntos
intervalos podra construir?; Cul es la
amplitud de cada intervalo?; Cuntas
medidas de frecuencia puede obtener para
cada intervalo?.
4) Construir tabla de frecuencia para la
variable: Intervalos, centro de clase,
amplitud, frecuencias.
Realice la siguiente actividad
Diagrama de Tallo y Hoja: permite organizar los
datos de una variable medida sobre un conjunto de
individuos. Su utilidad viene dada cuando no
contamos con herramientas automticas para
ordenar los datos.
Estadstica
17
TIPOS DE GRFICOS 1. Grfico de Sectores Circulares (de Torta)
Distribucin de las unidades de anlisis de
acuerdo a variable 1
A
20%
D
10%
C
40%
B
30%
Distribucin de las unidades de
anlisis de acuerdo a variable 1
B
30%
C
40%
D
10%
A
20%
Distribucin de las unidades de
anlisis de acuerdo a variable 1
B
30%
C
40%
D
10%
A
20%
Estadstica
18
TIPOS DE GRFICOS 2. Grfico de Barras
Numero de unidades de anlisis
de acuerdo a variable 1
0
100
200
300
400
500
A B C D
variable 1
N

Porcentaje de unidad de anlisis de acuerdo a


variable 1
0 20 40 60 80 100
A
B
C
D
v
a
r
i
a
b
l
e

1
% unidad de anlisis
-Este tipo de grfico se utiliza generalmente para
representar la frecuencia de las categoras de una
variable cualitativa.
-Cuando una variable es cuantitativa se puede utilizar
este tipo de grfico slo si la variable se ha
transformada en categoras.
-Hay distintas versiones de estos grficos (por ejemplo
en Excel), y en algunos casos son muy tiles para
describir el comportamiento de una variable en distintos
grupos.
Proporcin de unidad de anlisis de acuerdo a
variable 1
0 0,2 0,4 0,6 0,8 1
A
B
C
D
v
a
r
i
a
b
l
e

1
Proporcin de unidad de anlisis
Estadstica
19
Histograma
- Permite la representacin de
la frecuencia de una variable
Cuantitativa.
- El eje x se refiere a la
variable.
- El eje y se refiere a la
frecuencia (N , %).
- Cada barra representa la
frecuencia de la variable en la
poblacin en estudio (o la
muestra).
-El histograma se puede
construir desde los datos de la
tabla de frecuencia de la
variable en estudio.
TIPOS DE GRFICOS 3. Histograma
14 13 12 11 10 9 8 7
15
10
5
0
edad
F
r
e
c
u
e
n
c
i
a
N


edad
Histograma
Distribucin de los hijos de trabajadores
de la empresa de acuerdo a edad
Ejemplo
En el grfico se puede observar el nmero de
hijos , de menor edad (7-8 aos), las de mayor
edad (13-14 aos); y adems que la mayora de
hijos de los trabajadores estn entre los 10 y 12
aos.
Estadstica
20
TIPOS DE GRFICOS 5. Polgono de Frecuencia
edad
14 13 12 11 10 9 8 7
15
10
5
0
edad
F
r
e
c
u
e
n
c
i
a
N


Distribucin de los hijos de trabajadores
de la empresa de acuerdo a edad
-Esta representacin se basa en
el Histograma.
-Slo es til para variables
cuantitativas.
-El eje x se refiere a la
variable.
- El eje y se refiere a la
frecuencia (N , %).
-Los puntos que permiten la
unin de las lneas representa
el centro de clase (o marca de
clase).
Estadstica
21
TIPOS DE GRFICOS 5. Diagrama de Caja
- Permite identificar grficamente la
mediana, los cuartiles 1 y 3
(percentiles 25 y 75), mnimo y
mximo de una variable.
- Slo es til para variables
cuantitativas.
-El eje x permite identificar la
poblacion en estudio.
- El eje y representa los valores de la
variable en estudio.
Estadstica
1473 584 N =
Hombres Mujeres
E
d
a
d
100
90
80
70
60
50
40
30
20
10
0
Edad de las personas que se realizaron
angioplasta entre 1980 y 2000
22
TIPOS DE GRFICOS 6. Otros
Nmero de alumnos matriculados en la
Carrera A segn ao de ingreso
0
20
40
60
80
100
1998 1999 2000 2001 2002 2003
ao de ingreso
N


d
e

a
l
u
m
n
o
s
Nmero de alumnos matriculados en la
Carrera B segn ao de ingreso
0
20
40
60
80
100
1998 1999 2000 2001 2002 2003
ao de ingreso
N


d
e

a
l
u
m
n
o
s
Nmero de alumnos matriculados en las Carreras
segn ao de ingreso
0
50
100
150
200
1998 1999 2000 2001 2002 2003
ao ingreso
N


d
e

a
l
u
m
n
o
s
Carrera B
Carrera A
ao de ingreso Carrera A Carrera B
1998 60 80
1999 55 70
2000 80 50
2001 40 60
2002 68 50
2003 70 75
N de alumnos
Estadstica
23
OBSERVACIONES
* El Tipo de Grfico seleccionado va a depender de la variable en estudio.
* El Grfico debe contener un Ttulo General y la identificacin de cada
eje (variable en estudio y frecuencia).
* En ocasiones resulta ms ilustrativo un grfico que una tabla de
frecuencia.
* Al igual que las tablas, los grficos deben ser auto-explicativos.
Variables Cuantitativas
variable = x
i individuo el en variable la de valor =
i
x
n i ,..., 1 =
nc c c c
n
i
= + + =

=

1

= =
= + + =
n
i
i n
n
i
i
x c cx cx cx
1
1
1

b x a b ax b ax b ax
n
i
i n
n
i
i
+ = + + + + = +

= = 1
1
1
) ( ) ( ) (
2 2
1
1
2
n
n
i
i
x x x + + =

=

2
1
2
1
) ( ) (
n
n
i
i
x x x + + =

=

) ( ) ( ) (
1 1
1
n n
n
i
i i
y x y x y x + + + + = +

=

) ( ) ( ) (
1 1
1
n n
n
i
i i
y x y x y x + + =

=

variable = y
i individuo el en variable la de valor =
i
y
NOTACION
constantes : , , c b a
Estadstica
24
MEDIDAS DE TENDENCIA CENTRAL
-Media Aritmtica (Promedio)
-Mediana
-Moda
n
x
x
n
i
i

=
=
1
Media Aritmtica o Promedio
Mediana
) ( E
M
k
x =
2
M
) 1 ( ) (
E
+
+
=
k k
x x
x
1
x
2
x


n
x


Datos Cuantitativos
x
) 1 (
x
) 2 (
x


) (n
x


Datos Cuantitativos ordenados de menor a mayor
Si n es par
Si n es impar
centro del dato
) (
=
k
x
repite" se ms que dato el " M
o
=
Moda Datos
Cualitativos y Cuantitativos
Estadstica
25
Percentiles, Deciles o Cuartiles
-Percentil (ejemplo: 25, 50, 75)
-Decil (ejemplo: 4, 5, 8)
-Cuartil (ejemplo: 1, 2, 3)
El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que rene al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posicin 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posicin 34.
Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n
datos estn ordenados de Menor a Mayor
Estadstica
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que rene al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posicin 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posicin 22.
El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que rene al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posicin 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posicin 64.
26
MEDIDAS DE DISPERSIN
-Rango
-Varianza
-Desviacin Estndar
Rango
Varianza
x
1
x
2
x


n
x


Datos Cuantitativos
Coeficiente de Variacin
Comparacin entre Variables
Se refiere al comportamiento de las variables cuantitativas en un
grupo. Por ejemplo: Si se tiene un conjunto de personas a las que
se les mide Estatura, Peso, Edad: Entre estas variables cul
presenta mayor variacin?
) min( ) max(
i i
x x R =
Desviacin Tpica o Estndar
2
1
2 1 1
2 2
1
2
2
1
) (
1
) (
x x
n n
x
n
x
n
x x
s
n
i
i
n
i
n
i
i i
n
i
i
=

=


=
= = =
2
s s =
x
s
cv =
Estadstica
27
Estadstica
Otras medidas o Coeficientes
-Asimetra
-Kurtosis o Apuntamiento
Adems de la posicin y la dispersin de los datos, otra medida de inters en una distribucin de frecuencias
es la simetra y el apuntamiento o kurtosis.
Coeficiente de Asimetra
3
1
3
) (
s n
x x
CA
n
i
i

=

=
Si CA=0 si la distribucin es simtrica alrededor de la media.
Si CA<0 si la distribucin es asimtrica a la izquierda
Si CA>0 si la distribucin es asimtrica a la derecha
Coeficiente de Apuntamiento
4
1
4
) (
s n
x x
CAp
n
i
i

=

=
- Si CAp=0 la distribucin se dice normal (similar
a la distribucin normal de Gauss) y recibe el
nombre de mesocrtica.
- Si CAp>0, la distribucin es ms puntiaguda que
la anterior y se llama leptocrtica, (mayor
concentracin de los datos en torno a la media).
- Si CAp<0 la distribucin es ms plana y se
llama platicrtica.
28
Estadstica
Otras medidas o Coeficientes
-Asimetra
-Kurtosis o Apuntamiento
Ejemplos Histogramas con distinta asimetra y apuntamiento
V2
7,0 6,0 5,0 4,0 3,0 2,0 1,0
14
12
10
8
6
4
2
0
Desv. tp. = 1,67
Media = 3,9
N = 30,00
V4
2,0 1,0 0,0 -1,0
30
20
10
0
Desv. tp. = ,64
Media = 0,0
N = 30,00
V5
9,0 8,0 7,0 6,0 5,0 4,0 3,0 2,0 1,0
6
5
4
3
2
1
0
Desv. tp. = 2,42
Media = 5,2
N = 28,00
29
Estadstica
Otras medidas o Coeficientes
-Asimetra
-Kurtosis o Apuntamiento
Ejemplos
Media 3,9
Mediana 4
Moda 4
Desviacin estndar 1,67
Varianza de la muestra 2,78
kurtosis -0,43
Coeficiente de asimetra -0,02
Rango 6
Mnimo 1
Mximo 7
Cuenta 30
V1
9,0 8,0 7,0 6,0 5,0 4,0 3,0 2,0 1,0
16
14
12
10
8
6
4
2
0
Desv. tp. = 1,77
Media = 5,4
N = 66,00
1 4 4
1 4 4
1 4 5
2 4 5
2 4 6
2 4 6
2 4 6
3 4 6
3 4 7
4 4 7
Datos
Histograma
Medidas descriptivas
30
Estadstica
Media, Desviacin tpica, Coeficientes de Asimetra y Apuntamiento
para datos Agrupados (tabla de frecuencias)
Intervalo
Centro
de clase Amplitud F f FAA fra
I
1
c
1
a
1

I
2
c
2
a
2

.
.
I
k
c
k
a
k
n 1
Total n 1

f
1

f
2

f
k

n
1

n
2

n
k

Tabla de frecuencia (para variable cuantitativa)

1) La Media para datos agrupados es igual a la
suma de los productos de las marcas de clase
por sus frecuencias relativas, de la forma:

=
= =
k
j
j j c c
f c x Media
1
Sea c
j
la marca de clase (o centro de clase) y f
j
la
frecuencia relativa de la clase j, donde j=1, 2,, k.
2) La Desviacin tpica para datos
agrupados esta dada por:

=
=
k
j
j c j c
f x c s
1
2
) (
3) El Coeficiente de Asimetra para
datos agrupados esta dado por:
3
1
3
) (
c
k
j
j c j
c
s
f x c
CA

=

=
4) El Coeficiente de apuntamiento para
datos agrupados esta dada por:
4
1
4
) (
c
k
j
j c j
c
s
f x c
CAp

=

=
31
Estadstica
Descripcin de 2 variables cualitativas
Distribucin conjunta
Tabla 1 Actividad
Transporte Estudia Pensionado Trabaja
Autobus 5 7 0
Bicicleta 3 3 2
Caminar 2 5 2
Coche 5 4 5
Metro 6 7 4
Transporte N %
Autobus 12 20,0
Bicicleta 8 13,3
Caminar 9 15,0
Coche 14 23,3
Metro 17 28,3
TOTAL 60 100
Actividad N %
Estudia 21 35,0
Pensionado 26 43,3
Trabaja 13 21,7
TOTAL 60 100
Problema
Interesa estudiar cual es el
principal medio de transporte
preferido por un grupo de
personas a la hora de dirigirse
al centro comercial.

Para esto se consult a cada
persona sobre la actividad a la
que se dedicaba y el medio de
transporte preferido.
32
Estadstica
Descripcin de 2 variables cualitativas
Distribucin conjunta
N de personas
Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)
Tabla 2 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
Bicicleta 3 3 2 8
Caminar 2 5 2 9
Coche 5 4 5 14
Metro 6 7 4 17
TOTAL 21 26 13 60
33
Estadstica
Descripcin de 2 variables cualitativas
Distribucin conjunta
N de personas y % respecto de tipo de Transporte
Tabla 3 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
% 41,7 58,3 0 100
Bicicleta 3 3 2 8
% 37,5 37,5 25 100
Caminar 2 5 2 9
% 22,2 55,6 22,2 100
Coche 5 4 5 14
% 35,7 28,6 35,7 100
Metro 6 7 4 17
% 35,3 41,2 23,5 100
TOTAL 21 26 13 60
% 35 43,3 21,7 100
34
Estadstica
Descripcin de 2 variables cualitativas
Distribucin conjunta
N de personas y % respecto de tipo de Actividad
Tabla 4 Actividad
Transporte Estudia Pensionado Trabaja TOTAL
Autobus 5 7 0 12
% 23,8 26,9 0 20
Bicicleta 3 3 2 8
% 14,3 11,5 15,4 13,3
Caminar 2 5 2 9
% 9,5 19,2 15,4 15
Coche 5 4 5 14
% 23,8 15,4 38,5 23,3
Metro 6 7 4 17
% 28,6 26,9 30,8 28,3
TOTAL 21 26 13 60
% 100 100 100 100
35
MEDIDAS DE ASOCIACIN LINEAL
- Covarianza
- Correlacin
x
1
x
2
x


n
x


Datos
Cuantitativos
Covarianza:
Recordemos que: Hasta ahora hemos estudiado las medidas tendencia
central (Media, Mediana, Moda) y dispersin
(Varianza y Desviacin Estndar) para una Variable
Cuantitativa (x).
Es una medida de Variabilidad Conjunta entre dos variables (x
1
, x
2
) o bien (x , y)
x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2

) (n
x
) n (
y
Si Cov(x,y) es positiva: la asociacin entre x e y es directamente proporcional,
es decir que cuando x aumenta y tambin aumenta; y viceversa.
Si Cov(x,y) es negativa: la asociacin entre x e y es inversamente proporcional,
es decir que cuando x aumenta y disminuye; y viceversa.
Si Cov(x,y) es cero: no existe asociacin entre x e y.

=
=
n
i
i i
) y y )( x x (
n
) y , x cov(
1
1
Estadstica
36
MEDIDAS DE ASOCIACIN LINEAL
- Covarianza
- Correlacin
Datos
Cuantitativos
Coeficiente de Correlacin de Pearson (r): Mide el grado de Asociacin Lineal
entre dos variables Cuantitativas
Se refiere al grado de asociacin entre dos variables (x
1
, x
2
) o bien (x , y)
x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2

) (n
x
) n (
y
Si r es positivo: la asociacin entre x e y es directamente proporcional, es decir que
cuando x aumenta y tambin aumenta; y viceversa. Si r=1: la asociacin lineal es
perfecta.
Si r es negativo: la asociacin entre x e y es inversamente proporcional, es decir
que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociacin lineal es
perfecta.
Si r es cero: no existe asociacin entre x e y.
Correlacin:
1 1 s s r
y x
s s
) y , x cov(
r =
y x
n
i
i i
s s ) n (
y x n y x
r
1
1

=

=
Estadstica
37
r=1 r=-1
EJEMPLO : Representacin grfica de las variables x e y
Estadstica
38
Objetivo 2
Estudiar si los valores de una
variable pueden ser utilizados para
predecir el valor de la otra
REGRESION LINEAL SIMPLE
Datos Cuantitativos
Determinar si existe relacin
entre las variables x e y:
Coeficiente de Correlacin
Objetivo 1
Determinar si dos variables estn
asociadas y en qu sentido se da
la asociacin.
Estudiar la dependencia de una
variable respecto de la otra:
Modelo de Regresin
Trminos
Variable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)
Relacin Lineal (modelo lineal)
Parmetros (intercepto y pendiente)
I ntercepto (respuesta media)
Pendiente(efecto de la variable explicativa sobre la respuesta)
Error (residuo)
x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2

) (n
x
) n (
y
Estadstica
39
REGRESION LINEAL SIMPLE
Datos Cuantitativos
Notacin
Variable Respuesta: y
Variable Explicativa: x
Modelo de Regresin Lineal Simple: y
i
=o+|x
i
+e
i

I ntercepto: o
Pendiente: |
Error: e
x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2

) (n
x
) n (
y
Modelo Estimado
(recta de regresin)
bx a y + =
x b y a =
2
1 1
2
1 1 1
|
.
|

\
|

=


= =
= = =
n
i
i
n
i
n
i
i
n
i
i
n
i
x x n
y x xy n
b
Mtodo de Estimacin: Mnimos Cuadrados
i i i
y y e =
Residuos o Errores
Estadstica
40
REGRESION LINEAL SIMPLE
DATOS
MODELO DE REGRESIN LINEAL SIMPLE
y
i
=o+|x
i
+e
i

x
y
) 1 (
x
) (
y
1
) 2 (
x
) (
y
2

) (n
x
) n (
y
MODELO ESTIMADO
bx a y + =
x b y a =
2
1 1
2
1 1 1
|
.
|

\
|

=


= =
= = =
n
i
i
n
i
n
i
i
n
i
i
n
i
x x n
y x xy n
b
ESTIMADORES
i i i
y y e =
ERRORES
Estadstica
41
REGRESION LINEAL SIMPLE
EJ EMPLO: Aplicacin del Modelo de Regresin Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 nios, y estamos
interesados en determinar si existe algn tipo de relacin entre la talla del nio y su edad.
nio edad (meses) talla (cm)
i x
i
y
i
1 3 55
2 6 68
3 5 64
4 5 66
5 3 62
6 4 65
7 9 74
8 8 75
9 9 73
10 7 69
11 6 73
12 5 68
13 8 73
14 6 71

y=talla / x=edad / n=14

956
14
1
=

= i
i
y 3 , 68 = y
6 , 5 =
y
s

84
14
1
=

= i
i
x

6 = x

2 =
x
s

07 , 9 ) , cov( = y x

88 , 0 =
xy
r

5863
14
1
=

= i
i i
y x

556
14
1
2
=

= i
i
x


Estadstica
42
REGRESION LINEAL SIMPLE
EJ EMPLO: Aplicacin del Modelo de Regresin Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 nios, y estamos
interesados en determinar si existe algn tipo de relacin entre la talla del nio y su edad.
Modelo Estimado
bx a y + =


44 , 2 = b 64 , 53 = a

x y 44 , 2 64 , 53 + =


Interpretacin de los resultados
- Existe asociacin o dependencia entre la Talla del nio y la edad (r=0,88); a
medida que la edad aumenta la talla aumenta.
- Desde los resultados del modelo de regresin lineal simple, se tiene que la talla
media de un nio es de 53,64 cm. Cuando la edad del nio (meses) aumenta en
una unidad la talla se incrementa en 2,44 cm.
Estadstica
43
REGRESION LINEAL SIMPLE
EJ EMPLO: Aplicacin del Modelo de Regresin Lineal Simple
Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 nios, y estamos
interesados en determinar si existe algn tipo de relacin entre la talla del nio y su edad.
De acuerdo al coeficiente de
determinacin, el modelo ajustado
a los datos es adecuado (R
2

cercano a 1)
Bondad de Ajuste del Modelo
R
2
= 0,77

nio edad (meses) talla (cm) Talla estimada error
i x
i
y
i
i
y
i
e
1 3 55 61,0 -6,0
2 6 68 68,3 -0,3
3 5 64 65,8 -1,8
4 5 66 65,8 0,2
5 3 62 61,0 1,0
6 4 65 63,4 1,6
7 9 74 75,6 -1,6
8 8 75 73,2 1,8
9 9 73 75,6 -2,6
10 7 69 70,7 -1,7
11 6 73 68,3 4,7
12 5 68 65,8 2,2
13 8 73 73,2 -0,2
14 6 71 68,3 2,7

86 , 402 ) (
14
1
2
=

= i
i i
y y
7 , 92 ) (
14
1
2
14
1
2

= =
= =
i
i
i
i i
e y y

Estadstica

Вам также может понравиться