Вы находитесь на странице: 1из 18

Tema 1: Introduccin a la estadstica

Tema 1: Introducin

Para qu sirve la estadstica?


La Ciencia se ocupa en general de fenmenos observables
La Ciencia se desarrolla observando hechos, formulando leyes que los

explican y realizando experimentos para validar o rechazar dichas leyes

Los modelos que crea la ciencia son de tipo determinista o aleatorio

(estocstico)

La Estadstica se utiliza como tecnologa al servicio de las ciencias

donde la variabilidad y la incertidumbre forman parte de su naturaleza

La Estadstica [...] ensea y ayuda a investigar en todas las reas de la

Psicologa donde la variablidad no es la excepcin sino la regla

Tema 1: Introducin

Definicin
La Estadstica es la Ciencia de la

Sistematizacin, recogida, ordenacin y presentacin de


los datos referentes a un fenmeno que presenta
variabilidad o incertidumbre para su estudio metdico,
con objeto de
deducir las leyes que rigen esos fenmenos,

y poder de esa forma hacer previsiones sobre los mismos,


tomar decisiones u obtener conclusiones.

Tema 1: Introducin

Pasos en un estudio estadstico

Plantear hiptesis sobre una poblacin

Los depresivos tienen ms faltas en la universidad que los no depresivos.

En qu sentido? Mayor nmero? Tiempo medio?

Decidir qu datos recoger (diseo de experimentos)


Qu individuos pertenecern al estudio (muestras)

Depresivos y no depresivos universitarios.

Criterios de exclusin Cmo se eligen? Descartamos los que padecen enfermedades


mentales?
Qu datos recoger de los mismos (variables)

Nmero de faltas

Tiempo de duracin de las faltas

Sexo? Semestre? Otros factores?

Recoger los datos (muestreo)


Estratificado? Sistemticamente?

Describir (resumir) los datos obtenidos

tiempo medio de faltas en depresivos y no depresivos(estadsticos)

% de faltas de depresivos por sexo (frecuencias), grficos,...

Realizar una inferencia sobre la poblacin

Los depresivos faltan al menos 10 das/ao ms que la media de los no depresivos.

Cuantificar la confianza en la inferencia


Nivel de confianza del 95%
Significacin del contraste: p=2%
Tema 1: Introducin

Mtodo cientfico y estadstica

Plantear
hiptesis

Disear
experimento

Obtener
conclusiones

Recoger datos
y analizarlos

Tema 1: Introducin

Poblacin y muestra
Poblacin (population) es el conjunto sobre el que estamos
interesados en obtener conclusiones (hacer inferencia).
Normalmente es demasiado grande para poder abarcarlo.

Muestra (sample) es un subconjunto suyo al que tenemos


acceso y sobre el que realmente hacemos las observaciones
(mediciones)
Debera ser representativo
Est formado por miembros seleccionados de la
poblacin (individuos, unidades experimentales).

Tema 1: Introducin

Variables
Una variable es una caracterstica observable que vara entre los diferentes

individuos de una poblacin. La informacin que disponemos de cada


individuo es resumida en variables.
En los individuos de la poblacin, de uno

a otro es variable:

El grupo sanguneo

{A, B, AB, O} Var. Cualitativa

Su nivel de felicidad declarado

{Deprimido, Ni fu ni fa, Muy Feliz} Var.


Ordinal

El nmero de hijos

{0,1,2,3,...} Var. Numrica discreta

La altura

Tema 1: Introducin

{162 ; 174; ...} Var. Numrica continua

Tipos de variables
Cualitativas

Si sus valores (modalidades) no se pueden asociar naturalmente a un nmero


(no se pueden hacer operaciones algebraicas con ellos)
Nominales: Si sus valores no se pueden ordenar

Sexo, Grupo Sanguneo, Religin, Nacionalidad, Fumar (S/No)

Ordinales: Si sus valores se pueden ordenar

Mejora a una terapia, Grado de satisfaccin, Intensidad del dolor

Cuantitativas o Numricas

Si sus valores son numricos (tiene sentido hacer operaciones algebraicas


con ellos)
Discretas: Si toma valores enteros

Nmero de hijos, Nmero de cigarrillos, Numero de cumpleaos

Continuas: Si entre dos valores, son posibles infinitos valores

intermedios.
Altura, Presin intraocular, Dosis de medicamento administrado, edad
Tema 1: Introducin

Es buena idea codificar las variables

como nmeros para poder procesarlas


con facilidad en un computador.
Es conveniente asignar etiquetas a los
valores de las variables para recordar qu
significan los cdigos numricos.
Sexo (Cualitativa: Cdigos
arbitrarios)
1 = Hombre
2 = Mujer
Raza (Cualitativa: Cdigos
arbitrarios)
1 = Blanca
2 = Negra...
Felicidad Ordinal: Respetar un orden
al codificar.
1 = Muy feliz
2 = Bastante feliz
3 = No demasiado feliz
Se pueden asignar cdigos a respuestas
especiales como
0 = No sabe
99 = No contesta...
Estas situaciones debern ser tenidas en
cuentas en el anlisis. Datos perdidos
(missing data).
Tema 1: Introducin

Aunque se codifiquen como nmeros, debemos recordar siempre el

verdadero tipo de las variables y su significado cuando vayamos a


usar programas de clculo estadstico.
No todo est permitido con cualquier tipo de variable.

Tema 1: Introducin

10

Los posibles valores de una variable suelen denominarse modalidades.

Las modalidades pueden agruparse en clases (intervalos)


Edades:

Menos de 20 aos, de 20 a 50 aos, ms de 50 aos


Hijos:
Menos de 3 hijos, De 3 a 5, 6 o ms hijos

Las modalidades/clases deben forman un sistema exhaustivo y

excluyente
Exhaustivo: No podemos olvidar ningn posible valor de la variable
Mal: Cul es su color del pelo: (Rubio, Moreno)?
Bien: Cul es su grupo sanguneo?
Excluyente: Nadie puede presentar dos valores
simultneos de la variable
Estudio sobre el ocio
Mal: De los siguientes, qu le gusta: (deporte, cine)
Bien: Le gusta el deporte: (S, No)
Bien: Le gusta el cine: (S, No)
Mal: Cuntos hijos tiene: (Ninguno, Menos de 5, Ms de 2)
Tema 1: Introducin

11

Presentacin ordenada de datos


7

Gnero

Frec.

Hombre

6
5
4
3
2

Mujer

1
0
Hombre

Mujer

Las tablas de frecuencias y las representaciones

grficas son dos maneras equivalentes de presentar la


informacin. Las dos exponen ordenadamente la
informacin recogida en una muestra.
Tema 1: Introducin

12

Tablas de frecuencia

Exponen la informacin recogida en la muestra, de forma que no se pierda nada de

informacin (o poca).
Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad
Frecuencias acumuladas: Slo tienen sentido para variables ordinales y numricas
Muy tiles para calcular cuantiles .
Qu porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8
Entre 4 y 6 hijos? Solucin 1: 8,4%+3,6%+1,6%= 13,6%. Solucin 2: 97,3% - 83,8% =
13,5%
Frecuencias relativas (porcentajes): Idem, pero dividido por el total
Nivel de felicidad
Nmero de hijos

Vlidos

Perdidos
Total

Frecuencia Porcentaje
Muy f eliz
467
30,8
Bastante f eliz
872
57,5
No demasiado f eliz
165
10,9
Total
1504
99,1
No contesta
13
,9
1517
100,0

Porcentaje
v lido
31,1
58,0
11,0
100,0

Porcentaje
acumulado
31,1
89,0
100,0

Vlidos

Sexo del encuestado

Vlidos

Hombre
Mujer
Total

Frecuencia
636
881
1517

Porcentaje
41,9
58,1
100,0

Porcentaje
v lido
41,9
58,1
100,0

Tema 1: Introducin

Perdidos
Total

0
1
2
3
4
5
6
7
Ocho o ms
Total
No contesta

Frecuencia
419
255
375
215
127
54
24
23
17
1509
8
1517

Porcentaje
27,6
16,8
24,7
14,2
8,4
3,6
1,6
1,5
1,1
99,5
,5
100,0

Porcentaje
v lido
27,8
16,9
24,9
14,2
8,4
3,6
1,6
1,5
1,1
100,0

Porcentaje
acumulado
27,8
44,7
69,5
83,8
92,2
95,8
97,3
98,9
100,0

13

Datos desordenados y ordenados en tablas


Variable: Gnero

Gnero Frec.

Frec. relat.
porcentaje

Hombre 4

4/10=0,4=40%

Mujer

6/10=0,6=60%

Modalidades:

H = Hombre
M = Mujer

6
10=tamao
muestral

Muestra:
MHHMMHMMMH
equivale a

HHHH MMMMMM
Tema 1: Introducin

14

Ejemplo
Cuntos individuos tienen

menos de 2 hijos?
frec. indiv. sin hijos
+
frec. indiv. con 1 hijo
= 419 + 255
= 674 individuos

Qu porcentaje de individuos

tiene 6 hijos o menos?


97,3%

Qu cantidad de hijos es tal que

al menos el 50% de la poblacin


tiene una cantidad inferior o
igual?
2 hijos

Tema 1: Introducin

Nmero de hijos

0
1
2
3
4
5
6
7
Ocho+
Tot al

Frec.
419
255
375
215
127
54
24
23
17
1509

Porcent.
(v lido)
27, 8
16, 9
24, 9
14, 2
8, 4
3, 6
1, 6
1, 5
1, 1
100,0

Porcent.
acum.
27, 8
44, 7
69, 5
83, 8
92, 2
95, 8
97, 3
98, 9
100,0

50%

15

Grficos para v. cualitativas


Diagramas de barras
Alturas proporcionales a las frecuencias (absolutas

o relativas.)
Se pueden aplicar tambin a variables discretas

Diagramas de sectores (tortas, etc)


No usarlo con variables ordinales.
El rea de cada sector es proporcional a su

frecuencia (absotuta o relativa)

Pictogramas
Fciles de entender.
El rea de cada modalidad debe ser proporcional a

la frecuencia. De los dos, cul es incorrecto?.

Tema 1: Introducin

16

Grficos diferenciales para variables numricas


419
40 0

variables sean discretas o continuas.


Sirven con frecuencias absolutas o
relativas.

30 0

Recuento

Son diferentes en funcin de que las

255
215
20 0

127
10 0

54
24

Diagramas barras para variables discretas

375

23

17

7 Ocho o m s

Nme ro de hijos

Se deja un hueco entre barras para indicar los


valores que no son posibles

25 0

Histogramas para variables continuas

El rea que hay bajo el histograma entre dos


puntos cualesquiera indica la cantidad
(porcentaje o frecuencia) de individuos en el
intervalo.

Recuento

20 0

15 0

10 0

50

20

40

60

80

Edad del e ncue stado

Tema 1: Introducin

17

Diagramas integrales
Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se
realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la
cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los
construiremos en clase. Se pasan de los diferenciales a los integrales por integracin y a la
inversa por derivacin (en un sentido ms general del que visteis en bachillerato.)

Tema 1: Introducin

18

Вам также может понравиться