Вы находитесь на странице: 1из 20

05/03/2018

Tema 1
Introducción a la Inferencia Estadística

E. Inmaculada de la Fuente
Dpto. de Metodología de las CC del Comportamiento
Universidad de Granada

1. ¿Qué es la Inferencia estadística?


2. Conceptos básicos
3. Tipos de muestreo
3.1. Muestreo no probabilístico
3.2. Muestreo probabilistico o aleatorio
4. Distribución Muestral.

1
05/03/2018

BIBLIOGRAFÍA BÁSICA
Amón, J. (1991). Estadística para psicólogos. Vol. 2.
Probabilidad. Estadística inferencial.Madrid: Pirámide.
Pardo, A. y San Martín, R. (1998). Análisis de Datos en
Psicología II. Madrid: Pirámide.
Peña, D. (2003). Introducción a la Estadística para las
Ciencias Sociales. Madrid. McGraw-Hill
BIBLIOGRAFÍA COMPLEMENTARIA
Bernardo, J.M. (1981). Bioestadística. Una perspectiva
bayesiana. Barcelona: Vicens Vives.
DeGroot, M.H. (1988). Probabilidad y Estadística. México:
Addison-Wesley Iberoamericana.
Gonick, L. y Smith, W. (1999). Estadística en cómic.
Barcelona: Zambrera y Zariquiey.
Maciá, A., Lubin, P. y Rubio, P. (1997). Psicología
Matemática II. (3 vol.). Madrid: UNED.
Martín, Q. (2001). Contraste de Hipótesis. Madrid: La
Muralla-Hespérides.

Martínez-Arias, M.R., Maciá, A. y Pérez, J.A. (1989).


Psicología Matemática II (2). Madrid: UNED.
Peña, D. (2001). Fundamentos de Estadística.. Madrid:
Alianza Universidad.
Walpole, R.E. y Myers, R.H. (1994). Probabilidad y
Estadística. Méjico: McGraw Hill.
Welkowit, J.; Even, R.B. y Cohen, J. (1981). Estadística
aplicada a las ciencias de la educación. Madrid:
Santillana.

2
05/03/2018

1. INTRODUCCIÓN. ¿Qué es la
Inferencia Estadística?
Estadística descriptiva: parte de la
estadística que se encarga de clasificar los
datos obtenidos en una muestra y de
representarlos mediante un conjunto de
estadísticos (media, varianza, correlación …)

Estadística Inferencial: parte de la


estadística cuya finalidad es extraer
conclusiones acerca de la población a la que
pertenecen los datos de la muestra.

El objetivo fundamental de la Inferencia estadística


es obtener conclusiones de las propiedades de
la población a partir de las características de las
muestras que se utilizan para la realización del
estudio.
A dichas conclusiones o generalizaciones a partir
de las muestras utilizadas se les denomina
inferencias y suelen aparecer expresadas en
términos probabilísticos o en términos de
grados de confianza.
Las inferencias se realizarán a partir de los
estadísticos de las muestras y se referirán a los
parámetros poblacionales.

3
05/03/2018

INFERENCIA ESTADÍSTICA

POBLACIÓN MUESTRA
Selección al azar
(PARAMETROS) (ESTADÍSTICOS)

Distribuciones de
probabilidad

INFERENCIA
(en términos de
Probabilidad)

NIVELES
FASES DE UNA INVESTIGACIÓN CIENTÍFICA
-
Hipótesis Discusión de
TEÓRICO- In Hipótesis De los resultados.
Planteamiento du empíricas.
du teóricas.
CONCEPTUAL de problemas.
cci Modelos cci Consecuencias
ón teóricos. ón contrastables. Inducción

Objetivos de la Interpretación
-
investigación. de los
resultados.
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

Diseño de la investigación.
TÉCNICO-
METODOLÓGICO

Recogida de datos.

--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-
Análisis de datos

ANALÍTICO-
ESTADÍSTICO Ajuste de Pruebas de Tamaño del
modelos Significación. efecto.
estadísticos. Contraste de
hipótesis.

4
05/03/2018

INFORME DE INVESTIGACIÓN
Planteamiento

* Del problema

Interpretación  Búsqueda de 
de los datos información

Diseño de la 
Análisis de 
recogida de 
datos
datos

Recogida de 
datos

Los resultados a los que se llega en la Inferencia


estadística se basan en Teoremas del Cálculo de
Probabilidades tan rigurosos como los de cualquier otra
rama de las Matemáticas, si bien a la hora de aplicarlos
y sacar conclusiones hemos de especificar claramente
que los resultados son de tipo probabilístico; es decir,
asociado a las inferencias que realizamos, siempre se
encuentra un nivel de confianza o un nivel de
significación que se ha de especificar claramente.

Podemos clasificar los procedimientos de la Inferencia


estadística según diferentes criterios:

5
05/03/2018

Estimación

Según el objetivo
del investigador

Contraste de Hipótesis
Procedimientos de
Inferencia estadística

Inferencia clásica

Según el tipo de
información

Inferencia bayesiana

La Inferencia Estadística aborda dos tipos de problemas:

Puntual

Estimación

Por intervalos

Contraste de hipótesis

•Estimación puntual: se toma como valor del parámetro poblacional desconocido el


calculado por el estadístico de la muestra o por cualquier otro estimador que el
investigador considere oportuno.
•Estimación por intervalos: calcula un intervalo aleatorio dentro del cual puede
encontrarse el parámetro poblacional desconocido, con un nivel de confianza
determinado
•Contraste de hipótesis: procedimiento que permite identificar si la información
recabada en la muestra es o no compatible con una o más hipótesis planteadas
previamente. La decisión última será rechazar una hipótesis o no, en función de si el
proceso previo establece que es o no incompatible con los datos muestrales recogidos,
con un nivel de confianza determinado.

6
05/03/2018

1. Según el objetivo del estudio


• Métodos paramétricos: suponemos que los datos provienen de
una distribución conocida, cuyos parámetros deseamos estimar
• Métodos no paramétricos: no conocemos la distribución de la
población y realizamos hipótesis sobre éstas

2. Según el tipo de información


• Inferencia clásica: suponemos que los parámetros son valores fijos
desconocidos y que podemos estimar. Se utilizan los
procedimientos clásicos de estimación y contraste de hipótesis.
• Inferencia bayesiana: suponemos que los parámetros son
variables aleatorias, permitiendo introducir información sobre ellos a
priori. Existen procedimientos de estimación y contraste de hipótesis
bayesianos, tantos como clásicos, pero se desarrollan e interpretan
de forma diferente. Los procedimientos bayesianos se basan en el
concepto de probabilidad subjetiva o psicológica.

2. Conceptos básicos
ESTADÍSTICA
• Ciencia que se encarga de recoger, ordenar, y
analizar los datos de una muestra, extraída de cierta
población y que, a partir de esa muestra y
valiéndose del calculo de probabilidades permite
hacer inferencias acerca de esa población.

• ¿Qué hacemos con los datos?


– Describirlos.
– Explorarlos.
– Inferir a partir de ellos.

7
05/03/2018

2. Conceptos básicos
• Universo Conjunto de objetos
que comparten la característica
de estudio.

• Población Subconjunto de Universo

objetos a los que se pretende


generalizar los resultados.
Población

• Muestra Subconjunto de la
población que se selecciona y
analiza).
Muestraestra

• Unidad muestral Elemento


sobre el que se recoge la
información (v.g., persona a la
que se pregunta).

2. Conceptos básicos
ESTADÍSTICA
• ¿Qué hacemos con los datos?
– Describirlos
Estadística descriptiva.
– Explorarlos

– Generalizarlos Estadística inferencial


(inductiva).
• Se hace con el cálculo de probabilidades  Salto
de lo conocido (muestra) a lo desconocido
(población).

8
05/03/2018

2. Conceptos básicos
ESTADÍSTICA INFERENCIAL
• Para generalizar adecuadamente es necesario
disponer correctamente de dos herramientas:
– El muestreo Intenta garantizar que la muestra sea
representativa de su población.

– El cálculo de probabilidades Permite dar el salto


de lo conocido (muestra) a lo desconocido (población).

2. Conceptos básicos
POBLACIÓN Y PARÁMETRO
• Población El investigador tiene acceso a todos los
elementos de la población, que comparten una
característica de interés.

• Puede ser:
– Finita: se pueden enumerar todos sus elementos.
– Infinita: no se pueden enumerar.

• En Psicología, las poblaciones suelen ser finitas pero


tan grandes que pueden considerarse infinitas.

9
05/03/2018

2. Conceptos básicos
POBLACIÓN Y PARÁMETRO
• Se pueden llegar a conclusiones sobre las
características de la población a través de índices
como la media, la varianza o la proporción.

• Un parámetro es una función de los valores


poblacionales. Más concretamente, los índices
numéricos que describen características sobre la
población se llaman parámetros.

2. Conceptos básicos
POBLACIÓN Y PARÁMETRO
• Características de los parámetros:
– Son desconocidos: deben ser estimados con los datos
de la muestra.

– Son constantes: su valor numérico no varía.

– Se representan con letras griegas minúsculas:


• : media de la población.
• : desviación típica de la población.
• : proporción en la población.

10
05/03/2018

2. Conceptos básicos
MUESTRA Y ESTADÍSTICO
• Dado que la población es tan grande que resulta muy
difícil analizar todos sus elementos, se recurre a un
subconjunto, la muestra, para poder estudiar las
características de interés.

• De una misma población, se pueden extraer varias


muestras.

• Un estadístico es una función de los valores de la


muestra. Más concretamente, los índices numéricos que
describen características sobre la muestra se llaman
estadísticos

2. Conceptos básicos
MUESTRA Y ESTADÍSTICO
• Características de los estadísticos:
– Son conocidos, puesto que se pueden analizar todos
sus elementos.

– Sus índices numéricos varían entre muestras: son


variables aleatorias.

– Se expresan con letras latinas minúsculas:

11
05/03/2018

2. Conceptos básicos

Todo estudio estadístico tiene por objeto analizar


determinadas características en una población. Lo
ideal es poder observar dicha característica en
todos los individuos de la población, pero en la
mayoría de casos es imposible. Por eso,
habitualmente estudiamos una parte de la
población, es decir, una muestra.
Ejemplo: Podemos inferir el CI medio de los españoles
mayores de edad (media poblacional µ) a partir del
CI medio observado en algunos de ellos (media
muestral x)
Al trabajar con muestras, hay que diferenciar entre los
estadísticos observados en la muestra de los
parámetros reales correspondientes a la población.

3. TÉCNICAS DE MUESTREO
La fiabilidad de las conclusiones acerca de la población,
obtenidas a partir de una muestra, dependerá de lo
representativa que sea la muestra elegida. De ahí la
importancia de una buena elección de la muestra.
Además una importante ventaja de la realización de un
muestreo adecuado en una investigación es la economía
de tiempo y recursos al estudiar únicamente las variables
de una muestra en lugar de realizar análisis de toda la
población.
No obstante la desventaja o riesgo que conlleva la utilización de
muestras es que debemos asegurarnos de que la muestra
sea representativa de toda la población con el objetivo
fundamental de proceder a la generalización de las
características e hipótesis que permitan construir y/o probar
teorías que explique a la población o fenómeno. La
obtención de muestras apropiadas se consigue mediante el
seguimiento de un procedimiento correcto y una técnica
adecuada.

12
05/03/2018

El procedimiento correcto para seleccionar una muestra adecuada


incluye los siguientes pasos:

1. Definir los casos (participantes u otros seres vivos, objetos,


fenómenos o comunidades) sobre los cuales se habrán de
recolectar los datos.
2. Delimitar la población
3. Elegir el método de selección de la muestra: probabilístico o no
probabilístico
4. Precisar el tamaño de la muestra requerido
5. Aplicar el procedimiento de selección
6. Obtener la muestra

Una vez definidos los casos y delimitada la población tenemos que


elegir el método de selección de la muestra. El primer, y más
general, criterio de diferenciación de las técnicas de muestro es
diferenciar entre el muestreo probabilístico y no probabilístico. De
estos dos tipos el muestreo no probabilístico presenta
importantes limitaciones,pero también es cierto que suele ser
más asequible.

3.1. MUESTREO NO PROBABILÍSTICO

En el que la persona que selecciona la muestra es quien procura que


esta sea representativa, dependiendo de su intención u opinión, y
como su nombre indica no nos permite conocer la probabilidad de
pertenencia a la misma. Luego, en este caso la representatividad de
la muestra es subjetiva. Algunas de las técnicas de este tipo de
muestreo son las siguientes:

a) Sin normas, circunstancial o errático: la muestra se elige por


razones de comodidad o capricho. Por ejemplo un psicólogo escolar
decide presentar los resultados que ha ido obteniendo con los niños
del colegio en que trabaja tras aplicar un determinado
procedimiento de aprendizaje de la lectura.
b) Intencional u opinático: cuando el investigador que selecciona la
muestra procura que ésta sea representativa de la población según
su propio criterio. Por ejemplo, un psicólogo clínico especializado en
depresión desea observar la adherencia al tratamiento en las
terapias antidepresivas y envía un cuestionario a todos los
pacientes pertenecientes a los centros de salud de granada y toma
como datos los resultados de los informes que recibe de los
pacientes.

13
05/03/2018

c) Por cuotas y por rutas: en este caso la investigación es llevada a cabo


por varias personas. Se asigna a cada colaborador un número de
unidades de las que ha de tomar los datos, dejando a su propia elección
como seleccionarlas. Por ejemplo, el psicólogo de recursos humanos de
una empresa quiere llevar a cabo un estudio de motivación de
trabajadores en diferentes empresas. Elige como colaboradores a
becarios que realizan las prácticas en este centro que tienen que realizar
un determinado número de encuestas a trabajadores de diferentes
empresas. Podría suceder que se proporcionara a los becarios una lista
de trabajadores a los que podría pasar la encuesta y ellos seleccionan
los que les parecen convenientes (por cuotas). Pero también se le podría
marcar a los becarios la progresión de las entrevistas, basándonos en
algún criterio, por ejemplo cercanía de las empresa en la que se
encuentran los trabajadores de su vivienda (por rutas)
d) Bola de nieve: Se parte de un conjunto de individuos, que conducen a
otros, y estos a otros, y así hasta conseguir una muestra suficiente. Al
conjunto de individuos de partida les pedimos que nos indiquen personas
que compartan sus características y/o en otros casos que sean de
características opuestas. Entonces entrevistaremos a nuevos individuos
y continuaremos del mismo modo hasta que obtengamos el número de
individuos considerados en la muestra. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones "marginales",
delincuentes, sectas, determinados tipos de enfermos, etc.

El problema de éstas técnicas es que no garantizan la


representatividad de las muestras, fundamentalmente
por la subjetividad que conllevan. Generalmente sólo
darán como resultado muestras representativas de la
población en caso de que ésta sea muy homogénea con
respecto a la que se estudia. Pero aún logrando
muestras muy homogéneas, no nos permiten calcular la
probabilidad de error que podemos cometer al realizar
las inferencias de la muestra a la población. Por ello es
preferible, siempre que sea posible el uso de técnicas
probabilísticas o aleatorias

14
05/03/2018

3.2. MUESTREO PROBABILISTICO O ALEATORIO


El muestreo aleatorio se refiere a todo proceso que garantice a todos los
elementos de la población la misma probabilidad de ser incluidos en la
muestra. En el muestreo probabilístico se puede calcular de antemano
la probabilidad de obtener cada una de las muestras que es posible
seleccionar a partir de la población de referencia.

Para generalizar de manera válida de una muestra a la población, la


muestra no puede ser cualquier subconjunto de la población, es crucial
que sea aleatoria.

El muestreo aleatorio permite construir instrumentos adecuados mediante


los cuales podemos hacer inferencias estadísticas, determinando
además la probabilidad de error contenido en las mismas. El criterio
más general nos lleva a diferenciar dos tipos de muestreo probabilístico:

• Muestreo aleatorio sin reposición de elementos: los elementos


que constituyen la muestra no regresan a la población antes de
elegir a los elementos siguientes. En este caso el elemento no
vuelve a formar parte de la población una vez seleccionado, con lo
cual no puede volver a ser elegido. Imaginemos que queremos
saber la opinión sobre el aborto en España y para elegir
aleatoriamente los sujetos tomamos como base la lista de teléfonos.
En caso de muestreo aleatorio sin reposición los números de
teléfonos que van siendo seleccionados se descartan en las
siguientes elecciones.

• Muestreo aleatorio con reposición de elementos: cada elemento


de la población elegida para la muestra regresa a ésta antes de
elegir al siguiente miembro. De esta forma cuando un elemento es
seleccionado y cuantificadas las características objeto de estudio,
vuelve a formar parte de la población y puede volver a ser elegido.
En el ejemplo anterior una vez que ha sido seleccionado un teléfono
del listín volvemos a considerarlo válido para la siguiente elección.
Generalmente recibe el nombre de muestreo aleatorio simple.

15
05/03/2018

1. Muestreo aleatorio estratificado

Consideramos la población N, dividida en k


subpoblaciones de tamaño N1, N2…Nk. Dichas
poblaciones son disjuntas y cumplen que N1 + N2+…+
Nk = N. Cada una de las subpoblaciones se denominan
estratos. Los estratos han de ser lo más homogéneos
posible dentro de sí y heterogéneos entre ellos. Si
deseamos obtener una muestra de tamaño n de la
población inicial, seleccionamos de cada estrato una
muestra aleatoria de tamaño ni, de manera que n1+ n2
+…+nk= n
Si conocemos que el 70% de los estudiantes de psicología
son mujeres y el 30% son hombres, y deseamos que en
una muestra de 1000 estudiantes el 70% sean mujeres y
el 30% hombre, dividimos a la población en dos estratos
hombres y mujeres y elegimos 700 mujeres y 300
hombres

2. Muestreo por conglomerados

La población se divide en unidades o grupos, llamados


conglomerados, que deben ser lo mas representativas
posibles de la población, y extraemos aleatoriamente
uno o varios de ellos entre la totalidad, la muestra
estaría formada por todos los elementos de los
conglomerados elegidos previamente de modo aleatorio.
Los estratos han de ser lo más heterogéneos posible
dentro de sí y homogéneos entre ellos.

Así, por ejemplo, en vez de elegir una muestra de familias


diseminadas en una ciudad, elegimos al azar un número
de bloques de edificios, formada la muestra por todas
las familias pertenecientes a los bloques elegidos
previamente de forma aleatoria

16
05/03/2018

3. Muestreo aleatorio sistemático

Supongamos que la población consta de N elementos


ordenamos y enumerados desde 1 hasta N, y deseamos
extraer una muestra de tamaño n. Dicha población la
podemos dividir en N subconjuntos, cada unos de ellos con
k=N/n elementos.
Supongamos que tenemos la lista, N, de todos los alumnos de
una universidad, que se encuentran ordenados de acuerdo
con la inicial de su apellido y deseamos obtener una
muestra de tamaño n de alumnos que estén distribuidos
homogéneamente a lo largo de una lista. Para ello elegimos
aleatoriamente un alumno de entre los N/n=k primeros y
luego vamos eligiendo sistemáticamente el que esté situado
k lugares después del primero elegido, k lugares después
del segundo elegido, etc.
Así, por ejemplo, si la población consta de 10.000 alumnos y
deseamos obtener una muestra de tamaño 50, elegimos al
azar un alumno entre los 10.000/50=200 primeros alumnos.
Supongamos que tal alumno ocupa el lugar 115. Pues bien,
la muestra estará compuesta por los alumnos 115,
(115+200) 315, 515…

4. DISTRIBUCIÓN MUESTRAL
Supongamos que se quiere estudiar un parámetro de cierta
población. Una forma de hacerlo sería considerar un
estadístico adecuado y una muestra, calcular el estadístico
correspondiente a esa muestra y considerar como
aproximación del parámetro poblacional el valor del
estadístico.
Pero, como se puede suponer, si se considera otra muestra
diferente y se realiza la misma operación, se obtienen, en
principio, estadísticos diferentes.
Para una mejor aproximación del parámetro poblacional se
puede proceder del modo siguiente:
• Se consideran todas las muestras posibles de tamaño n.
• Se calcula el valor del estadístico.
• Se considera la variable aleatoria que asigna a cada muestra
el valor del estadístico que proporciona.
• Esta variable aleatoria tiene una distribución de probabilidad,
a la que denominaremos “distribución muestral” del
estadístico que consideremos.

17
05/03/2018

EJEMPLOS

1. Sea la media de una muestra (m.a.s.) de tamaño 9 extraída de una


población con distribución N(µ=0, σ2 =81). Seleccionada al azar
una muestra de entre las de dicho tamaño, ¿cuál es la probabilidad
de que su media sea superior a 2?.
2. Estamos interesados en estudiar la variable peso en la población
de recien nacidos españoles y sabemos que la varianza de esta
variable en la población vale 0,01 gramos. Si se selecciona una
muestra aleatoria de 31 recien nacidos, ¿qué probabilidad hay de
que la varianza de la misma tome un valor inferior a 0,004823?
(suponemos que dicha variable en la población sigue una
distribución Normal).
3. Consideremos la población de estudiantes de Psicología con
distribución N(µ=100, σ =25) en una escala de inteligencia
espacial. Si extraemos una muestra aleatoria de 100 sujetos, ¿cuál
es la probabilidad de que se obtenga en ella una media de 98
puntos o más?. ¿Cuál la de que se encuentre entre 97 y 103?.
4. Las notas de cierto examen se distribuyen según una normal de
media 5,8 y desviación típica 2,4. Halar la probabilidad de que la
media de una muestra tomada al azar de 16 personas esté
comprendida entre 5 y 7.

18
05/03/2018

EJEMPLOS

10. Por estadísticas del Ministerio se sabe que la media del sueldo de
los becarios es de 406.15€ con una desviación típica de 55.5 (se
supone una distribución normal). Se escogen al azar a 100 becarios:
– ¿Cuál es la probabilidad de que la media del salario de la
muestra sea inferior a 400€?
– ¿Cuál es la probabilidad de que la media del salario de la
muestra se encuentre entre 400 y 410€?
– ¿Cuál es la probabilidad de que la media del salario de la
muestra sea superior a 415€?.

19
05/03/2018

EJEMPLOS

11. Se sabe que la puntuación de un test en la población sigue una


distribución N(30,42). Se escoge una muestra de 25 personas
– ¿Cuál es la probabilidad de que la varianza muestral oscile entre
21.25 y 25.19?
– ¿Cuál es la probabilidad de que la varianza muestral tome un
valor superior a 10.02?
– ¿Cuál es la probabilidad de que la media sea inferior a 35?

20

Вам также может понравиться