Академический Документы
Профессиональный Документы
Культура Документы
psicologa
CONCEPTO Y FUNCIONES DE LA ESTADSTICA:
DESCRIPTIVA e INFERENCIAL
La estadstica se ocupa de la sistematizacin, recogida, ordenacin, y
presentacin de los datos referentes a un fenmeno que presenta
variabilidad o incertidumbre para su estudio metdico, con objeto de hacer
previsiones sobre los mismos, tomar decisiones u obtener conclusiones.
A partir de aqu obtenemos dos grandes reas:
Estadstica descriptiva
Se organizan y resumen conjuntos de observaciones procedentes de una
muestra o de la poblacin total, en forma cuantitativa.
Procedimientos:
Para una variable
- ndices de tendencia central
- Estadsticos de variabilidad
- Estadsticos de asimetra
Para dos variables
- Coeficientes de correlacin
- Ecuaciones de regresin
Estadstica Inferencial
Se realizan inferencias acerca de una poblacin basndose en los datos
obtenidos a partir de una muestra.
Procedimientos: El clculo de probabilidades.
Definicin de Estadstico: Es una propiedad descriptiva (una medida) de
una muestra.
DISTRIBUCIN DE FRECUENCIAS
Una distribucin de frecuencias es una representacin de la relacin entre
un conjunto de medidas exhaustivas y mutuamente influyentes y la
frecuencia de cada una de ellas.
Funciones:
REPRESENTACIONES GRFICAS
Un grfico es una forma rpida de visualizar un conjunto de datos o
distribucin de frecuencias.
Diagrama de barras
Se utiliza para variables nominales, ordinales y cuantitativas discretas.
Diagrama de sectores
Se utiliza para variables cualitativas y cuasicuantitativas.
Pictograma
Se utiliza para variables cualitativas
Histograma
Polgono de frecuencias
Representacin grfica de dos variables
a) Diagrama de barras conjunto
b) Diagrama de dispersin o nube de puntos
8. PROPIEDADES DE LA DISTRIBUCIN DE
FRECUENCIAS
a) Tendencia central
Se refiere al lugar donde se centra una distribucin particular en la escala
de valores.
b) Variabilidad
Se refiere al grado de concentracin de las observaciones en torno al
promedio.
Una distribucin de frecuencias ser:
Homognea (tiene poca variabilidad). Si los valores de distribucin estn
cercanos al promedio. (Cuando hay pocos rectngulos alrededor del central)
Heterognea (tiene mucha variabilidad). Si los valores se dispersan mucho
en torno al promedio. (Cuando hay muchos rectngulos alrededor del
central)
c) Asimetra o sesgo
Se refiere al grado en que los datos se reparten equilibradamente por
encima y por debajo de la tendencia central.
Def.
Suma de todas las puntuaciones de la
distribucin, dividida por el total de casos u observaciones.
La mediana: es el ndice empleado cuando la distribucin es
asimtrica y no es posible aplicar la media aritmtica. La mediana no
se ve afectada por los valores extremos que en su clculo ocupan las
posiciones centrales. Por lo tanto, la mediana es un valor apropiado
para representar la tendencia central de la distribucin y se puede
obtener todo tipo de variables excepto en variables cualitativas. La
mediana de una variable X, representada por Md, se define como el
valor de la variable que divide la distribucin de frecuencias en dos
partes iguales, conteniendo cada una el 50% de las observaciones.
La moda: la moda es otro ndice de tendencia central que se puede
obtener tanto en variables cualitativas como en cuantitativas. Se
representa por Mo, y se define como el valor o categora de la
variable con mayor frecuencia absoluta.
La eleccin de una medida de tendencia central: para
seleccionar un valor que resuma adecuadamente la tendencia central
de la distribucin de frecuencias, se recomienda como primera opcin
la media aritmtica, por que en ella basan su importancia muchos
estadsticos. nicamente se desaconseja su uso con pocos valores
extremos, cuando el nivel de medida de la variable es nominal u
ordinal y/o en datos agrupados en los que existen intervalos abiertos
en los extremos de la distribucin.
MEDIDAS DE POSICIN:
Las medidas o ndices de posicin, tambin llamados cuantiles,
informan acerca de la posicin relativa de un sujeto con respecto a su
grupo de referencia, dentro de la distribucin de frecuencias de la
variable.
Percentiles: los tambin llamados centiles, son los 99 valores de la
variable que dividen en 100 la distribucin de frecuencias.
Cuartiles y deciles.
MEDIDAS DE VARIABILIDAD
La variabilidad o dispersin hace referencia al grado de variacin que
hay en un conjunto de puntuaciones. Por ejemplo: entre dos
Inferencia estadstica
El valor estadstico obtenido de una muestra (como media) no ser
igual al valor del parmetro de poblacin. Para inferir un parmetro a
partir de un estadstico hay que aplicar herramientas estadsticas de
tipo inferencial como la estimacin por intervalo (intervalos de
confianza) o contraste de hiptesis.
MUESTREO: Cmo obtener muestras para, a travs de ellas, estudiar una poblacin.
Se debe intentar que sean muestras representativas de la poblacin que queremos estudiar.
INFERENCIA: En base a los resultados obtenidos de una muestra, hacer una afirmacin
sobre la poblacin de la que la muestra ha sido extrada.
Es funcin, entre otras cosas, de la variabilidad de la poblacin en la variable estudiada.
Cuanto mayor sea la variabilidad mayor ser el nmero de elementos que debamos
entresacar de la poblacin al formar la muestra para poder asegurarnos que representan a
aquella.
Si no hay variabilidad cualquier elemento de la poblacin que elijamos, representar a toda
la poblacin.
Uno de los problemas mayores con los que nos encontramos, suponiendo que el tamao de
la muestra sea el adecuado.
La inferencia estadstica, es decir, las afirmaciones que hacemos sobre la poblacin en
base al estudio
de una muestra, se hace siempre, en trminos probabilsticos.
Para que podamos hacer una inferencia con una probabilidad conocida de xito, es
necesario que nuestra muestra haya sido obtenida aleatoriamente.
Una de las implicaciones del muestreo probabilstico (y slo de l) es que se puede estimar
el error muestral.
ERROR MUESTRAL: Es la diferencia entre el resultado obtenido en la muestra y el que
se habra obtenido si hubisemos hecho un censo con la poblacin siguiendo los mismos
procedimientos que en la muestra.
POBLACIN: Es el conjunto de elementos, finito o infinito, definido por una o ms
caractersticas, de las que gozan todos los elementos que lo componen, y slo ellos.
TIPOS DE MUESTREO.
MUESTREO PROBABILSTICO: Es aquel en el que se puede calcular de antemano la
probabilidad de obtener cada una de las muestras que sea posible seleccionar, para lo cual es
necesario que la seleccin de la muestra pueda considerarse como un experimento aleatorio. Es
el nico tipo de muestreo que es capaz de darnos el riesgo (error) que cometemos en la
inferencia.
Este tipo de muestreo, por el hecho de basarse en la Teora de la Probabilidad.
MUESTREO INTENCIONAL U OPINATICO: En el cual la persona que selecciona la
muestra procura que esta sea representativa segn su criterio, dependiendo, por lo tanto, de su
intencin u opinin sobre qu es representativo en cada caso.
MUESTRO SIN NORMAS, CIRCUNSTANCIAL O ERRATICO: Es aquel en el que se
toma la muestra de cualquier manera, por razones de comodidad o capricho .
o TABLAS DE NUMEROS ALEATORIOS.
Se utilizan en la seleccin de la muestra.
Consisten en una serie de dgitos (en ms o menos cantidad segn de qu tabla se trate)
dispuestos en pginas y presentados por grupos de filas y columnas, de modo que puedan leerse,
cmodamente los nmeros.
o DISTRIBUCIONES EN MUESTREO.
Distribucin poblacional.
Si tomamos todos los elementos de la poblacin que interesa estudiar y medimos en ellos
una caracterstica, podemos realizar una distribucin de frecuencias de esos resultados, que ser
la distribucin de frecuencias de esa caracterstica en la poblacin, definida por su media y su
varianza.
PARMETROS: Son las medidas realizadas en la poblacin y se designan con letras
griegas.
= media de la poblacin.
2 = varianza poblacional.
Distribucin de la muestra.
Si en la muestra elegida medimos la caracterstica que interesa obtenemos unos resultados,
cuya distribucin de frecuencias constituye la distribucin de la caracterstica en la muestra,
definida por su media y su varianza.
ESTADSTICOS: Son las medidas realizadas en la muestra y se designan por letras
latinas maysculas.
Y = media de la muestra.
S2 = varianza de la muestra.
Distribucin muestral o distribucin del estadstico <<1>> en el muestreo.
o A partir de una poblacin que tengamos definida, podemos obtener todas las muestras
posibles, de un
determinado tamao, de esa poblacin y medir en ellas una determinada caracterstica, pudiendo
obtener un
resultado numrico o funcin para cada muestra; la distribucin de frecuencias de estos
valores
constituye la distribucin muestral de esa caracterstica llamada tambin distribucin del
estadstico
<<1>> a partir de los resultados de las muestras.
o ERROR TIPICO: La desviacin tpica de la distribucin muestral de un estadstico (es
decir; la raz cuadrada de su varianza), suele ser conocida como error tpico de ese estadstico.
o ESTIMACIN: Es el resultado numrico de cada uno de los valores de la funcin
estimadora, es decir, los valores numricos parciales de cada muestra posible.
o ESTIMADOR INSESGADO: Cuando tengamos un estadstico tal que su media coincide
con el parmetro poblacional que queremos estimar.
o ACURACIDAD: Se da cuando los estimadores sean insesgados, y adems, en lo posible,
tengan una varianza pequea para que estn muy centrados en torno al valor central.
Intervalos de confianza
Concepto
La finalidad de un intervalo de confianza es estimar un parmetro
desconocido de una poblacin a partir de una muestra. Al estimar la
media de la poblacin a partir de una muestra, podemos cometer un
error de estimacin |X- |.
La estimacin por intervalo consiste en acotar el error con una alta
probabilidad 1 (nivel de confianza) de forma que |X- | no sea
superior a un estimado mximo (Emx).
El error de estimacin mximo (Emx) es funcin de la variabilidad de
la variable en la poblacin, del nivel de confianza (n.c.) y del tamao
de la muestra.
o ESTIMACIN POR INTERVALOS.
Se elabora un intervalo en el que se espera se encuentre el parmetro desconocido, con una
cierta probabilidad.
La estimacin por intervalos va ms all al establecer un rango de valores dentro del cual
estara el valor del parmetro.
El trmino probablemente nos indica que una estimacin por intervalos viene
acompaada de una probabilidad.
0,99 significa que si repitiramos el mismo experimento en la misma poblacin y en las
mismas condiciones, esperamos que el 99% de las veces el intervalo contenga el valor del
parmetro .
Siendo el intervalo la media y el error de +Una estimacin por intervalos expresa, de alguna manera, el grado de confianza con el que
se espera est el valor del parmetro en el intervalo, por lo que se suele llamar intervalo
confidencial.
METODOS DE ESTIMACION.
Mtodo de mxima verosimilitud.
Es elegir como estimador de un parmetro aquel que maximice la probabilidad de lo que de
hecho se ha observado en la muestra.
Mtodo de los mnimos cuadrados.
Estima y imponiendo la condicin de que la suma de los errores al cuadrado sea mnima.
Tanto por el mtodo de mxima verosimilitud como por el de los mnimos cuadrados, se
estiman los parmetros y a partir de una muestra aleatoria extrada de la poblacin de
la variable que se est estudiando. Segn el primer mtodo lo que se hace es elegir como
estimacin la que maximice la probabilidad de los datos muestrales, mientras que segn el
segundo se trata de estimar los estimadores que hagan mnima la suma de los errores al
cuadrado.