Академический Документы
Профессиональный Документы
Культура Документы
CALDWELL,
CAP 1
Una variable es cualquier cosa que pueda adquirir una calidad o cantidad diferente, es
cualquier cosa que pueda variar. La información sobre diferentes variables se conoce
como datos (data). Cuando se reúnen los datos relativos a algunas variables específicas
hablamos de un conjunto de datos (data set), las piezas individuales de información se
denominan data points. Una distribución de datos es una lista de respuestas asociadas
con una variable particular en un conjunto de datos. Distribución de frecuencia: una
tabla o gráfico que indica cuántas veces aparece un valor en un conjunto de datos de
respuestas.
Niveles de medición:
Nominal: descansa en un sistema de categorías. Las categorías tienen que ser
mutuamente excluyentes y deben ser colectivamente exhaustivas.
Ordinal: aparece la noción de orden (mas que, menos que).
Intervalo: noción de intervalos iguales.
Ratio: propiedades de intervalo + tiene un punto cero conocido. Hablamos en
términos de proporciones o razones.
Una población (o universo) son todos los casos posibles que cumplen ciertos criterios,
cambia constantemente por lo tanto nunca se puede obtener una imagen totalmente
precisa de la población. Una muestra es una porción de una población.
Análisis estadístico:
1) E. DESCRIPTIVA: se usan para resumir o describir datos de muestras y
poblaciones, ej. media y rango.
2) E. INFERENCIAL: una estadística es una característica de una muestra y un
parámetro es una característica de la población. Utiliza estadísticas de la muestra
para hacer inferencias sobre los parámetros de la población, son los
procedimientos que utilizamos para "dar el salto" de una muestra a una
población.
DATOS CUANTITATIVOS
AGRESTI Y FINLAY, CAP 2: MUESTREO Y MEDICION
Las medidas deben ser validas (reflejar el concepto) y confiables (si se mide de nuevo la
rta es igual).
Variable: una característica q puede variar en valores entre sujetos en una muestra o
población. Los valores que puede tomar la variable forman la escala de medición. Tipos:
Categorías o números, Nro de niveles:
Cuantitativa: la escala de medición tiene valores numéricos. Medidas en una
escala de intervalos (distancia numérica). Discretas o continuas.
Categórica o Cualitativa: es un conjunto de categorías, difieren en calidad. Escala
nominal (sin orden) u ordinal (orden). Discretas.
Nro de valores en la escala de medición:
Discreta: sus posibles valores forman un conjunto de números separados. Nro
de hermanos.
Continua: puede tomar un continuo infinito de posibles valores de números
reales. Altura.
PIOVANI, LA OBSERVACION
Tipología Gold:
Grado de revelación
Nos indica qué tan lejos se desvían las puntuaciones de la media (si hay más
variabilidad en una distribución la DE aumenta).
AGRESTI Y FINLAY, ESTADISTICAS DESCRIPTIVAS
DESCRIPCION DE DATOS CON TABLAS Y GRAFICOS:
DISTRIBUCION DE FRECUENCIAS Resume los recuentos de posibles valores o
intervalos de valores. Una F. RELATIVA reporta esta info utilizando porcentajes
(proporción x 100) o proporciones (nro de observaciones en una categoría / total de
observaciones).
GRAFICO DE BARRAS: usa barras sobre posibles valores para representar una
distribución de frecuencia para una variable categórica. Barras van separadas.
HISTORIOGRAMAS: cada intervalo (mutuamente excluyente) tiene una barra que
representa el nro de observaciones para v. cuantitativa. Forma de la
distribución:
a. Forma de U: los puntos más altos están abajo y los puntajes más altos están
cerca del medio. Indica una polarización en la variable entre dos conjuntos
de sujetos.
b. Forma de campana: indica que la mayoría de los sujetos tienden a cerca de
un valor central.
1. Simétrica
2. No simétrica: sesgada a la drcha o izquierda dependiendo donde la cola sea
más larga.
STEM-AND-LEAF PLOTS: representa cada observación por su dígito inicial (el
tallo) y por su último dígito (la hoja). V. cuantitativa. Si lo miramos de costado
tiene la misma forma q el historiograma.
DIAGRAMA DE CAJA: representa los cuartiles, los valores extremos y cualquier Commented [MP4]:
valor atípico.
DESCRIPCION DE DATOS CON MEDIDAS DE TENDENCIA CENTRAL:
MEDIA: útil solo para variables cuantitativas, se tira en la dirección de la cola más
larga de una distribución sesgada.
MEDIANA: escala ordinal, para distribuciones simétricas la media y la mediana
son idénticas, en las d. muy sesgadas se prefiere la mediana.
MODA: útil para todo tipo de datos.
DESCRIPCION DE DATOS CON MEDIDAS DE VARIABILIDAD:
RANGO
DESVIACION ESTANDAR: Según la regla empírica, para una distribución en forma
de campana es muy inusual que una observación caiga más de tres DE de la
media (si es mayor, entonces outlier).
REGLA EMPIRICA: para distribuciones forma campana
ESTADISTICA INFERENCIAL
D’ANCONA, LA SELECCIÓN DE LAS UNIDADES DE OBSERVACION: el diseño de la
muestra
- Definición de la población (unidades sobre las q se desea obtener info)
- Diseño de la muestra (selección de unidades concretas de esta población):
representatividad de la muestra:
o Tamaño de la muestra:
Depende de los recursos económicos y plazos temporales disponibles
Los diseños muestrales probabilísticos demandan un tamaño muestral
superior a los no probabilísticos (+ muestra, - error muestral)
Cuanto más heterogénea la población, mayor la varianza poblacional
ergo necesita un mayor tamaño muestral
En muestras pequeñas el error de muestreo aumenta, muestras más
grandes mayor precisión de la estimación ergo menor error muestral
El nivel de confianza mas habitual es 2sigma (DE poblacional) que
supone un 95% de probabilidad de acertar en la estimación a partir de
los datos muestrales
ERROR MUESTRAL: grado de inadecuación entre las estimaciones muestrales y los
parámetros poblacionales. En su calculo intervienen: