Академический Документы
Профессиональный Документы
Культура Документы
ESTADÍSTICA
DEFINICIÓN
Ciencia que estudia los métodos para recopilar,
organizar, analizar y caracterizar datos sobre hechos,
fenómenos o situaciones al menor costo, con el objeto
de interpretarlos, realizar estimaciones y generar
información relevante para la toma decisiones. (Del latín
“Statisticus”; status: estado, situación y sufijo icus:
relativo a, en relación a)
ESTADÍSTICA PARAMÉTRICA
Teoría y métodos de análisis de datos que presuponen determinadas
condiciones acerca de la distribución de la variable de estudio en la
población de la cual se ha obtenido la muestra investigada, de manera
que, la validez de los resultados dependen del cumplimiento de esas
suposiciones.
Algunas suposiciones pueden ser, por ejemplo, la distribución normal
de los datos, homocedasticidad de varianzas y que el nivel de medida
de la variable de estudio sea de intervalo o de razón.
En las pruebas paramétricas se utiliza regularmente la media
aritmética como medida de tendencia central y la varianza como
medida de dispersión. Algunas pruebas paramétricas son: prueba t de
Student, análisis de regresión, análisis de varianza (ANDEVA, ANOVA),
correlación de Pearson, entre otras.
ESTADÍSTICA
ESTADÍSTICA NO PARAMÉTRICA
Teoría y métodos de análisis de datos que requieren el
cumplimiento condiciones generales pero ninguna acerca de la
forma específica de la distribución de la cual fue obtenida la
muestra, por ello se conocen también como pruebas de distribución
libre. Se utiliza la mediana como medida de tendencia central y
rango como medida de dispersión. Es útil es casos donde la variable
de estudio ha sido medida en escala nominal u ordinal.
Algunas pruebas no paramétricas son: la prueba de los signos,
prueba de rangos de Wilcoxon, el análisis de varianza unifactorial de
Kruskal-Wallis, el análisis de varianza bifactorial de Friedman y los
coeficientes de correlación de Spearman y de Kendall, entre otros.
ESTADÍSTICA
DIFERENCIAS ENTRE ESTADÍSTICA
PARAMÉTRICA Y NO PARAMÉTRICA
CON RELACIÓN A PARAMÉTRICA NO PARAMÉTRICA
Distribución de los
datos
Medidas descriptivas
asociadas
Tipo de variables
Nivel de medición de
las variables
Pruebas estadística
ALFABETO GRIEGO: SÍMBOLOS ESTADÍSTICOS
minúscula mayúscula equiv minúscula mayúscula equiv
alfa a nu n
beta b xi x
gamma g ómicron o
delta d pi , p
épsilon e rho(ro) r
zeta z sigma , s
eta e tau t
theta , th / z úpsilon u, y
iota i phi ( fi ) , f
kappa c/k ji o chi j
lambda l psi s
mu m omega o
POBLACIÓN Y MUESTRA
Muestreo
Población Muestra
media x
2 varianza s2
CENSO p proporción p̂ ENCUESTA
total ˆ
Coef . Correlación r
Parámetros Estimador
Inferencia
VARIABLES Y TIPOLOGÍA
VARIABLE DE ESTUDIO
Característica, propiedad o construcción
conceptual que comparten un conjunto de entes
en el marco de una investigación, que al ser
medida u observada en uno de los elementos y
luego en otro, su valor, grado o categoría puede
mostrar un cambio cuantitativo o cualitativo.
En estudios de corte experimental se le llama VARIABLE DE
RESPUESTA. Las variables pueden ser cuantitativas o cualitativas
(categóricas). No confundir variable de estudio con categoría de
análisis o un indicador.
VARIABLES Y TIPOLOGÍA
CATEGORÍA DE ANÁLISIS
Una categoría de análisis agrupa un conjunto de aspectos o
unidades de significado que resultan relevantes desde el punto de
vista investigativo, de los cuales se recoge información y se
presentan resultados. Se utilizan en el marco de la investigación
cualitativa.
Las categorías se construyen creando un nombre, palabra clave o
concepto que recoge un subconjunto de ideas sobre la base de un
criterio unificador, logrando que al final del proceso todas las ideas
estén incluidas en alguna de las categorías establecidas. Surgen a
partir del marco teórico o de la información recolectada en el
proceso mismo de investigación.
VARIABLES Y TIPOLOGÍA
INDICADOR
Es un dato que brinda información cualitativa o
cuantitativa, que sirve de referencia para monitorear
objetivamente el desenvolvimiento y evolución de un
proceso o actividad; para valorar las características y la
intensidad de un hecho o proyectar una tendencia
futura; para medir o comparar los resultados
efectivamente obtenidos en la ejecución de un proyecto
o programa. Un conjunto o sistema de indicadores debe
tener capacidad para reflejar la realidad. Se utilizan en
el contexto de programas y proyectos.
VARIABLES Y TIPOLOGÍA
EJEMPLOS
• En un estudio donde se desea comparar dos
variedades de caña a partir de la recopilación y análisis
estadístico de datos registrados en el tiempo, al
rendimiento de azúcar y a altura de planta, por
ejemplo, se le llaman variables de estudio.
VARIABLE CUANTITATIVA
Variable que puede medirse con un instrumento y lleva
asociada una unidad de medida. Las variables
cuantitativas se miden en escala de intervalo o de razón
y pueden ser discretas o continuas.
VARIABLES Y TIPOLOGÍA
VARIABLE DISCRETA
Solo adopta ciertos valores como resultado del conteo,
regularmente son números enteros cuyas divisiones
carecen de relevancia práctica en sentido natural o por
determinación.
VARIABLE CONTINUA
Son las que pueden tomar cualquier valor entre dos
números enteros y se obtienen como resultado de la
medición. Variables discretas expresadas por en
relación a cualquier tipo de intervalo se transforman a
variables continuas calculando el valor promedio.
NIVELES DE MEDICIÓN
7 Me gusta mucho
VARIABLES
CUALITATIVA CUANTITATIVA
DE
NOMINAL ORDINAL DE RAZÓN
INTERVALO
EJEMPLOS
Clasifique las siguientes variables de estudio en cualitativa o cuantitativa, discreta
o continua, dicotómica o politómica e indique nivel de medición.
x
i 1
i
x
i 3
i 3 4 5 6 7 25
x
i 1
i 5 2 1 3 8 19
NOTACIÓN SUMATORIA
Por ejemplo, la sumatoria de los enteros positivos
hasta 100:
100
x
i 1
i 1 2 3 ...50 51... 98 99 100
Observación :
1 100 101, 2 99 101, 3 98 101, 50 51 101
Entonces :
100
x
i 1
i 50 101 5050 Carl Friedrich Gauss
2
n 2 2
n n 1 n n 1
x 3
13
2 3
33
...n 3
i 1
i
2 4
PROPIEDADES
n
01 x
i 1
i x1 x2 x3 ... xn
Tomar en cuenta que :
2
n n
n
02 i 1 2 3
x 2
x 2
x 2
x 2
... xn
2
i 1
xi xi
2
i 1
i 1
n
03 k nk
i 1
n n
04 k x
i 1
i k xi
i 1
n
05 x y
i 1
i i x1 y1 x2 y2 x3 y3 ... xn yn
PROPIEDADES
n n n
06 x y x y
i 1
i i
i 1
i
i 1
i
n n n n
06 x k x k x nk
i 1
i
i 1
i
i 1 i 1
i
n
07 x k x k x k x3 k ... xn k
2 2 2 2 2
i 1 2
i 1
x 2kxi k x
n n n n
07 xi k 2k xi nk 2
2 2 2 2
i i
i 1 i 1 i 1 i 1
NOTACIÓN SUMATORIA
Utilizar los conjuntos de datos para repasar las propiedades
de la notación sumatoria.
Conjunto 1.
Xi 2 5 3 1
K=2
Yi 5 3 2 4
Conjunto 2.
Xi 4 3 6 8
K=3
Yi 1 5 7 2
NOTACIÓN SUMATORIA
Si xi pertenece al conjunto de los números enteros positivos,
calcular el resultado de las siguientes expresiones:
120 90
a) x i
b) x
i 52
i
i 73
x x x
i 73
i
i 1
i
i 1
i
120
120 120 1 72 72 1
xi
i 73 2
2
120
x
i 73
i 7260 2628 4632
NOTACIÓN SUMATORIA
Dada la tabla de datos, calcular el resultado de las
siguientes expresiones:
xi fi xifi xi2fi k
3 16 48 144 x f
i 1
i i
4 18 72 288 a) k
6
7
34
25
204
175
1224
1225 f
i 1
i
8 18 144 1152
10 15 150 1500
126 793 5533
2
k
xi fi
i 1
k
i 1
x 2
i if
n
b)
n 1
EJEMPLO
En la tabla siguiente se da rapidez en la impresión de texto en páginas por
minuto (ppm) y el precio de cada impresora. Calcular el resultado de:
xi yi n
n
y
a x y
V (ppm) Precio ($) 2 i
10 250
i i b i 1
i 1 n
20 740
25 890 n
12
16
360
450
c y x y x
i 1
i i i i
18 525
n xi yi xi yi
d
n xi 2 xi
2
Respuestas:
a) 1,214,390
n xi yi xi yi
2
b) 535.83
c) 1417.1
e
n x 2 x 2 n y 2 y 2
i i i i
d) 43.01
e) 0.958
EJEMPLO
Con los datos mostrados, calcular el valor de las siguientes expresiones.
x y xy x2 y2
2
x y n 480 120 57600 230400 14400
480 120 xi 520 130 67600 270400 16900
xi2 i 1
n
520 130
i 1 n
640
745
140
150
89600
111750
409600
555025
19600
22500
640 140 a) 1255 190 238450 1575025 36100
745 150 n 1 920 180 165600 846400 32400
1255 190 1170 210 245700 1368900 44100
920 180 1630 220 358600 2656900 48400
1170 210 TOTALES 7360 1340 1334900 7912650 234400
1630 220
n
b x y x y
i 1
i i i i
Respuestas:
a) 163064.29
xi yi
xi yi
b) 2770.97
c) 14585.71
c) n
n 1
SUMATORIAS DOBLES
NIVELES DEL NIVELES DEL FACTOR COLUMNA
TOTAL DE FILA
FACTOR FILA j=1 j=2 j=3
b
y
a a a
y y y
TOTAL DE y..
i1 y1 i2 y2 i3 y3 ij
COLUMNA i 1 i 1 i 1 i 1 j 1
i 1, 2, ... a j 1, 2,... b
Los datos de i=1 hasta a (i=1,2…a) son las observaciones para cada uno los
niveles del factor fila, en cada nivel de factor columna. Los datos de j=1 hasta b
(j=1,2…b) son las observaciones para cada uno de los niveles del factor columna,
en cada nivel del factor fila.
SUMATORIAS DOBLES
NIVELES DEL NIVELES DEL FACTOR COLUMNA
TOTAL DE FILA
FACTOR FILA j=1 j=2 j=3
b
y
a a a
y y y
TOTAL DE y..
i1 y1 i2 y2 i3 y3 ij
COLUMNA i 1 i 1 i 1 i 1 j 1
yij = Observación de la variable respuesta en el i-ésimo nivel del factor fila y en el j-ésimo nivel del factor columna
y.. = Total de las observaciones yij de la variable de respuesta
y1j = Observaciones de columna en la fila 1. a b a b
y1. = Total de observaciones de columna en la fila 1. i 1
yi y j yij y
j 1 i 1 j 1
yi. = Totales de observaciones de columna en la i-ésima fila.
SUMATORIAS DOBLES
a Indica que deben sumarse las observaciones de fila en la
y
i 1
i1 columna 1, que equivale al total de la columna 1 (y1).
Observe que el punto representa un total, y, que el total de
columna es igual a la sumatoria de observaciones fila en esa
columna.
b
y
Indica que deben sumarse los totales de j=1 hasta j=b, lo que
j equivale al gran total (y..). Observe que el gran total es igual a
j 1 la suma de todas las observación yij.
b a a b
y
j 1
j yi yij y
i 1 i 1 j 1
R / y3 86 j 1
EJEMPLO
A manera de conclusión, con relación al ejercicio anterior:
y 2j
Indica que deben sumarse los cuadrados de los totales de
j 1
cada máquina, desde j=1 hasta j=b
a
yi 1
2
i
Indica que deben sumarse los cuadrados de los totales de
cada operario, desde i=1 hasta i=a
a b
y
i 1 j 1
ij
Indica que deben sumarse todos los valores de resistencia
observados.
EJERCICIO
En la tabla cruzada (o de contingencia) siguiente, se presenta el número de
plantas de manía (Arachis hypogaea L.) que registran distintos grados de
severidad según la práctica de manejo utilizada en el cultivo.
Severidad
Práctica de manejo
Baja (i=1) Moderada (i=2) Alta (i=3)
Rotación de cultivos (j=1) 235 124 38 397
150 (i=3) 1 1 3 1 2 8
9 6 13 6 10
a) y j b) c) d ) y 2
ij
b ab a ab ab
j 1 i 1 j 1 i 1 j 1
t i
y 2
y2
r yi y
2 i 1
i 1 r tr
ESTADÍSTICA DESCRIPTIVA
x i
x1 x2 x3 ...xn
x i 1
PARA UNA MUESTRA
n n
N
xx1 x2 x3 ...xn
i
i 1 PARA UNA POBLACIÓN
N N
MEDIA ARITMÉTICA: Propiedades
La suma de las desviaciones de un conjunto de datos con relación a su
media es siempre cero.
n
n n n n n x i n n
x x x x x nx x n
i 1
i
i 1
i
i 1 i 1
i
i 1
i
i 1
n
xi xi 0
i 1 i 1
x i
x i 1
n
n
n x xi xi n x
i 1
MEDIA ARITMÉTICA
Se obtuvo una muestra de los salarios de siete trabajadores de una
institución educativa. Calcular la media aritmética.
Trabajador 1 2 3 4 5 6 7
Salario (Q) 3400 6100 6200 2800 6100 4400 6000
n
x i
3400 6100 6200 2800 6100 4400 6000 35000
x i 1
5000
n 7 7
El salario promedio de trabajadores es de Q5,000.00. El salario de los
trabajadores, asumiendo que es igual para todos, es de Q5,000.00
Trabajador Salario (Q) x-media
1 3400 -1600
2 6100 1100
3 6200 1200
4 2800 -2200
5 6100 1100
6 4400 -600
7 6000 1000
Suma de desviaciones 0
MEDIA ARITMÉTICA Y VALORES ATÍPICOS
Me 10
6 9 10 13 15 n=5
10 11
Me 10.5
2
6 9 10 11 13 15 n=6
MEDIANA (Me)
CÁLCULO DE LA MEDIANA UTILIZANDO FÓRMULAS
Para una serie de datos ordenada ascendentemente, la posición que
ocupara el valor de la mediana está dada por cualquiera de las
siguientes expresiones.
x n 1 50 n 1 50n 50 n 1 n 1 xn 50n n
px px
100 100 100 100 2 2 2 100 100 2
n 1 px
n
px
2 2
Cuando el resultado es entero, ese valor es la Si el resultado es un entero, la mediana es la semisuma de dos
posición en la que se encuentra la mediana en la valores de la serie de datos, el que ocupa la posición calculada
serie de datos. Cuando el resultado no es número y el que se encuentra en la posición siguiente. Si la expresión da
entero, la mediana es la semisuma de los números un valor que no es entero se toma solo la parte entera y se le
anterior y posterior de la serie de datos que suma la unidad, el número resultante es la posición en la que
comparten dicha posición. se encuentra la mediana en la serie de datos.
Mediana x, Me
MODA (Mo)
La moda es el valor que se presenta con mayor frecuencia. Hay
situaciones en que dos o más datos distintos se presentan en la serie
de datos se repiten con la misma frecuencia, o bien puede darse que
ningún dato se repita. De ahí que la serie de datos pueda ser amodal,
bimodal o multimodal. Si contienen más de dos modas, son
multimodales. Si todos los datos tienen la misma frecuencia, es
amodal. En los casos multimodales casi nunca se da la moda como
medida de tendencia central porque ofrecer tres o más modas no
resulta de mucha ayuda para describir los datos.
Trabajador 1 2 3 4 5 6 7
Salario (Q) 3400 6100 6200 2800 6100 4400 6000
MEDIA PONDERADA
Se utiliza cuando en un conjunto de datos, cada uno tiene
un peso determinado o un factor de importancia relativa,
el cual puede expresarse como frecuencia o porcentaje.
xp
xp
i i
p i
OTROS TIPOS DE MEDIAS
MEDIA PONDERADA: EJERCICIOS
En junio, una inversionista compró 300 acciones a Q200 cada una. En agosto
compró 400 acciones más a Q250. En noviembre compró 450 acciones, pero el
precio bajó a 230 cada título. ¿Cuál ha sido el capital de inversión y el precio
promedio ponderado de cada acción?
Un estudiante obtuvo 80 y 53 puntos en dos exámenes con 20% de
ponderación. Obtuvo 70 puntos en el laboratorio del curso que tiene 30% de
ponderación ¿Cuál es la zona acumulada y la nota promedio ponderada?
En un muestreo de trozas al interior de un bosque se identificaron tres patios
de acopio. En cada uno de los patios se hizo el conteo de trozas y se
determinó el volumen promedio (m3/troza). Calcular el volumen total y
promedio de los tres patios.
Patio Número de trozas Promedio
1 100 1.51
2 200 1.31
3 25 2.10
OTROS TIPOS DE MEDIAS
MEDIA GEOMÉTRICA
La media geométrica resulta útil para promediar porcentajes, índices, cifras
relativas y datos que cambian en el tiempo de un periodo a otro, donde se
necesita conocer una tasa promedio de cambio, como la tasa de crecimiento
promedio en un periodo de varios años. En tales casos, la media aritmética
simple resulta inapropiada, pues proporciona resultados equivocados. Lo
que se debe hacer es calcular la media geométrica. La media geométrica de
un conjunto de n números positivos se define como la raíz enésima del
producto de n observaciones, menos uno, así:
n
xg n
x
i 1
i
xg n x1 x2 x3 ...xn
Se le llama crecimiento exponencial o geométrico a aquella progresión que aumenta por multiplicación de
una cantidad constante llamada razón.
OTROS TIPOS DE MEDIAS
MEDIA GEOMÉTRICA
La media geométrica se utiliza con más frecuencia para calcular tasas de
cambio promedio durante cierto periodo. Para ello los porcentajes se utilizan
en forma decimal y a las tasas de incremento o decrecimiento se les suma
100% (1.0). En consecuencia, la expresión para la media geométrica se puede
reescribir de la siguiente manera:
Donde :
xg n
t1 t2 t3 ...tn 1 100 ti
xi
100
1
i
x 2
x12 x22 x32 ... xn2
xc i 1
n n
1 n n
xa
1 n 1 n
1 1 1 1
n 1 ...
i 1 xi i 1 xi
x1 x2 x3 xn
OTROS TIPOS DE MEDIAS
MEDIA ARMÓNICA: EJERCICIOS
Una cosechadora durante una hora de operación registra una capacidad de
trilla de 80 toneladas por hora (t/h) en un cultivo de maíz y de 110 t/h durante
la hora siguiente. En otro caso, en el supuesto que se cosecha un tonelaje
determinado de maíz a razón de 80 toneladas por hora (t/h) y en otra
oportunidad se cosecha el mismo tonelaje pero a razón de 110 t/h. ¿Se debe
utilizar en ambos casos, el mismo procedimiento para calcular la capacidad de
trilla promedio? R/No, la capacidad del trilla promedio en igualdad de tiempo
es la media aritmética, mientras que dicho promedio en igualdad de pesos es la
media armónica.
Un comerciante compró un cargamento de 330 kilogramos de manzana a
Q12.00/kg. Poco después compró otros 180 kg a Q22.00/kg y una tercera
compra de 264 kg a Q15.00/kg. ¿Cuál es el precio promedio al que se
compraron manzanas?
Un vehículo recorre 280 km en cuatro tramos de igual longitud. Los primeros 70
km los recorre a 90 km/h, el siguiente tramo a 40 km/h, el tercer tamo a 75 km/h
y el último tramo a 60 km/h. Calcular la velocidad promedio en el trayecto de los
280 kilómetros.