Академический Документы
Профессиональный Документы
Культура Документы
En primer lugar se buscará una forma de medir la dispersión en términos absolutos (i.e.,
dependiendo de las unidades en las que se mida la variable).
Matemáticamente la distancia de un valor a otro es la diferencia entre esos valores sin signo,
es decir, en valor absoluto. Sin embargo, el valor absoluto tiene muy malas propiedades
matemáticas. En cambio, si se elevan las distancias al cuadrado, también “se quita” el signo y
eso s´ı que tiene buenas propiedades matemáticas. Así surge la varianza, que sirve igualmente
para medir la dispersión conjunta en torno a la media, pero es más operativa.
Puede comprobarse que la varianza se puede calcular alternativamente como la media de los
valores de la variable al cuadrado menos la media al cuadrado de la variable, es decir,
. Esta segunda fórmula suele resultar más cómoda a la hora de hacer los cálculos.
El coeficiente de variación se suele utilizar con variables que toman valores positivos (precios,
rentas, etc.) y cuya media no está próxima al 0, ya que en caso contrario al dividir por un valor
muy cercano a 0, el resultado puede desvirtuarse. Tampoco se debe utilizar la desviación para
comparar la dispersión de dos variables medidas en las mismas unidades (a no ser que el valor
de la media sea el mismo), porque, por ejemplo, no es lo mismo 1 cm de dispersión en relación
a una media de 170 cm que 1 cm de dispersión en relación a una media de 2 cm. Como la
dispersión también se utiliza para medir la representatividad de la media, el CV también se
puede utilizar para comparar la representatividad de dos medias. Por otro lado, como el valor
de CV es una cantidad relativa, ayuda a valorar la dispersión/representatividad de la media, en
el sentido de establecer si es grande o pequeña. Valores bajos del CV indicaran poca
dispersión/mucha representatividad y valores altos indicaran mucha dispersión/poca
representatividad. No hay criterios universales para decir que un valor del CV es “bajo” o “alto”,
aunque en la práctica se suelen considerar bajos los valores inferiores al 30 o 40 %, moderados
entre esas cantidades y aproximadamente el 80 % y cuando se superan el 120 o 140 % ya se
considera que la dispersión es bastante elevada. En resumen, se utiliza el CV para variables
positivas cuya media no está próxima a 0 con el objetivo de medir la dispersión entorno a la
media y/o su representatividad cuando se deben establecer comparaciones o valoraciones.
EJERCICIO 1
Los psicólogos que trabajan en un Centro de Día para adultos de la tercera edad de la Ciudad de
Lago Agrio, observaron el estado civil de un grupo de 120 varones que se tratan por problemas
depresivos. Sus registros se presentan en la siguiente tabla:
¿Qué Estado Civil se le asignaría a Antonio G. si solo sabe que se trata por problemas depresivos
y concurre a dicho Centro de Día? Justifique su respuesta.
Resolución:
La moda de la distribución de la variable Estado Civil de los adultos mencionados es la categoría
VIUDO, pues a ella le corresponde la mayor frecuencia. Esta categoría es la más probable para
una observación realizada al azar. Por tanto, en las condiciones dadas, a Antonio G. se le
asignaría el estado civil VIUDO. Nótese que la categoría DIVORCIADO también concentra una
alta proporción de las frecuencias. En el ejercicio resuelto 4 se retomará este ejercicio y se
cuantificará la incertidumbre para la asignación hecha al azar.
Ejercicio 2
SOLUCIÓN:
La media: suma de todos los valores de una variable dividida entre el número total de datos de
los que se dispone:
La mediana
: es el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por
debajo.Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos
valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos
dos valores nos dará a su vez
60, que es el valor de la mediana
.La moda: el valor de la variable que presenta una mayor frecuencia es 60
La varianza S 2
: Es la media de los cuadrados de las diferencias entre cada valor de la variable y la media
aritmética de la distribución.
La desviación típica S: es la raíz cuadrada de la varianza.
EJERCICIO 3
Obtener la varianza y desviación estándar de la siguiente muestra, que nos indica el número de
cigarros queson consumidos en promedio al día por un conjunto de 20 encuestados.
Resumen.