Вы находитесь на странице: 1из 40

Medidas de Tendencia Central

Nunca se alcanza la verdad total, ni nunca se est totalmente alejado de ella.


Aristteles 384 AC-322 AC.

Aunque se organicen los datos en una forma til y significativa es preciso disponer de los datos de forma tal que puedan presentarse proposiciones cuantitativas (Haber y Runyon, 1992). Una forma til de describir a un grupo en su totalidad es encontrar un nmero que lo represente (Levin, 1979). Se ha observado que una de las caractersticas que se presenta en mltiples distribuciones de frecuencias es que los datos se acumulan alrededor de un valor central situado entre los dos extremos de la variable que se estudia (Haber y Runyon, 1992). En la investigacin social, ese valor se conoce como una medida de tendencia central, ya que est generalmente localizada hacia el medio o centro de una distribucin en la que la mayora de los puntajes tienden a concentrarse (Levin, 1979). La tendencia central es un ndice de localizacin central empleado en la descripcin de las distribuciones de frecuencias. La capacidad de localizar un punto de tendencia central puede ser muy til para el investigador. Por ejemplo, podr reducir una masa de datos a un simple valor cuantitativo que llegar a ser comprendido y comunicado a otros especialistas.

114

Arnaldo Torres Degr y Evelyn Afanador Mejas

[5.1] Tipos de Medidas de Tendencia Central


Puesto que el centro de una distribucin puede ser definido de diferentes maneras, habr tambin diferentes medidas de tendencia central. Usualmente se conocen tres (3) tcnicas: la moda, la mediana y la media aritmtica.

Moda
La medida de tendencia central mas fcil de obtener es la moda. Esto es cierto debido a que la moda (Mo) puede encontrarse simplemente por inspeccin ms que por clculos (Levin, 1979). Se usa propiamente con datos nominales, pero puede emplearse con datos ordinales, de intrvalo y de razn (Downie y Heath, 1986). La moda (Mo) es el valor que se repite con mayor frecuencia en una distribucin especfica. Si todos los valores son diferentes, no existe la moda; por otra parte, un conjunto de valores puede tener ms de una moda (Daniel, 1985). Sintetizando, podemos indicar que en una distribucin especfica podemos encontrar ms de una moda, una sola moda o ninguna moda.

Mediana
Es el valor que se encuentra en el centro de un conjunto. Por consiguiente, es el valor que divide la poblacin o la muestra en dos parte iguales; de tal forma que la mitad de los valores son mayores que la mediana y la otra mitad es menor que la mediana. Una de las cualidades de esta medida es que los valores extremos no afectan el resultado.

Media Aritmtica
Es la medida de tendencia central comnmente utilizada. Es el centro de gravedad, el punto alrededor del cual los valores se aglutinan. Usted probablemente estar ntimamente familiarizado con la media, porque siempre que obtiene un "promedio" de calificaciones (notas) donde suman los valores de las notas y se divide por el nmero total de notas se calcula la media aritmtica. La media aritmtica es la sumatoria () de todos los valores () de una poblacin (N) o una muestra (n), dividida entre el nmero de valores que se sumaron. La media aritmtica obtenida de la

Medidas de Tendencia Central 115

poblacin se representa con la letra griega (Miu) y la media aritmtica obtenida de la muestra se representa con la letra latina ( barra). La frmula para expresar la media aritmtica en la poblacin o universo es:

= N

= x N

Mientras que la frmula para expresar la media aritmtica en una muestra es:

= n

= x n

El resultado de la media aritmtica es afectado por cada valor. Los valores extremos influyen en la media aritmtica y en algunos casos pueden distorsionarla tanto que resulte inconveniente como una medida de tendencia central.

116

Arnaldo Torres Degr y Evelyn Afanador Mejas

[5.2] Anlisis de Tendencia Central a partir de un Arreglo de Datos


Cuando un investigador conduce un estudio, de ordinario rene gran cantidad de informacin numrica o datos acerca de un problema, confrontado frecuentemente con masas de datos que necesitan ser descritas (Otto, 1987). En su forma original, tal cual son recopilados, estos datos estn usualmente desorganizados. El ser humano o la mente humana no pueden extraer el significado de un gran conglomerado de datos si el mismo no est organizado.

Edad inicial del uso de Internet entre los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico entre el ao acadmico 2003-2004

21 10 18 18 21 15 16 15 16 22 12 23 23 23 10 18 13 23 12 15 22 10 16 16 12 23 16 13 13 21 13 15 15 12 13 16 13 15 21 15
datos hipotticos

Si analizamos la data arriba expuesta, podemos constatar que la edad inicial del uso de Internet entre los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico en el ao acadmico 2003-2004 estn desorganizadas. Por consiguiente, la desorganizacin de dichos datos nos dificulta por ejemplo establecer cul fue la edad inicial del uso de Internet que ms se repiti entre los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico o cul es la edad inicial del uso de Internet ms alta o la ms baja entre los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico. Hay que estar clara que a mayor cantidad de datos desorganizados (cien, quinientos, o cientos de miles) aumenta el grado de dificultad para contestar estas preguntas.

Medidas de Tendencia Central 117

Para poder contestar estas interrogantes debemos de acomodar los datos de una forma til utilizando el arreglo de datos. El mismo consiste en organizar los datos obtenidos en una forma ordenada, de menor a mayor o viceversa. Con esta estructura establecida, podemos con facilidad aplicar diversos mtodos estadsticos para poder entender mejor el conjunto de datos en estudio. Si quisiramos realizar un anlisis de tendencia central sobre la edad inicial del uso de Internet entre los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico del ao acadmico 2003-2004, el primer paso sera organizar las edades de mayor a menor o viceversa (ver figura 5.1). A partir de este arreglo de datos es posible obtener con ms facilidad la moda, la mediana y la media aritmtica.

Figura 5.1 Edades organizadas de menor a mayor

10 10 10 12 12 12 12 13 13 13 13 13 13 15 15 15 15 15 15 15 16 16 16 16 16 16 18 18 18 21 21 21 21 22 22 23 23 23 23 23
N= 40 datos hipotticos

Moda
La moda como establecimos anteriormente es el valor que aparece con mayor frecuencia o el ms que se repite. No hay que realizar ningn clculo, solamente inspeccionar u observar el conjunto de datos organizados. Si analizamos los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico organizados conforme la edad inicial del uso de Internet (ver figura 5.2) podemos establecer a simple vista que se repiten las edades. No nos debemos confundir, si observamos la figura 5.2 es posible identificar nueve (9) grupos que repiten sus valores: de la edad 10 se repiten 3; de la edad 12 se repiten 4; de la edad 13 se repiten 6; de la edad 15 se repiten 7; de la edad 16 se repiten 6; de la edad 18 se repiten 3; de la edad 21 se

118

Arnaldo Torres Degr y Evelyn Afanador Mejas

repiten 4; de la edad 22 se repiten 2 y de la edad 23 se repiten 5.

Figura 5.2 Para establecer la Moda (mo)

10 10 10 12 12 12 12 13 13 13 13 13 13 15 15 15 15 15 15 15 16 16 16 16 16 16 18 18 18 21 21 21 21 22 22 23 23 23 23 23
N=40 datos hipotticos

Para buscar la moda (mo) de la edad inicial del uso de Internet entre los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico que ms se ha repetido tendramos que sealar que la edad quince (15) es el que tiene ms presencia, con siete (7) repeticiones. Podemos concluir que la edad inicial del uso de Internet entre los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico para el ao acadmico 2003-2004 que ms se repiti fue 15 aos. Obviamente, las dems edades tiene repeticiones pero la edad 15 sobrepasa las dems edades en cantidad. Veamos otro escenario, supongamos que la edad quince (15) la eliminramos (ver figura 5.2.a).
Figura 5.2.a Para establecer la Moda (mo)

10 10 10 12 12 12 12 13 13 13 13 13 13 __ __ __ __ __ __ 16 16 16 16 16 16 18 18 18 21 21 21 21 22 22 23 23 23 23 23
N=40 datos hipotticos

Medidas de Tendencia Central 119

Si tuviramos que buscar la moda (mo) segn las edades que aparecen en la figura 5.2.a nos daramos cuenta que de todas los grupos que se repiten hay dos edades que tienen el valor mximo de repeticin: la edad trece (13) con seis (6) repeticiones y la edad diecisis (16) con seis (6) repeticiones. Hay un empate y en el momento de seleccionar la moda hay que seleccionar ambas edades, es decir, la moda es 13 y 16.

Mediana
Para buscar la mediana segn el arreglo de datos, o sea, el valor que est en el medio de un conjunto de datos, existen dos (2) mtodos: 1. Si el nmero de valores, casos u observaciones es impar, la mediana ser el valor que est en el centro, cuando todos los valores se han arreglado en forma ordenada. Ejemplo, si tienes un grupo de 5 individuos con las siguientes edades 16, 21, 19, 19, 17 y deseas obtener la mediana de la edad de dicho grupo podemos observar que la cantidad de sujetos es impar. Por tanto, teniendo los casos organizados de mayor a menor o viceversa la mediana se encontrar en el medio luego de dividir la poblacin en dos mitades.

16, 17,

19

19, 21

mediana

2.

Si el nmero de valores, casos u observaciones es par, no se tiene una sola observacin en el centro, sino dos (2). En este caso se toma la mediana como la media de estas dos (2) observaciones, cuando todas las observaciones se han arreglado en forma ordenada. En otras palabras, se suman los valores y se divide entre dos (2), siendo este resultado la mediana. Ejemplo, si tienes un grupo de 8 individuos con las siguientes edades 16, 21, 19, 18, 17, 24, 22, 22 y deseas obtener la mediana de la edad de dicho grupo podemos observar que la cantidad de sujetos es par. Por tanto, teniendo los casos organizados de mayor a menor o viceversa la mediana se encontrar entre dos valores luego de dividir la poblacin en dos mitades. Para obtener la mediana debemos coger el ltimo valor de la primera mitad y sumarlo con el

120

Arnaldo Torres Degr y Evelyn Afanador Mejas

primer valor de la segunda mitad. Luego dicho resultado debe ser dividido por 2, es decir: (19 + 21) 2 = 20 siendo dicho resultado la mediana.

16, 17, 18, 19

20

mediana

21, 22, 22, 24

Para conocer, qu mtodo hay que emplear para obtener la mediana (md), preguntamos: cuntos estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico estn participando en el anlisis de la edad inicial del uso de Internet? La respuesta es cuarenta (40) casos, siendo este un nmero par (ver figura 5.1) Al dividir los cuarenta (40) casos tendramos dos (2) grupos de veinte (20) casos sin que se registre una observacin en el centro (ver figura 5.3).

Figura 5.3 Para establecer la mediana (md)

10 10 10 12 12 12 12 13 13 13 13 13 13 15 15 15 15 15 15

15

15.5

16

16 16 16 16 16 18 18 18 21

21 21 21 22 22 23 23 23 23 23 mediana
datos hipotticos

N=40

La mediana (md) de las edades de inicio sobre el uso de Internet entre los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico recay entre las edades 15 y 16 (ver figura 5.3) Para calcular la edad inicial del uso de Internet mediana (md) entre los estudiantes de ciencias polticas de la Universidad Pitirres de Puerto Rico usaremos la siguiente ecuacin:

Medidas de Tendencia Central 121

Edad inicial en el Internet, 15 aos + 16 aos = estudiantes de 2 ciencias polticas = (15 + 16) 2 = 15.5

Podemos concluir que en la Universidad Pitirre de Puerto Rico para el ao acadmico 2003-2004 la edad mediana de inicio sobre el uso de Internet entre los estudiantes de ciencias polticas fue de 15.5 aos. Profundizando ms en dicha conclusin, se puede indicar que el 50 por ciento de los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico para el ao acadmico 2003-2004 reflejaba que la edad de inicio en el Internet comenz a los 15.5 aos o ms. Por otro lado, podemos sealar lo inverso, que el 50 por ciento de los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico para el ao acadmico 2003-2004 reflejaba que la edad de inicio en el Internet comenz a los 15.5 aos o menos.

Media Aritmtica
Para obtener la media aritmtica o simplemente la media segn el arreglo de datos se suman todos los casos y luego se dividen entre la cantidad de casos. La media aritmtica de la edad inicial del uso de Internet entre los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico para el ao acadmico 2003-2004 la obtendremos de la siguiente manera: 1. Sumando () todos las frecuencias (), es decir, todas las edades de cada estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico para el ao acadmico 2003-2004 al momento del inicio al uso de Internet (ver figura 5.4). Dicha sumatoria fue de 654.

122

Arnaldo Torres Degr y Evelyn Afanador Mejas

Figura 5.4 Para establecer la media aritmtica ()

= 10 + 10 + 10 + 12 + 12 + 12 + 12 + 13 + 13 + 13 13 + 13 + 13 + 15 + 15 + 15 + 15 + 15 + 15 + 15 16 + 16 + 16 + 16 + 16 + 16 + 18 + 18 + 18 + 21 21 + 21 + 21 + 22 + 22 + 23 + 23 + 23 + 23 + 23

654
N =40 datos hipotticos

2.

Dividirlo por la cantidad (N) de casos, es decir, todos las edades de inicio en el Internet de todos los estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico. Dicha cantidad suma 40 edades.

Suma de todas las edades de cada estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico N Cantidad de todas las edades de cada estudiantes de ciencias polticas de la Universidad Pitirre de Puerto Rico

= =

654 40 16.35 aos

Podemos interpretar que la Universidad Pitirre de Puerto Rico para el ao acadmico 2003-2004 la edad media de los estudiantes de ciencias polticas al inicio del uso de Internet fue de 16.35 aos.

Medidas de Tendencia Central 123

Ejercicios de Tendencia Central


segn arreglo de datos
Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.

NOMBRE: NUMERO DE ESTUDIANTE:

FECHA: _______________ SECCION: ___________

Ejercicio 5.2.1 Favor de utilizar los datos para calcular y analizar la moda, mediana y media aritmtica segn el formato de arreglo de datos.

Estudiantes de trabajo social sobre la edad de inicio en el consumo de bebidas alcohlicas, Universidad Pitirre, Puerto Rico: 2000

10 23 19 17 15 23 19 16 10 16 19 23 17 19 10 23 19 16 10 19 17 10 16 19 15 10 15 14 23 16 19 16 10 16 19 15 17 19 10 23 19 19 15 17 10 17 19 23 16 14 17 23 10
Casos hipotticos

124

Arnaldo Torres Degr y Evelyn Afanador Mejas

Ejercicio 5.2.2 Favor de utilizar los datos para calcular y analizar la moda, mediana y media aritmtica segn el formato de arreglo de datos.

Estudiantes de criminologa con respecto al gasto en dlares diario de gasolina, Universidad Pitirre, Puerto Rico: 2000

12 20 15 10 22 15 10 12 09 22 09 12 08 10 15 10 22 10 12 09 08 15 05 22 05 15 08 10 20 09 20 12 08 15 09 12 05 20 12 10 22 20 12 15
Casos hipotticos

Medidas de Tendencia Central 125

Ejercicio 5.2.3 Favor de utilizar los datos para calcular y analizar la moda, mediana y media aritmtica segn el formato de arreglo de datos.

Estudiantes de sociologa con respecto a la cantidad de hermanos en su familia, Universidad Pitirre, Puerto Rico: 2000

2 1 4 3 6 2 7 3 5 1 2 6 3 5 1 3 4 1 2 3 1 4 3 1 3 4 2 8 3 2 5 7 3 2 9 3 1 1 5 3 8 5 1 3 4 3 5 2 1 4 6
Casos hipotticos

126

Arnaldo Torres Degr y Evelyn Afanador Mejas

Ejercicio 5.2.4 Favor de utilizar los datos para calcular y analizar la moda, mediana y media aritmtica segn el formato de arreglo de datos.

Estudiantes de administracin pblica con respecto a la cantidad de crditos acumulado de concentracin, Universidad Pitirre, Puerto Rico: 2000

18 12 15 20 15 21 27 18 14 16 27 21 24 15 15 27 15 12 18 15 15 18 14 18 16 27 16 18 21 15 18 12 15 27 15 12 18 16 12 15 20 18 16 13 21 15 27 18 12 14 18 27 20 15 14 27 18 20 16 15
Casos hipotticos

Medidas de Tendencia Central 127

[5.3] Anlisis de Tendencia Central a Partir de los Datos no Agrupados


Otra forma de organizar los datos cuantitativos es utilizando la estructura de datos no agrupados. Se organizan las categoras de la variable de inters en orden de magnitud, o sea, de mayor a menor o viceversa. Los casos se acumulan segn la categora que aplique. Si observamos el cuadro 5.1 notaremos que la variable de inters es la edad de las madres adolescentes solteras que tuvieron un nacimiento en Puerto Rico para el ao 1993. La categora edad, ubicada en la primera columna (x), se organizacin de menor a mayor, comenzando con la edad de 12 aos y culminando con la edad de 19 aos1. La otra columna que aparece en el cuadro 5.1 establece la frecuencia () o cantidad de nacimientos edades. ocurridos con madres adolescentes solteras que tienen ciertas Para cada categora existe una Edad de madre adolescente soltera 12 13 14 15 16 17 18 19 Nacimientos ocurridos 7 65 273 735 1,268 1,730 1,317 1,944 Frecuencia de nacimientos ocurridos por madres adolescentes solteras Puerto Rico, 1993 Cuadro 5.1

Fuente: Cuadro elaborado por el Dr. Arnaldo Torres Degr con datos obtenidos del Departamento de Salud, 1995. Informe Anual de Estadsticas Vitales de Puerto Rico: 1993. Nacimientos Vivos, tabla 7. Nacimientos vivos por sexo, edad de la madre, Estado Jurdico: p. 51

frecuencia. Por ejemplo, podemos establecer que 7 nacimientos ocurridos en Puerto Rico para el ao 1993 provienen de madres adolescentes solteras que tenan una edad de 12 aos, o que 1,317 nacimientos ocurrieron con madres adolescentes solteras que tenan una edad de 18 aos. Con este tipo de estructura podemos realizar un anlisis de tendencia central. No obstante, para determinar la mediana y la media aritmtica es necesario completar en el cuadro 5.1 dos (2) columnas adicionales. En la medida que se desarrolle el anlisis de tendencia central segn la estructura de datos no agrupados se explicarn las nuevas columnas.

Segn el Departamento de Salud de Puerto Rico, establece que una mujer que tenga un hijo(a) a los 19 aos o menos es considerada una madre adolescente.

128

Arnaldo Torres Degr y Evelyn Afanador Mejas

Figura 5.5 Procedimiento para obtener la moda segn los datos del cuadro 5.1 Edad de madre adolescente soltera () 12 13 14 15 16 17 18 moda 19

Moda
La decir en moda las la podremos categoras, columna de encontrarla en la columna (), es

Nacimientos ocurridos () 7 65 273 735 1,268 1,730 1,317 [1,944]

observando Cul es la () mayor

frecuencias (). La premisa sera, cul de las categoras es la ms que se repite?. En otras palabras, en que edad de la madre adolescentes solteras ocurrieron ms nacimientos. Si analizamos la figura 5.5 observamos que entre todas las categoras de las edades presentadas, la categora 19 tiene

ms nacimientos (1,944). Podemos concluir que en Puerto Rico para el ao 1993 los nacimientos en el grupo de las madres adolescentes solteras fueron ms frecuentes en madres de 19 aos de edad.

Mediana
Para la mediana en datos no agrupados necesitamos la frecuencia acumulada (a) de los nacimientos ocurridos entre las madres adolescentes solteras. La columna de frecuencia acumulada (a) es la acumulacin de frecuencias o casos de nacimientos, segn van pasando las categoras. Si observamos la construccin de la columna (a) en la figura 5.6 podemos notar que siete (7) nacimientos ocurrieron con madres adolescentes solteras de 12 aos de edad. Este resultado es el primero que se registra en la columna (a). Si sumamos la () de nacimientos ocurridos con las madres adolescentes solteras de 12 aos de edad con la () de nacimientos ocurridos con las madres adolescentes solteras de 13 aos de edad, podemos indicar que hasta la edad de 13 aos hay acumulados 72 nacimientos y el resultado se coloca en la

Medidas de Tendencia Central 129

columna (a). Hasta la edad de 14 aos tenemos acumulados 7 + 65 + 273, o sea, 345 nacimientos y el resultado se coloca en la columna (a). Se continuar acumulando y colocando los resultados en la columna (a) hasta que lleguemos a la ltima categora y por ende a la ltima acumulacin. Cuando llegamos a la ltima acumulacin podemos establecer que dicho resultado tiene que ser el total de casos del universo (N). Podemos concluir que 7,339 nacimientos ocurrieron con madres adolescentes solteras de 19 aos o menos.

Figura 5.6 Procedimiento para obtener la mediana segn los datos del cuadro 5.1 Edad de madre adolescente soltera () 12 13 14 15 16 17 18 19

Nacimientos ocurridos () 7 65 273 735 1,268 1,730 1,317 1,944

Frecuencia Acumulada (a) 7 72 345 1,080 2,348 4,078 5395 (N) 7,339

Terminada la construccin de la columna (a) estaremos en posicin de buscar la mediana. Para desarrollar la mediana debemos realizar los siguientes pasos:

Primer paso: Buscar un Indicador. El mismo se obtiene tomando el total de


casos (N), se suma 1 y luego se divide entre dos (2). Indicador = ( N + 1 ) 2

130

Arnaldo Torres Degr y Evelyn Afanador Mejas

Segundo paso: Comparar el indicador con los valores de la columna (a).


Debemos encontrar un valor en la columna (a) que sea igual al indicador o mayor inmediato.

Tercer paso: Una vez encontrado el valor correspondiente nos detenemos y buscamos la categora que le corresponda para establecer la mediana.
Para buscar la edad mediana de madres adolescentes solteras observamos que la columna (a) ha sido creada (ver figura 5.7) y que el paso siguiente es buscar un indicador. Indicador = ( N + 1 ) 2 = ( 7,339 + 1 ) 2 = 3,670

Ahora comparo el indicador obtenido (3,670) con la columna (a) y busco un valor que sea igual al indicador (ver figura 5.7). En la columna (a) no hay ningn valor que sea igual al indicador, por lo tanto, busco un valor que sea mayor inmediato que el indicador. El valor mayor inmediato de 3,670 es 4,078. Al detenerme en ese valor inmediatamente busco la edad que le corresponde, siendo 17 aos. Podemos establecer que entre el grupo de madres adolescentes solteras que procrearon un hijo(a) en Puerto Rico para el ao 1993, la edad mediana fue de 17 aos. Profundizando ms en este hallazgo podemos sealar que el 50 por ciento o la mitad de las madres adolescentes solteras que procrearon un hijo(a) en Puerto Rico para el ao 1993, la edad flucta entre 17 aos o ms, o 17 aos o menos.

Medidas de Tendencia Central 131

Figura 5.7 Procedimiento para obtener la mediana segn los datos del cuadro 5.1 Edad de madre adolescente soltera () 12 13 14 15 16 mediana 17 18 19

Nacimientos ocurridos () 7 65 273 735 1,268 1,730 1,317 1,944

Frecuencia Acumulada (a) 7 72 345 1,080 2,348 4,078 5395 (N) 7,339

Qu valor de la columna (a) es igual o mayor inmediato al valor del indicador (3,670)?

Media Aritmtica
Para buscar la media aritmtica a partir del cuadro 5.1 es necesario elaborar (ver figura 5.8) una columna adicional (x). La columna (x) se obtiene multiplicando la columna (x) por la columna (), es decir, x = (x) por (). Realizada la columna se debe sumar todos los valores de la columna para obtener la sumatoria de la columna x ( x). Posteriormente, dicha sumatoria (x) ser usada para obtener la media aritmtica.

132

Arnaldo Torres Degr y Evelyn Afanador Mejas

Figura 5.8 Procedimiento para obtener la media aritmtica segn los datos del cuadro 5.1 Edad de madre adolescente soltera () 12 por 13 por 14 por 15 por 16 por 17 por 18 por 19 por

Nacimientos ocurridos () 7= 65 = 273 = 735 = 1,268 = 1,730 = 1,317 = 1,944 =

(x) 84 845 3,822 11,025 20,288 29,410 23,706 36,936 x 126,116

Con la x obtenida, es decir la suma de todos los valores de la columna x, se dividir por la cantidad de casos, es decir por la N. Con esto podemos calcular la media aritmtica: = x N = 126,116 7,339 = 17.1843575 = 17.18

Podemos interpretar que en Puerto Rico para el ao 1993 la edad media (promedio o media aritmtica) de las madres adolescentes solteras que procrearon un hijo(a) fue de 17.18 aos.

Medidas de Tendencia Central 133

Ejercicios de Tendencia Central


segn datos no agrupados
Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.

NOMBRE: NUMERO DE ESTUDIANTE:

FECHA: _______________ SECCION: ___________

Ejercicio 5.3.1 Favor de utilizar los datos y completar las columnas para realizar un anlisis de tendencia central segn datos no agrupados
Frecuencia de nacimientos por edad de madres adolescentes casadas Puerto Rico, 1993

Edad 14 15 16 17 18 19

47 257 579 922 1,317 1,705

a*

x*

Fuente: Departamento de Salud de Puerto Rico, 1995. Informe Anual de Estadsticas Vitales: Puerto Rico 1993. Nacimientos, tabla, 7: pg. 51.

134

Arnaldo Torres Degr y Evelyn Afanador Mejas

[5.3.1.a] Favor de buscar y analizar la moda

[5.3.1.b] Favor de calcular y analizar la mediana

[5.3.1.c] Favor de calcular y analizar la media aritmtica

Medidas de Tendencia Central 135

Ejercicio 5.3.2 Favor de utilizar los datos y completar las columnas para realizar un anlisis de tendencia central segn datos no agrupados.

Frecuencia de nacimientos por edad de madres adolescentes (total) Puerto Rico, 1993

Edad 12 13 14 15 16 17 18 19

7 65 320 987 1,847 2,652 3,293 3,649

a*

x*

Fuente: Departamento de Salud de Puerto Rico, 1995. Informe Anual de Estadsticas Vitales: Puerto Rico 1993. Nacimientos, tabla, 7: pg. 51.

136

Arnaldo Torres Degr y Evelyn Afanador Mejas

[5.3.2.a] Favor de buscar y analizar la moda

[5.3.2.b] Favor de calcular y analizar la mediana

[5.3.2.c] Favor de calcular y analizar la media aritmtica

Medidas de Tendencia Central 137

[5.4] Anlisis de Tendencia Central a partir de los Datos Agrupados


Otra forma de organizar los datos cuantitativos es utilizando la estructura de datos agrupados. Las categoras se organizan en grupos o en clases. La cantidad o frecuencia () se va ubicando conforme la asociacin que tenga dicho caso con la clase. Para el ao 2003 en Puerto Rico se pudo constatar que 21,164 ciudadanos fueron vctimas de violencia domstica. Como dato significativo se puede sealar que el 86.09 por ciento de las vctimas por violencia domstica fueron mujeres (18,221 casos), mientras que el 13.91 por cientos de las vctimas por violencia domstica casos). mujeres fueron varones (2,943 Esto sugiere que en Puerto 50-54 55-59 60-64 65-69 631 320 152 145 vctimas por violencia 35-39 40-44 45-49 2,442 1,832 978 Cantidad de vctimas en incidentes de violencia domstica por edad Puerto Rico, 2003 Edad (x) 15-19 20-24 25-29 30-34 Cuadro 5.2

() 1,982 4,901 4,354 3,427

Rico para el 2003 por cada 6.19 domstica un varn fue vctima por la misma causa. Retomando otra vez el hilo conductor de este tpico, si observamos el cuadro 5.2 las vctimas por violencia domstica en Puerto Rico para el ao 2003 fueron ubicados en

Fuente: Cuadro elaborado por el Dr. Arnaldo Torres Degr con datos obtenidos de la Polica de Puerto Rico, Superintendencia Auxiliar del servicio a la ciudadana, Divisin de Estadstica

grupos de edades, lo que llamaremos clases. Dichas edades estn presentadas en grupos quinquenales, o sea, en grupos de cinco (5) aos. Las edades fueron organizadas en clases tales como 15 aos hasta 19 aos, de 20 aos hasta 24 aos y as sucesivamente hasta llegar a la ltima clase de 65 aos hasta los 69 aos. Cada clase est constituida por un lmite inferior y superior. Al analizar la primera clase del

138

Arnaldo Torres Degr y Evelyn Afanador Mejas

cuadro 5.2 (edad de 15 a 19 aos) notaremos que el primer valor (15 aos) es inferior al segundo valor (19 aos). Por deduccin podemos afirmar que entre la clase (1519) la edad de 15 aos es un lmite inferior (LI), mientras que la edad 19 es un lmite superior (LS). Para realizar un anlisis de tendencia central segn la configuracin de los datos agrupados se debe generar otra informacin (ver diagrama 5.1), adicional a las clases, las frecuencias () y la frecuencia acumulada (a).

Diagrama 5.1 Clase (LI-LS)


donde:

Pt (x)

LRI

LRS

Clase = Categoras de la variable cualitativa organizadas en grupos. LI = Lmite inferior o el valor ms pequeo de la clase. LS = Lmite superior o el valor ms grande de la clase. = Frecuencia o cantidad de casos y observaciones. a = Es la frecuencia () acumulada. Esta se obtiene sumando () la columna de la frecuencia (). I = Es el intrvalo de clase, o sea la distancia que existe entre el lmite superior vs. el lmite inferior de cada clase. La forma para obtener el intrvalo de clase es: I = LS - LI + 1

Pt = Es el punto medio, o sea, el valor que se encuentra en el medio de cada clase. Para obtener el Pt de cada clase se debe sumar el lmite inferior y el lmite superior y luego dividirlo entre 2. Pt = LI + LS 2 Las implicaciones del (Pt) es que se asume que todos los casos se

Medidas de Tendencia Central 139

encuentran en el medio de su clase. Tomando el cuadro 5.2 como ejemplo, podemos decir que 4,354 vctimas por violencia domstica en Puerto Rico para el ao 2003 tenan entre 25 aos a 29 aos. Sin embargo, es impredecible establecer cuantos de esa frecuencia tienen 25 aos, 26 aos, 27, aos, 28 aos o 29 aos. Por tanto, se asume que todos los casos se encuentran en el medio de la clase. Podemos entonces indicar que la edad de todos los casos (4,354 vctimas por violencia domstica) tenan 27 aos. Por tanto, el Pt se convierte para cada clase la categora que representar la frecuencia. LRI = Lmite real inferior: el lmite inferior de cada clase se le resta punto cinco (.5) LRI = LI . 5 LRS = Lmite real superior: el lmite superior de cada clase se le suma punto cinco (.5) LRS= LS + . 5 x = Frecuencia () multiplicado por el punto medio (Pt). x = () (Pt)

Moda
Con estas columnas podemos, sin ninguna dificultad, completar un anlisis de tendencia central. Si quisiramos obtener la edad que ms se repite (moda) de las vctimas por violencia domstica en Puerto Rico para el ao 2003, tendramos que analizar cul de las clases es la ms que se repite. Entre todas las clases (ver figura 5.9) la ms que se repite el grupo de 20 a 24 aos. Si observamos, en dicha clase se registraron 4,901 casos, siendo este la frecuencia mayor comparado con las otras frecuencias. No obstante, entre la clase 20-24 aos existen cinco (5) edades. Cul de esas edades es la ms que se repite?. En otras palabras, de los 4,901 casos, podremos determinar cuntas vctimas por violencia domstica tenan 20 aos, 21 aos, 22 aos 23 aos o 24 aos. Realmente no se posible. Por consiguiente, se sugiere que se escoja el punto medio de la clase seleccionada. En teora, estamos suponiendo que todas las 4,901 vctimas por violencia domstica que fueron ubicados

140

Arnaldo Torres Degr y Evelyn Afanador Mejas

entre 20 a 24 aos se agrupan en el medio de la clase. Podemos establecer que en Puerto Rico para el ao 2003 la edad que ms se repiti entre las vctimas por violencia domstica fue de 22 aos.

Figura 5.9 Procedimiento para obtener la moda segn los datos del cuadro 5.2 Edad (clases) 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 Pt (x) 17 Moda 22

()
1,982 [4,901]

a
1,982 6,883

I 5 5

5 27 4,354 11,237 5 32 3,427 14,664 5 37 2,442 17,106 5 42 1,832 18,938 5 47 978 19,916 5 52 631 20,547 5 57 320 20,867 5 62 21,019 152 5 67 145 21,164 Por consiguiente, la moda es el Pt de la clase. Cul es la clase que ms se repite?

Mediana
Para desarrollar la mediana debemos realizar los siguientes pasos:

Primer paso: Buscar un Indicador. El mismo se obtiene tomando el total


de casos (N), se suma 1 y luego se divide entre dos (2). Indicador = (N + 1) 2

Medidas de Tendencia Central 141

Segundo paso: Comparar el indicador con los valores de la columna


(a). Debemos encontrar un valor en la columna (a) que sea igual al indicador o mayor inmediato.

Tercer paso: Una vez encontrado el valor correspondiente nos detenemos en ese valor y separamos toda la lnea incluyendo la frecuencia acumulada (a) anterior. El propsito de la separacin es que en la misma se encuentra toda la informacin necesaria para calcular la mediana. Cuarto paso: Utilizar la frmula para calcular la mediana.

Mediana = LRI + I
donde:

N a anterior 2

LRI = Lmite real inferior I = Intervalo de clase = Frecuencia N = Poblacin a anterior = Frecuencia acumulada anterior

Prosiguiendo con el ejercicio, para obtener la mediana se debe calcular primeramente el indicador.

Indicador = ( N + 1) 2 = (21,164 + 1) 2 = 10,582.5

142

Arnaldo Torres Degr y Evelyn Afanador Mejas

Una vez calculado el indicador (10,582.5) reiteramos que el propsito del mismo es slo y nicamente sealar. Con esto en mente es posible comenzar el clculo de la mediana, veamos:

Figura 5.10 Procedimiento para obtener la mediana segn los datos del cuadro 5.2

Edad (clases)

Hombres

()
1,982 4,901 4,354 3,427 2,442 1,832 978 631 320 151 145

a
1,982 6,883 11,237 14,664 17,106 18,938 19,916 20,547 20,867 21,019 21,164

Pt (x)

LRI

LRS

15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69

5 5 5 5 5 5 5 5 5 5 5

17 22 27 32 37 42 47 52 57 62 67

14.5 19.5 24.5 29.5 34.5 39.5 44.5 49.5 54.5 59.4 64.5

19.5 24.5 29.5 34.5 39.5 44.5 49.5 54.5 59.5 64.5 69.5

33,694 107,822 117,558 109,664 90,354 76,944 45,966 32,812 18,240 9,362 9,715 x 652,131

Ahora, comparo el indicador obtenido (10,582.5) con la columna (a) y busco un valor que sea igual al indicador. Al no encontrarlo busco un valor que sea mayor inmediato que el indicador. El valor mayor inmediato a 10,582.5 es 11,237. Al detenerme en ese valor inmediatamente separo toda la lnea y cuando paso por la columna de a separo la frecuencia acumulada anterior. Recordemos que el propsito de encasillar la lnea correspondiente a la clase 25- 29 aos (ver figura 5.10) es separar la data que ser utilizada para calcular la mediana. Con esto establecido podemos calcular la mediana:

Medidas de Tendencia Central 143

Edad Mediana = LRI + I Edad Mediana = 24.5 + 5 4,354

N a anterior 2 21,164 6,883 2

= 24.5 +

5 (10,582 6,883) 4,354 5 (3,699) 4,354

= 24.5 +

= 24.5 + .001148369 (3,699) = 24.5 + 4.247816931 = 28.7478169 = 28.75 aos

Podemos establecer que en Puerto Rico para el ao 2003, la edad mediana de las vctimas por violencia domstica fue de 28.75 aos. Profundizando ms en este hallazgo podemos sealar que el 50 por ciento o la mitad de las vctimas por violencia domstica en Puerto Rico para el ao 2003 fluctuaba entre 28.75 aos o ms, o 28.75 aos o menos.

Media Aritmtica
Para buscar la media aritmtica a partir del cuadro 5.2 es necesario elaborar (ver figura 5.10) una columna adicional conocida como (x). La columna (x) se obtiene multiplicando la columna (Pt) por la columna (), es decir, x = (Pt) por (). Realizada la columna se deben sumar todos los valores de la columna para obtener la sumatoria de la columna x (x). Posteriormente, dicha sumatoria (x) ser usada para obtener la media aritmtica. La x obtenida, es decir la suma de

144

Arnaldo Torres Degr y Evelyn Afanador Mejas

todos los valores de la columna x, se dividir por la cantidad de casos, es decir por la N. Con esto podemos realizar la media aritmtica:

= x N = 652,131 21,164 = 30.81322056 = 30.81

Podemos interpretar que en Puerto Rico para el ao 2003 la edad media (o la media aritmtica de la edad) de las vctimas por violencia domstica fue de 30.81 aos.

Medidas de Tendencia Central 145

Ejercicios de Tendencia Central


segn datos agrupados
Favor de identificar las hojas de ejercicios y elaborar todos los problemas segn lo establecido en el texto. Desprenda las hojas de ejercicios y entrguelas al profesor, SI FUESE NECESARIO.

NOMBRE: NUMERO DE ESTUDIANTE:

FECHA: _______________ SECCION: ___________

Ejercicio 5.4.1 Favor de utilizar los datos y completar las columnas para realizar un anlisis de tendencia central segn datos agrupados. Frecuencia de vctimas femeninas por violencia domstica y grupos de edades, Puerto Rico, 2003 Edad (clases) 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 Mujeres () 1,916 4,359 3,717 2,869 2,052 1,539 796 514 250 107 102 x a I Pt (x) LRI LRS x

Fuente: Polica de Puerto Rico, Superintendencia Auxiliar del servicio a la ciudadana, Divisin de Estadstica

146

Arnaldo Torres Degr y Evelyn Afanador Mejas

[5.4.1.a] Favor de buscar y analizar la moda

[5.4.1.b] Favor de calcular y analizar la mediana

[5.4.1.c] Favor de calcular y analizar la media aritmtica

Medidas de Tendencia Central 147

Ejercicio 5.4.2 Favor de utilizar los datos y completar las columnas para realizar un anlisis de tendencia central segn datos agrupados. Frecuencia de vctimas masculinos por violencia domstica y grupos de edades, Puerto Rico, 2003 Edad (clases) 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 Hombres () 66 542 637 558 390 293 182 117 70 45 43 x a I Pt (x) LRI LRS x

Fuente: Polica de Puerto Rico, Superintendencia Auxiliar del servicio a la ciudadana, Divisin de Estadstica

148

Arnaldo Torres Degr y Evelyn Afanador Mejas

[5.4.2.a] Favor de buscar y analizar la moda

[5.4.2.b] Favor de calcular y analizar la mediana

[5.4.2.c] Favor de calcular y analizar la media aritmtica

Medidas de Tendencia Central 149

Ejercicio 5.4.3 Favor de utilizar los datos y completar las columnas para realizar un anlisis de tendencia central segn datos agrupados. Frecuencia de suicidios por grupo de edades, Puerto Rico, 1990 Edad (clases) 15-19 20-24 25-29 30-34 35-39 40-44 45-49 50-54 55-59 60-64 65-69 70-74 75-79 Suicidios () 12 30 35 45 45 28 30 25 21 21 27 30 32 x Pt (x)

LRI

LRS

Fuente: Departamento de Salud de Puerto Rico, 1993. Estadsticas Vitales de Puerto Rico: Resumen de una dcada 1980 al 1990. Muertes por causas externas, tabla 1, pg. 93.

150

Arnaldo Torres Degr y Evelyn Afanador Mejas

[5.4.3.a] Favor de buscar y analizar la moda

[5.4.3.b] Favor de calcular y analizar la mediana

[5.4.3.c] Favor de calcular y analizar la media aritmtica

Medidas de Tendencia Central 151

[5.5] Frmulas
Media aritmtica o media para poblacin
= N = x N

Media aritmtica o media para muestras = n = x n

Indicador
I= (N+1) 2

Mediana para datos agrupados

Md = LRI + I

N a anterior 2

152

Arnaldo Torres Degr y Evelyn Afanador Mejas

[5.5] Ejercicios Adicionales


Arreglo de datos [5.5.1] Favor de buscar y analizar la moda, mediana y media de la nota del primer examen de los atletas de la Universidad Pitirre para el ao 2004 en el curso de primeros auxilios: datos hipotticos 56; 78; 78; 75; 77; 72; 75; 79; 79; 80; 72; 73; 74; 72; 75; 73; 72; 70; 72; 80; 77; 75; 72; 90; 88; 72; 74; 78; 80; 66; 72; 76; 83; 90; 72; 77; 79. [5.5.2] Favor de buscar y analizar la moda, mediana y media de la cantidad de horas semanales viendo televisin entre los atletas de la Universidad Pitirre para el ao 2004: datos hipotticos 15; 10; 20; 10; 10; 27; 22; 10; 16; 16; 09; 17; 28; 19; 15; 15; 15; 18; 10; 10; 10; 14; 17; 20; 13; 12; 12; 18; 20; 08; 09; 10; 12; 14; 20; 16; 12. Favor de buscar y analizar la moda, mediana y media de la cantidad en dlares por concepto en compra de libros para estudios entre los atletas de la Universidad Pitirre para el ao 2004: datos hipotticos 95; 76; 50; 88; 50; 89; 74; 90; 56; 86; 89; 90; 69; 150; 120; 120; 90; 96; 89; 100; 89; 58; 90; 60; 100; 58; 88; 79; 90; 100; 120; 90; 99; 87; 90; 99; 130.

[5.5.3]

Datos no agrupados [5.5.4] Favor de buscar y analizar la moda, mediana y media de la edad de las mujeres menores quienes se les presentaron querellas en Puerto Rico para el ao fiscal 1991-1992, segn los datos registrados en el ejercicio 6.3 de la pgina 169. [5.5.5] Favor de buscar y analizar la moda, mediana y media de la edad de las varones menores quienes se les presentaron querellas en Puerto Rico para el ao fiscal 1991-1992, segn los datos registrados en el ejercicio 6.3 de la pgina 169.. Favor de buscar y analizar la moda, mediana y media de la edad de todos los menores quienes se les presentaron querellas en Puerto Rico para el ao fiscal 1991-1992, segn los datos registrados en el ejercicio 6.3 de la pgina 169.

[5.5.6]

Datos agrupados [5.5.7] Favor de buscar y analizar la moda, mediana y media de la edad por suicidio en Puerto Rico para el ao 1980, segn los datos registrados en el cuadro 4.1 de la pgina 105. [5.5.8] Favor de buscar y analizar la moda, mediana y media de la edad por suicidio en Puerto Rico para el ao 1990, segn los datos registrados en el cuadro 4.1 de la pgina 105. Favor de buscar y analizar la moda, mediana y media de la edad por suicidio en Puerto Rico para el ao 2000, segn los datos registrados en el cuadro 4.1 de la pgina 105.

[5.5.9]

Вам также может понравиться