Вы находитесь на странице: 1из 33

CURSO DE ESTADSTICA BSICA APLICADA A LA GESTIN OFICINA NACIONAL DE SERVICIO CIVIL ESCUELA DE FUNCIONARIOS PLICOS AO 2009.

Responsable: Lic. Daniella M. Repetto Pereira dmrepe@hotmail.com

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

1.- CONCEPTOS BSICOS DE ESTADSTICA Estadstica es algo ms que la recoleccin y publicacin (tal cual se ven en revistas y diarios) de hechos y datos numricos Se puede considerar como la aplicacin del mtodo cientfico de anlisis de datos numricos, con el fin de tomar decisiones racionales. Estadstica ser tratada aqu como una Ciencia que trata de la recopilacin, presentacin, anlisis e interpretacin de datos numricos (estadsticas) con el fin de realizar una toma de decisiones ms efectiva Funciones de la Estadstica: Resumen de los datos y extraccin de informacin relevante, esto es de las mediciones observadas, sean estas numricas, clasificatorias, ordinales o de otro tipo. Bsqueda y evaluacin de los modelos y pautas que ofrecen los datos, pero que se encuentran ocultos por la inherente variabilidad de los mismos. Contribuir al diseo eficiente de experimentos y encuestas. Facilitar la comunicacin entre los cientficos, ya que siempre ser ms fcil comprender la referencia a un procedimiento estndar, sin necesidad de mayor detalle. La autentificacin cientfica que sera el utilizar adecuadamente los mtodos estadsticos de acuerdo a los estudios que se estn realizando; y la no exageracin de produccin de datos en trabajos que de repente no lo requieren. Divisiones dentro de la estadstica: Estadstica Descriptiva: Consiste en un conjunto de instrumentos y temas relacionados con la descripcin de colecciones de observaciones estadsticas, se refiere tanto al total de la poblacin como a la muestra, y su finalidad es resumir un conjunto de datos numricos. Estadstica Inferencial o Inductiva: Se ocupa de la lgica y el procedimiento para la inferencia y la induccin de propiedades de una poblacin en bases a resultados obtenidos de una muestra conocida. A MODO DE EJEMPLO: Analizaremos las Estadsticas sobre la Violencia y la Criminalidad en el Uruguay. Objetivo general: Realizar un Anuario sobre la Violencia y la Criminalidad en el Uruguay.
ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

Objetivo especfico: Describir las condiciones de la Violencia y la Criminalidad segn, los Delitos y Faltas, hechos y la cantidad de personas asignadas a tareas de seguridad. Para poder realizar este estudio descriptivo se deben tener en cuenta los conceptos de universo, poblacin, muestra, unidad de anlisis y unidad de relevamiento UNIVERSO DE ANLISIS El universo se compone por todos los objetos, cosas, individuos, caractersticas del fenmeno que se quiere estudiar, en nuestro ejemplo seran Todos los delitos denunciados en el Uruguay desde 2000 hasta el 2006. POBLACIN La poblacin objeto de estudio se compone por todos los objetos, cosas, individuos, caractersticas del fenmeno que se quiere estudiar se podra definir como el conjunto de las unidades que constituyen el objeto de investigacin, debe estar acotada en espacio y tiempo para as poder definirla con mayor precisin y exactitud. Para nuestro ejemplo la poblacin objeto de estudio se definira como Todos los delitos denunciados en el Uruguay durante el primer semestre del ao 2002 MUESTRA La muestra es una parte de esa poblacin o universo objeto de estudio. Debe de estar compuesta por los mismas cosas, objetos, individuos, de la poblacin a la cual pertenece; la muestra es una parte representativa de esa poblacin y se selecciona para que represente a la poblacin total del estudio en la ejecucin del proyecto de investigacin emprico, debe tambin estar acotada en espacio y tiempo. Para nuestro ejemplo la muestra seran algunos delitos denunciados en el Uruguay durante el primer semestre del 2002. UNIDAD DE ANLISIS La unidad de anlisis seran los elementos (cosas, objetos, individuos, grupos etc. cada uno de ellos) que componen la muestra pertenecientes a la poblacin objeto de estudio la unidad de anlisis se definira como la unidad bsica de ese conjunto. En nuestro ejemplo la unidad de anlisis sera un delito denunciado en Uruguay . UNIDAD DE RELEVAMIENTO Es la unidad que aporta la informacin, es aquel individuo, grupo u objeto que trasmite o brinda la informacin para la construccin del dato estadstico. En nuestro ejemplo, la unidad de relevamiento es el.
ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

Muchas veces la unidad de anlisis y de relevamiento coincide.

UNIVERSO

POBLACIN POBLACIN

MUESTRA UNIDADES DE ANLISIS RECOLLECIN DE DATOS Para poder efectuar el estudio de la descripcin de la violencia y criminalidad en el Uruguay, debemos definir previamente qu tcnicas metodolgicas de investigacin aplicaremos en nuestro estudio, teniendo en cuenta el tipo de diseo de investigacin que se est planteando, el objeto de estudio que se va a analizar y la teora sobre la que se va a sustentar el estudio. Tambin se podran utilizar fuentes secundarias de datos ya existentes que aportaran informacin sobre el objeto de estudio, as como encuestas oficiales, censos (por ejemplo el del Instituto Nacional de Estadstica de 1996), Encuesta Continua de Hogares, datos publicados por organismos pblicos o privados, entre otros. Supongamos que para estudiar la descripcin de la delincuencia en el Uruguay se realiza un relevamiento de la informacin contenida en los formularios de denuncias de los mismos. Para esto, se requiere determinar los tipos de datos con los cuales se va a trabajar, es decir las variables que aportarn la informacin a nuestro problema de estudio. VARIABLES Representan y sintetizan conceptualmente las propiedades o caractersticas de las unidades de anlisis, a las cuales se les pueden adjudicar distintos valores numricos. Son conceptos que pueden asumir diferentes valores.

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

Del punto de vista estadstico se manejan variables aleatorias o sean fenmenos de inters, cuyos resultados (datos) observados pueden diferir entre una y otra respuesta (valores), a estas posibles respuestas se les llama categoras de la variable. Las categoras de una variable deben cumplir dos requisitos fundamentales, deben de ser exhaustivas (deben estar todas las respuestas posibles) y excluyentes (no se pueden ubicar las respuestas en dos categoras al mismo tiempo, pertenece a una categora u a otra). Por ejemplo: Variable Respuestas (Categoras) Variable Respuestas (Categoras) Variable Respuestas Delitos contra la persona lesiones, homicidios, sexuales

Nivel Educativo Alto, Medio, Bajo.

Cantidad de Intervenciones Policiales las veces que se registran las mismas (una, cinco, ocho....etc.)

Existen dos tipos bsicos de variables aleatorias que producen datos de tipo: cualitativo y cuantitativos. Las variables que producen datos cualitativos producen categricas Delitos contra la propiedad, nivel educativo respuestas

Las variables que producen datos cuantitativos producen respuestas numricas cantidad de intervenciones policiales Los datos cuantitativos se pueden considerar tambin como discretos o continuos. Los datos cuantitativos discretos son respuestas numricas que surgen de un proceso de conteo, ejemplo Los datos cuantitativos continuos son respuestas numricas que surgen de un proceso de medicin, ya que las repuestas puede encontrarse en un intervalo segn sea la exactitud del instrumento de medicin.; La Estadstica Descriptiva puede ser univariada, referirse a una sola variable, o bivariada ms de una variable simultneamente. La estadstica descriptiva univariada, es aquella rama de la estadstica que analiza y describe la distribucin de una variable.
ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

Las variables reflejan el dato (las repuestas) y se distribuyen a travs de sus diferentes valores, generando una distribucin de frecuencias. Esta distribucin de frecuencias puede ser original (los datos brutos) o una distribucin de datos agrupados (una tabla de datos). Distribucin de Datos Originales Ejemplo: distribucin de la variable delitos contra la persona Lesiones, lesiones, homicidios, homicidios, sexuales, lesiones, homicidios, lesiones, homicidios, homicidios, sexuales, lesiones, homicidios, homicidios homicidios, sexuales, lesiones, sexuales, lesiones, lesiones, sexuales, homicidios, homicidios, sexuales, lesiones, sexuales, lesiones, lesiones, sexuales, homicidios,

La distribucin de frecuencias originales podra aparecer tambin con las categoras codificadas. Donde 1 = lesiones 2= homicidios 3= sexuales

1 - 1 2 2 3 1 3 2 3 - 1 1 1 3 2 2 - 1 2 2 3 1 3 1 2- 3 1 1 1 3 2 - 2 2

Distribucin de Datos Agrupados TABLA DE DISTRIBUCIN DE LOS DELITOS CONTRA LA PERSONA Para poder armar una tabla de frecuencias de este tipo se debe definir previamente los elementos de las misma.
VARIABLE 1 (LESIONES) 2 (HOMICIDIOS) 3 (SEXUALES) TOTAL fi 12 11 7 30 hi 0,4 0,36 0,24 1 % 40 36 24 100

Porcentajes de Delitos contra la Persona

23% 40% 1 (LESIONES) 2 (HOMICIDIOS) 3 (SEXUALES)

37%

Fuente: Elaboracin propia.

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

Frecuencias Absolutas ( fi o ni) Nmero de elementos en la poblacin o en las muestras, que adoptan un mismo valor para la variable. Significa la cantidad de veces que se repite ese valor (categora) en la distribucin. Ejemplo: frecuencia absoluta de lesiones igual 12; frecuencia absoluta de homicidios igual 11, frecuencia absoluta de sexuales igual 7. Frecuencia Relativa (fr o hi) Proporcin de la unidad que representa la frecuencia absoluta. Se obtiene de dividir cada frecuencia absoluta entre el total de la poblacin. fr = fi / n Ejemplo: frecuencia relativa de lesiones es igual a 12/30, es decir, 0,40; para los homicidios es 11/30, es decir, 0,36; sexuales 7/30, es decir 0,24. La suma de las frecuencias relativas debe ser igual a 1. La descripcin de una variable depende del tipo de escala de medicin a la cual pertenece, luego de definida la misma se describir a travs de la realizacin de tablas (resumen de la informacin), grficos e indicadores de posicin y/o dispersin que depender en ambos casos de la escala de medicin que se est trabajando.

2.- CLASIFICACIN DE ESCALAS DE MEDICIN Y SUS GRFICOS RESPECTIVOS. Las escalas de medicin pueden ser nominales, ordinales, intervales o de razn, se definen a partir de su nivel de medicin. Comenzaremos por las escalas de menor nivel, nominales y ordinales que se representan a travs de variables cualitativas. Para continuar posteriormente con las escalas de mayor nivel, intervales y de razn representadas por las variables cuantitativas.

INTERVAL RAZN

NOMINAL

ORDINAL

ORDINAL

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

ESCALA NOMINAL Es una escala que clasifica unidades en dos o ms categoras que se excluyen mutuamente, establecindose equivalencias o diferencias, no establece ningn tipo de orden para las respuestas. Los valores de las respuestas es decir las categoras son atributos o cualidades, si por algn motivo aparecen nmeros como respuestas, estos son cdigos de clasificacin, nunca sus verdaderos valores. Ejemplos: Sexo (masculino, femenino); Delitos contra la Persona (lesiones, homicidios, sexuales); Estado civil (soltero, casado, viudo, divorciado, unin libre); Delitos contra la propiedad (hurto, rapia, daos).

ESCALA ORDINAL Cuando las unidades o valores son clasificados y ordenados segn su magnitud (de menor que o mayor que) se est en presencia de una escala ordinal. Los nmeros indican un orden pero no muestran con exactitud la respuesta y estos nmeros muchas veces son cdigos, o una manera jerrquica de describir las categoras de una variable. EJEMPLOS: Nivel Educativo (Alto, Medio, Bajo) Opinin sobre las condiciones del celdario (Muy Bueno, Bueno, Malo, Muy Malo, otro) ESCALA DE INTERVALOS Son escalas de medida que clasifican y ordenan las unidades presuponiendo la existencia de intervalos iguales para que la distancia entre cualquiera de los pares de unidades sea conocida y pueda ser objeto de comparacin. Ejemplos: La edad La cantidad de Intervenciones Policiales ESCALAS DE RAZN Cuando una medicin tiene todas las caractersticas de una medida de intervalo (de una escala interval), y adems se le puede asignar un punto de origen verdadero de valor 0. Es decir que e punto de origen se conoce y no es ambiguo, porque su valor puede ser cero o menor a cero. Ejemplo: Nmero de aos de la Escolaridad ( puede ser 0, 1, 3, 8 ....,etc) Ingreso mensual por actividad principal (0, $1.000, $ 1.500, $ 3.500........)

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

DESCRIPCIN DE VARIABLES SEGN SU ESCALA DE MEDICIN. Como ya se dijo anteriormente, para describir una variable se deben tener tres elementos fundamentales, tablas, grficos y medidas resumen (indicadores de posicin, centralidad y dispersin). Comenzaremos por definir como se deben construir las tablas de frecuencias, para cada una de las escalas de medicin nominal, ordinal, interval y ratio (cociente o razn), para luego establecer qu tipo de grficos se pueden realizar y finalmente definir cules son los indicadores de posicin y dispersin ms adecuados para cada una de las escalas mencionadas.

TABLA PARA ESCALAS NOMINALES. Las tablas de distribucin de frecuencias para variables que pertenecen a una escala nominal, deben tener los siguientes componentes: Xi = es la variable con la cual se est trabajando y sus respectivas categoras. fi ni = Frecuencia Absoluta Simple: Nmero de elementos en la Poblacin o en la muestra, que adoptan un mismo valor para la Variable. Significa la cantidad de veces que aparece o se presenta ese valor (categora) en la distribucin. N = Tamao de la Poblacin: es el total de casos por los que est compuesta la poblacin objeto de estudio que se est trabajando. n = Tamao de la Muestra: es el total de casos que contiene la muestra sobre la que se est trabajando. fr hi = Frecuencia Relativa Simple: Proporcin de la unidad que representa la frecuencia absoluta para cada una de las categoras de la variable, tomando un valor que vara entre 0 y 1; se pueden expresar tambin en porcentajes (%), variando su valor de 0 a 100 %. Se obtiene dividiendo cada frecuencia absoluta entre el total de la poblacin o de la muestra. Si se quiere expresar en porcentajes (%) se deben multiplicar por 100, el resultado obtenido en la divisin anterior. Para la Poblacin fr = fi / N Para la Muestra fr = fi / n

La suma de las frecuencias relativas simples siempre debe dar 1 (uno) si se est trabajando con la proporcin y 100 % si se expresa en porcentajes. Nunca los valores que asuman las frecuencias pueden ser negativos, ya que denotan las veces que aparecen esas respuestas (caractersticas) en la distribucin de la variable que se est trabajando.
ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

Distribucin de DELITOS contra la persona para el Ao 2002. Xi (delitos contra la persona) LESIONES HOMICIDIOS SEXUALES n (total) Fi 2524 124 461 3109 fr (%) 81 4 15 100 %

FUENTE: Anuario Estadstico sobre Violencia y Criminalidad en el Uruguay 1990 2002. Programa de Seguridad Ciudadana Ministerio del Interior

Para obtener las frecuencias relativas simples (fr) que aparecen en la tabla se debi realizar los siguientes pasos: fr = fi / n 2524/3109 = 0,81 como lo expresamos en porcentajes (%) lo que se hizo a posteriori fue multiplicarlo por 100. Donde 81% se deduce de la siguiente manera: (2524 % 3109) x 100 = 81 % Este procedimiento se aplica sobre cada una de las frecuencias absolutas simples de la tabla de distribucin de frecuencias, de acuerdo a las categoras que posee la variable, lo cual significa que tendr para cada una de las categoras respectivas una frecuencia absoluta simple y una frecuencia relativa simple (la proporcin o porcentaje de acuerdo a las veces que se reiteran esas respuestas para cada categora).

GRFICOS PARA ESCALA NOMINAL Para las escalas nominales los grficos que se pueden realizar son los siguientes: Sectores o Torta. (se debe realizar en porcentajes y es fundamental la presentacin de las referencias para cada una de las categoras de la variable en estudio) Barras Simples, Barras acostadas y Bastones.( Se pueden utilizar las frecuencias absolutas o relativas simples en forma indistinta las cuales se deben ubicar en el eje Y, mientras que en el eje X de deben ubicar las categoras de la variable en estudio). Pictogramas. (Se debe recordar que siempre la figura que se seleccione debe ser utilizada teniendo en cuanto la unidad a la que pertenece, es decir: si una casa es igual a 1000 casas y esto se toma como la unidad de medida, 2 casas sern igual a 2000 casas)

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

10

GRFICO DE SECTORES Porcentajes de Delitos contra la Persona. Ao 2002.


15% 4% LESIONES HOMICIDIOS SEXUALES 81%

FUENTE: Anuario Estadstico sobre Violencia y Criminalidad en el Uruguay 1990 2002. Programa de Seguridad Ciudadana Ministerio del Interior

GRFICO DE BARRAS. Delitos contra la Persona. Ao 2002.


Cantidad de Casos
3000 2500 2000 1500 1000 500 0 LESIONES HOMICIDIOS SEXUALES Serie1

Delitos
FUENTE: Anuario Estadstico sobre Violencia y Criminalidad en el Uruguay 1990 2002. Programa de Seguridad Ciudadana Ministerio del Interior

GRFICO DE BARRAS ACOSTADAS Delitos contra la Persona. Ao 2002.


SEXUALES

Delitos

HOMICIDIOS LESIONES 0 1000 2000 3000 SEXUALES HOMICIDIOS LESIONES

Cantidad de Casos
FUENTE: Anuario Estadstico sobre Violencia y Criminalidad en el Uruguay 1990 2002. Programa de Seguridad Ciudadana Ministerio del Interior.

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

11

TABLA PARA ESCALA ORDINAL. La tabla de distribucin de frecuencias para escalas ordinales, contiene los mismos elementos que la escala nominal, a diferencia de la anterior se le deben agregar las frecuencias absolutas y relativas acumuladas. Las frecuencias acumuladas se generan a partir de que, la distribucin de frecuencias se clasifica en una tabla en donde las categoras son ordenadas en forma natural de menor a mayor, generndose las frecuencias absolutas y relativas acumuladas. Para Manuel Garca Ferrando (1) las distribuciones de frecuencias acumuladas son tiles en la comparacin cuando se desea comparar la forma en que los casos se distribuyen a lo largo de una escala . Fi Ni = Frecuencias Absolutas Acumuladas Significan la cantidad de casos (respuestas posibles) que se pueden obtener hasta un determinado nivel de la escala de medicin. Fr Hi = Frecuencias Relativas Acumuladas es la proporcin o el porcentaje de casos (proporcin de las respuestas posibles) que se pueden lograr hasta un determinado nivel de la escala de medicin. Distribucin del total de encuestados segn el Nivel Educativo. Xi (Nivel Educativo). BAJO MEDIO ALTO n (total)
FUENTE: Elaboracin propia......

fi 95 25 7 127

fr (%) 75 20 5 100 %

Fi 95 120 127

Fr 75% 95 % 100 %

Para obtener las frecuencias absolutas y relativas acumuladas se debe tener en cuenta que la escala de medicin de la variable al menos debe ser ordinal, ya que el procedimiento que se debe seguir para obtener cada una de estas frecuencias parte de la base, que la escala a la cual pertenece la variable tiene un orden, y que las categoras de la variable en la tabla estn ordenadas segn un criterio que puede ser creciente (de menor a mayor) o decreciente (de mayor a menor) generndose as las frecuencias acumuladas crecientes o decrecientes. En general se trabajar con el orden natural creciente (de menor a mayor) generndose as las frecuencias absolutas acumuladas (Fi Ni) y las frecuencias relativas acumuladas (Fr Hi).

(1) Garca Ferrando M.: Siocioestadstica. Introduccin a la Estadstica en Sociologa. Pg. 60. Alianza Editorial. Madrid 1985
ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

12

GRFICOS PARA ESCALA ORDINAL Para realizar una descripcin grfica de las variables de escala ordinal utilizando las distribuciones de frecuencias simples, se debe seguir el mismo procedimiento que para las escalas nominales, generndose grficos de sectores o torta, barras simples o acostadas y bastones; la diferencia entre estas escalas est dada por las frecuencias acumuladas absolutas o relativas ya que con las mismas se puede construir el grfico de escalera.

GRFICO DE SECTORES O TORTA Distribucin del Nivel Educativo.


6% 20%

BAJO MEDIO ALTO


74%

FUENTE: Elaboracin propia ........

GRFICO DE BARRAS. Distribucin del Nivel Educativo


Frecuencias Absolutas Simples 100 80 60 40 20 0
BAJO MEDIO ALTO BAJO MEDIO ALTO

Nivel Educativo
FUENTE: Elaboracin propia......

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

13

GRFICO DE BARRAS ACOSTADAS. Distribucin porcentual del Nivel Educativo


Nivel Educativo
ALTO MEDIO BAJO 0 20 40 60

5 20 75
80 ALTO MEDIO BAJO

Frecuencias Relativas Simples


FUENTE: Elaboracin propia......

GRFICO DE ESCALERA. Nivel Educativo


Frecuencias Absolutas Acumuladas 140 120 100 80 60 40 20 0 120 95 BAJO MEDIO ALTO BAJO MEDIO Nivel Educativo
FUENTE: Elaboracin propia......

127

ALTO

TABLAS PARA ESCALAS INTERVALES Y/O RATIO (RAZN) La tabla de distribucin de frecuencias para escalas intervales o de ratio, posee todos los elementos de las escalas nominales y ordinales, con la diferencia que en estas escalas las categoras de la variable pasan a ser clases o intervalos de clases ; ya que estas escalas clasifican y ordenan las unidades presuponiendo la existencia de intervalos iguales, para que la distancia entre cualquiera de los pares de unidades sea conocida y pueda ser objeto de comparacin. Los elementos que componen la tabla de distribucin de frecuencias para escalas intervales y/o de ratio (razn) son los siguientes: L. Inf. = Lmite inferior de la clase o del Intervalo de clase. L. Sup. = Lmite Superior de la clase o del Intervalo de clase.
ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

14

L.Inf. L.Sup. = Clase o Intervalo de clase. Xc = Marca de Clase. Es el valor representante de esa clase, es l punto medio de cada clase o intervalo de clase y se obtiene realizando la siguiente operacin matemtica : Lmite Inferior + Lmite Superior 2 A i = Amplitud de clase. Es la distancia que existe entre el lmite inferior (Xi 1) y el lmite superior (Xi + 1). Se obtiene restando el valor del lmite superior menos el valor del lmite inferior para cada clase o intervalo de clase. Lmite Superior - Lmite Inferior fi ni = Frecuencia Absoluta Simple. fr hi = Frecuencia Relativa Simple. Fi Ni = Frecuencia Absoluta Acumulada. Fr Hi = Frecuencia Relativa Acumulada. Para construir la tabla de distribucin de frecuencias para estas escalas se debe tener en cuenta algunos criterios: Seleccin del nmero apropiado de clases o intervalos. Las clases o intervalos dependen de la cantidad de observaciones con que se est trabajando, cuanto mayor es el nmero de observaciones, mayor es el nmero de clases y viceversa. Se debe tener una cantidad de clases adecuadas ya que si existen pocas clases, los datos se encontrarn concentrados y si ocurre lo contrario, una excesiva cantidad de clases los datos estarn poco concentrados, obtenindose poca informacin en ambos casos. Obtener un intervalo de clase apropiado. Lo ideal es que las clases o intervalos sean de la misma amplitud ancho. Para determinar la amplitud en una tabla de frecuencias (la diferencia entre la observacin ms grande y la ms pequea) se debe seguir los siguientes pasos: 1. Definir la cantidad de clases que se desean trabajar. 2. Amplitud = Recorrido de la variable Nmero de Clases El recorrido de la variable es igual al Rango de la distribucin, la observacin ms grande el valor mximo, menos el valor ms pequeo el valor mnimo. Rango = Valor Mximo Valor Mnimo
ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

15

Establecer los lmites y fronteras de cada clase para evitar superposiciones de las frecuencias, e incluir al mismo tiempo todo el recorrido de la variable es decir todas las posibles respuestas, el criterio que utilizaremos para elaborar los mismos ser que cada clase o intervalo sea abierto por la derecha y cerrado por la izquierda. Esto lo que hace es que el lmite superior de la primera clase, sea igual al lmite inferior de la segunda y as sucesivamente hasta la ltima clase en la que termina nuestra tabla de distribucin de frecuencias.

La desventaja que tiene la tabla de distribucin de frecuencias para estas escalas cuantitativas (intervales y ratio o razn), es que no resulta posible saber como se distribuyen los valores individuales dentro de un intervalo particular de clase, solamente se podran conocer estos valores si se tiene acceso a la distribucin de datos originales.

Distribucin del total de encuestados segn el Ingreso Mensual de los Hogares El ingreso est medido en pesos uruguayos (unidad de medida) L. Inf. - L. Sup. Xc fi Fr (%) Fi Fr 500 a 2.500 1.500 66 40 66 40 2.500 a 4.500 3.500 76 45 142 85 4.500 a 6.500 5.500 17 10 159 95 6.500 a 8.500 7.500 5 3 164 98 8.500 a 10.500 9.500 4 2 168 100 168 100 n (total)
FUENTE: Elaboracin propia......

Ai 2.000 2.000 2.000 2.000 2.000

Para determinar la marca de clase (Xc) para cada uno de los intervalos se debe realizar la siguiente operacin: L. Inf. + L. Sup. = Xc Para la primera clase de 500 pesos a 2.500 pesos 2 (500 + 2.500) % 2 = 1.500 pesos. Para la segunda clase de 2,.500 pesos a 4.500 pesos ( 2.500 + 4.500)%2 = 3.500 pesos. As sucesivamente para cada clase o intervalo de clase. Para determinar la amplitud (Ai) de cada clase o intervalo de clase se debe realizar la siguiente operacin: L. Inf. - L. Sup. = Ai Para la primera clase de 500 pesos a 2.500 pesos. 2.500 500 = 2000 pesos. Para la segunda clase de 2.500 pesos a 4.500 pesos 4.500 2.500 = 2000 pesos y as sucesivamente para cada una de las clases o intervalos de clase.
ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

16

Distribucin del total de encuestados segn horas semanales de trabajo. L. Inf. L.Sup. Xc fi Fr (%) Fi Fr Ai 0 a 64 32 50 30 30 30 64 64 a 72 68 39 23 89 53 8 72 a 77 74,5 37 22 126 75 5 77 a 98 87,5 42 25 168 100 21 168 100 n (total)
FUENTE: Elaboracin propia......

GRFICOS PARA ESCALAS INTERVALES Y DE RATIO O RAZN. Las escalas cuantitativas se describen grficamente a travs de los siguientes grficos: Histograma de Frecuencias: se debe utilizar la distribucin de frecuencias simples absolutas o relativa, el histograma representa a las frecuencias mediante reas; la variable aleatoria se representa a travs del eje X (eje horizontal) donde se ubican los intervalos de clase, mientras que en el eje Y (vertical) se representan las frecuencias simples absolutas o relativas. Al ser continuo el eje X lo que se pretende mostrar es que la variable es cuantitativa continua, donde la altura de los rectngulos que forman el histograma dan idea de densidad o concentracin de los datos en esa zona, es decir que cuanto ms alta sea el rea de una clase ms cantidad de datos posee y cuanto ms baja y ms cerca del eje X est el rea correspondiente a otra clase, menos cantidad de datos posee. Cuando se utilizan frecuencias relativas para la confeccin del histograma el rea que queda por debajo de l (rea total encerrada) es igual a 1. Si se realizara un histograma de frecuencias simples con una sola clase, ste tomara la forma de un rectngulo, por lo que el histograma se ver afectado por la cantidad de clases y por la amplitud de cada una de ellas. Es importante destacar que si alguna de las clases definidas posee un solo dato, el rea correspondiente a la misma ser casi imperceptible ya que su altura ser mnima, y no cumplira el objetivo de poder observar la distribucin a travs de un grfico.
GRFICO HISTOGRAMA DE FRECUENCIAS. Horas Semanales de Trabajo.

50 40 Frecuencias 30 Absolutas 20 Simples 10 0

0 a 64 64 a 72 72 a 77 77 a 98
0 a 64 64 a 72 72 a 77 77 a 98

Intervalos de Clase
FUENTE: Elaboracin propia......

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

17

GRFICO HISTOGRAMA DE FRECUENCIAS RELATIVAS Ingreso Mensual de los Hogares.


Frecuencias Relativas Simples
50 40 30 20 10 0
500 a 2.500 2.500 a 4.500 4.500 a 6.500 6.500 a 8.500 8.500 a 10.500

40

45 500 a 2.500 2.500 a 4.500 4.500 a 6.500 6.500 a 8.500 8.500 a 10.500

10 3 2

Intervalo de Clase

FUENTE: Elaboracin propia......

Polgono de Frecuencias: al igual que el histograma de frecuencias , el polgono se construye con las frecuencias absolutas o relativas simples, las cuales se ubican en el eje Y, mientras que en el eje X se ubican las clases, la diferencia est dada en que el polgono une los puntos medios de cada clase es decir las marcas de clase (Xc). El rea que queda por debajo de la totalidad del polgono debe ser 100% o 1 si se utilizan las frecuencias relativas y se debe cerrar el primero y el ltimo punto medio o marca de clase con el eje X (horizontal), a fin de encerrar el rea de la distribucin observada, esto se logra al conectar el primer punto medio observado con el punto medio de una clase precedente ficticia y el ltimo punto medio observado con el punto medio de una clase sucesiva ficticia. La ventaja que otorga el polgono con respecto al histograma es que se pueden plantear en un mismo plano varias distribuciones de frecuencias simultneamente, y sirve a los efectos de comparacin de distintas distribuciones univariadas sobre un mismo fenmeno al mismo tiempo, mientras que sera imposible de visualizar distribuciones univariadas en un mismo plano a travs de los histogramas de frecuencias, ya que sera dificultoso identificar las diferentes distribuciones.

No se presentarn aqu las formas correspondientes a cada grfico de distribucin de frecuencias para las escalas mencionadas, ya que sern vistos a travs de la instrumentacin de clases de apoyo de SPSS. Sus formas pueden ser consultadas tambin en la bibliografa recomendada en el curso.

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

18

Ojiva: este grfico tiene la caracterstica de utilizar las frecuencias absolutas o relativas acumuladas en el eje Y, mientras que el eje X se mantienen los intervalos de clase, pero su forma surge de unir los lmites superiores de cada clase en forma creciente a partir del eje horizontal (X). Es decir desde donde comienza la distribucin (en el primer lmite inferior) hasta la culminacin de la misma (el ltimo lmite superior).

GRFICO DE OJIVA Ingreso Mensual de los Hogares


Frecuencias Absolutas Acumuladas 200 150 100 50 0
500 a 2.500 2.500 a 4.500 4.500 a 6.500 6.500 a 8.500 8.500 a 10.500

Intervalos de Clase
FUENTE: Elaboracin propia......

_____________________________________________________

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

19

3.- MEDIDAS DE TENDENCIA CENTRAL. Las medidas de posicin y centralidad.

Son las medidas que nos facilitan determinar cules son las posiciones en la distribucin o cmo es esta distribucin a travs de las distintas medidas que se pueden obtener. Cabe destacar que algunos autores hacen referencia a medidas de tendencia central y otros a medidas de posicin, la forma de denominacin depende del tipo de anlisis que se quiera realizar; es decir las medidas de posicin marcan la posicin sobre la que se concentran los datos y las medidas de tendencia central implican diferentes definiciones en una puntuacin central Las medidas de centralidad ms usadas son: la moda, la mediana, la media,. Las medidas de posicin que trabajaremos sern los cuantiles o cuartiles, deciles y percentiles.

LA MODA

Es aquel valor de la distribucin que ms se repite, es decir el valor ms frecuente. Puede ocurrir que la distribucin no tenga moda o que exista ms de una moda. Cuando la distribucin tiene dos modas se denomina bimodal, si tiene ms de dos modas es multimodal. Si tiene una sola moda unimodal.
Es el indicador ms adecuado para describir escalas nominales, aunque se puede utilizar para el resto de las escalas es decir, ordinales, intervales y de razn o ratio.

Cuando los datos estn agrupados la moda para variables de escala nominales u ordinales se ubica observando en las frecuencias absolutas simples, el o los valores ms frecuentes, la moda sera para este caso el valor que toma la variable es decir la categora donde se ubica. Si analizamos la tabla de distribucin de frecuencias de los Encuestados segn su Lugar de Nacimiento, la moda o modo se ubicara en la ciudad de Rivera ya que all se concentra la mayor cantidad de observaciones de la distribucin (104 de 168). Si se analiza la tabla de distribucin de frecuencias de los Encuestados segn el Nivel de Instruccin, la moda se ubicara en el nivel Secundaria UTU Incompleta ya que all est el 45 % de la distribucin (76 casos de 168). Para variables intervales o de razn, la moda es el punto medio de la clase que contiene la mayor frecuencia de casos, es decir la marca de clase Xc de ese intervalo de clase; en este caso de debe hablar de intervalo modal o clase modal que sera el que contiene a la moda.

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

20

Al analizar la distribucin de frecuencias de los Encuestados segn el Ingreso mensual de los Hogares, la moda se ubicara en la clase de 2.500 a 4.500 pesos uruguayos, siendo su valor respectivo la Marca de Clase de ese Intervalo, es decir 3.500 pesos uruguayos. Cuando se analiza la tabla de distribucin de encuestados segn las horas semanales en las bancas, la clase modal se ubica entre 0 y 64 horas semanales, siendo su valor 32 horas semanales respectivamente. El inconveniente que tiene este estadstico es que si todos los valores numricos son diferentes no es calculable porque no existe. La ventaja es que la moda no es sensible a los valores extremos.

LA MEDIANA

La mediana es una medida de centralidad que expresa el centro de los datos como el punto o valor numrico que deja por debajo de s y por encima de s el 50 % de los datos, es decir la mitad de las puntuaciones de una distribucin. Por lo que divide a la distribucin en dos partes iguales, dejando la misma cantidad de datos a ambos lados de su ubicacin. Su forma de clculo depende de si se trabaja con datos originales o datos agrupados. Al trabajar con datos originales, la primera apreciacin es que deben estar ordenados de menor a mayor o en orden creciente; la segunda apreciacin es tener en cuenta el tamao de la muestra estableciendo si n es par o impar. La mediana los que hace en este caso, es dividir las observaciones originales en 2 partes iguales, quedando la misma cantidad de observaciones hacia la derecha como hacia la izquierda de la misma.
50 % L MEDIANA l 50 % l

DISTRIBUCIN
Cuando n es impar la mediana pertenece al valor central de la distribucin. Si tenemos los siguientes valores

Generalmente se calcula K = N + 1 k nos da la ubicacin de la MEDIANA, 2 K = 5+1 = 3 este es el lugar donde se ubica la mediana 2

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

21

El valor de la MEDIANA pertenece aquella observacin que se encuentra en dicha posicin, en este caso es igual a 6.

Se puede decir que para este caso, la mediana se ubica en el lugar 6 ya que este valor numrico divide a la distribucin en dos partes iguales, la misma cantidad de casos para un lado que para el otro y su valor tambin es 6.
Si n e par

6 8

Entonces K = N + 1 = 4+1 = 2,5 nos da la ubicacin de la MEDIANA 2 2 la mediana se ubicara en el centro de los dos trminos centrales (entre 6 y 8) y su valor sera la suma de estos dos valores (6 y 8) dividido entre 2, lo que sera el promedio de los puntos centrales
Valor de la Mediana = 6 + 8 = 14 = 7 2 2

En este caso la mediana se ubica en el lugar (posicin) 2,5 y su valor es 7. Para los datos agrupados la mediana se identifica en las frecuencias relativas acumuladas cuando el valor de dicha frecuencia supera al 50 %. Para el caso de la tabla de distribucin de frecuencias de los Encuestados segn su Nivel de Instruccin , la mediana se ubicara en las frecuencias absolutas acumuladas que superaran el valor 168/ 2 = 84 o si se observa las frecuencias relativas acumuladas en el valor que superara el 50 %, siguiendo cualquiera de los dos procedimientos la mediana estara en el Nivel de Instruccin Secundaria UTU Incompleta. Si se trabaja con datos agrupados para variables intervales, entones la frmula de clculo de la mediana es

Mdn=

L. inf + (1/2 N - Fi-1) x Ai fi

L. inf: es el lmite inferior del intervalo que contiene a la mediana N n : es el total de casos (poblacin o muestra) Fi - 1 ; la frecuencia acumulada absoluta anterior a la que contiene a la Mediana Ai : es la amplitud o distancia del intervalo que contiene a la mediana fi

: es la frecuencia absoluta simple de la clase que contiene a la mediana

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

22

Lo primero es identificar el intervalo o clase que contiene a la mediana que puede realizarse con la frecuencia relativa acumulada que supere al 50 %, identificando en las frecuencias absolutas acumuladas el valor que supere a n / 2. Para la tabla de distribucin de frecuencias de los Encuestados segn el Ingreso mensual de los Hogares, la mediana se ubicara en la clase de 2.500 a 4.500 pesos uruguayos ya que si se observan las frecuencias relativas acumuladas esta es la primera clase que supera el 50 % de la distribucin (85 %) y si se observan las frecuencias absolutas acumuladas, en esta clase se ubican 142 observaciones, siendo la primera clase que supera al valor de n/2 que es igual a 168/2 = 84. Para obtener el valor de la mediana se debe aplicar la frmula que se defini anteriormente: Mdn = 2.500 + ( 168 66) x 2.000 = 2960 pesos uruguayos. 76 Finalmente llegamos a obtener el valor de la mediana que es 2960 pesos uruguayos, como es evidente el valor que se obtiene del clculo de la mediana tiene que estar comprendido dentro de los valores entre los cuales se define esa clase o intervalo de clase. Para este caso concreto 2960 pesos uruguayos, son los que dividen la distribucin del ingreso mensual de los Hogares de los encuestados dejando por debajo de s el 50 % de las observaciones y por encima de s el otro 50 %.
La mediana es el indicador ms adecuado para las variables ordinales ya que el concepto mismo proporciona direccin puntuaciones por encima y por debajo de la mediana, no presupone conocimiento de la distancia, excepto para el caso de amplitud de intervalos en el que cae la mediana cuando se tienen datos agrupados, esto significa que si se trabaja con los datos agrupados se pierde un poco de informacin, al igual que si se utiliza la moda en estas condiciones.

La MEDIANA tiene la ventaja que al igual que la MODA, sus valores no se ven afectados por los valores extremos de la distribucin.

LA MEDIA

Existen diferentes tipos de medias, tal como la media aritmtica, la media geomtrica y la media armnica; se har referencia a la media aritmtica. La media aritmtica es el promedio o medida de tendencia central ms conocida y de mayor uso, es muy fcil de calcular ya sea para datos originales __ o agrupados. El estadstico X es simplemente la suma de todos las puntuaciones de una distribucin dividida por el nmero de casos.

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

23

Por ejemplo si se quiere saber la media o el valor promedio de recaudacin de los encuestados en las bancas, se suma el valor de todas las recaudaciones y se divide por el total de recaudaciones efectuadas. Si se cuentan con las recaudaciones en una distribucin original el promedio o la media se calculara de la siguiente forma:

As dado n valores de X, es decir n cantidad de recaudaciones efectuadas por los encuestados de las bancas con una valor X1, X2, X3 ....hasta Xn, si se parte de la distribucin que se plantea a continuacin donde cada valor corresponde al monto de las recaudaciones en miles de pesos uruguayos, el promedio se las mismas aplicando la frmula sera: 5 5,4 _ X= 6 6,6 7 n=5

( 5 + 5,4 + 6 + 6,6 + 7) = 30 = 6 es decir 6 mil pesos uruguayos. 5 5

Si se trabajara con una distribucin de datos agrupados, la media se obtendra aplicando la siguiente frmula: Para escalas cuantitativas.

Para escalas cuantitativas que se trabajan en tablas de intervalos o clases.

Si volvemos al ejemplo de la distribucin de encuestados segn las horas semanales trabajadas en las bancas, el promedio o media de horas trabajadas sera: _ X = ( 32 x 50) + ( 68 x 39) + (74,5 x 37) +(87,5 x 42) = 63,59 horas 168 La media aritmtica es el indicador de posicin ms adecuado para describir variables cuantitativas es decir variables intervales y de razn.; es imposible pensar en el clculo del promedio en variables cualitativas como el lugar de nacimiento , , nivel de instruccin, ya que las escalas de
ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

24

medicin de estas variables no permiten realizar promedios, sera impensable hablar del promedio de los encuestados de la Ciudad de Rivera, con los de la Ciudad de Sant Ana o de Otros lugares ya que no puede existir el promedio de las combinaciones de estas categoras, tampoco sera posible calcular un promedio para las categoras de Nivel Educativo ya que no se podran combinar los encuestados que pertenecen al nivel primaria incompleta, con los de primaria completa, ni los de secundaria incompleta, etc. En la media aritmtica cada valor o puntuacin contribuye a la suma de los mismos de una forma diferente, esto quiere decir que si yo tengo n cantidad de valores de horas semanales trabajadas en las bancas o ingreso mensual de los hogares en miles de pesos uruguayos al efectuar la suma de cada uno de los valores para cada variable se puede tener en cada una de las distribuciones mencionadas valores denominados extremos. Los valores extremos, son aquellos valores que tienen una distancia considerable con respecto al grueso de los valores obtenidos. Si se tiene una distribucin de ingreso mensual por hogar con valores bajos y valores altos el promedio dar un valor medio es decir ni alto ni bajo. Tambin puede ocurrir que se tengan muchos valores de ingreso mensual por hogar bajos y homogneos es decir similares y pocos valores altos, esto har que la media tienda a un valor medio por estar cargada por los valores altos, ocurrira lo inverso si la mayora de los valores fueran altos y se tuvieran algunos bajos, la media tendera a un valor medio en la distribucin. Por dicho motivo se debe tener en cuenta que la Media es sensible a los valores extremos. Tambin se puede hacer referencia a la media ponderada que se utiliza cuando se desea calcular la media de una distribucin cuyos valores tienen diferente significado o importancia para el estudio final. Volvamos al ejemplo del monto de las recaudaciones en miles de pesos uruguayos, y dmosle ms importancia al valor de la ltima recaudacin bajo el supuesto que pertenezca al da de la semana de ms venta por lo cul su valor lo ponderaremos 3 veces ms de lo que es; 5 5,4 6 6,6 7 n=5

1x 5 + 1 x 5,4 + 1 x 6+ 1 x 6,6 +3 x 7 = 44% 5 = 8,8 5

Ppropiedades de la media

_ Tomando la convencin x = X - X, llamada variable centrada,


1. La suma de los desvos respecto de la media es cero: x = ( X - X) = 0

Ejemplo de los desvos de la distribucin anterior:


ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

25

(5 6) + (5,4 6 ) + (6 6 ) + (6,6 6) + (7-6) = 0


2. La suma de los cuadrados de los desvos en torno a la media es un mnimo. Es decir que la suma del cuadrado de las diferencias entre cada observacin y su media, debe ser menor, que la suma de las diferencias al cuadrado entre cada observacin y cualquier otro valor seleccionado. ( X - X) 2 < ( X - a)2 para cualquiera.

2 2 2 2 (5 6) + (5,4 6 ) + (6 6 ) + (6,6 6) + (7-6) = 2,72

Supongamos que arbitrariamente seleccionamos el valor 6,2. 2 2 2 2 (5 6,2) + (5,4 6,2) + (6 6,2 ) + (6,6 6,2) + (7-6,2) = 2,92 2

3. La media del producto de una constante es igual a la media de la variable por la constante:

b*X = b* X
Utilizaremos como constante el valor 2 __ X = (5 x 2) + (5,4 x 2 ) + (6 x 2) + (6,6 x 2) + (7x 2) = 12 5 _ X = ( 5 + 5,4 + 6 + 6,6 + 7) = 30 = 6 6 x 2 = 12 5 5
4. Si n1 numeros tiene de media; n2 nmeros tienen de media m2; ni nmeros tiene de media mi, entonces la media de todos los nmeros es: _ X = n1m1 + n2m2 +...ni mi se trata de una media ponderada de todas las n1 + n2 + ...+ ni medias posibles. 5. Si la media Y1 = Ax1 + B1, la media de Y2 = Ax2 + B2, la media de Yn = Axn + B siendo A y B dos constantes arbitrarias entonces la media de todas la Yi es _ __ Y = A X + B, ya que por definicin siendo y = 1,2,...n

_ Y=

Yi n

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

26

RELACION Y COMPARACIN DE LAS MEDIDAS DE TENDENCIA CENTRAL

Se han planteado diferentes ventajas y desventajas para cada una de las medidas referidas, ahora se destacara algunas comparaciones relevantes entre las mismas.

La media utiliza ms informacin que la mediana, esto se debe a que en frmula de clculo se tienen en cuenta todas las puntuaciones (respuestas) de la distribucin, mientras que para el clculo de la mediana se tiene en cuenta la puntuacin del caso medio. Por este motivo es que la media es sensible a los valores extremos. La media es ms estable que la mediana, ya que vara menos de una muestra a otra en una misma poblacin. La media debe ser utilizada nicamente en variables que pertenezcan a escalas cuantitativas. La mediana es el indicador de posicin ms adecuado para las escalas ordinales, pero adems puede ser utilizado para escalas cuantitativas. La moda es el nico indicador de posicin que admiten las escalas nominales, pero se puede utilizar tambin para las escalas ordinales y para las escalas cuantitativas, con la salvedad que si la distribucin est medida a travs de intervalos o clases se debe hablar de Clase Modal. Una de las primeras caractersticas que se deben tener en cuenta en una distribucin, son la cantidad de picos o puntas (modas) que tiene la misma. Si la distribucin tiene un pico solo entonces se denomina unimodal posee una sola moda. Si posee dos picos entonces es bimodal posee dos modas y finalmente si tienen ms puntas entonces es multimodal, donde las puntas pueden tener diferentes alturas. El grado de simetra de las distribuciones. Para poder hablar de simetra tendramos que tener en cuenta la forma de un histograma de frecuencias, donde ya sabemos que la mediana divide a la distribucin en dos partes iguales, cada una de las reas es imagen de la otra, por lo tanto la superficie de cada una de las reas es idntica, pero a pesar de que las reas pueden tener la misma superficie no tienen porque representar imgenes recprocas. Cuando la distribucin es simtrica. las medidas de tendencia central se concentran sobre un mismo punto de la distribucin (eje vertical) y si la misma es una distribucin unimodal, la moda tambin coincide con la media y la mediana. Si las medidas no coinciden en un mismo punto porque tienden ms hacia un lado o hacia el otro se dice que la distribucin es asimtrica.

Simetra Perfecta

Es cuando la media, la mediana y la moda coinciden en el mismo punto (valor).

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

27

Asimetra Cuando las medidas de tendencia central no coinciden y sus valores varan de acuerdo a un sesgo de asimetra, generndose la asimetra positiva que es cuando las medidas se ubican en el siguiente orden segn sus valores de menor a mayor (en forma creciente); primero la moda, luego la mediana y finalmente la media y la asimetra negativa cuando las medidas se ubican en la distribucin, ordenadas en forma creciente pero en el siguiente orden de aparicin, primero la media, luego la mediana y por ltimo la moda. Para aquellas distribuciones en donde exista nicamente una moda (distribuciones unimodales) y las mismas sean moderadamente sesgadas se cumple la siguiente relacin emprica:

Media Moda = 3 (Media Mediana)

La curtosis o el grado de apilamiento de los casos alrededor de un punto de la distribucin. En una distribucin unimodal y simtrica pueden aparecer formas en donde el apuntamiento es importante y donde la distribucin tiene una concentracin importante de frecuencias sobre ese punto, esta forma de acuerdo a su curtosis se denomina Leptocrtica. Si la distribucin de frecuencias es ms achatada, es decir ms uniforme, esta forma segn su curtosis es platicrtica y finalmente si la distribucin no es ni muy apuntada ni achatada, donde su forma es ms parecida a una campana, estamos en presencia de una curtosis denominada mesocrtica.

4.- MEDIDAS DE DISPERSIN.


Dan cuenta de la variacin o dispersin de una distribucin, lo que indican es si en la distribucin los valores son muy parecidos o muy distintos entre si, es decir si estn desperdigados a lo largo de toda la distribucin o estn prximos unos de otros. Las medidas de dispersin de una distribucin son importantes, debido a que nos suministran informacin complementaria que nos permite juzgar la confiabilidad de nuestras medidas de tendencia central. Las medidas de dispersin que se trabajarn en el curso son: el rango o recorrido de una variable, el rango intercuartlico, la varianza, el desvo estndar o tpico y el coeficiente de variacin.

RANGO O RECORRIDO
Es el recorrido total de la variable, ya que es la distancia existente entre el valor mximo y el valor mnimo de una distribucin.

Rango = Valor Mximo - Valor Mnimo


Su frmula de clculo es aplicable tanto a distribuciones de datos originales como, a distribuciones de datos agrupados (tablas de distribucin de frecuencias).
ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

28

Si analizamos nuestros ejemplos anteriores, se puede observar que el rango en la Distribucin de encuestados segn el Ingreso Mensual de los Hogares es igual a:
RANGO = 10.500 500 = 10.000 pesos uruguayos.

Lo cual significa que entre el ingreso mensual ms bajo de los hogares, hasta el ingreso mensual ms alto hay una diferencia de 10.000 pesos uruguayos, por lo cual el recorrido de los ingresos desde el ms bajo hasta el ms alto para los encuestados es de 10.000 pesos uruguayos. Si se analiza la Distribucin de los encuestados segn las horas semanales de trabajo en las bancas se obtiene que el rango de la distribucin es igual a 98 horas semanales, ya que es la diferencia entre el que trabaja 0 hora semanal que son los que trabajan menos horas, con los que trabajan semanalmente 98 horas que son por cierto los que trabajan ms horas de toda la distribucin. La desventaja de esta medida es que, solamente tiene en cuenta los valores extremos de la distribucin y deja de lado los valores intermedios (interiores) de la misma.

VARIANZA
Es similar a la desviacin media, ya que se basa en las diferencias existentes entre la media aritmtica y cada una de las puntuaciones, pero utilizando el cuadrado de estas diferencias. Es una de las medidas de dispersin ms importantes ya que considera todos los valores de la distribucin.
2

La varianza (S) es el promedio de los cuadrados de las distancias de las observaciones hechas a partir de la media, por lo cual su valor oscilar entre 0 y mayor que 0, nunca la varianza puede dar un valor negativo. La varianza expresa el cuadrado de las unidades usadas en los datos de la variable, no hablamos de un resultado expresado en las mismas unidades de los datos originales, ya que su valor est elevado al cuadrado, por lo cul es considerado un valor abstracto. La frmula de clculo de la Varianza depender si la distribucin es de datos originales o de datos agrupados. Adems se debera tener en cuenta si se est trabajando, con muestras o poblaciones, ya que en el clculo de la misma, al igual que de las medidas de dispersin derivadas de la varianza la frmula vara de acuerdo a esta situacin. Para el caso de clculo de la Varianza en una Poblacin en el denominador el trmino correcto a utilizar es N, mientras que en la muestra se utiliza n 1 ya que es insesgada. Tambin es bueno aclarar que cuando se trabaja con indicadores o medidas resumen mustrales estas se denominan estadsticos, mientras que cuando se trabajan con los mismos indicadores pero para la poblacin estos se denominan parmetros.

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

29

Supongamos que se decide calcular la varianza (S) de los datos originales que utilizamos en el repartido anterior para calcular la media. 5 5,4 6 6,6 7 n=5

La media que ya se haba calculado es: _ X = ( 5 + 5,4 + 6 + 6,6 + 7) = 30 = 6 mil pesos uruguayos. 5 5 La VARIANZA
2 2 2 2 2 2

S = (5 6) + (5,4 6) + (6 6) + (6,6 6) + (7 6) = 51
2 2 2 2 2 2

S = (1) + (0,36) + (0) + (0,36) + (1) = 1 + 0.36 + 0 + 0,36 + 1 = 51 4


2

S = 2,72 % 4 = 0,68
Si aplicramos una de las frmulas definidas para datos agrupados en la Distribucin de encuestados segn horas semanales de trabajo en las bancas, el resultado de la varianza sera:
ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

30

Primero presentaremos la frmula de la media para datos agrupados:

L.Inf. L.Sup.

Xc
32 68 74,5 87,5

fi

fr (%) (Xc x fi)

Xc

0 a 64 64 a 72 72 a 77 77 a 98
n (total)

50 39 37 42 168

30 23 22 25 100

32x50= 1600 68x39= 2652

2 32 = 1024 2 68= 4624


2

74.5x37= 2756.5 74,5= 5550.25


2

2 (Xc x fi) 1024x50 = 51200 4624x39= 180336 5550.25x37= 205359.25

87.5x42= 3675 (Xc x fi) = 10683,5

87.5=7656.25

7656.25x42= 321562.5
2

(Xc x fi)= 758457.75

Donde la Media es igual a: _

X = 10683,5 % 168 = 63,59 horas semanales.


2 2

S = 758457.75 168x (63,59) = 758457.75 168 x 4043.69 = 168 1 167


2

S = 758457.75 679339.92 = 79117.83 = 473.76 es la varianza de 167 167 horas semanales

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

31

DESVIACIN ESTNDAR DESVIO TPICO


Es por definicin la raz cuadrada de la Varianza. Dado que se define a partir de la varianza, tiene todas las propiedades de sta. Es decir que, valores pequeos de desvo tpico corresponden a muestras o valores originales concentrados alrededor de su media y valores grandes corresponden a muestras o valores originales muy distribuidos respecto a su media. La desviacin estndar o desvo tpico (S) nos permite determinar con mayor grado de precisin, dnde se sitan los valores de una distribucin de frecuencia en relacin con la media. La desviacin estndar se simboliza con la letra S y su formula es indistinta para distribuciones de datos originales o agrupados:

S=

S2

Si se planteara el Desvo estndar de las Horas semanales de trabajo en las bancas, el mismo sera:

S=

473,76 = 21,77 horas semanales.

Entonces se podra decir que la variabilidad de las distribution de las horas semanles de los encuestados que trabajan en las bancas es de 21,77 horas. Una ventaja que presenta la desviacin tpica respecto a la varianza son las unidades en las que se expresa, ya que en la varianza las unidades estn expresadas al cuadrado, en el desvo estndar o tpico el resultado del mismo se expresa en las unidades originales de la variable que se est trabajando; dado a que se obtiene tomando la raz cuadrada de las varianza. Es importante tener en cuenta que tanto la Varianza, como el Desvo Estndar, hacen referencia sobre la variabilidad absoluta de los valores, en una distribucin, cuanto ms pequeos son sus valores ms homognea es la distribucin, cuanto ms elevado son sus valores ms heterognea es la distribucin.

COEFICIENTE DE VARIACIN
Es la medida de dispersin que hace referencia a la variabilidad relativa, ya que relaciona una medida de posicin como la media y una medida de dispersin como el desvo estndar, que al multiplicarlo por 100, nos da el porcentaje de variacin que existe con respecto al valor promedio de la distribucin.
Su frmula es igual para datos originales que para datos agrupados

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009.

32

C.V .

S x 100 = X

Entonces se podra decir, que el porcentaje de variacin de las horas semanales de los encuestados que trabajan en las bancas con respecto al su valor promedio es de 34,23 %.

C.V. = 21,77 63,59

x 100 = 34,23 %

El coeficiente de variacin como medida relativa, es de vital importancia a la hora de comparar la variabilidad de dos o ms conjuntos de datos (distribuciones) que se expresan en diferentes o iguales unidades de medida.

BIBLIOGRAFA:

Glass G. Stanley J.C. : METDOS ESTADSTICOS APLICADOS A CIENCIAS SOCIALES. Ed. Prentice Hispanoamericana S.A. Lind Marchal Mason ESTADSTICA PARA ADMINISTRACIN Y ECONOMA 11 edicin. Ed. Alfaomega 2005. Pea D. Romo J. : INTRODUCCIN A LA ESTADSTICA PARA LAS CIENCIAS SOCIALES. Ed. Mc Graw Hill Interamericana de Espaa, S.A.U.1999. Garca Ferrando Manuel : SOCIOESTADSTICA. Ed. Alianza. Madrid 1996.

ESTADSTICA BSICA APLICADA. A LA GESTIN LIC. DANIELLA MARA REPETTO PEREIRA. ONSC 2009

Вам также может понравиться