Вы находитесь на странице: 1из 6

Universidad de Concepcin Departamento de Sociologa Clase N 2.

ANLISIS ESTADSTICO UNIVARIADO En esta seccin se mostrar cmo presentar y describir datos de una sola variable. Para presentar los datos se utilizan esencialmente procedimientos grficos porque la idea principal es explorar sus caractersticas a fin de lograr un buen conocimiento de la estructura de los datos. La idea central de la estadstica descriptiva es describir un conjunto de datos. Fundamentalmente se trata de describir un conjunto de valores numricos en varias formas abreviadas. Para este propsito se utilizan (1) las medidas de tendencia central (2) la medidas de dispersin (3) las medidas de posicin y (4) los tipos de distribucin. PRESENTACIN GRFICA DE LOS DATOS Existen varios modos grficos de describir informacin. El mtodo utilizado siempre est determinado por el tipo de datos y por la idea a ser representada. 1. Grfico de Barras Verticales Los grficos de barras verticales se utilizan frecuentemente para representar datos de atributos o variables cualitativas. En la abcisa se coloca la variable nominal o atributo a representar y en la ordenada la frecuencia o nmero de casos correspondiente. La altura de cada rectngulo representa la magnitud de la categora especfica: Ejemplo: La tabla siguiente enumera los casos quirrgicos de un hospital general en el ao 2001.

_________________________________________________ Tipo de Operacin Nmero de casos _________________________________________________ 20 45 58 98 115 74 65 23 -----------------n= 498 _________________________________________________ Construccin del grfico de barras. 2. Grfico Circular o sectorial: Es el grfico tambin conocido como grfico de torta, porque en su representacin circular a cada categora de la variable nominal o atributo se le otorga un trozo porcentual proporcional de manera similar a como se corta una torta para ser distribuida. Cada trozo de la torta tiene un tamao proporcional al peso de la categora en el total de la variable. La frmula para determinar el trozo de torta correspondiente a cada categora es: 360 x fi X= ---------n Torcica Huesos y articulaciones Otorrinolaringolgicas Generales Abdominales Urolgicas Proctolgicas Neurociruga

Ejemplo de construccin del grfico sectorial.

3. Diagrama de puntos: El diagrama de puntos representa los datos de una variable discreta graficndolos con un punto en una escala. Esta escala puede ser vertical u horizontal. La frecuencia de los valores es representada colocando un punto sobre otro en la escala. Ejemplo: Una muestra de 19 puntajes de una prueba aleatoriamente elegidos es la siguiente: 76 86 74 84 82 62 96 76 66 78 76 92 78 82 72 74 52 88 68

Los datos se deben primero ordenar de manera ascendente. Ejemplo de construccin del diagrama de puntos. 4. Diagrama de tallos y hojas (Stem-and-leaf) Este grfico es un muy importante componente del anlisis de datos exploratorio (EDA) que se ha hecho muy popular en los ltimos aos para sintetizar datos numricos. Es muy fcil de construir y es una combinacin de tcnicas grficas y de ordenamiento de datos. Se utilizan los mismos valores de la variable para efectuar el ordenamiento. El tronco o tallo (stem) del grfico est constituido por el primer dgito de los datos y las hojas (leaf) son los dgitos posteriores. Por ejemplo, el dato 458 puede dividirse como sigue: primer dgito 45 usado en la clasificacin dgitos posteriores 8 usado en la exhibicin

Ejemplo de construccin de un diagrama de tallos y hojas: Construir un diagrama de tallos y hojas para los siguientes datos: 76-74-82-96-66-76-78-72-52-68-86-84-62-76-78-92-82-74-88.

DISTRIBUCIONES DE FRECUENCIA: La forma ms comn de presentar organizadamente los datos se denomina distribucin o tabla de frecuencias. Un conjunto desorganizado de datos, a travs de la distribucin de frecuencias adquiere una primera ordenacin y resumen que posibilita una vasta gama de operaciones estadsticas posteriores. La distribucin de frecuencias posibilita efectuar un resumen de los datos, esto es permite computar algunos valores que sintetizan toda la distribucin de la variable. En sntesis, la distribucin de frecuencias permite reducir la informacin relativa a un nmero muy grande de casos a una forma ms simple, que permite al investigador una representacin o visin sinttica acerca de la manera en que se distribuyen u ordenan los casos. Ejemplo de construccin de tablas de frecuencias: Un investigador social desea conocer las razones que motivan la vagancia infantil. Uno de sus primeros pasos es ubicar una fuente que posibilite recolectar datos que permitan estructurar su estudio. Decide visitar un hogar de menores en donde se asila a los menores en situacin irregular. All se encuentra con 70 nios cuyas edades son las siguientes: 8 6 7 5 9 10 8 7 7 5 8 9 6 8 8 8 7 7 5 9 7 9 6 6 10 7 9 8 6 8 7 9 6 5 7 7 8 9 6 5 10 9 7 8 8 8 9 6 7 7 9 8 7 5 6 5 6 8 9 6 10 6 7 5 7 8 9 8 10 8

Pasos en la construccin de la distribucin de frecuencias: 1. Se debe ubicar el valor mnimo y mximo de la variable. En este ejemplo, la variable edad (Xi) tiene un valor mnimo (Xmin) de 5 y un valor mximo (Xmax) de 10 aos. 2. Se debe efectuar un ordenamiento o arreglo, esto es, colocar los datos en forma ascendente o descendente. 3. Se deben contar las frecuencias o casos para cada estrato o categora de la variable. El clculo de las frecuencias debe realizarse con sumo cuidado pues cualquier error desvirta la validez de la distribucin influyendo en todas las medidas calculadas posteriormente. El error de recuento y clasificacin es imposible de controlar sin rehacer todo el trabajo de construccin de la tabla. Distribucin o tabla de frecuencias Xi (edad) 5 6 7 8 9 10 Recuento fi fir 0.12 0.17 0.23 0.24 0.17 0.07 1.00 Fac(+) 8 20 36 53 65 70 Fac(-) firac(+) 70 62 50 34 17 5 0.12 0.28 0.51 0.75 0.92 1.00 firac(-) 1.00 0.88 0.71 0.48 0.24 0.07

8 12 16 17 12 5 n= 70

COMPONENTES DE LA TABLA DE FRECUENCIAS: 1. Columna Xi: Corresponde a la variable estudiada. Las categoras de la variable generalmente son determinadas a criterio del investigador. 2. Columna fi: Corresponde a las frecuencias absolutas, o sea, al nmero de casos que tiene cada estrato de la variable. La suma de las frecuencias absolutas es igual a n. 3. Columna fir: Se denomina frecuencias relativas y expresan el nmero de casos de cada estrato de la variable en trminos de proporcin. Se obtiene dividiendo cada frecuencia (fi) por el nmero de casos (n). La suma

de la columna fir debe siempre terminar en 1.00 y corresponde al 100% de los casos. Es el tamao de la muestra o el nmero de casos recolectados 4. n: para la variable considerada. Se denomina frecuencia absoluta acumulada 5. Columna Fac(+): ascendente (+) y nos indica el nmero de casos que son iguales o menores que un valor determinado de la variable. Se obtiene esta columna acumulando los valores de la frecuencia absoluta (fi), desde arriba hacia abajo. El ltimo valor de la Fac(+) debe ser igual a n. Se denomina frecuencia absoluta acumulada 6. Columna Fac(-): descendente (-) y nos indica el nmero de casos que son iguales o mayores que un valor determinado de la variable. Se obtiene esta columna acumulando los valores de la frecuencia absoluta (fi) desde abajo hacia arriba. El primer valor de la Fac(-) debe ser igual a n. Las frecuencias acumuladas ascendentes y descendentes permiten un construir un grfico denominado Ojivas de Galton. Permiten adems un clculo rpido e intuitivo de la mediana. 7. Columna firac(+): Se denomina frecuencia relativa acumulada ascendente (+) y nos permite expresar en terminos proporcionales el nmero de casos que son menores o iguales que un valor determinado de la variable. El ltimo valor de la firac(+) debe ser igual a 1.00 Se denomina frecuencia relativa acumulada 8. Columna firac(-): descendente (-) y expresa la proporcin de casos que son iguales o mayores que un valor determinado de la variable. El primer valor de la firac(-) debe ser igual a 1.00. La utilidad que proporcionan las columnas de firac est dada por el hecho que al colocar en trminos relativos o porcentuales las columnas de una tabla de frecuencias, se facilita el anlisis comparativo con distribuciones de frecuencias similares.

Вам также может понравиться