Академический Документы
Профессиональный Документы
Культура Документы
I. INTRODUCCION Estadstica: Es una metodologa cientfica que permite recolectar, organizar y procesar datos que proporcionen informacin que sirvan de base para la toma de decisin. Por ejemplo aplicar una encuesta para conocer la preferencia del electorado, aplicar un tratamiento especial a un grupo de personas y observar el resultado, buscar datos sobre la matrcula estudiantil, u otro tema en particular. En cambio, cuando hablamos de Estadsticas nos referimos a un conjunto de medidas o indicadores que describen el comportamiento de un fenmeno de inters en un momento determinado. Por ejemplo, el porcentaje de lectores que prefieren a un candidato en particular, el tiempo necesario para realizar unas tarea, las unidades producidas diariamente por una empresa, las ventas de una empresa, etc. Es decir que las estadsticas representan el fin u objetivo que buscamos y la Estadstica el medio para conseguirlo. 1.1 DIVISION DE LA ESTADISTICA
La Estadstica como metodologa cientfica se divide en dos ramas, la Estadstica Descriptiva y la Estadstica Inferencial Estadstica Descriptiva: Es un conjunto de mtodos y tcnicas que permiten describir un conjunto especfico de datos. La Estadstica Descriptiva como su nombre lo indica, describe un grupo particular. Sus principales herramientas son. 1) Clculo de porcentaje y tasas 2) Presentacin tabular, (cuadros y tablas) 3) Presentacin grfica 4) Clculo de medidas de Medidas de Tendencia Central, (promedios) 5) Clculo de medidas de dispersin o variabilidad 6) Clculo de nmeros ndice. 7) Otras tcnicas descriptivas. Estadstica Inferencial: Se refiere a un conjunto de mtodos y tcnicas que permite obtener informacin acerca de una poblacin completa, con solo estudiar una parte de ella (muestra). La Estadstica Inferencial nos permite llevar los resultados obtenidos en una muestra a la poblacin. Sus principales herramientas son: Clculo de probabilidades, muestreo y distribucin muestral, estimacin, prueba de hiptesis, anlisis de varianza, anlisis de regresin y correlacin, otras. 1.2. Conceptos y Definiciones
1.3 FUENTES DE DATOS Ya se ha dicho que la Estadstica es una metodologa cientfica que permite obtener datos que al ser procesados se convierten en estadsticas o indicadores relacionados a una o mltiples variables. Podemos decir entonces que el quehacer de la Estadstica se centra en dar respuestas a una serie de preguntas o interrogantes que surgen en un momento determinado sobre un tema en particular, por ejemplo, Cul es la bebida gaseosa preferida por la poblacin?, por qu las personas prefieren un banco en particular para depositar sus ahorros?, qu porcentaje de la produccin est saliendo defectuoso?, cul ser el nivel de precios para el prximo semestre?, Cmo podemos motivar a los/as estudiantes?, cul mtodo de enseanza es ms efectivo para lograr el aprendizaje en los/as estudiantes? y as sucesivamente. Para dar respuestas a estas preguntas debemos recurrir a la bsqueda de datos y en tal sentido debemos de responder a las siguientes preguntas cules son las fuentes para obtener datos? O de donde obtendremos datos para dar respuesta a nuestra pregunta? En primer lugar vamos a clasificar las fuentes de datos atendiendo al origen de los datos y en este sentido las fuentes de datos pueden ser primarias y secundarias. Las fuentes de datos primarias son aquellas en las cuales los datos son generados por quien o quienes realizan la investigacin, es decir que son datos de primera mano, hechos a la medida como lo seala Dillon1, es decir que las fuentes primarias se utilizan para cubrir una necesidad de informacin especfica. 1.3.1 Fuentes primarias de datos Las principales fuentes primarias de datos son el Censo, La Encuesta o Estudios por Muestreo y Los Experimentos. 1. Censo: Es un tipo de investigacin en la cual se estudian todos los elementos de una poblacin determinada. El censo tiene las ventajas de que proporciona informacin sobre una poblacin completa, con un bajo margen de error y adems permite la ubicacin fsica de cada uno de los miembros de la poblacin. Tiene la desventaja de que resulta muy costoso en trminos econmicos, de tiempo y de materiales. 2. Estudios por Muestreo: Son estudios en los cuales solo se estudia una parte de la poblacin, es decir una muestra. Los estudios por muestreo tienen las ventajas de que proporcionan informacin til y confiable sobre una
1
William Dillon, Thomas J. Madden y Neil H. Firtle: La Investigacin de Mercados. Entornos de Marketing
1.4 VARIABLES Y SU CLASIFICACIN Una Variable es una caracterstica que puede variar de un elemento a otro en la poblacin estudiada. Ejemplos: peso corporal de las personas, tamao las aulas universitarias, estatura de las personas, nmero de asignaturas cursadas por los estudiantes por semestre, etc. Las variables se dividen en dos grupos: Cualitativas y Cuantitativas Variables cualitativas: son aquellas variables que describen una cualidad o atributo en el elemento estudiado, estas variables responden la pregunta cul?, ejemplos de estas variables pueden ser: religin que profesan los dominicanos, partido poltico preferido, color de la piel, sexo de los y las estudiantes, raza, carrera estudiada, etc. Variables cuantitativas: son aquellas variables que describen una cantidad en el elemento estudiado. Las variables cuantitativas responden la pregunta cunto?, por ejemplo: nmero de estudiante por aula, venta diaria de una empresa, nmero de hijos por familia, estatura de los estudiantes que cursan estadstica en este semestre, etc. Las variables cuantitativas discontinuas o discretas. se dividen en dos categoras: Continuas y
Variables cuantitativas continuas: son aquellas variables cuantitativas cuyos resultados pueden expresarse en nmeros fraccionarios o decimales. Estas variables provienen de un proceso de medicin, por ejemplo el nivel de ingreso de las personas, consumo familiar, estatura de las personas, gasto diario de los estudiantes, etc. Variables cuantitativas discontinuas o discretas: son aquellas variables cuantitativas cuyos resultados se expresan en nmeros enteros, es decir que no admiten valores decimales. Las variables cuantitativas discontinuas o discretas provienen de un proceso de conteo, por ejemplo nmero de asignaturas por estudiante, nmero de estudiantes por aula, nmero de personas que llega a un restaurante de comida rpida, etc. Obsrvese que las variables cuantitativas continuas pueden expresarse en nmero fraccionarios y las discretas o discontinuas se expresan en nmeros enteros, por lo que, aunque en muchas ocasiones expresamos una variable en nmero enteros, no significa que sea discreta, por ejemplo, el gasto en transporte, mayormente lo expresamos en nmero entero, sin embargo, es una
Wayne W., Daniel & James C. Terrell: Estadstica para Administracin y Economa Tomo I. Editora McGraw-Hill. 7. Edicin. Junio 2000.
Planeacin
Anlisis y presentacin
Aunque estos pasos pueden y varan atendiendo a los criterios del investigador en trminos generales estos pasos representan el proceso lgico de una investigacin aunque reciban diferentes nombres. A continuacin se hace una descripcin breve de cada uno de estos. 1. Planeacin: Es la fase en la cual se definen los aspectos administrativo y operativos de la investigacin. Esta fase comprende entre otras actividades, el establecimiento de los objetivos: general y especficos, alcance de la investigacin, poblacin de estudio, presupuesto necesario, cronograma de actividades y plan de anlisis o resultados esperados. 2. Diseo del estudio: En esta fase se define y se disea el instrumento de recoleccin de datos (cuestionario, entrevistas, observacin, entre otros) y se
3
Ver a Lincoln L. Chao: Estadstica para las Ciencias Administrativas. Tercera Edicin. Editora McGraw-Hill
10
4. Con quien vive el estudiante _____________________________ 5. Tipo de escuela: 1. Pblica 2. Privada 2. Repitiente
6. Condicin del estudiante: 1. Promovido 7. Calificacin en Matemticas ______ 8. Calificacin en Espaol ______ 9. Calificacin en Sociales ______ 10. Calificacin en Naturales _____
La metodologa consisti en tomar una muestra de treinta estudiantes de la escuela pblica y treinta de la escuela privada. La fuente de datos utilizada fue el registro de cada estudiante en la escuela, procediendo a completar el instrumento de recoleccin de datos diseado A continuacin se presenta una muestra del instrumento de recoleccin de datos completado durante la tercera fase del estudio. Por conveniencia las respuestas se han subrayado de forma que se puedan identificar fcilmente. Ntese que los cuestionarios no estn numerados y si lo estuvieran no representan una jerarqua o importancia, sino que el numeral asignado es una escala nominal.
11
4. Con quien vive el estudiante: Con padre y madre 5. Tipo de escuela: 1. Pblica 2. Privada
4. Con quien vive el estudiante: con ambos padres 5. Tipo de escuela: 1. Pblica 2. Privada
6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas 69 8. Calificacin en Espaol 75 9. Calificacin en Sociales 72 10. Calificacin en Naturales 71 Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos 1. Nombre y apellidos del estudiante Paola Mocin 2. Edad 10 3. Sexo: 1. Masculino 2. Femenino
6. Condicin del estudiante: 1. Promovido 2. Repitiente 7. Calificacin en Matemticas 67 8. Calificacin en Espaol 69 9. Calificacin en Sociales 64 10. Calificacin en Naturales 69 Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos 1. Nombre y apellidos del estudiante: Yordi Gonzlez 2. Edad 11 3. Sexo: 1. Masculino 2. Femenino
4. Con quien vive el estudiante: con la madre 5. Tipo de escuela: 1. Pblica 2. Privada
6. Condicin del estudiante: 1. Promovido 7. Calificacin en Matemticas 80 8. Calificacin en Espaol 78 9. Calificacin en Sociales 76 10. Calificacin en Naturales 80
2. Repitiente
6. Condicin del estudiante: 1. Promovido 7. Calificacin en Matemticas 70 8. Calificacin en Espaol 68 9. Calificacin en Sociales 65 10. Calificacin en Naturales 65
2. Repitiente
Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos 1. Nombre y apellidos del estudiante Ashley Ciprin 2. Edad 9 aos 3. Sexo: 1. Masculino 2. Femenino
Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos 1. Nombre y apellidos del estudiante Vicente Meja 2. Edad 13 aos 3. Sexo: 1. Masculino 2. Femenino
4. Con quien vive el estudiante ambos padres 5. Tipo de escuela: 1. Pblica 2. Privada
4. Con quien vive el estudiante con la madre 5. Tipo de escuela: 1. Pblica 2. Privada
6. Condicin del estudiante: 1. Promovido 7. Calificacin en Matemticas 85 8. Calificacin en Espaol 80 9. Calificacin en Sociales 82 10. Calificacin en Naturales 78
2. Repitiente
6. Condicin del estudiante: 1. Promovido 7. Calificacin en Matemticas 65 8. Calificacin en Espaol 70 9. Calificacin en Sociales 78 10. Calificacin en Naturales 70
2. Repitiente
12
4. Con quien vive el estudiante ambos padres 5. Tipo de escuela: 1. Pblica 2. Privada
4. Con quien vive el estudiante con una ta 5. Tipo de escuela: 1. Pblica 2. Privada
6. Condicin del estudiante: 1. Promovido 7. Calificacin en Matemticas 83 8. Calificacin en Espaol 90 9. Calificacin en Sociales 89 10. Calificacin en Naturales 91
2. Repitiente
6. Condicin del estudiante: 1. Promovido 7. Calificacin en Matemticas 88 8. Calificacin en Espaol 90 9. Calificacin en Sociales 89 10. Calificacin en Naturales 85
2. Repitiente
Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos 1. Nombre y apellidos del estudiante Charly Cepeda 2. Edad 13 aos 3. Sexo: 1. Masculino 2. Femenino
Universidad Autnoma de Santo Domingo Estudio sobre el rendimiento escolar Formulario de recoleccin de datos 1. Nombre y apellidos del estudiante Helena Parache 2. Edad 11 aos 3. Sexo: 1. Masculino 2. Femenino
4. Con quien vive el estudiante ambos padres 5. Tipo de escuela: 1. Pblica 2. Privada
4. Con quien vive el estudiante con ambos padres 5. Tipo de escuela: 1. Pblica 2. Privada
6. Condicin del estudiante: 1. Promovido 7. Calificacin en Matemticas 77 8. Calificacin en Espaol 78 9. Calificacin en Sociales 83 10. Calificacin en Naturales 78
2. Repitiente
6. Condicin del estudiante: 1. Promovido 7. Calificacin en Matemticas 77 8. Calificacin en Espaol 72 9. Calificacin en Sociales 81 10. Calificacin en Naturales 65
2. Repitiente
Una vez agotada la tercera fase, la recoleccin de datos, nos dedicamos a cuarta fase, el procesamiento de los datos, recordando que esta fase incluye la organizacin, codificacin, digitacin y edicin, para luego obtener los cuadros y tablas, as como las medidas estadsticas que nos permitan dar respuestas a los objetivos planteados. En el caso que nos ocupa para la organizacin podemos por ejemplo asignar un nmero a cada instrumento completado. Para la codificacin, el trabajo se reduce significativamente, ya que el instrumento diseado tiene cada pregunta pre-codificada, por ejemplo, para el sexo se le asigna el nmero uno a los de sexo masculino y el dos a las de sexo femenino, de igual forma a los y las estudiantes de escuelas pblicas se le asigna el nmero uno y los y las de colegios privados el nmero dos. Sin embargo, en el caso de la pregunta relacionada a con quien vive el o la estudiante, es recomendable establecer un cdigo numrico para las posibles respuestas, ya que en el instrumento esta es una pregunta abierta. Los cdigos
13
Como se muestra en la figura anterior, a la derecha aparece el nmero asignado al instrumento y en la pregunta de con quien vive el o la estudiante se ha asignado como respuesta el nmero uno ya que en ambos casos los estudiantes viven con ambos padres. Para la digitacin se podra colocar los datos en una matriz, colocando cada variable en las columnas y cada fila para los elementos estudiados. En este caso vamos a utilizar la hoja de clculo de Excel para la digitacin como se muestra en la figura nmero cinco. (Es preciso aclarar que existen numerosos programas en los que se puede hace la digitacin, se ha elegido el Excel por la disponibilidad y facilidad del mismo)
14
El proceso de edicin de los datos sera imprimir los datos digitados y luego verificar si el proceso de digitacin se ha hecho correctamente. Una vez que se ha realizado el proceso de digitacin y edicin de los datos, se procede a obtener los cuadros y tablas, as como las medidas estadsticas que nos permitan dar respuesta a los objetivos del trabajo de investigacin, pero sobre este particular volveremos a tratarlo en los captulos siguientes.
1.7 PRESENTACIN DE RESULTADOS Una vez que se ha completado el proceso de investigacin con el anlisis de los resultados, el paso siguiente consiste en presentar dichos resultados a la entidad interesada. Para hacerlo existen cinco formas que describiremos brevemente a continuacin:
15
1. Presentacin oral: Cuando los resultados de la investigacin se presentan en forma de discurso. Por ejemplo, muchas organizaciones, (empresas, partidos polticos, ONG`s, entre otras) convocan a una rueda de prensa o a un encuentro con el objetivo de dar a conocer los resultados de una investigacin determinada. La presentacin oral tiene la ventaja de que es fcil de preparar y su costo es bajo, sin embargo, presenta la desventaja de que quien recibe la informacin va olvidando los primeros datos en la medida en que se avanza con el suministro de informacin. 2. Presentacin escrita: Es aquella en la cual los resultados de una investigacin se presentan en un informe en forma de texto. La presentacin de los resultados de una investigacin presentados en un informe, requieren de una mayor formalidad y de un esfuerzo mayor. Un informe con los resultados de una investigacin consta de seis partes esenciales. 2.1 Hoja y/o carta de presentacin: en esta parte se presenta de manera formal los resultados de la investigacin. ndice de contenido: en esta parte del informe se establece o describe la ubicacin fsica de cada una de las partes contenidas en el informe. Resumen ejecutivo: como lo indica su nombre, es un resumen que contiene los principales resultados de la investigacin. Su objetivo fundamental es describir el comportamiento de la poblacin estudiada de manera rpida y precisa sin adentrarse en detalles. Cuerpo del trabajo: En esta parte se describen de manera detallada todos los resultados de la investigacin, incluye la presentacin de cuadros, tablas, grfico, descripcin textual, as como el clculo de medidas estadsticas. Conclusiones: las conclusiones representan el juicio extrado de los resultados de la investigacin. Se refieren a los puntos a los cuales llega quien o quienes realizan el estudio despus de analizar de manera detallada los resultados obtenidos. Las conclusiones dan respuestas a las interrogantes establecidas y a los objetivos planteados en la fase de planeacin. Recomendaciones: se refiere al conjunto de sugerencias o curso de accin que se sugieren seguir a partir de los resultados de la investigacin.
2.2
2.3
2.4
2.5
2.6
16
3.2
Nota aclaratoria: se utiliza para especificar cualquier detalle o aclaracin referente a los datos incluidos en el cuadro. Por ejemplo, en el cuadro que se muestra a continuacin se podra incluir una nota aclaratoria para indicar que solo se incluyen a los estudiantes que asistieron ese da a la clase o que incluye a otros colados de otra seccin
No. 9 25 34
de la que se trate.
4) Presentacin grfica: es aquella en la cual los resultados de una investigacin se presentan en forma de grfico. La importancia de la presentacin grfica es que permite observar el comportamiento de una variable sin entrar en detalles, solo con observar el cuadro.
17
Se x o d e l o s e s t u d i a n t e s d e Es t -x x x , s e c c i n 00
26.5%
73.5%
MASCU LIN O F EMEN IN O
Por ejemplo, al observar un recibo de la facturacin de la electricidad, se muestra un grfico como el que vemos a nuestra derecha, observamos como ha variado el consumo, si se ha consumido ms o se ha consumido menos.
Una presentacin grfica contiene los mismos elementos que un cuadro o tabla, es decir: ttulo, cuerpo, fuente y nota aclaratoria. 5) Presentacin Mixta: es aquella en la cual quien o quienes realizan la investigacin utilizan para la presentacin de los resultados del estudio dos o ms formas de presentacin de datos.
18
Como se puede observar, tenemos datos suficientes como para dar un diagnstico sobre el rendimiento de los y las estudiantes, sin embargo, sin una organizacin esto se hace poco aplicable. Una forma sencilla de iniciar una exploracin de los datos, para conocer sus caractersticas es organizando los mismos en orden ascendente como se ilustra a continuacin. Este procedimiento no nos proporcionar mucha informacin sobre las caractersticas relevantes de la variable, nos permite conocer por ejemplo cual es el rendimiento mayor y el menor y permite adems observar si existe un valor que se repita con una frecuencia mayor que los dems, etc.
19
Ahora podemos fijarnos una idea ms acabada sobre el rendimiento de los y las estudiantes de las escuelas pblicas y privadas, por ejemplo, observamos que ms de un tercio tiene un rendimiento promedio inferior a los 70.0 puntos, que solo cinco de los 133 estudiantes estudiados tienen un rendimiento superior a 90.0 puntos y as sucesivamente. 2.2 DISTRIBUCIONES DE FRECUENCIA Los datos que provienen de un censo, una encuesta por muestreo, diseo experimental y aquellos que provienen de fuente secundarias que no han sido agrupados o condensados, como por ejemplo la revisin de un expediente clnico, se presentan en la mayora de los casos en una Distribucin de frecuencia, ya sea para una o para mltiples variables. Una distribucin de frecuencia es un arreglo matricial, (arreglo de filas y columnas) donde se presenta los valores o atributos de una variable y su respectivas frecuencias. Antes de entrar en detalles sobre los diferentes tipos de distribuciones de frecuencias, vamos a definir el concepto de frecuencia y los diferentes tipos de frecuencias. La Frecuencia, en trminos estadsticos, se define como el nmero de veces que se repite un dato u observacin. Por ejemplo, al observar el sexo de 50 estudiantes de un curso de Estadstica, se observaron los datos que se presentan en la tabla siguiente
20
M F M F F
F F F F F
F F F F M
F M F F F
M F M F F
F F M F F
F F F F F
M F M F F
F F F F F
F M F F M
Para estos datos, el dato masculino, (M) se repite 11 veces por lo tanto esa es su frecuencia y el dato femenino, (F) se repite 39 veces, que es su frecuencia. 2.3 TIPOS DE FRECUENCIA Existen cuatro tipos de frecuencias: la absoluta simple, la relativa simple, la absoluta acumulada y la absoluta relativa acumulada. 2.3.1 Frecuencia absoluta simple, (fi): se define como el nmero de veces que se repite un dato u observacin. Comnmente se le denomina con el nombre de frecuencia. Por ejemplo, en el cuadro anterior el dato masculino tiene una frecuencia absoluta simple de 11, mientras que el dato femenino presenta una frecuencia absoluta simple de 39. 2.3.2 Frecuencia absoluta acumulada, (FA): consiste en la suma continua y subsecuente de la frecuencia absoluta simple. La frecuencia absoluta acumulada expresa la cantidad de elementos que se encuentra por debajo de un valor especfico. 2.3.3 Frecuencia relativa simple, (fr o %): consiste en expresar la frecuencia absoluta simple, (fi) como una proporcin con aspecto al total de frecuencia. 2.3.4 Frecuencia relativa acumulada, (FRA o % acumulado): Expresa la frecuencia absoluta acumulada, (FA) como un porcentaje con respecto al total de frecuencia y representa la proporcin de elementos que se encuentran por debajo de un valor determinado. La FRA se puede obtener de dos formas: a) Sumando de manera continua y subsecuente la frecuencia relativa simple. b) Dividiendo cada frecuencia absoluta acumulada entre el total de frecuencia. 2.4 Clase: Es un rango de valor en el cual se incluye un conjunto de datos que para fines de anlisis se consideras homogneos. Veamos un ejemplo sobre como se obtienen las diferentes frecuencias que conforma una distribucin de frecuencia. Para la ilustracin vamos a tomar la calificacin obtenida por 50 estudiantes en una prueba parcial de Estadstica, los datos se ilustran en la tabla nmero dos a continuacin.
21
Para ordenar estos datos, lo primero que vamos a hacer es colocar en la primera columna la variable, en este caso la calificacin obtenida, pero como puede tomar mltiple valores, se clasifica en cinco categoras, la primer, los/as que obtuvieron menos de 12 puntos, la segunda los/as estudiantes que obtuvieron entre 12 y menos de 14 puntos, la tercera los/as estudiantes que obtuvieron entre 14 y menos de 16 puntos, la cuarta clase est compuesta por los/as estudiantes que obtuvieron entre 16 y menos de 18 puntos y la quinta clase, est formada por aquellos/as estudiantes que obtuvieron entre 18 y 20 puntos. De esta forma, la primera columna queda como se ilustra a continuacin: Calificacin 12.0
12.0 13.9 14.0 15.9 16.0 17.9 18.0 20.0 TOTAL El segundo paso es determinar la cantidad de estudiantes que cae dentro de cada una de estas categoras o clases. Para esto, sencillamente se cuenta en la tabla dos, la cantidad de calificaciones que est dentro de cada uno de los lmites de cada categora o clase. Para determinar la cantidad de datos en cada categora o clase se puede hacer contando de manera directa cada valor o a partir de un proceso de conteo detallado, colocando una raya, un punto o un smbolo en cada categora cada vez que aparece un valor que se corresponda con esta. Al observar los datos sueltos de la tabla dos, en la primera categora, las calificaciones menores de 12 puntos, hay 11 estudiantes, con calificacin
22
A partir de esta frecuencia absoluta simple, se obtienen las dems frecuencias. La frecuencia relativa, por ejemplo se obtiene al dividir cada frecuencia absoluta entre el total de frecuencia. Si esta frecuencia se desea expresar como un porcentaje, entonces se multiplica por 100. La primera frecuencia relativa es [(11/50) x 100]= 22.0%, la segunda frecuencia relativa es [(10/50) x 100]= 20.0% y as sucesivamente, la tercera frecuencia relativa es [(10/50) x 100]= 20.0%, la cuarta frecuencia relativa es [(12/50) x 100]= 24.0% y la quinta y ltima frecuencia relativa de esta distribucin es [(17/50) x 100]= 14.0% El resultado de calcular cada una de la frecuencia relativa se muestra en la tabla siguiente: Calificacin 12.0 fi 11 10 10 12 7 % 22.0 20.0 20.0 24.0 14.0
50 100.0
23
Una vez que se ha determinado la frecuencia absoluta acumulada el siguiente paso es calcular la frecuencia relativa acumulada o porcentaje acumulado. Este porcentaje puede obtenerse de dos formas, o se acumula la el porcentaje simple o se divide cada frecuencia absoluta acumulada entre el total. El procedimiento de acumular el porcentaje simple, simplifica los clculos. El porcentaje acumulado de la primera clase es igual porcentaje simple de la misma. Para nuestro ejemplo, el porcentaje acumulado de la primera clase o
24
Una vez que han calculado las frecuencias se procede a completar el cuadro de manera adecuada, es decir, poner el ttulo, se elimina la columna del conteo, (si se ha incluido), y se coloca la fuente de los datos. Cuadro No : Calificacin de 50 estudiantes de un curso de estadstica en una prueba parcial Calificacin fi % FA FRA 12.0 11 10 10 12 7 50 22.0 20.0 20.0 24.0 14.0 100.0 11 21 31 43 50 22.0 42.0 62.0 86.0 100.0
25
2.5 TIPOS DE DISTRIBUCIN DE FRECUENCIA Para agrupar los datos existen tres tipos de distribucin de frecuencia, la cuales se utilizarn de acuerdo al tipo de datos que estemos tratando. 2.5.1 Distribucin de frecuencia para datos cualitativos: cuando se tienen datos cualitativos, el procedimiento se simplifica, pues solo se requiere colocar las diferentes categoras de la variable y la frecuencia asociada con dada una de ellas, como se muestra en el ejemplo siguiente:
Cuadro No.: Personas con quienes viven los/as estudiantes de las escuelas pblicas y de la privadas
Con quien vive Ambos padres Con la madre Con el padre Otro familiar Total
Fuente: Estudio de mayo del 2006
fi 106 15 5 7 133
2.5.2 Distribucin Frecuencia Simple o Tipo I: es un tipo de distribucin de frecuencia que se utiliza para presentar una variable cuantitativa discreta, cuyo rango de valor sea menor o igual de diez. Es decir se utiliza para variables cuantitativas discretas que toman pocos valores diferentes. Ejemplos de estas variables son nmero de hijos/as por familia, nmero de asignaturas cursadas por los estudiantes de la UASD, nmero de cursos realizados por los empleados y empleadas de una empresa, entre otros. Ejemplo: Se les pregunt a cincuenta profesores sobre el nmero de estudiantes reprobados que tena en su curso, los datos son:
Tabla 3: Nmero de estudiantes reprobados/as por curso
3 5 3 2
1 4 5 4
4 2 3 4
5 4 1 5
3 5 2 4
2 3 2 3
2 2 4 1
4 3 2 2
2 3 1 3
2 1 0 1
El dato menor que aparece en los datos es el valor cero y el mayor es el cinco de forma tal que esta variable en esta muestra toma seis valores diferentes: cero, uno, dos, tres, cuatro y cinco. Para organizar los datos en una distribucin de frecuencia simple o tipo I colocamos los diferentes valores de
26
2.5.3 Distribucin Frecuencia con Clase o Tipo II: Este tipo de distribucin se utiliza para variables cuantitativas continuas y para aquellas variables cuantitativas discretas, cuyo rango de valor sea mayor de diez. Siempre que se trate de datos cuantitativos continuos se hace necesario el uso de este tipo de distribucin. La razn para ello es que los datos cuantitativos continuos pueden diferir uno del otro por milsima de datos, lo que, de tener los diferentes valores con sus respectivas frecuencias se podra tener tantas clases como valores individuales se tenga, perdindose de esta manera la esencia de la agrupacin de los datos, proporcionar informacin sobre las caractersticas de las variables estudiadas Un ejemplo de este tipo de distribucin de frecuencia se muestra a continuacin Cuadro No : Calificacin de 50 estudiantes de un curso de estadstica en una prueba parcial Calificacin fi % FA FRA 12.0 11 10 10 12 7 50 22.0 20.0 20.0 24.0 14.0 100.0 11 21 31 43 50 22.0 42.0 62.0 86.0 100.0
27
Los pasos que se presentan a continuacin son solo una gua de cmo organizar los datos en una distribucin de frecuencia con clase, puesto que la forma de presentar los datos muchas veces depende de lo que se quiera mostrar en la distribucin. Pero cuando no se tiene una idea de cmo agrupar los datos, los siguientes pasos son una buena gua y estos pasos son: 1. Calcular el rango de la variable: El rango de una variable se define como la diferencia entre dato mayor y el dato menor y el mismo indica los diferentes valores posibles que puede tomar la variable RV = Xmayor - Xmenor 2. Calcular el intervalo o ancho de la clase: El intervalo o ancho de la clase es la diferencia que existe entre el lmite inferior y el lmite superior de cada clase y el mismo se puede obtener por tanteo o se puede establecer de acuerdo a los objetivos de quien est presentado la informacin. Una forma de obtener el intervalo de cada clase es a partir de la regla sugerida por Sturges4 la cual establece que el ancho o intervalos de clases en una distribucin de frecuencia puede aproximarse a partir de la siguiente frmula:
A partir de esta frmula se obtiene un intervalo de igual dimensin para todas las clases lo que facilita el anlisis. 3. Establecer los lmites de cada clase: para establecer los lmites de cada clase o intervalo, se inicia con el dato menor y se le suma el intervalo y as se contina hasta llegar al dato mayor observado. Es importante tener en consideracin que los lmites se deben establecer de forma excluyentes, esto es, que los valores en los lmites no deben ser iguales, por ejemplo, si una clase va de 30 a 40, como el 40 no va incluido en esa clase lo aconsejable es establecer como limite superior el resultado de la suma disminuido en una unidad, lo que nos dara una clase con los siguientes lmites; 30 a 39, as, la siguiente clase iniciara con 40 y de esta forma los valores del lmite superior de una clase y el inferior de la siguiente no van a ser iguales. Este procedimiento ayuda a que quien lea u organice la informacin no tenga dudas sobre donde colocar por ejemplo el 40, adems de que este procedimiento facilita un mayor entendimiento del comportamiento de los datos.
4
Herbert A. Sturges: The Choice of a Class Interval, Journal of the American Statistical Association. Marzo 1926
28
4. Realizar el conteo y establecer las frecuencias: El conteo consiste es determinar cuantos valores de la variable pertenecen a cada clase o intervalo Ejemplo: 1. Los datos que se muestran a continuacin representan las edades de un grupo de 40 personas que asistieron al estreno de una pelcula
21 40 22 26 24 21 20 22 33 31 22 24 29 28 23 39 35 20 43 38 26 26 50 35 26 21 47 20 25 33 45 46 44 32 26 20 32 41 38 25
A partir de los datos desarrolle las siguientes preguntas: a) b) c) d) Construir una distribucin de frecuencia Determinar el porcentaje de personas que tiene menos de 30 aos Interprete el resultado de la frecuencia relativa simple de la tercera clase Interprete el resultado de la frecuencia relativa acumulada de la quinta clase. e) Qu porcentaje de las personas que asistieron al curso de estadstica tiene menos de 38 aos? Iniciamos con los cinco pasos para construir una distribucin de frecuencia con clase: 1. Rango de la variable: RV = Xmayor - Xmenor RV = 50 20 RV = 30 2.
RV 1 ( 3 . 322 log n )
3. Establecer los lmites de cada clase: recordemos que para la primera clase se suma el intervalo al dato menor y as sucesivamente, como se muestra a continuacin:
29
30
a) Construir una distribucin de frecuencia. b) Qu por ciento de las viviendas tienes un tamao inferior a los 25 m 2? c) Qu por ciento de las viviendas tiene un espacio mayor a 30 m2? d) Interpretar el resultado de la cuarta clase de la frecuencia relativa acumulada. e) Interpretar el resultado de la frecuencia relativa simple de la tercera clase.
31
a) Construir una distribucin de frecuencia con cinco clases. b) Interpretar el resultado de la frecuencia relativa simple de la tercera clase. c) Interpretar el resultado de la frecuencia absoluta acumulada de la cuarta clase. d) Qu porcentaje de estudiantes tiene un ndice de calificacin menor a 3.00 puntos? 3. La escolaridad de 35 padres de presenta como sigue. 14 16 13 14 16 12 16 16 13 12 15 12 13 14 16 12 15 16 familia (expresado en aos de educacin) se 12 16 18 13 14 12 12 15 12 16 15 14 14 16 13 17 17
a) Organice los datos en una distribucin de frecuencia. b) Qu porcentaje de padres de familia, tiene menos de 15 aos de educacin? c) Qu porcentaje de padres de familia tiene 12 aos de educacin? 4. El ingreso quincenal, en cientos de RD$ de un grupo de empleados de la empresa K.G. se muestra en los datos siguientes. 24 39 44 38 38 16 22 32 29 28 27 60 48 10 31 23 30 12 27 17 21 24 37 18 42
a) Organice los datos en una distribucin de frecuencia con un intervalo de RD$10. b) Qu porcentaje de los empleados ganan menos de $20? c) Qu porcentaje gana entre 30 y 40? d) Interpretar el resultado de la frecuencia relativa simple de la segunda clase. 5) El rea de estudio de un grupo de 30 estudiantes se presenta a continuacin. 1. 2. 3. 4. 5. 6. 7. Administracin Economa Contabilidad Contabilidad Mercadeo Economa Mercadeo 11. Indeciso 12. Indeciso 13. Economa 14. Mercadeo 15. Indeciso 16. Administracin 17. Economa 21. Administracin 22. Computacin 23. Mercadeo 24. Economa 25. Indeciso 26. Administracin 27. Computacin
32
a. Construir una distribucin de frecuencia. b. Calcular el porcentaje de estudiante por rea de estudio.
33
TABULACIN CRUZADA
Tambin se le llama tabla de doble entrada y se utiliza para presentar dos o ms variables en un solo cuadro. La Tabulacin Cruzada proporciona una descripcin bsica de la interrelacin que hay entre las variables que se tabulan en el cuadro, de igual forma ayuda a buscar patrones de interaccin siempre que la frecuencia de cada celda represente un nmero significativo con respecto al total. Para realizar un cuadro de doble entrada se sigue el mismo procedimiento que para construir una distribucin de frecuencia con una variable. Es decir que se debe tomar en consideracin las variables a incluir en el cuadro de doble entrada, (cualitativa o cuantitativa y en el caso de las variables cuantitativas, se debe tomar en cuenta si estas son continuas o discontinuas). 2.7.1 TABULACIN CRUZADA PARA DOS VARIABLES Para la construccin de un cuadro de doble entrada con dos variable, se coloca una de las variables en la primera columna o columna principal y la otra variable en la primera fila, de forma tal que se forme una celda comn para cada una de las categoras de las variables incluidas. La variable que se coloca en la primera fila generalmente es aquella que tienen un mayor nmero de categoras. Para ilustrar lo que se ha dicho, suponga que estamos interesados en conocer la relacin que existe entre dos variables, digamos X e Y. Suponga adems que la variable X tiene cinco categoras, X1, X2, X3, X4 y X5 y que la variable Y tiene tres categoras, Y1, Y2, Y3, si queremos presentar estas dos variables en un solo cuadro, el cuadro tendra la forma siguiente: Yi Xi X1 X2 X3 X4 X5 TOTAL Y1 Y2 Y3 TOTAL Total X1 Total X2
. .
Total X5 Total general
El cuadro indica dos renglones para el total, esto es debido a que estamos presentando solo dos variables, as, en el total de la ltima fila representa el
34
1 Masc.
11 Masc.
21 Fem
Para este caso tenemos dos variables, una variable cuantitativa, (calificacin matemtica) y una cualitativa, (sexo de los/as estudiantes). La variable sexo tiene dos categoras, masculino y femenino, y la calificacin en matemtica es continua y su rango es mayor de 10 por lo tanto hay que hacer una distribucin con clases. Para ello vamos a dividir esta variable en cuatro categoras, los estudiantes con menos de 70 puntos, los que tienen entre 70 y 80 puntos, los que tienen entre 80 y 90 y los que tienen 90 o ms puntos. Luego de esta clasificacin el cuadro queda como se ilustra a continuacin: Como se muestra en el cuadro siguiente, el primer alumno es de sexo masculino y tiene una calificacin de 68 puntos, por lo tanto se coloca en la columna de masculino y en la primera fila, ya que aqu de colocan los que tienen calificacin entre 60 y 69 puntos. El segundo estudiante es una estudiante y tiene una calificacin de 86 puntos, por lo tanto se coloca en la columna de sexo femenino y en la tercera fila, ya que aqu se deben colocar los estudiantes que tienen entre 80 y 89 puntos. El tercer estudiante es sexo masculino y tiene una calificacin de 72 puntos, por lo que se coloca en la columna de masculino y en la segunda fila, ya que en
35
///////////// ///
Total 6 16 7 1 30
Determinar el porcentaje de estudiante por sexo Calcular el porcentaje de estudiantes con menos de 80 puntos De los que tienen menos de 90 puntos, qu porcentaje es femenino? Del grupo femenino qu porcentaje tiene menos de 90 puntos? Que porcentaje de estudiantes tiene entre 80 y 89 puntos
Ejercicio: Con los datos que se presentan en la tabla siguiente crear un pequeo reporte indicando la relacin entre el rendimiento acadmico y el sexo de los estudiantes, entre el nmero de asignatura por sexo, as como el gasto en transporte por sexo y nmero de asignaturas cursadas. Finalmente incluya un pequeo anlisis de la relacin entre la edad de los estudiantes y el nmero de asignaturas cursadas.
36
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
22 24 23 25 21 25 22 21 28 28 29 25 20 30 28 24 28 24 21 24 35 21 24 22 21 26 25 24 29 25
M F M M M F M F F F M F M F F F F F F M M F M F F F F M M F
3 3 4 5 3 3 3 6 3 4 5 3 4 2 3 4 3 6 4 3 2 4 3 3 4 3 4 5 3 5
80.0 77.8 75.6 74.6 82.1 74.3 77.7 80.1 70.3 70.3 73.5 74.3 79.8 73.3 81.5 74.4 78.6 76.7 77.7 79.4 75.7 83.0 81.2 76.8 80.7 70.8 71.3 74.9 82.6 80.6
20 50 60 30 30 50 40 40 40 40 40 20 40 20 40 40 40 40 20 20 40 40 50 60 30 50 20 80 30 20
37
38