Академический Документы
Профессиональный Документы
Культура Документы
Estadstica Ciencia de recolectar, organizar, analizar e interpretar informacin. La estadstica se encarga de describir los resultados de una investigacin cientfica, de tomar decisiones basadas en dicha investigacin y de estimar cantidades desconocidas
Poblacin
Poblacin finita
Calificaciones en Clculo de 600 estudiantes de una escuela Las alturas de los residentes de una ciudad Longitudes de los pescados de un lago
Poblacin infinita
Los puntos obtenidos al lanzar un dado indefinidamente Datos de presin atmosfrica medida diariamente Mediciones de profundidad de un lago desde cualquier posicin
Estadstica Descriptiva
Comprende aquellos mtodos usados organizar y describir la informacin recabada. Estadstica Inferencial
para
Comprende aquellos mtodos y tcnicas usados para hacer generalizaciones, predicciones o estimaciones sobre poblaciones a partir de una muestra. El concepto de probabilidad juega un papel importante, por no estar absolutamente ciertos de la veracidad de tales inferencias.
Estadstica descriptiva
1. Organizacin de datos A la informacin usada se le llama datos Datos cuantitativos: Informacin numrica Peso en kilos Edad en aos Longitud en centmetros Datos cualitativos: Representan categora o atributos que pueden clasificarse segn un criterio de cualidad. Sexo: hombre,mujer Color: rojo, verde, azul Marca de automvil: Ford, Chevrolet
Nmero de nios en una familia Cantidad de automviles en un estacionamiento El nmero de personas en una fila Datos continuos: Datos obtenidos de un proceso de medicin, donde la caracterstica que se mide puede tomar cualquier valor numrico en un intervalo. Tiempo en llegar al trabajo Velocidad de un automvil en km/h Peso en kilogramos
Tabla de Frecuencias
Nmero de faltas (x) Frecuencia (f) 0 2 1 4 2 7 3 6 4 6 5 2 6 4 7 4 8 3 9 4
Ejemplo.
Cinco miembros, Prez, Maldonado, Gonzlez, Crdenas y Torres, de la junta directiva de una pequea universidad, fueron nominados para presidirla y los datos siguientes muestran el resultado de la eleccin.
Prez Maldonado Maldonado Maldonado Prez Gonzlez Maldonado Torres Maldonado Gonzlez Maldonado Maldonado Maldonado Prez Crdenas Crdenas Prez Torres Crdenas Crdenas Torres Prez Prez Crdenas
Tabla de Frecuencias
Miembro de la junta Frecuencia (f) Crdenas 5 Gonzlez 2 Maldonado 8 Prez 6 Torres 3
Ejemplo.
El Hospital Christus Muguerza quiere saber si su servicio en la sala de emergencias es adecuado. Para empezar el estudio, el gerente del departamento correspondiente registra el nmero de personas que ocupan la sala de emergencias cada da durante un perodo de 12 das, con los resultados siguientes.
Da Nm. de pacientes 1 2 3 4 5 6 7 8 9 10 11 12 7 43 8 22 13 28 36 18 23 21 15 52
Se construyen seis agrupamientos o clases. La clase 1, por ejemplo, representa de 1 a 10 pacientes Tabla de Frecuencias Clase 1-10 11-20 21-30 31-40 41-50 51-60 Frecuencia (f) 2 3 4 1 1 1
Los extremos de las clases se llaman lmites de clase La distancia entre cualquiera de dos lmites superiores consecutivos o entre cualquiera dos lmites inferiores consecutivos es llamada amplitud de clase (w).
Cada clase en una tabla de frecuencia tiene lmites de clase tericos llamados fronteras de clase.
Las fronteras de clase y las amplitudes de clase de una tabla de frecuencias agrupadas se determinan considerando la unidad o precisin de la medida. La frontera inferior de clase de un intervalo se localiza media unidad abajo del lmite y la frontera superior de clase de un intervalo se localiza media unidad arriba del lmite.
Para el ejemplo, la unidad de medida es 1 pues se estn contando individuos, por lo que la frontera inferior para la primera clase es [1-0.5(1)]=0.5 y la frontera superior para esta misma clase es [10+0.5(1)]=10.5.
La amplitud w de cualquier clase de una tabla de frecuencias agrupadas puede encontrarse tambin restando la frontera inferior de la clase de su frontera superior.
Ejemplo. La siguiente es una tabla de frecuencias agrupadas para el peso en libras de 18 recin nacidos. Clase Frecuencia (f) 3.0 - 4.4 1 4.5 - 5.9 1 6.0 - 7.4 7 7.5 - 8.9 8 9.0 - 10.4 1 La precisin de la medida de las clases es 0.1 libras.
Frontera inferior para la clase 7.5 8.9: 7.5 (0.5)(0.1)=7.5 0.05 = 7.45
Nmero de clases
Si todos los datos se agrupan en un nmero pequeo de clases, las caractersticas de los datos originales se ocultan y se puede perder informacin relevante. Si se utilizan demasiadas clases, stas dan demasiados detalles y se pierde el propsito del agrupamiento, que es condensar los datos de manera significativa y fcil de interpretar. Adems puede ser que muchas clases queden vacas quitndole sentido al agrupamiento de los datos.
La eleccin del nmero de clases, que denotaremos por c, es arbitraria; sin embargo es importante considerar los puntos anteriores.
Ejemplo. Si el nmero de medidas es 25, determine el nmero de clases obtenido por la regla de Sturges.
Amplitud de Clase
R es el rango , diferencia entre la medida mayor U y la medida menor L . El lmite inferior de la primera clase debe estar en, o un poco antes, de la medida menor. Acordaremos empezar la primera clase con la medida menor.
Ejemplo. El profesor Smith puso un examen final consistente en 100 preguntas a su grupo de Estadstica. Los datos siguientes representan el nmero de respuestas correctas en cada examen. 17 15 78 4 22 34 44 64 62 77 13 41 7 67 88 Construya una tabla clases. 21 42 77 16 41 de 10 32 7 9 9 82 2 81 45 17 13 82 61 22 92 frecuencias 65 18 87 79 98 4 37 83 44 37 5 54 16 67 85 agrupadas con 5
Ejemplo. Los siguientes datos representan el nmero de clientes que visitan una tienda en un perodo de 22 das. Use seis clases y construya una tabla de frecuencias agrupadas para los datos. 28 42 52 50 29 31 34 45 48 38 28 33 33 49 32 37 41 43 46 49 34 49
Clase 28 32 33 37 38 42 43 47 48 52 53 - 57 Frecuencia (f) 5 5 3 3 6 0 Clase 26 30 31 35 36 40 41 45 46 50 51 - 55 Frecuencia (f) 3 6 2 4 6 1
Marca de clase. Es el punto medio de cada clase y se determina sumando los lmites inferior y superior de la clase y dividiendo por 2. Tambin se conoce como punto medio de la clase. Lo denotaremos por X. Consideremos el ejemplo anterior referente al nmero de clientes que entran a una tienda en un perodo de 22 das. La marca de clase para la clase 2 es 33 .
Cada marca de clase para las clases siguientes a la primera, puede encontrarse tambin sumando la amplitud de clase a la marca de clase precedente.
Ejemplo. El conjunto de datos siguiente, representa los totales de efectivo (en dlares) gastados en un cierto fin de semana por 25 estudiantes graduados. Construya una tabla de frecuencias agrupada que contenga cinco clases.
Tabla de frecuencias agrupadas Nmero de clase 1 2 3 4 5 Clase 17.89 - 30.88 30.89 - 43.88 43.89 - 56.88 56.89 - 69.88 69.89 - 82.88 Frecuencia (f) 8 8 7 1 1 Marca de clase (X) 24.385 37.385 50.385 63.385 76.385
Tabla de frecuencia relativa La frecuencia relativa de una medida o clase se encuentra dividiendo la frecuencia f de dicha medida entre el total n de medidas. La tabla que contiene esta informacin se llama tabla de frecuencia relativa. Note que una frecuencia relativa equivale a un porcentaje, por lo que la suma de las frecuencias relativas, sin error de redondeo, es siempre 1.
Ventaja de la tabla de frecuencia relativa sobre otra tabla de frecuencias: Se pueden hacer comparaciones entre conjuntos similares de datos que tengan las mismas clases pero frecuencias totalmente distintas.
Ejemplo. La siguiente tabla exhibe los salarios iniciales de ingenieros recin graduados en dos universidades estatales A y B. Tabla de frecuencia agrupada
Universidad A Clase salarial $10,000 - 12,999 13,000 - 15,999 16,000 - 18,999 19,000 - 21,999 22,000 - 24,999 25,000 - 27,999
f 0 2 7 6 3 2
Universidad B Clase salarial $10,000 - 12,999 13,000 - 15,999 16,000 - 18,999 19,000 - 21,999 22,000 - 24,999 25,000 - 27,999
f 1 1 2 2 3 1
Tabla de frecuencia acumulada La frecuencia acumulada de cualquier medida o clase, es la suma de la frecuencia de esa misma clase, y de las frecuencias de las medidas o clases anteriores. Lo anterior es de inters cuando se quiere saber el nmero de observaciones menores o iguales que algn valor dado.
Ejemplo. Obtenga la tabla de frecuencia acumulada a partir de la siguiente tabla de frecuencia agrupada correspondiente al ejemplo del examen de estadstica Clase Frecuencia (f) 2 - 21 18 22 - 41 8 42 - 61 6 62 - 81 10 82 - 101 8
2 - 21 22 - 41 42 - 61 62 - 81 82 - 101
Tabla de frecuencia relativa acumulada La frecuencia relativa acumulada de cualquier medida o clase, se obtiene dividiendo la frecuencia acumulada entre el total de medidas Ejemplo. Clase 2 - 21 22 - 41 42 - 61 62 - 81 82 - 101 Frecuencia relativa acumulada 18 / 50=0.36 26/ 50 = 0.52 32 / 50 = 0.64 42 / 50 = 0.84 50 / 50 = 1.00
Una grfica es una forma ilustrada de representar y resumir datos, sta puede hacer ms evidentes ciertas caractersticas que una tabla de frecuencias.
Grficas ms usadas: De pastel
De barras
Histogramas Polgono de frecuencias Otras
Para datos cualitativos, es un agrupamiento no ordenado de los datos en categoras discretas, donde cada dato puede incluirse solamente en uno de los grupos; por ejemplo, gnero, raza, tipo de sangre y religin. Las escalas nominales, se usan principalmente con propsitos de identificacin o de clasificacin.
Las grficas de pastel se usan slo para representar partes de un total.
Ejemplo.
La siguiente tabla contiene datos referentes a los beneficiarios de los donativos hechos por ciudadanos estadounidenses en 1983. Beneficiarios
Religin Artes y humanidades Servicios Sociales Educacin Salud Otros
Totales (en miles de millones de dlares) 31.0 4.1 6.9 9.0 9.2 4.7
31.0
6.9 4.1
9.0
9.2 4.7
5.0
0.0 Religin
Educacin
Salud
Otros
31.0
6.9 4.1
9.0
9.2 4.7
Religin
Educacin
Salud
Otros
Artes y humanidades 6%
Histograma
Un histograma es un tipo de grfica de barras para una distribucin de frecuencia (tablas de frecuencias no agrupadas y agrupadas).
Distribuciones de frecuencias no agrupadas La idea es representar cada frecuencia por una barra cuya rea sea proporcional a ella. Tpicamente, el ancho de cada barra se escoge como 1 y as el rea de la barra es igual a la frecuencia de la medida.
Ejemplo. La siguiente tabla contiene el nmero de nios en edad escolar en cada una de las 50 familias de una muestra. Construya un histograma para los datos. Nmero de nios en edad escolar 0 1 2 3 4
Frecuencia (f)
15 8 14 9 4
16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 0 1 2 3 4
Para construir un histograma para datos medidos en una escala de intervalo se acostumbra:
1. Organizar los datos de una tabla de frecuencia agrupada. 2. Construir una grfica de barras usando las fronteras de clase para colocar las barras, y las frecuencias para indicar las alturas de las barras.
Ejemplo. La siguiente tabla de frecuencias agrupadas representa la tasa de desempleo, en porcentajes, para 27 ciudades del este de EU. Construya un histograma con estos datos. Tasa de desempleo Nmero de (en porcentajes) ciudades 3.7 - 5.1 5 5.2 - 6.6 12 6.7 - 8.1 6 8.2 - 9.6 1 9.7 - 11.1 0 11.2 - 12.6 1 12.7 - 14.1 2
En Excel
13 12 11 10 9 8 7
6
5 4 3 2 1 0 3.7 - 5.1 5.2 - 6.6 6.7 - 8.1 8.2 - 9.6 9.7 - 11.1 11.2 - 12.6 12.7 - 14.1
Histograma de frecuencia relativa Se puede construir un histograma de frecuencia relativa cambiando la escala vertical de un histograma de frecuencias. La altura de las barras en un histograma de esta naturaleza indicar la proporcin del total representado por cada clase.
Ejemplo. Considere el ejemplo referente a la tasa de desempleo para 27 ciudades de EU. Construya la tabla de frecuencia relativa y el histograma de frecuencia correspondiente. Tasa de desempleo Nmero de Frecuencia (en porcentajes) ciudades (f) relativa 3.7 - 5.1 5 0.19 5.2 - 6.6 12 0.44 6.7 - 8.1 6 0.22 8.2 - 9.6 1 0.04 9.7 - 11.1 0 0.00 11.2 - 12.6 1 0.04 12.7 - 14.1 2 0.07
En Excel
0.50 0.45
0.40
0.35
0.30
0.25 0.20 0.15 0.10 0.05 0.00 3.7 - 5.1 5.2 - 6.6 6.7 - 8.1 8.2 - 9.6 9.7 - 11.1 11.2 - 12.6 12.7 - 14.1
13 12 11 10 9 8 7 6 5 4 3 2 1 0 3.7 - 5.1 5.2 - 6.6 6.7 - 8.1 8.2 - 9.6 9.7 - 11.1 11.2 - 12.6 12.7 - 14.1
Polgonos de Frecuencia El polgono de frecuencia se construye uniendo los puntos ( X , f ) (marca de clase y su correspondiente frecuencia). Considere el ejemplo de los clientes que visitan una tienda en un perodo de 20 das.
Clientes 26 30 31 35 36 40 41 45 46 50 51 - 55
Frecuencia (f) 3 6 2 4 6 1
X 28 33 38 43 48 53
7 6 5 4 3 2 1 0 23 28 33 38 43 48 53 58
7 6 5 4 3 2 1 0 23 28 33 38 43 48 53 58
3. Anlisis de datos
Media o promedio aritmtico La media o promedio aritmtico de un conjunto de datos se encuentra sumando los nmeros y dividiendo despus la suma entre el nmero de medidas. La media se puede determinar slo para datos cuantitativos. Esta se puede calcular tanto para muestras como para poblaciones. media muestral media poblacional
Ejemplo. Suponga que se tiene la siguiente muestra de edades en aos de principiantes de una universidad. 18 18 18 18 19 19 19 20 20 21
O tambin
Desventaja: se ve afectada por los valores extremos. Por ejemplo, suponga que un corredor ha corrido en seis de los maratones mas grandes del pas, quedando en las posiciones siguientes 3 5 4 6 2 85
La media de estos valores es 17.5 . Si la media se usa para describir la habilidad del corredor, no parece razonable pues a lo ms termin en sexto lugar en las primeras cinco carreras.
Para datos contenidos en una tabla de frecuencia agrupada, se usan las marcas de clase para representar las medidas de cada clase. Entonces la media muestral aproximada es
Ejemplo. Los siguientes datos representan el nmero de discos vendidos cada da durante un perodo de 25 das en una tienda de msica localizada en un centro comercial. 60 36 61 56 19 35 51 42 21 28 33 67 30 49 57 54 59 28 63 38 15 24 35 46 53 Por conveniencia, los datos se presentan en una tabla de frecuencias agrupadas
Nmero de das 4 7 3 6 5
Encuentre a) El nmero promedio de discos vendidos por da b) El nmero promedio aproximado de discos vendidos por da.
Mediana La mediana es el puntaje medio ordenado. Si el nmero de medidas es impar, entonces ser la medida en el centro; pero si es par, la mediana es la media de las dos medidas que ocupan posiciones centrales. Ejemplo. Los Bobcats han anotado en 8 juegos consecutivos los siguientes puntos 6 10 3 21 0 35 42 14
0 3 6 10 14 21 35 42
La mediana es
Ejemplo. Encuentre la mediana para los datos muestrales organizados en la siguiente tabla de frecuencia que representa el nmero de faltas en cada perodo de clases durante la primavera de 1988 en un grupo de introduccin a la filosofa.
Nmero de faltas 0 1 2 3 4 Frecuencia 10 10 8 4 8 f acumulada 10 20 28 22 40
1. Cualquier valor de la clase coincide con la marca de clase. 2. Los valores en cada uniformemente en la clase. clase se distribuyen
Ejemplo. La siguiente tabla representa las velocidades, en millas por hora, para una muestra de 37 coches que recorren una zona escolar donde se permite circular hasta 25 millas por hora. Encuentre la mediana aproximada. Velocidad Nmero de coches f acumulada 1-5 3 3 6-10 2 5 11-15 5 10 16-20 10 20 21-25 7 27 26-30 10 37
Criterio1.
Velocidad Nmero de coches 1-5 3 6-10 2 11-15 5 16-20 10 21-25 7 26-30 10 X 3 8 13 18 23 28 f acumulada 3 5 10 20 27 37
La mediana muestral aproximada ser la marca de clase que ocupa el lugar 19 (n impar).
Moda La moda, si se da, es la medida ms frecuente. Es la nica medida de tendencia central que puede utilizarse para datos cualitativos.
Ejemplos.
1 1 3 3 3 2 7 8 la moda es 3
Para datos agrupados, el uso de la moda depende del agrupamiento arbitrario de los datos, lo cual es una desventaja. La moda para una distribucin de frecuencia agrupada se conoce como moda cruda o clase modal. Una moda cruda o clase modal, si existe, corresponde a la marca de clase para una clase que contenga la frecuencia mayor y para datos desplegados en un histograma, una moda se asocia con la barra ms alta.
Marca de clase 20 25 30 35 40
frecuencia 4 3 2 3 4
4.5
4
3.5 3
Modas crudas: 20 y 40
2.5 2 1.5
1
0.5 0
20
25
30
35
40
Medidas de dispersin o variabilidad Las medidas de tendencia central solas, usualmente no describen apropiadamente una caracterstica en estudio.
Ejemplo. David y Ricardo lanzan cada uno 25 flechas a un blanco. Los siguientes son sus puntajes.
Frecuencia Puntaje David Ricardo 10 2 0 9 3 0 8 4 5 7 7 8 6 2 5 5 1 4 4 1 3 3 1 0 2 2 0 1 2 0 David y Ricardo tienen el mismo puntaje promedio, 6.32
Puntaje de David
10
Puntaje de Ricardo
10
Rango Diferencia entre medida mxima U y medida mnima L; esto es, R = U L El rango no es una medida sensible para la dispersin de una coleccin de datos. Tambin puede afectarse drsticamente por la presencia de valores extremos de los datos.
Una desviacin positiva para una medida, indica que la medida est por encima de la media, mientras que una desviacin negativa seala que est por debajo de la media.
Como la desviacin de un valor representa la distancia de una medida y la media de un conjunto de datos, podramos pensar que el promedio de todas las desviaciones proporciona una medida de dispersin de todas las medida con respecto a la media.
Varianza Se define como el promedio de los cuadrados de las desviaciones de los valores. Para una poblacin
Es difcil interpretar la varianza como medida descriptiva de dispersin pues sus unidades son el cuadrado de las unidades de medida.
Desviacin estndar Es la raz cuadrada de la varianza. Las unidades de la desviacin estndar son las mismas que las de las medidas.
Suma de cuadrados para datos en una tabla de frecuencias. Para una muestra Para una poblacin