Вы находитесь на странице: 1из 86

I n t r o d u c c i n

DESCRIPCION 1. 7 Por qu estudiar dstica? 1.2 B lenguaie de a estadstica 1.3 Estadstica descriptiva inferencia! 1.4 Inferencias y nes 1.5 El papel de la computadeduccioe esta-

OBIETIVOS

DEL

CAPITULO

En este captulo estudiaremos: > > > > > os dos significados La diferencia La dierena La dierena de! trmino estadstica. v una muestra. paramero. y estadstica inferencia! induc-

entre un poblacin

entre un estadsuco y un entre estadstica descriptiva la probabilidad

Cmo se relacionan cin y la deduccin.

y la estadstica

con ia

> >

Por qu es Importante

estudiar

estadstica. estadstica.

El pape! de ia computadora

en la

dora en la estadstica

a razn principal de que una empresa sea abandonada por sus cuentes es J L / u n mal servicio. Los directores y los profesionales del desarrollo organizativo tienen el reto de ayudar a sus empresas a mejorar el servicio al cuente, satisfacer al mismo y mantener el lugar de ventas. Segn un artculo de Stum y Church , la investigacin lo demanda; ellos- citan los siguientes hechos
1

obtenidos mediante tcnicas estadsticas y que ilustran as distintas formas de usar la informacin estadstica para el manejo de la toma de decisiones. De acuerdo con un estudio de Forum, el motivo principal de que un cliente acuda a un competidor es un mal servicio. La American Management Associaon asegura que el 6 0 % de ventas nuevas deben provenir de clientes antiguos, que muestran lealtad de recompra. E l consultor R. L. Desatnick seala que, por ejemplo, en la industria automotriz un cuente leal representa un ingreso de 140,000 dlares a lo largo de su vida. L a Consumer Affairs Office advierte que siete de cada diez personas pueden suspender una relacin con un proveedor basndose en el tipo de trato recibido durante el primer contacto. La ATT reporta que el nmero de 800 lneas telefnicas usadas a menudo por compaas que desean proporcionar informacin o asistencia al cliente, crece anualmente un 25 por ciento. El Technical Assistance Research Project (TARP) afirma que una compaa nunca tendr conocimiento del 9 0 % de sus cEentes insatisfechos, aunque estas personas molestas les cuenten a otras 10 sus experiencias negativas, pero que cuando los clientes insadsfechos los emplazan legalmente, su lealtad aumentar significativamente si sus demandas se resuelven en forma satisfactoria.

2 i

Capitulo 1 Inmucar,

Seccin !.' Por qu estudiar estadstica! 3

Panorama

dei

captulo

Las personas \emos a estadstica oesde perspectivas distintas, suele vrsele como algo relacionado con porcentajes, promedios, cuentas y grficas; para algunos, ia estadstica es un rea de estudio consistente en reglas v mtodos para tratar informacin; oara otros, ia estadstica es una forma de actuar y de oensar con resoecto a los sucesos mundanos aue ocurren irregularmente v aue estn gooemados por ciertas ieyes de mcertidumbre. Este captulo introduce las ideas bsicas y e! lenguaje de la estadstica.

Como consumidores de informacin estadstica y usuarios potenciales de tcnicas estadsticas, necesitamos entender las ideas bsicas v las herramientas de esta disciplina. Muchos de nosotros estamos influidos diariamente por algn aspecto de la estadstica manejada en la informacin aue obtenemos de ia radio y de la televisin, o de peridicos revistas. Por ; ejemplo, podemos leer u or que: 1. Algunos estudios sugieren que alrededor de! 50% de todos ios ahoeamientos de adolescentes y adultos estn asociados con el uso del alcohol. 2. Las familias con slo uno de los padres constituyen actualmente el 26% de todas las familias estadounidenses con nios menores de 18 aos contra sioel 3% en 1970. 3. Siete de cada diez estadounidenses no tienen facultad de decisin. 4. El predominio de ia diabetes en personas con sobrepeso es casi ei mple que en personas sin sobrepeso. 5. Ms de 3,000 compaas aseguradoras pagan arriba de 8.800 millones de dlares anuales por reclamaciones. 6. Hay un 50% de probabilidades de que e! perdedor nunca ms vuelva a competir. 7. Los nios que cepillan sus dientes cor. la pasta dentfrica marca X tienen un 35% menos caries. 8. El importe neto medio de las jubilaciones recientes para los beneficanos de la Segundad Social de 1981 a 1982 estuvo entre los 64,700 y los 68.300 dlares para matrimonios y entre los 17,000 y os 30.000 dlares para los solteros. 9. En 1960 se estim que slo ei 1% de los estudiantes del ltimo ao de bachillerato haba probado la mariguana, mientras que en 1980 se estim que el 60% lo haba hecho. 10. Algunos estudios sugieren que el sentimiento de desamparo est correlacionado con una marcada disminucin de as clulas que combaten enfermedades en vanos sistemas inmunolgicos. Estos ejemplos indican que la informacin estadstica se usa por una gran cantidad de razones. Entre ellas encontramos: I Informar al pblico, como en los ejemplos anteriores. Proporcionar comparaciones, ejemplos 2,4. 8 y 9. Explicar acciones que se han efectuado, ejempios i. 4 y 10. Influir en decisiones que han de tomarse, ejemplos 1 y 7. Justificar un reclamo o afirmacin, ejempios 1 . y 10.
7

SECCION

7.7

Por qu estudiar

estadstica?

Existen cuando menos cuatro buenas razones para estudiar estadstica, al hacerlo seremos capaces de: 1. Aprender las reglas y mtodos para tratar informacin estadstica. 2. Evaluar y cuancar la importancia de los resultados estadsticos que veamos publicados. 3. Conocer los aspectos dei pensamiento estadstico como un componente esencial de una educacin humansdca. 4. Entender mejor ei mundo real de nuestro entorno. Quiz una de las razones ms importantes para estudiar estadstica en este nivel, sea que nos permite tomar crticamente la informacin estadstica proporcionada por los medios de comunicacin, por ejemplo, consideremos las afirmaciones siguientes hechas en algunos anuncios en estos medios. Usaremos X en lugar del nombre de una marca comercial: 1. La llanta marca X trena un 35% mas rapidcrr^MaTrapidcrque qu?) 2. En un periodo de euauo aos, el rendimiento de la gasolina para el coche X aument en 50%. (50% de qu'') 3. El jabn marca X es 99.44% puro. (Puro en qu El jabn?)
1

4. Noventa por ciento de todos los coches de la marca X vendidos en los ltimos 10 aos estn todava en circulacin. (Con esta afirmacin, supondremos enneamente que los coches se vendieron en aproximadamente ei mismo nmero todos los aos, pero muchos de los autos en circulacin fueron adquindos durante los lmos tres o cuatro aos.) 5. El calmante marca X contiene el doble de calmante. (Significa eso que caima ms eficazmente el dolor que cualquier otro calmante )
11

6. Cuatro de cada cinco dentistas interrogados declararon preferir la pasta dentfricaX. Cuntos dentistas fueron interrogados? Cmo fueron escogidos'.') 7. Ninguna aspirina caima mejor el dolor que ia de marca X. '.Esta afirmacin no dice que ia marca X sea mejor que cualquier otra, slo dice que a marca X es tan buena como cualquiera otra, i i Las mujeres que usan ia marca X reportaron un 30% de aiivio curante las Dnmeras horas. Puede medirse ei aiivioen trminos de porcentaje.' Que significa esto''
1

Predecir futuros resultados, ejempio 6. Estimar cantidades desconocidas, ejemplos i y 9. Establecer una relacin o asociacin entre dos factores, eiempios 1.4 y ] 0. Como somos consumidores de informacin estadsuca. podemos usar ia

estadstica para estudiar y entender mejor muchos sucesos cambiantes que contribuirn a nuestracomprensin ael mundo. Estudiarestadstica nos permitir dar una interpretacin razonable a cada uno de los ejempios antenores; asi. ia cantidad 55% del ejemplo puede interpretarse libremente porque no conoce7

9. El calmante marca X es recomendado por mucha de ia gente ms conocedora..Ms conocedorasoore que? 'Sobre cualquier tema?

Capitulo 1 Introduccin

Seccin 1.1 iPor qu estudiar estadstica"! mos la base de la umparxin: puede ser difcil si no imposible, encontrar una pasta de dientes que permita tener 3 5 % menos caries que cualquier otra pasta de dientes cuando se prueoa bajo condiciones similares en grupos de runos semejantes e independientes, pero sera extremadamente simple encontrar un nio que use pasta de la marca X y ,ue tiene ?5 r menos canes
c

vanos

iidad: .t tipo de programa de ejercicios permitir calificar a un asegurado para -:> obtener una prima reducida?, de cunto debe se: la reduccin? y qu factores de nesgo deben descalificar a un asegurado enrolado en un programa de ejercicios para obtener una reduccin en ia pnma? Una persona con una slida formacin estadsnea es quien podr asesorar a la compaa de seguros para evaluar los mritos dei nuevo programa. EJEMPLO 1.4 Qu papel juega la dieta en las afecciones cardiacas de coronaria? Durante casi dos generaciones se ha debatido el papel de la dieta en as afecciones cardiacas de coronaria. La teora dieta-corazn afirma que la reduccin del colesterol en la sangre mediante la dieta disminuye elriesgode contraer alecciones cardiacas de coronaria: para probar parcialmente la relacin entre la reduccin del colesterol en la sangre y las afecciones cardiacas de coronaria se emprendi un estudio que utiliza el frmaco colesterarmna. medicamento reductor del colesterol. Ei estudio utiliz a 3,800 hombres de edad intermedia; todos teman niveles de colesterol en ia sangre de al menos 265 miligramos por decilitro de sangre, que los colocaban dentro del 5% de . | ! ; ; I I | i adultos estadounidenses con ms altos niveles de colesterol. y se encontr que todos estaban libres de cualquier sntoma de afecciones cardiacas de la coronaria al empezar el estudio. Mil novecientos hombres fueron asignados aleatoriamente a cada uno de los dos grupos: un grupo con tratamiento y un grupo de control. Los pamcipantes en el grupo con tratamiento recibieron dosis diarias de colestiramina y una dieta para reducir el colesterol, durante 7.4 aos en promedio, mientras que los participantes en el grupo de control no recibieron colestiramina, sino un placebo indistinguible de sta. E! estudio concluy que el grupo con frmaco tuvo menos ataques al corazn (155 personas contra 187 del grupo de control) y menos muertes por ataques al corazn (30 personas contra 38). Se juzg que la diferencia entre los dos grupos es estadsticamente significanva; la probabilidad no se debe slo'a factores de suerte, los hallazgos apoyan la creencia de que la reduccin de colesterol en la sangre usando colestiramina en hombres de edad intermedia con niveles de colesterol superiores a 265 miligramos, es eficaz para reducir las afecciones cardiacas de coronaria/ EsbuenaianuevaCocaCola?Apnncipiosde 1985. la compaa Coca Cola anunci i ;
;

que algn otro nio, por ejemplo uno que no se los lava. Como consumidores cotidianos de informacin estadstica, debemos estar conscientes de los usos y abusos en ei manejo de dicha informacin. En este curso aprenderemos FIGURA 1.1 cmo puede obtenerse cada uno de los nmeros mencionados en los ejemplos de esta seccin. Como consumidores de informacin estadstica encontramos con frecuencia grficas que la proporcionan. Por ejemplo, los padres han gastado aproximadamente 142.700 dlares en un hijo cuando ste llega a los 17 aos. La grfica de pastel de la figura 1.1 indica cmo se ha distribuido ese dinero": podemos ver de un vistazo que de! presupuesto total, los gastos debidos a comida, vivienda y transporte tienen montos ms o menos iguales y los hechos en diversiones, atencin mdica y varios, tambin tienen montos casi iguales. Como usuarios potenciales de los mtodos y tcnicas estadsticos, necesitamos estar familiarizados con el quehacer de la investigacin estadstica bsica, con la descripcin de los resultados de nuestra bsqueda cientfica, con la toma de decisiones basadas en sta y con la estimacin de cantidades desconocidas. Los ejemplos 1.1.1.2 y 1.3 ilustrarn cmo puede usarse la estadstica en general, y los ejemplos 1.4, 1.5 y 1.6 mostrarn aplicaciones de la estadstica que responden a cuestiones de inters general.

Cmo se gastan 142,700 dlares para mentener a un nio hasta los 17 aos de edad

EJEMPLO

1.1

; En comercial de televisin se afuma que una marca de un producto es supenor a todas las otras marcas: si la afirmacin se basa en una encuesta cientfica se estar usando para educar a los televidentes; pero si dudamos de la afirmacin, en un intento : para desmentirla podemos recopilar datos relevantes sobre todas las marcas del ; producto en cuestin, analizar los resultados usando procedimientos estadsticos : apropiados y tomar una decisin respecto a a afirmacin del anuncio. Con frecuencia ' las afirmaciones de los anuncios se basan en informacin insuficiente o en anlisis defectuosos de la misma. EJEMPLO 1.5

que estaba cambiando en secreto la frmula para fabncar esa bebida, una frmula que haba usado desde 1886; luego de que la nueva Coca Cola fue lanzada al mercado. los miembros de Consumer Reports intentaron responder preguntas como stas: a qu sabe realmente la nueva Coca Cola?, es mejor que la antigua? y cmo se compara con la Pepsi Cola? El equipo de invesugacin realiz tres pruebas de sabor a ciegas con 95 de sus miembros y 532 copas de plstico. Los resultados del estudio no mostraron diferencia en los gustos entre Pepsi Cola y la nueva Coca Cola; ambos productos fueron preferidos sobre la vieja Coca Cola por un margen de 2 a 1. Se encontr que las tres frmulas consistan en cerca de 99% de agua carbonatada y azcar, cada una con entre 6.14% y 6.22% de fructosa y entre 4.54% y 4 7 3 % de dextrosa azcar de maz." Tradicin y otros factores humanos diversos pueden afectar as preferencias de los consumidores; aunque el experimento parece indicar que la nueva Coca Cola es superior en sabor a a anngua. ia Coca Cola clsica esta desplazando a ia nueva en muchas regiones'eEstadoyUniosv-

EJEMPLO

1.2

Suponga que queremos determinar quin es el mejor maestro del Excel College. Cmo debemos proceder para hacerlo'.' Podemos preguntar a los estudiantes de Excel quien es ei mejor maestro, anazar los resultados y llegar a una conclusin. Debemos preguntara cada estudiante?, cmo debe conducirse laencuesta?. como se analizar la informacin? y de que manen se determinara quin es ei mejor maestro' Uno de los prooositos centrales de a estadstica es dar respuestas a estas y a otras preguntas.

EJEMPLO

1.3

Una compaa de seguros de vida esta pensando onecer primas reducicas a los aseguraoos que se enroien en un programa de ejercicios. Para ayudar a ia compaa ae seguros a tomar ia decisin, se recolectar y analizara informacin sobre mona-

EJEMPLO

1.6

Daa ei humo del tabaco a ios no fumadores? Se sabe desde hace mucho que a ios fumadores es hace dao fumar. Para determinar si ei humo dei tabaco es daino para los no fumadores, en ia Universidad de California en San Diego se realizo un estudio

Capitulo Introduccin

tecin 1.2 El lenguaje dla estdisiica 7

-asado sn pruebas sobre funciones pulmonares: estas pruebas fueron realizadas en .".<',0no fumadores de mediana edad, cuyo entorno estaba relativamente libre de humo de '.abaco, y en otro grupo de 200 no fumadores de mediana edad que haban estado expuestos ruunanamente ai humo del tabaco durante 20 aos o mas. Ambos grupos se compararon con fumadores que no aspiran el humo, fumadores geros. fumadores moderados y fumadores empedernidos: 'os investigadores concluyeron que los 'ios grupos de no fumadores no diferan significativamente en los resultados de pruebas pulmonares que medan el dao de la capacidad vital y a razn ae expiracin inicial, sin embargo, reportaron una diferencia estadsticamente significativa entre ios dos grupos en la cantidad de pequeas vas pulmonares daadas: los no fumadores expuestos con pasividad al humo en su trabajo tuvieron puntajes que se juzgaron indicativos de enfermedades pulmonares, pero sus puntajes fueron similares a los de los fumadores ligeros, uno a diez cigarros por da. y a los de os fumadores que no aspiran el humo. El estudio sugiere que la exposicin crnica al humo de! tabaco en el trabajo es daina para los no fumadores y que reduce er. mucho las funciones de las vas pulmonares pequeas."'

Los investigadores calculan que '.oda a ramiiia de computador, personales de la marca I B M controla alrededor dei de ias mucrocomput-doras vendidas en Estados Unidos. El numero 40% os un ejemplo de un estadstico.

Una diferencia bsica en estadstica es la que existe entre una ^oblacin y una muestra. Una poblacin es ei total de la informacin o de os obietos de nteres para un estadstico en una investigacin particular.

Una muestra es cualquier subconjunto de una poblacin.

La coleccin d promedios por grado de os estudiantes iPPG i en un plantel de e bachillerato local

D e e servir como poblacin estadstica, v cualquier subcoleccin, ud

digamos los PPG de los estudiantes en una clase de matemticas 101. puede servir GRUPO DE EJERCIOOS 7.7 4. En ms de un milln de millas de prueba, nuestros automviles han tenido un promedio de reparaciones menor al 1 por ciento. 5. Noventa y ocho por ciento de los mdicos prescriben el almante-enconrradaen -la-marca- X6. El alimento contenido en nuestra marca ayuda a reducir los niveles de coiesterol de la sangre en los adultos. 7. Los productos alimenticios bajos en grasas ayudan a reducir los ataques al corazn. 8. Los alimentos con alto contenido de fibra disminuyen las posibilidades de tener cncer de colon. Un fabricante de calentadores de petrleo quiere determinar si los consumidores estn satisfechos con la hechura de sus aparatos; con ese propsito localiza a 5.000 de sus 200,000 clientes y les pregunta: '"est satisfecho con la hechura del calentador que compr' " Identificar la poblacin y ia muestra
1

como muestra de esa poblacin. Para ejemplo dei Excel College dado en la seccin 1.1. la poblacin consiste en las respuestas de todo el estudiantado a la pregunta: "quin es el mejor maestro " Como
9

Para cada una de las afirmaciones siguientes: (a) establezca la conclusin a la que, en su opinin, llega un lector de la afirmacin, y (b) liste las preguntas que considera deben hacerse sobre la afirmacin para evitar llegar a una conclusin falsa. 1. Entre los 35 y los 65 aos de edad, siete de cada diez trabajadores sufrirn una lesin que durar tres meses o ms. 2. A la edad de 32 aos, una lesin que dure tres meses o ms es seis veces ms probable que la muerte. 3. El personal de nuestro autoservicio tiene 100 aos de experiencia.

sera extremadamente difcil y llevara mucho tiempo preguntar a cada estudiante, en vez de ello podemos preguntar a un subconjunto representativo del plantel: este subconjunto representauvo de la poblacin constituye una muestra, a informacin de la muestra puede usarse para estimar quin es el mejor maestro del Excel College.

para este caso. Solucin: La poblacin es la coleccin hipottica de respuestas de los

200,000 clientes: no hemos preguntado a toda la poblacin pero esperamos aprender algo mediante la muestra. La muestra la constituyen las 5.000 SECCIN 7.2 El lenguaje de la estadstica respuestas dadas por los clientes interrogados. Sin embargo, una poblacin estadsuca no necesita > r reai. Por eiemplo. si un e investigador esta interesado en los posibles precios de venta de automviles de 1995. ia informacin deseada no existe, pero aun cuando no este disponible, ios precios de La estadstica, en smgujar. es a ciencia Ue recolectar, organizar, analizar e interpretar informacin: as estadsticas, en piurai. son nmeros obtenidos ce un conjunto o coleccin de informaciones. venta de automviles d varios aos pasados, unto con a informacin relativa ai e ndice macionano. pueden usarse para predecir ios precios finaies ce ios automviles en 995.

Como todas ias ciencias, la estadstica tiene su lenguaje propio. Comencemos examinando ei termino estadstica que nene dos significados.

Como ciencia, ia estadstica se encarga de describir ios resultados de una investigacin cientfica, ae tomar decisiones oasaaas en dicha investigacin y de estimar cantidades desconocidas. Las caractersticas numricas usadas como estimaciones sirven como ejempio de un estadstico.

Un valor usado., en.estadstica,puede constituir, un estadstico o un parmetro, depende de ia extensin de ia informacin. Examinaremos las definiciones siguientes en ei ejemplo !. 1 i y despus mostraremos sus usos en ias aniicaeiones 1.2 v i.5.

8 Capitulo 1 Introduccin GRUPO DE EJERCICIOS 1.2

Seccin 1.2 El lenguaje de a estadstica

Un estadstico es caaiquier carectcrisca numrica ce urr; muestre. Un oarmetro es cuaiauier caracterisoca numrica ae una pooiacion.

1 . En un memo por reducir ei nmero de accidentes en carretera, el estado de Maryiand ha llevado a cabo una campaa que se propone reducir ei nmero de corredores ) de conductores que sufren los efectos del alcohol. Un investigador que est interesado en determinar hasta qu punto el alcohol es un factor que contribuye a las muertes en carretera en el estado de Maryiand. obtuvo informacin del mes de junio de cinco de las 22 patrullas de caminos del estado. a: Cul es la poblacin de inters para el investigador'' b) Describa la muestra. ci Cmo puede usar el investigador ia informacin muestrai para estimar hasta qu punto el alcohol es un factor que contribuye a las muertes en carretera dentro dei estado de Maryiand? . El probiema mdico del sndrome de inmunoderciencia adquirida (SIDA), ha creado altos niveles de ansiedad y preocupacin entre el pblico. Los puntajes revelan que 71 % de todos los casos de SIDA en Estados Unidos se han dado enue hombres homosexuales o bisexuales, y que alrededor del 18% han ocurrido entre los usuanos de drogas intravenosas; mucha gente se pregunta sobre la posibilidad de contraer el SIDA a travs de una transfusin sangunea. Aunque la sangre para transfusin se analiza respecto al SIDA, un investigador mdico quiere estudiar los registros clnicos de 50 hospitales localizados en ciudades de todo Estados Unidos para determinar la cantidad de casos de SIDA que se ha comprobado se deben a transfusin sangunea, a) Cul es la poblacin de inters para ei investigador? b i Describa la muestra. Un doctor afirm recientemente que una cucharada diana de aceite de hgado de bacalao puede curar la artritis y un investigador est interesado en probar ia afirmacin. Se usan dos grupos, cada uno con 50% de pacientes artrticos, y slo a ios pacientes de uno de ios grupos se les administra una cuenarada diana de aceite de hgado de bacalao durante un ao. despus aetcnai rodos ios sujetos de ambos grupos - examinaran respecto a ios sntomas de 'artritis, e Cules son ias dos poblaciones de inters? b i Desenca as eos muestras. i. Desde 1971 hasta principios de 985. ia Nauonal Hishway Trafile Saery Association i'NHTSAi ha atribuido al menos 20? muertes a vehculos fabricados oor la Ford Motor Company que inesperadamente se echan para atrs y sobre a gente; tambin se han reportado 4.597 demandas a resultas de movimientos inesperados de reversa en ios vehculos Ford: hacia junio de 1980, la NHTSA haba recibido ms de 23,000 repones de coches de la Ford que tenan fallas en ei engranaje o en el arranque. El gobierno, en lugar de emiar una orden respecto a los vehculos afectados, negoci un acuerdo con la compaa Ford en un intento de prevenir futuras demandas o muertes. La empresa convino en mandar avisos junto con calcomanas preventivas para colocarse en el tablero de los vehculos, a los propietarios de los vehculos afectados, unos 23 millones de coches y camiones; a mediados de 1981. el Center for Auto Safety verific 700 vehculos marca Ford en cuatro ciudades para asegurarse de que las calcomanas preventivas haban sido pegadas en los tableros, pero slo 7% de los carros tenan entonces adherida dicha calcomana, a) Identifique la poblacin de nteres para el Center for Auto Safety en este ejemplo, bl Describa la muestra. c) Dira usted que la campaa de la calcomana tuvo xito en reducir movimientos de reversa inesperados en los vehculos Ford? Explique. d) Identifique una poblacin de inters para la NHTSA. Se realiz un estudio de seis meses para determinar si el estrs y el estado de nimo estn ligados a la presencia de ciertas clulas del sistema inmunolgico; en l participaron 36 personas con distintos niveles de estrs y dicho estudio requera examinar muestras de sangre, tomadas a intervalos regulares, respecto de cambios en el numero de clulas auxiliares y de npo T que regulan ias funciones inmunolgicas. Los resultados revelaron que ei aumento en ios raveies de estrs pareca estar directamente relacionado con una disminucin de clulas tipo T y ataques de herpes, a i Identifique a la poblacin ue nieres. bi Descnba a muestra.

EJEMPLO

1.11

En un estudio realizado en :989 por el Food Marketing Institutc >obre modas de compras en supermercados, una muestra de respuesta? Je compradores revel que ei promedio de consumo tarruiiarde alimentos era de 74 dlares; el valor de 74 dlares es un ejemplo de un estadstico; ei estudio revel tambin que por cada minuto adicional de permanencia en ia tienda sobre ei promedio de 80 a 90 minutos por semana, hay un gasto adicional de l .89 dlares; las cifras 80,90 y ] .89 dlares sor, tambin ejemplos de estadsticos. Ei estudio se realiz para obtener informacin soore la poblacin de todos los supermercados, sobre el promedio de consumo de aumentos en todos los consumidores y el promedio de tiempo semanal dedicado alas compras por todos ellos, adems dei monto adicional gastado por cada minuto extra dedicado a las compras sobre el promedio por consumidor, todos son ejemplos de parmetros desconocidos. Si un estudio de todos los clientes de supermercados revela que el promedio familiar es de 2.2 viajes al establecimiento cada semana y las respuestas de todos los clientes de supermercados comprenden a toda la poblacin, entonces ei valor 2.3 es un ejemplo de un parmetro.

.t^KtnTiarirpe&aei^

en un cierto

colegio, un administrador tom una muestra de 200 estudiantes y determin la proporcin de estudiantes en la muestra que turnan cigarrillos. Identifique el parmetro y el estadstico. Solucin: El parmetro es la proporcin de todos los estudiantes en el

colegio que el administrador determin que fuman cigarrillos, mientras que el estadstico es la proporcin de estudiantes en la muestra de 200 que s fuman cigarrillos. APLICACION 1.3

Una propina es la cantidad de dinero que sobre el lotai del consumo se otorga por un servicio satisfactorio. A los asistentes a 1,500 centros nocturnos se les dio un cuestionario confidencial preguntndoles cunta propina haban dejado; los clculos posteriores demostraron que la propina promedio fue de alrededor de 1 5 % sobre ei total del consumo. Es parmetro o estadstico 15%? Explique su respuesta. Solucin: Si slo estn en estudio ios 1,500 establecimientos, entonces a

informacin sobre as propinas de esos establecimientos constituye ia poblacin y ! 5 % oei consumo es ei parmetro, sin embargo, si ei dato de las propinas de ios i .500 establee'.miemos forma una muestra de una poblacin mayor de datos de nronmas. entonces 1 5 % dei consumo es un estadstico. I

10 i

Capitulo 1 Introducn

Seccin 1.3 Estadstica descriptiva e inrerencul * 11

6. Un censo comnieto dei piante! de estudiantes de una universidad revel que el nmero de estudiamos . 5 0 aos de edad o mayores era ce 515. Este nmero :1c es un estadsnco o un parmetro? -. Se hizo una encuesta telefnica a 100 familias de una

comunicad a fin de detectar ciudadanos intersanos en sacar mayores 'impuestos para mejorar a calidac ae :s educacin oubca. La encuesta revel que un ? % si oaearia mavores impuestos para lograr ai :m. ; .
b 0

nviUn completa que necesitamos para llegar a ia verdad absoluta sobre a!t'.r: evento total. Las decisiones e inferencias se basan en informacin limitada e incompleta: ios mtodos de la estadstica inferencial y el conocimiento obtenido al usarlos, nos permiten utilizar informacin disponible limitada para entender y tratar con las incertidumbres de este mundo cambiante y azaroso. Por ejemplo, podemos predecir el trigo que se producir el ao entrante si nos basamos en las producciones de los aos prximos pasados: estimar el crecimiento del ingreso promedio de un periodo de cinco aos con base en el conocimiento del promedio de ingresos en el pasado y de otros estadsticos descriptivos; tambin podramos tratar de predecir el total de puntos alcanzados durante la temporada por un equipo particular de ftbol, si conocemos los ya obtenidos en los primeros siete juegos; con estadstica inferencial establecemos cmo sern las cosas probablemente o a veces slo cmo pueden ser. Usando mtodos de probabilidad, intentaremos medir el grado de incertidumbre asociado con una inferencia.

es

un estadstico o un parmetro'

SECCIN 1.3

Estadstica descriptiva

e inferencial

Los procedimientos y anlisis que aparecen en estadstica caen en dos categoras generales, descriptiva e inferencia!, dependiendo del proposito de! estudio. La estadstica descriptiva comprende aquellos mtodos usados para organizar y describir la informacin recabada. Estos mtodos se usan para analizar la informacin y desplegarla en forma grfica tal. que permita interpretaciones con significado. Los mtodos de ia estadstica descriptiva nos ayudan a describir el mundo en torno nuestro. Usamos estadstica descriptiva cuando recolectamos informacin: como la produccin promedio de tngo por acre en una cierta regin agrcola, el nmero de personas con distintos niveles de ingresos, o el promedio de puntos obtenidos por un equipo de ftbol americano durante el primer cuarto _ de juego. Esperamos saber como son las cosas mediante la estadstica descnptiva. EJEMPLO 1.13

\s situaciones siguientes, que son paralelas a las situaciones descriptivas daas en ! el ejemplo 1.12, requieren estadsuca inferencial. i ; 1. Un jugador de boliche quiere estimar la oportunidad que uene de ganar un torneo prximo con base en su promedio de la temporada actual y en los promedios de sus futuros contnncantes. \. Con base en una encuesta de opinin, a un poltico le gustara calcular la oportunidad de reelegirse en las prximas elecciones. \. Con apoyo en la variacin de sus calificaciones de exmenes en la primera cuarta pane del curso de clculo, Mara desea predecir la que tendr en las calificaciones de exmenes de la segunda cuarta pane del curso de clculo. 4. El seor Smith desea calcular el monto semanal promedio que gastar en
1

EJEMPLO

1.12

, Las situaciones siguientes utilizan estadstica descriptiva, 1. Un jugador de boliche quiere conocer su promedio de anotaciones en los 1 pasados 12 juegos. 2. Una mujer dedicada a la poltica desea saber el porcentaje exacto de votos que obtuvo en la ltima eleccin. 3. Mara quiere describir la vanacin que hay en las cinco calificaciones de exmenes que comprenden la pnmera cuarta pane de su curso de clculo. 4. Al seor Smith le interesa determinar el promedio semanal total de sus gastos en comestibles durante ios ltimos tres meses. GRUPO DE EJERCICIGS 1.3

comestibles el ao prximo, tomando como base sus facturas de comestibles del ltimo ao.

1. El seor Jackson, candidato a alcalde de un pueblo pequeo, quiere determinar si debe hacer una campaa ms fuerte contra su oponente: para ello entrevistar a 500 de ios i.500 votantes registrados. Si los resultados indican que tiene 25% ms votos que su oponente, no intensificar sus esfuerzos de campaa contra su nval. as Identifique "poblacin. 3: ,Cu es la muestra?
L

di Ubique un parmetro. e) Qu hara el seor Jackson si tuviera el 65% de os votos de la muestra? 2. D un ejemplo no mencionado en e! texto de cada uno de ios siguientes conceptos: ai poblacin bi muestra c i estadsnco di parmetro

Por otro lado, la estadstica inferenciai involucra teora ue probabilidad. La estadstica inferencial comprende aqueilos mtodos y tcnicas usados Dar hacer eenerauzaciones. predicciones o estimaciones soore poblaciones a parar de una muestra. La habilidad para hacer generalizaciones sobre la poblacin a partir de una muestra es un aspecto importante en estadstica. Rara vez tenemos ia nor-

c i Seale un estadstico.

12 i

Captulo 1 Introduccin

Seccin;. Inferencias v deducciones

13

3. Un agente independiente de mercado realiz un estudio de precios de aumentos en cuatro de aiez establecimientos expendedores de comestibles en una ciudad pequea. Los precios que siguen corresponden a bolsas de azcar de cinco libras: ! .25 dlares. 1.18 dlares. 1.20 dlares y 1.30 dlares; el agente hizo ias cuatro .ulrrnaciones que anotamos abajo. Cules se obtuvieron usando estadstica inferencial y cules con estadstica descriptiva? Explique sus respuestas, ai El precio ms alto cobrado en el pueblo es i .30 dlares. b) Dos nendas cobran ms de i .20 dlares por una bolsa de 5 libras de azcar, c.) La cuarta pane de as nendas cobran ms de 0.25 dlares por una libra de azcar, d) Los precios en todos los mercados para una bolsa de 5 libras de azcar varan entre 1.18 y 1.30 dlares. 4. Un anuncio comercial afirma: "cuatro de cada cinco mdicos recomiendan el preparado A". Creeusted que esta conclusin proviene de una muestra o de una poblacin? Explique. 5. Se estableci que el costo promedio de los textos escolares en un colegio pequeo durante el TBroseftStre" fue de 135 dlares, conbase en una inscripcin de 1,200 estudiantes. Como un trabajo de clase en el colegio, un

grupo de estadstica encuesto i 25 estudiantes pitra determinare! promedio dei el ltimo semestre dlares. Idennfique: ai a poblacin. b.i ia muestra. ci ios parmetros. d) dos estadsticos y z) qu podra concluir ei giupo de estadstica si e! costo promedio de un libro para ia muestra de 25 estudiantes fuera de 400 dlares ? 6. Clasifique ia naturaleza de cada una de las afirmaciones siguientes como inferencial o descriptiva; tambin diga cules son ias hiptesis en que basa su respuesta. a) Una familia de cinco o ms miembros tiene un gasto semanal promedio en compras de comestibles de 109 dlares. b) El 6 6 % de todas las compras de comestibles no son planeadas. c) En 1978 hubo un total de 11.767 artculos comestibles comprados. d) Cada ao sale del mercado un 8 0 % de artculos comestibles recientes. e) El nmero de artculos comestibles diferentes existentes en un establecimiento comn en 1989 era de 26.430. EJEMPLO 1.15 ce un Ubre de texto e.i se concluy que fue de 152.25 EJEMPLO 1.14

Cuando hacemos una generalizacin sobre un parmetro poblacional basndonos en la iniUnnacin derivada de una muestra, estamos usando induccin.

Si despus de probar un cierto nmero ce uvas de un piaron legamos a la generalizacin de que todas as uvas contenidas ah estn agrias, estamos usando un razonamiento inductivo; la generalizacin de que todas ias uvas dei platn estn agnas es un ejempio de inferencia.

Una inferencia es una generalizacin obtenida mediante induccin.

En estadstica inferencial. las inferencias se hacen tpicamente sobre un parmetro poblacional empleando slo una muestra especfica, en lugar de muchas muestras como uno esperara por el uso de la induccin. Cuando se hace esto, debe tenerse gran cuidado de asegurarse que ia muestra sea verdaderamente representativa de la aplicacin. A l adjudicar propiedades de una poblacin a las muestras, estamos deduciendo; las deducciones requerirn probabilidad, el estudio de la incertidumbre. Estudiaremos probabilidad en los captulos del 5 al 7 y estadstica inferencial del 8 al 15.

Deduccin y probabilidad. Supongamos que 1,000 automviles son de fabricacin reciente, que 5% de ellos tienen un componente direccionai defectuoso y que un comerciante local nene una muestra de diez de esos coches. Como una aplicacin de la probabilidad, podemos intentar determinar la posibilidad de que al menos dos de esos diez automviles tengan componentes defectuosos en la direccin. Como la . muestra es un subconjunto de la poblacin, podramos esperar que 5% represente la posibilidad de que un cierto coche de la muestra est defectuoso. En el capitulo 5 aprenderemos a determinar la probabilidad de que al menos dos de las diez unidades : tengan componentes defectuosos.

SECCION

1.4

Inferencias

deducciones

El estudio de la estadstica requiere tanto induccin como deduccin t vase FIGURA 1.2 la figura 1.2). EJEMPLO
Muestra Estadstica inferencial (induccin) Probabilidad ideauccioni Poblacin

Induccin versus deduccin

1.16

Estadstica inferencial. Suponga que 1.000 autos son de fabricacin reciente y que no se sabe cuntos Denen defectos en la direccin. Paraesnmar el porcentaje de autos con sistema direccionai defectuoso en esta poblacin, inspeccionaremos una muestra de diez unidades. Si se encuentra que dos de ellas tienen sistema direccionai defectuoso, podremos inferir usando la induccin que 20%. es decir 200 de ios 1,000 automviles, tienen fallas en el sistema direccionai; ia proporcin de sistemas direccionaies defectuosos en la muestra es un ejemplo de u estadsnco: ^u valor e n s

Muestra

0.20. Ei porcentaje de automviles, en esta poblacin, que tienen ei sistema direccionai defectuoso es un ejemplo de un parmetro. En ei captulo 9 aprenderemos a usar a estadstica reara esomar parmetros desconocidos.

La induccin consiste en razonar desee ios ejempios especficos at caso general. La deduccin consiste en razonar oesde ei caso general hasta ios ejemplos espeeeos

La confiabilidad de una inferencia es un aspecto fundamental de ia estadstica inferencial. Una inferencia es conabie si se puede depender de ella con una cierta segundad, yaque no puede describirse con exactitud una

Seccin 1.5 El papel de li computadora en ia estadstica i 15

caracterstica de una poblacin si la inferencia no es c.">able. La leona de la probabilidad debe usarse ai determinar la conabilidac de una inferencia. Estudiaremos este tema en los captulos 9 y 10. y ia probabilidad en los captulos 5 al 7.

entrar en e! sistema que responde ahora con ei smbolo del programa MTB >. Dar iniormar que est esperando otra orden de! usuano. quien escribir ia orden MEAN C' y oprimir en seguida la ecia de entrada para pedir ei promedio de ios nmeros en la columna encuetada con CI: la computadora responde inmediatamente con MEAN = 40.800 y otro smbolo MTB >. Note que en este ejemplo las instrucciones I SET Cij y i M E A N C l son

El papel de a computadora

en k estadstica

las rdenes dadas por e! usuano. A l final de cada orden el usuario debe oprimir la tecla de entrada, enter o return para que ingresen las rdenes en el sistema de la computadora; este modo de comunicacin con el sistema de la computadora es la razn de que a MINTTAB se le llame sistema operado mediante rdenes, en oposicin a un sistema operado por men, donde la seleccin en el men da lugar a una accin particular de la computadora.

Con la introduccin de las microcomputadoras. ei trabajo pesado de clculos asociado con un gran nmero de datos y con anlisis complicados, ha sido relegado a ias computadoras. Como las manipulaciones tediosas de os datos se hacen con la computadora, el usuario puede concentrarse en ei anlisis de los resultados. Hay muchos programas computacionales amigables disponibles en el mercado que permiten a los estudiantes y a los especialistas realizar los clculos estadsticos tediosos con poca o ninguna dificultad. Algunos de los programas ms usuales incluyen MINTTAB. SPSSx, SAS. B M D P y SYSTAT. Todos permiten al usuario comunicarse con el sistema de la computadora mediante comandos sencillos. En este texto hemos escogido usar MINTTAB para ilustrar las aplicaciones estadsticas que utilizan computadora. Este programa, desarrollado originalmente en la Pennsylvania State University como una herramieriia para ensear estadstica, hoy en di? se usa omni'.a^.Ca.t t ^ i t o en la enseanza ccmo-en-ut ' W' ~ii-:>h
m n

MTB

>SET C l

DATA > 34 68 39 21 42 DATA > END MTB > MEAN C l MEAN = 40.800 MTB>

en todo Estados Unidos; puede instalarse en

Las computadoras son herramientas muy eficaces cuando se necesita procesar una gran cantidad de datos, realizar alguna tarean forma repetitiva o cuando los resultados deben analizarse rpida y cuidadosamente. Los problemas que se encuentran en este libro utilizarn conjuntos de datos relativamente pequeos; pero aun as algunos de los clculos pueden resultar tediosos en una calculadora; es deseable que se entiendan los clculos manuales hechos en el texto y realizar cada una de sus etapas en forma sucesiva al resolver muchos de los ejercicios. Una vez hecho esto, usted comprender los usos y las limitaciones de cada procedimiento. Tambin ser capaz de entender e interpretar los resultados que ellos proporcionan; si usted tiene acceso a una computadora, puede usar un paquete estadstico, como NNIT.AB. para efectuar procedimientos similares en el futuro. Muchos de los conjuntos de datos, en las aplicaciones prcticas de este

umaades centrales de procesamiento, as como en mim y microcomputadoras, ya que ofrece una gran capacidad de clculo tanto para el estuoiante como para el investigador de la estadstica. MJNITAB es un programa interactivo operado mediante ordenes; una vez cargado en la computadora, el usuario se comunica con el sistema y da ordenes que son ejecutadas de inmediato. Es muy fcil de usar. La aparicin del smbolo MTB > en la pantalla del monitor le informa al usuario que el sistema est listo para aceptar una orden de un dispositivo de entrada, como el teclado. Despus de que los datos se han introducido en ei programa, ei usuario da una orden oprimiendo la tecla de entrada y el sistema proporciona inmediatamente el valor deseado.

La pantalla 1.1 muestra las rdenes de MlNlTAB y las correspondientes respuestas usadas para determinar la media i promedio i de

texto, se usan para mostrar en pantalla el uso de M I N I T A B y cumpiir al menos cinco propsitos: 1. ilustrar la sencillez del uso de M1NIT.AB. 2. Visualizar las rdenes que debe proporcionar ei usuano para lograr los resuitados estadsticos deseados. 3. Conocer ei formato y a notacin usados en ias resouestas de a computadora. ~. Saber ia magnitud de a potencia de calcuio estadstico disponible con MINiTAB y con otros paquetes estadsticos. 5. Ensear ei uso de MINTTAB en ei desarrollo de algunas tareas estadsucas.

las curas 34.68.39.31

y 43. Despus

del smbolo del sistema MYB >. ei usuario escribe 5ET Cl y presiona ia tecla ue entrada ta computadora no se entera de la orden sino hasta que ia tea; de entrada es opnmidai. Esta accin informa a MlNlTAB que debe crear una columna, identificada en la memoria como C!. que contendr Sos datos. Ei sistema responder con ei

simDoio DATA">: aqu el usuario escribe ias

curas: 54. oS. 59, 2! y 42. . ocnme

ia tecla de entrada oara registrarlos en la memoria del sistema, conde se usan espacios en vez de comas para separar os nmeros; a comoutaoora responde otra vez con ei simooio DATA > y como no habr mas informacin, ei usuario escr.be LVD para

^& i

Capitulo ! introduccin

REPASO

')EL

CAPITULO

TRMINOS IMPORTANTES

Los trminos siguientes, pertenecenies al captulo, se han mezclado para proporcionar una prctica ms eficaz. Para cada uno d una definicin con sos propias palabras; despus verifique sus respuestas con ias proporcionadas en el texto.
or

2
DESCRIPCION 2.7 Datos: los bloques de a construccin 2.2 Organizacin estadstica de da> > > grfica > > rae tos mediante afa/as 2.3 Representacin de datos

Estadstica o r g a n i z a c i n de

descriptiva: datos

en

estimar estadstica descriptiva estadstica inferencial estadstica confiabilidac

sistema operado por induccin poblacin estadstica parmetro

rdenes

deduccin inferencia muestra MINITAB

OBJETIVOS

DEL

CAPITULO

En este captulo estudiaremos; Datos. Dos tipos generales de datos. Datos clasificados segn el upo de escala de medicin usado. Cmo organizar y resumir los datos mediante abas. Cmo mostrar los datos mediante distintos tipos de grficas. ^*?sw^^-w!

I I I I C B S B ^

e realiz un estudio dividido en dos partes con dos muestras a fin de medir 1,300 usuarios de una vasta regin que inclua Estados Unidos. Canad y Gran Bretaa; la otra muestra const de cerca de 900 personas prestadoras de servicios representantes de nueve organizaciones diferentes. L a primera parte de los cuestionarios del estudio se construy sobre 17 aspectos del servicio al cliente y los entrevistados se refirieron a cada aspecto en dos niveles: importancia y pericia. Los niveles de importancia preguntaban a los entrevistados: "Qu tan importante considera usted que es esta dimensin para un servicio eficiente al cliente?" Las respuestas posibles iban desde 5, extremadamente importantes, hasta uno, no importante. L a encuesta sobre pericia preguntaba a los entrevistados: "Qu tan bien cree usted que el personal de prestacin de servicios al cliente aprovecha este aspecto cuando interacta?" En donde las respuestas iban desde 5, siempre lo aprovechan bien, hasta uno, nunca lo aprovechan. L a segunda parte del estudio se dise para medir el impacto del servicio al cliente sobre la decisin de los consumidores de repetir e! negocio; una pregunta era: "Cunto influye un buen servicio en su decisin de volver a tratar con esta organizacin?" En la escala de cinco puntos, las respuestas iban desde 5, tiene un gran efecto, hasta uno, poco o ningn efecto. Una segunda pregunta a los entrevistados era: "Qu tan seguido comenta usted con otras personas si recibi un servicio a clientes excelente o malo?" Las categoras de respuestas fueron "nunca", "ocasionalmente" y "con regularidad". Los resultados indicaron que el sentir de ios cuentes sobre la calidad del servicio difiere del sentir de los prestadores de servicios. La tabla 2.1 lista los puntajes medios delssntii- dt losclkntes-y de^prnonai de servicios al cuente para 5 de ios 17 aspectos del servicio al cliente; las figuras 2.1 y 2.2 muestran el impacto del servicio al cliente en los negocios. En este captulo, conoceremos distintas clases de datos y como organizados y presentarlos usando tablas y tambin grficas, como aqu.

18 Estadstica aescripth-a: organizador oe aos

Seccin 11 Datos: los bloques de construccin de a estadstica

19

TABLA 2.1 Puntajes de clientes y personal de prestacin | de servicios


.Aspecto Comunicacin Sensibilidad del cliente Capacidad de decisin Conocimiento del trabajo Motivacin para servir a ios clientes

Muestra de clientes

Muestra de^stadores j de se ;':. _'


5

EJEMPLO

2.1

Ejemplos de datos cuanmavivos son ei peso dado er. los. ia edad en aos, ia iongiruc en centmetros, el voiumen en metros cbicos, el precie en pesos. Los datos cualitativos representan categora atributo -cus -jueden clasifi>

Importancia

4.05 i$2 3.S4 4.10 3.97

Provecho

mponancia

2.95

4.55 -.38 4.34 4.54 4.27

Pxveeho carse sesn un cnteno o cualidad. Ejempios de datos cualitativos son ei sexo: hombre, muier: e! coior: roio. verde, azul, la religin: catlica, protjame, juda: ei upo ae sangre: A. 8. AB. 0: ia marca favorita de coche: Ford. Chevrolet; o una marca de comoutadora: IBM. Kavprc

2.67 2.96 2"?

'

3.53 3 56 3.32 EJEMPLO.

| FIGURA 2.1 I Efectos de un buen serj vicio Muestra de contacto personal con clientes

Gran efecto

moderado

Efecto

Poco 0 ningn efecto

Zenith. Compaq. Los datos consistentes en nmeros se pueden clasificar en trminos cuantitativos o cualitativos, dependiendo de cmo se usen. Si se usan como una etiqueta para propsitos de identificacin, son cualitativos; en otro caso, son cuantitativos vase el ejemplo 2.3); sin embargo, algunas mediciones pueden hacerse mediante escalas cuantitativas o cualitativas, como en el ejemplo 2.4. EJEMPLO 2.3 Si un nmero de sene de un radio se usa para identificar e! nmero de radios fabricados hasta ese momento, ser una medida cuantitativa, pero si se usa sio para propsitos de identificacin, es un elemento de informacin cualitativa. EJEMPLO 2.4 Si ia estatura de un individuo se mide en pies y pulgadas, entonces la informacin es cuantitativa: pero si se mide como bajo, medio o ano. es cualitativa Ademas, la estatura puede medirse usando datos cuantitativos, pies \, pero representarse por datos cualitativos, bajo, medio o alto. Los datos cuantitativos pueden clasificarse como discretos o continuos.

9< 7 S3%

2%

4? <c

I
FIGURA 2.2 Comentario verbal sobre j el servicio Muestra de contacto personal con clientes

Excelente servicio

Servicio malo

389o 57%

75 9r

|
I

| Panorama

del captulo

El aspecto fundamental de !a estadstica es la informacin que contiene: sin informacin que recabar, organizar, analizar e interpretar, no habra razn para usar o estudiar estadstica; a la informacin usada en estadstica se le llama datos. Para que sea til dicha informacin en la toma de decisiones, debe organizarse v mostrarse apropiadamente. Ei tipo de datos indicar los mtodos a usar en su anlisis. Comenzamos captulo con un estudio de los distintos IDOS de datos. EJEMPLO 2.. este

Los datos obtenidos de un proceso de comeo son datos discretos.

Los datos obtenidos de un proceso de medicin, donde a caracterstica que se mide puede tomar cualquier valor numrico en un intervalo, son datos continuos.

Ejemplos de dato discretos son el nmero de nios en una familia, la cantidad ue coches en un estacionamiento, ei salario de un individuo, ei conjunto de persona; en una fila: ei nmero de pulsaciones del corazn por minuto ;. a presin sangunea, medida con instrumento digital, tambin son ejemplo de datos discretos: sin eraoargo. la velocidad de un coene en millas por ora, no da lugar a dato:- seretes porque puede legar a ser cualquier cifra, desde O millas por hora hasta la velocidad mxima

SECCIN 2.1

Datos: los bloques

de construccin

de la estadstica

Cabe distinguir entre ei trmino "Jatos"

y "Jato".

Dato es una porcin de

informacin. Datos es sinnimo de muestra. Los datos pueden ciusiticurse en dos categoras generales, cuantitativos y cualitativos. EJEMPLO 2.6 Los datos continuos no se pueden contar. Ei peso en kiiocrarr.ej.lj estaara en metros. i tiempo en minutos y a distancia en kilmetros, ion eiernpios de datos continuos: l presin parometnca y ei tiempo que tarca usted en legar a a escuela son ejempios Los datos cuantitativos >e refieren a iniorrr.acion numence. ono cuento
v

de datos continuos, pero e: nmero de personas en ana piau un rvr. de -emarii concurrido no sena continuo poraue es una cantidad que > se ?uede cenia:.

cuanto.-. < se miaer, en una escala numrica.

20

Estadstica descnpt/va: organizacin de dalos

Seccin 2.7 Datos: los bloques de construccin ae U estadstica

21

Cualquier proceso de medicin que proporcione dates continuos est mitado por la precisin dei instrumento de medicin utilizado. Por ejemplo, si un instrumento es preciso hasta los dcimos de pulgada y se usa para medir la altura de un individuo, entonces hay slo un nmero finito de medidas posibles que pueden obtenerse y ias estaturas asi medidas se redondearn hasta dcimos de pulgada Una medida de este tipo representa una aproximacin a la medida real. Las medidas reales son tericas.y representan dato* continuos, mientras que las medidas aproximadas son datos discretos poraue hay slo un nmero finito de formas de medir algo con un instrumento de precisin dado. E n realidad, todas las medidas fsicas son discretas: ia restriccin de una precisin limitada se aplica slo a los instrumentos de medicin, no a los datos: stos son de naturaleza continua y se redondea su valor de acuerdo con la precisin de los instrumentos usados para obtenerlos. Nuestro propsito principal al analizar datos es efectuar una interpretacin que tenga sentido. Como regla general, la cantidad de informacin contenida en los datos depende de su naturaleza: las dicotomas cuantitativo-cualitativo y discreto-continuo no siempre son adecuadas para la clasificacin de datos segn la cantidad de informacin que contienen: los datos tambin se pueden clasificar segn la escala de medicin o el procedimiento que los gener. Considere el dgito 4 en las siguientes situaciones: ai El nmero de la camiseta de ftbol de Juan es el 4. b) Juan su en ei 4 gradee c) Juan registr la temperatura como 4 Celsius. d) Juan cultiv un pepino que midi 4 pulgadas de largo. Estas situaciones representan cuatro niveles distintos de informacin, resultantes del uso de escalas diferentes de medicin. La medida en la situacin del inciso a, por ejemplo, se usa slo para identificar o clasificar a Juan como el jugador de ftbol nmero 4; el 4 grado en ei caso de la situacin del inciso
o

Las situaciones vistas de a a d son representativas de cuatro .o ie escalas de medicin que discutiremos con detalle porque el tipo de escala de medida usada determina ia cantidad de informacin contenida en cualquier dato proporcionado. Cuatro tipos de escalas de medicin usados en estadstica 1. Normai 1. Ordinal 3. De intercalo 4. De razn

Escala

nominal^

Existen escalas nominales tanto para los datos cuantitativos como para los cualitativos. Una escala nominal para datos numricos asigna nmeros a ias categoras para distinguirlas como en el ejemplo 2.7. Una escala nominal para datos cualitativos, como en ei ejemplo 2.S. es un agrupamiento no ordenado de los datos en categoras discretas, donde cada dato puede incluirse solamente en uno de los grupos. Las escalas nominales se usar? principalmente con propsitos de identificacin o de clasificacin.

EJEMPLO

2.7

Emre ios atos numricos que son nominales se incluyen ios nmeros en las camisetas deportivas, los nmeros de cdigo de las zonas postales, los nmeros telefnicos y los puntajes de ftbol americano. 6 puntos por un touchdown. i punto por la patada extra. 2 puntos por una escapada exira y 3 puntos por un gol de campo.

EJEMPLO

2.8

Los datos nominales que son cualitativos incluyen el gnero, la raza, ei tipo de sangre y la religin.

Escala

ordinal

Los datos medidos en una escala nominal ordenada de alguna manera s denominan datos o r d w k s Una escala ordinal coloca las medidas en categoras, cada una de las cuales ndica un nivel disnto respecto a un atributo que se est midiendo.

b, tambin es una clasificacin, pero da ms informacin porque nos da el nivel del grado, ms avanzado que el 3 grado y menos que el 5. aunque qu
o

tanto ms o menos es algo que no podemos medir. En la situacin del inciso c. de nuevo vemos niveles de comparacin, pues 4 indica que la temperatura es ms alta que una temperatura de 2 Celsius y ms baja que una temperatura de 7 Celsius. Es ms, una temperao

EJEMPLO
o

2.9

La lista de datos ordinales comprende: 1. Clasificaciones por letra: A. B, C. D y F; estos grados indican categoras de perfeccionamiento, as como os niveles alcanzados. 2. Rangos acadmicos: instructor, asistente de profesor, profesor asociado y profesor, donde un profesor nene mayor rango acadmico que un instructor. 3. La numeracin de ias casas en ias calles: caile Norte 42. calle Norte 42; \ as sucesivamente. La casa correspondiente al domicilio calle Norte 423 se localiza entre as casas iocaiizaoas en caile Norte 421 \e Norte 423. 4. La evaluacin de un maestreo: pobre, razonable, buena y superior. 5. Los raaos ae a escueia: primero, secundo, tercero, etctera.

tura de 4 Celsius es 1.5 ms alta que una de 2.5. porque la diferencia entre 4 y 2.5 es 1.5. Sin embargo, una temperatura de 4 Ceisius no es ei doble
o o

de caliente que una temperatura de 2 Celsius.


o

Finalmente, en el inciso , la medida 4 identifica al pepino como miembro de una ciase de pepinos que miden 4 pulgadas de largo; sabemos tambin que este pepino es ms iargo que uno de 3 pulgadas de longitud, que excede de pulgada a uno ae 3 y que es ei doble de iargo de un pepino ae 2 pulgadas de longitud.

J U

i , uescnotrva: orzanuadn ae datos

Seccin 2.7 Datos.- los bloques de constmKn .le i estadstica

21

No es posible determinar ia diferencia o distancia entre ios valores medidos en uoa -escala-ordinal.-.Ajm cuando solemos codificar ia letra dei grado A como 4. B como 3. C como 2. D como 1 y F como 0. nc diramos, por ejemplo, que una A es el doble de buena que una C o que un estudiante con A sabe el doble ae un estudiante con C. iodo lo que podemos decir es que ia calificacin A es mejor o de un grado supenor a la C. yaque una escaia^ ordinal no admite unidad de distancias \\': SAPLO 2.11

ausencia completa de calor, 'a escaia Cetsius no es una escala de razn; r..-r otra pane, la escala Keivin de temperatura, donde 0 K corresponde a -273* C. es un ejemplo de una escala de razn e temperatura.

Las escalas de razn incluyen escalas usadas comnmente para medir unidades como pies, libras, dlares y centmetros: los resultados de contar objetos tambin son datos de razn: diez manzanas es ei doble que cinco manzanas. Con una escaia de razn, una persona que pesa 200 libras siempre pesara ei doble que una persona de O libras, aunque se use otra escala de razn, como onzas, gramos o kiios.

Escala de intervalo

Los datos medidos en una escala ordinal para los cuales pueden caicuiars* las distancias entre valores, se llaman datos de intervalo. L a distancia^ ntre dos valores es importante y ios datos de intervalo son cuantitativos por necesidadr'una escala de intervalo no siempre tiene un punto cero, un punto que indique la ausencia de o que se quiere medir. I APLICACIN 2.1 ' i '

Suponga que se hace una encuesta a un grupo de maestros con respecto a su religin y que 15 son protestantes, 2 i catlicos y 7 judos. Qu tino de datos
0

son stos Solucin:

La respuesta de cada profesor es protestante, catlico o nidio v

EJEMPLO

2.10

Las listas de datos de intervalo comprenden: 1. Puntajes en las pruebas de inteligencia: un puntaje de inteligencia de 110 es cinco puntos supenor a uno de 105 (datos ordinales i. En este caso, no solo podemos decir que un puntaje de 110 es superior a uno de 105, sino que tambin podemos decir que es cinco puntos ms alto; pero no podemos decir que una persona con un puntaje de inteligencia de 180 es doblemente lista que una persona que tiene uno de 90. y una determinada diferencia entre dos puntajes de inteligencia no siempre tiene el mismo significado; por ejemplo, las diferencias entre 100 y 90 y entre i 50 y 140, pueden tener interpretaciones d^atas-awique^nbflrsean iguales a 107Aunque una persona con 140 es ms inteligente de acuerdo con la prueba de inteligencia que una persona con 100. no podemos decir que quien tiene un puntaje de 150 es tanto ms inteligente que una persona con 140. o que lo es una persona con un cociente ae inteligencia de 100 respecto a una persona con uno de 90. 2. Temperaturas Celsius. Una temperatura de 80 es 40 ms caliente que una temperatura de 40. pero no es correcto decir que 80 es el doble de caliente que 40, Ntese tambin que una temperatura de 0 no representa la ausencia i GRUPO DE EJERCICIOS Habilidades bsicas 2.1

estas respuestas constituyen datos nominales de categoras o cualitativos: por otro lado, los nmeros 15, 21 y 7 resultan de contar los datos cuantitativos. Las cifras obtenidas al realizar operaciones con datos, como la suma, no deben confundirse con la coleccin de datos.

Es importante ser capaz de clasificar datos de acuerdo con ia escala de medida usada. A l realizar una inferencia sobre una poblacin ue inters, as tcnicas usadas dependen de! tipo de escala medida. Por e;empio. si se trabaja con una muestra de datos ordinales, debe utilizarse una tcnica estadstica que use datos ordinales: al clasificar los datos segn ei tipo de escala de medida usada, el investigador puede identificar la mejor estadstica para analizar los datos.

j ^

^ C22T

HCn?" Q

total de calor. El punto cero en la escala de temperatura Celsius fue escogido arbitranamente como el punto de congelamiento e indica que est presente algo de calor. Tencameme. -273 C representa ei mnimo absoiuto de temperatura, la temperatura en laque ias molculas de una sustancia se mueven a una velocidad casi de cero. 3. Fechas. Ronaid Reagan fue investido como el 40" presidente de Estados Unidos en 981.192 aos despus de George Washington - 7789' Podemos especificar ia distancia entre estos dos sucesos oroenados. i92 aos, pero si existiera el ao cero, no representara ia ausencia de tiempo.

1. Clasifique los datos siguientes en cuantitativos y cualitativos: CcC^Aa) Estaturas en pulgadas de cinco jugadores de basquetbol. o r f \ Peso en onzas de doce pollitos. Ouoii ci Clasificacin tnica de empicados. CwW di Nmeros telefnicos de amigos.

d i Fechas de cumpleaos de ios miembros de su familia. 3. Gasifique os datos siguientes come discretos o continuos: c\. Ei numero de defectos en caca umeau ue un ote ue cOcocnes nuevos, p; Puntales de matemticas en u prceca ue aptitud

JN/* \yO

2. Clasifique tambin como cuantitativos o cualitativos: C U a) Calificaciones numer.cas PPG ce os miembros ce a c;ase eiementcu. C C A * ^ Ccactones con erra de 15 estudiantes cei grupo 209 ae filosofa,

acadmica de 30 alumnos dei iraw ao de preparatoria. -' DisQiKia-en yaraas recorrida por ur. mediocimpista en cada juego amanee ta iama ;er.coradu. C^c Peso oerdiuo en libras por 20 personas aebicc a una dieta.

Escala de razn

Los datos medidos en una escaia de intervalo con un pumo cero aue stgruii "ninguno", se laman, datos-de-raron^con datos medidos en una escaia de razn, podemos determinar cuntas veces es mayor una meaida que OUE.

24

Estadstica descriptiva: oraritnn de datos

Seran 2.2 Organizadn de datos mediante tibias 25

4. Clasifique ios datos siguientes como discren.s o continuos: (*3 a) E! numero de carreras anotadas en caria juego por Ies Piratas en ia temporada de 1900. C b) l.r.s sueldos ganados en el ltimo mes por 50 directores de nsututos. C l c) Las temperaturas promedio dianas de los ltimos 30 das. (~ di El nmero de granos de arena en cada una de i 00 playas. La tabla siguiente connene la distribucin de vehculos registrados en Excel College. ct Clase Tipo de
c V

Diga si la informacin ante;. es cuar.ctanva o : caaniativa. D i Clasifique ios datos de cada categora como discretos, continuos o cerno ninguno de los dos. c: Ordene ia informacin como nominal ordinal, ae mervaioocerazon P,W\

es ennde, ei arreglo puede ser difcil de manejar o de comprender: por eso a menudo se usan tablas como una aproximacin general a la organizacin de datos en bruto. En esta seccin estudiaremos vanos tipos de tablas usadas para organizar datos: en ia seccin 2.3 discutiremos medios grficos para mostrar datos no agrupados organizados en forma tabular. E l upo de datos nominal, ordinal, de intervalo o de razn determinar la forma en que se coloquen. La frecuencia de una medida o de una categora, es ei numero de veces, que aparecen en una coleccin de datos.,, El uso de frecuencias es mis conveniente para datos cualitativos o discretos: el smbolo / se usa para denotar ia frecuencia de una medida. L a muestra de datos siguiente representa el nmero de tiros libres fallados por un equipo de basquetbol durante los ltimos siete juegos:
7 2 i

La sura de abate muestra una escaia numrica para medir la efectividad de ia enseanza.

Cifra

i QV Necesita meiorarse

i Verdaderamente extraordinana

Efectiva y competente

vehculo Coche Camioneta ; Motocicleta

registrada

\ 7

& 25 10

a) Identifique el tipo de escala de medicin. b) Suponga que 30 estudiantes usan esta escaia para evaluar a su maestro de estadstica. Sera ms fcil interpretar esos resultados que ios que se obten dran si los 30 estudiantes evaluaran a su maestro mediante una opinin escrita de respuesta libre Explique. 8. Los estudiantes de una universidad se clasifican como de pnmer ao, de segundo ao. de penlumo ao y de ltimo ao. Qu tirio de escala de medicin es sta? TABLA 2.2 9. D un ejemplo distinto de los mencionados en ia seccin de una escala ordinal para datos cuantitativos. 10. Toda informacin numrica proporciona datos cuan6 1

E! nmero

aparece con una frecuencia de / = 2. 2 aparece con una fre-

cuencia de / = 3. 8 y 4 aparecen con una frecuencia d e / = 1. Existen dos tipos generales de tablas para reportar datos usando frecuencias, stas son: t a i s r d e T f t c u e n c i a s n o a g r u p a d a s y t a b l a s d e f r e c u e n c i a s
5

o 4

l Bicicleta

/ a) Clasifique los datos de cada una de las tres columnas como cuanntativos. / b) Identifique los datos de la tercera columna como discretos o continuos. " ~ , c) Determine ios datos de cada una de las tres columnas como nominales, ordinales, de intervalo o de razn. 6. El Memorial Hospital registra la informacin siguiente de cada uno de los pacientes: A, nmero de segundad social f ^ fecha del ltimo ingreso , fecha de nacimiento C compaa de seguros C A patrn direccin particular telfono particular 11.

g r u p a d a s . ' A m b a s tablas se mencionan como t a b l a s d e f r e c u e n c i a y estudiaremos primero las tablas de frecuencias no agrupadas. Tablas de frecuencias no agrupadas * Los datos sobre tiros libres citados anteriormente pueden resumirse como lo muestra la tabla 2.2. donde x denota las medidas y / , la frecuencia de cada medida; la tabla 2.2 es un ejemplo de una tabla de frecuencias no agrupadas para datos discretos.

Tabla de frecuencias de datos sobre tiros libres 7

titauvos? Por qu
G

N O

APLICACION 2.2

Construya una tabla de frecuencias para los datos siguientes, correspondientes al nmero de faltas a ciases durante el periodo de otoo de 1988 para estudiantes inscritos en la materia Estadstica 101. y
2 1 ~ 2

Toda informacin no numenca nos ofrece datos cua5i

litativos? Explique.

S a
5 3

3
2

i ? 3: i 5 6 J 3 2
0

1 0

SECCIN 2.2

Organizacin

de datos mediante

tablas

5 5

9 "

El objetivo de la organizacin de datos es acomodar un conjunto de datos en iorma til para revelar sus caractersticas esenciales y simplificar ciertos anlisis. Los datos que no estn organizados se denominan datos no agrupados. Una manera de acomodados es construir un arreglo ordenado: esto es. acomodando ios datos de abajo hacia amba o ai revs: si ei numero de datos Solucin: Como paso intermedio usaremos m a r c a s d e c u e n t a para ayudar

a determinar ia frecuencia / de cada observacin, donde .r representa el numero de faltas.

26

saoi'stca escrip&f: organizacin de ditos

Seccin 2.2 Organizacin de datos mediante labias

27

escala / intervalo, y para cantidades grandes de datos que no se midan con V al meri :na escaia de intervalo, debe usarse una tabia de frecuencias no agrupadas. Supongamos que el Memorial Hospital quiere saber si su servicio en la sala

ii mi mi ni mi

de emergencias es adecuado. Para empezar el estudio, ei gerente dei departamento corresponente registra el nmero de personas que ocupan la sala de emergencias cada da durante un periodo de 12 das, con los resultados siguientes: Da i 2 3 4 5 6 " 36 8 18 9 23 10 21 11 15 12 52

Sum.de pacientes 1 43 En correspondencia con cada observacin, hacemos una marca i I i en ia

8 22

13 28

Para simplificar los datos, el gerente construye seis agrupamientos o clases: la primera clase representa de 1 a 10 pacientes; la segunda, de 11 a 20; la tercera, de 21 a 30 y as sucesivamente. A partir de esta clasificacin, prepara una tabla de frecuencias agrupadas (tabla 2.3) para mostrar qu tan a menudo, a lo largo de los doce das, cae en cada grupo el nmero de pacientes. Las clases de frecuencias agrupadas poseen lo que se llama l m i t e s de clase. Para la clase 1-10, a 1 se le llama lmite inferior de clase, y a 10, lmite supenor TABLA 2.3 de clase. Existen dos medidas que caen entre 1 y 10. inclusive: tres medidas que caen entre 11 y 20, inclusive; cuatro medidas que caen entre 21 y 30. inclusive; una medida que cae entre 31 y 40. inclusive y as sucesivamente. La distancia entre cualquiera de dos lmites superiores consecutivos o entre cualquiera de dos ) b'mites inferiores consecutivos es llamada a m p l i t u d de d a s e . La amplitud de cada clase en la tabla 2.3 es 10. La distancia entre el limite superior de la primera clase y el lmite superior de la segunda clase es 20 -10 = 10. Cada clase en una tabla de frecuencia tiene lmites de clase tericos llamados fronteras de clase; al lmite superior terico se le llarna/ronrera superiory al lmite inferior terico de clase se le llama frontera inferior. L a frontera infenor para la primera clase es 0.5 y la frontera superior para esa misma ciase es 10.5. Para esta tabla de frecuencias, la frontera supenor de cada clase se encuentra sumando 0.5 al lmite superior, y la frontera inferior de cada clase se encuentra restando 0.5 del lmite inferior de cada clase. Note que cuando se examina una tabla de frecuencias agrupadas sin los datos no agrupados, esto es, antes del procesamiento estadstico, no conocemos las medidas individuales: por ejemplo, en la tabla 2.3 vemos que dos medidas caen en la clase 1 a 10, pero no sabemos cules son estas, lo cual no sera el caso para una tabla de frecuencias no agrupadas donde se conocen todas las medidas. Cualquier tabia de frecuencias agrupadas debera poseer ias tres caracten'sncas . siguientes: !. Uniformidad: cada clase debera tener ia misma amplitud. 2. Unicidad: aos ciases no se traslapan. 3. Compietez: cada uno de ios datos debe pertenecer a alguna ciase. Tabla de frecuencias

columna de marcas al lado del valor observado; cuando se han hecho todas las marcas se cuentan las de cada medida x para determinar la frecuencia. Note que la suma de todas las frecuencias de una tabla de frecuencias es igual al numero de datos de la coleccin. En este caso, la suma de ias frecuencias (42) representa las 42 clases para las cuales se registraron las faltas, i

APLICACION 2.3

Cinco miembros. Jones. Smith, Baker, Brown y Thomas. de la junta directiva de una pequea universidad, fueron nominados para presidirla y los datos siguientes muestran el resultado de la eleccin; construva una tabla de
-tecuenci
, _ .

agrupadas para los datos de la saia de emergencias Clase 1-10 . 11-20 . 21-30 . 31-40 . 41-50 . 51-60 . Frecuencia ( f 2 3 4 1 1 1

- Smith Jones Brown Brown Jones Thomas Brown Brown Thomas Jones Jones Brown

Jones Smith Smith Smith Solucin:

Jones Baker Smith Thomas

Smith Baker Smith Smith

La tabla de frecuencias es como sigue: Miembro de la junta Bakei^ Brown Jones Smith Thomas Frecuencia (/) 2 5 6 8 3

Tablas de agrupadas

frecuencias

Las tablas de frecuencias como la tabla 2.2 se denominan apropiadamente tablas de f r e c u e n c i a s no a g r u p a d a s porque cada medida nene ia frecuencia correspondiente. U ^ o a t o ^ f c & e e i u a c r e en contraste, pr*. serna las frecuencias de acuerdo con grupos o ciases de medidas Las tablas de frecuencias agrupadas se usan comunmente para resumir grandes cantidades de datos continuos que contienen relativamente pocas repeticiones: tales resmenes ractlitan'cierroscicuios estadsticos y presentaciones grficas cuando no se usa la computadora: para usar una tabla de frecuencias ahupadas a fin de resumir ios datos, estos deben medirse al menos con una

Estadstica descriptiva: organizacin de dalos

Seccin 2.2 Organizacin de datos mediante tablas

29

Las fronteras de clase y as amplitudes de ciase de una tabla de frecuencias agrupadas se determinan considerando.Ja unidad o precisin de ta medite. Para las clases de a tabla 2.3. ia precisin de la medida es el nmero entero ms cercano, ya que estamos contando individuos, as que la unidad de medida es 1. ^ o a t r a werior de ciase de un intervalo se localiza mema unidad abajo dei* 'nftit.'fl Donara.supenor de, clase.dfi.un imerwato se focatea faMa unifott^* arriba del lmite* Para la primera clase de la tabla 2.3. la frontera inferior de clase es f 1 - 0.5(1)] = 0.5 y la frontera supenor es [10+0.5(1)] = 10.5. Ninguno de los datos cae en la frontera de un intervalo, por lo tanto, las medidas 0.5 y 10.5 no pueden caer en la primera clase, pero cualquiera de las medidas entre 0.5 y 10.5 si. Desde luego, 0.5 y 10.5 no son medidas posibles, as que las fronteras de* clase slo tienen significado matemtico.* La amplitud tv de cualquier clase de una tabia de frecuencias agrupadas puedt encontrarse restando la frontera inferior de la clase de su frontera supenof. Entonces, para la primera clase en la tabla 2,3, w = 10.5 - 0.5 = 10. Tome en cuntalos ejemplos 2.12 y 2.13.

EJEMPLO

2.13

La siguiente es una taiva de frecuencias agrupadas para ei peso en libras de 18 recin nacidos. Clase Frecuencia (f) i i

3.0-4.4 4.5-5.9 6.0-7.4 7.5-8.9

9.0-10.4

7 8

La precisin de la medida de las clases**!. 1 libras. Para la clase 7.5 - 8.9, al restar la mitad de una unidad del lmite inferior de ciase se obuene 75-1.0.5) (0,!}= 15 0.05 = 7.45. la frontera inferior de clase. La frontera supenor de clase se encuentra sumando media unidad al lmite superior de clase, obtenindose 8.9 + (0.51 (0.11 = 8.95; note que ningn peso corresponde a alguna frontera porque la precisin de ia medida es el dcimo de libra ms cercano.

En cualquier tabla de frecuencias agrupadas, la amplitud de clase puede encontrarse simplemente realizando el procedimiento siguiente; Determinacin de la amplitud de ciase Rstense dos lmites superiores de clase consecunvos o inferiores de clase consecuvos, o dos fronteras infenores consecutivas, o dos fronteras infenoI ' res consecutivas, o rstese la frontera tnfenor de una ciase de la frontera supenor de dicha clase. I i \ j

EJEMPLO'2712

La siguiente es una tabla de frecuencias agrupadas para el nmero de semillas en 21 naranjas. Clase 3-6 H-14 Frecuencia i f )

Para los datos de la sala de emergencia proporcionados onginalmente en la tabla 2.3, podemos calcular la amplitud de clase como se indica en la tabla 2.4.

TABU 2.4
Clculo de ia amplitud de clase para la tabla 2.3

Clase 1-10 w = 20 - 10 = 10

Frecuencia ( f )

7-10

15-18 La precisin de medida para las clases es i porque los datos de la tabla son nmero* enteros.Para la clase 7-10, si sumamos (0.5) (1) = 0.5 al lmite supenor de clase 10. obtendremos la frontera supenor de clase 10.5. Para conocer la frontera inferior restamos 0.5 de! lmite inferior de clase y nos resulta 7 - 0.5 = 6.5 (vase el ejemplo 2.13). El ancho de la clase 7-10 se encuentra entonces restando la frontera inferior de ciase de la frontera supenor. es decir, w = 10.5 - 6.5 = 4. Lmites de clase
7

1-20 w = 31 = 0 1-30

f ; 31-40

41-50 51-60

Sin embargo, note que la amplitud de clase no se encuentra restando el lmit l


>

inferior de clase dei lmite superior.* Eieccn de cases oara 10.5 L :abas ce frecuencias zsrvpszs'' Si se quiere construir una tabla de frecuencias agrupadas para una cierta coleccin de datos, es necesario responder tres preguntas relativas a las. clases. i. ^Cuntas ciases deben usarse' 1 Cul debe ser ia amplitud de case'?' J . En qu vaior debe empezar la pnmera clase ?

65 I Fronteras de clase

30

tstaistica descriptiva: organizacin de datos

Seccin 2.2 Organizacin de datos mediante tabks 31

Escoger ei nmero de ciases requiere vanas consideraciones. Si todos los datos se agrupan en un nmero pequeo de clases, ias caractersticas de los datos originales se ocultan y puede perderse informacin relevante: por otro lado, demasiadas clases dan demasiados detalles y se pierde ei f*etsi*Q del agrupamiento. que es condensar los datos de manera significad va y fci de interpretas Adems, demasiadas clases pueden dar lugar a que muchas clases queden vacas quitndole sentido al agrupamiento de ios datos. El iifflllet d4atcs>ienotado por & depende de la situacin y dei tota!
l

Como la medida menor debe caer en ia primera ciase, ei lmite inferior de ia primera ciase debe estar en. o un poco antes de. la medida menor L. As que podemos establecer un acuerdo generai soore ias clases de nuestras tablas de frecuencias agrupadas, empezando siempre iapnmera clase con la medid menor* esto nos ser especialmente til cuando verifiquemos nuestras respuestas. En la prcuca. es comn que la primera clase empiece en un nmero que permita expresar las clases de intervalos convenientes, pero hay ocasiones en que se justifica una excepcin a la regia (vase el ejercicio 33 al final de esta seccin i. Cuando ia primera clase comienza con la menor de ias medidas, el valor mnimo que puede tomar w depende de a unidad de medida. Ei valor mnimo para la amplitud de ciase w se determina redondeando ei cociente R/c al siguiente valor entero.

de los datos obtenidos. Como no hay un acuerdo genera! entre los estadsticos acerca del nmero de clases que deben usarse y dado que la eleccin es arbitraria, en este texto usaremos de 5 a 15 clases, inciusive.

Nmero de clases para una tabla de frecuencias agrupadas: Entre 5 y 15 clases (inclusive). Una sugerencia til para el nmero de clases est dado por la regla de Sturges, que establece como nmero de clases necesario, aproximadamente. ft*<UStarj. c = 3.3(teg<) + J donde n es el nmero de medidas y log n es el logaritmo de n en base 10 E l valor de c es comn redondearlo ai entero ms cercano. EJEMPLO 2.14 \i ei nm. :o de medidas proporcionadas es n - 25. la regia de Sturges sugiere usar i seis ciases, porque c = 3.3(log/i+ i = 3.3log 251 + l = 3.3(1.3979)+ 1 = 6 : donde = significa aproximadamente igual que.

E! valor de u se toma como el mnimo entero mayor que R/c -

E l profesor Smith puso un examen final consistente en 100 preguntas a su grupo de Introduccin a la contabilidad. Los datos siguientes representan el nmero de respuestas correctas en cada examen: construya una tabla de frecuencias agrupadas con cinco clases que 3yude al profesor Smith a analizar los resultados. 17 1 44 77 7 Solucin: Paso !. Primero determinamos el rango R. Como la medida mayor es U 98 y la mnima L - 2, el rango es /?=/, = 9 8 - 2 = 96 Paso 2. A continuacin determinamos w. la amplitud de cada clase. Vea que el nmero de clases est dado por c - 5. 15 78 21 10 32 22 34 42 64 62 77 9 ~ 65 18 87 4 44

9 82 79 98

2 81 45 3~ 83

13 41 16 17 13 82 37

5 54

67 88 41 61 22 92 Ib 67 85

Algunos investigadores piensan que. en muchas situaciones, la regla de Sturges da un valor de c que permite la construccin de una tabia de frecuencias agrupadas que da una imagen realista de los datos no agrupados. Una vez establecido el nmero de intervalos de clase que se usarn, la amplitud de clase se encuentra usando el rango R. que es la diferencia entre la medida mayor U y la medida menor L en a muestra:

= f = = 19.2
9

Como ia unidad de precisin para los puntajes de examenes es i. escogemos Como celases deben cuDnr ei rango, dividimos ste entre el numero de ciases para encontrar la amplitud de ciase w: : I Aapiitud de cUs? - i el mnimo entero mayor que 19.2 como el valor de ia amplitud. Para nuestra aplicacin, ei mnimo entero mayor que 19.2 es 20; en consecuencia. w = 20. Paso i. Comenzamos con L - Z y construimos ia primera ciase con un ancho ae 20. Supongamos que la primera ciase se extiende de 2 a x. donde x representa ia incsnua imite suoenor de ciase i vase el diasrama adjunto).

Estadstica descripv: organizacin de datos

Seccin 2.2 Organizacin de dalos mediante tablas 33

Limites de clase x X+CL5


f

R=

1i-l

= 5 2 - 2 8 = 24 Paso 2. Determinamos ei ancho de cada ciase: = H = 2 = c 6


'

Fronteras de ciase

Debemos usar un anchode u =5 en este caso; si no. ios seis intervalos pueden Como la unidad de medida es 1 y 0.5CV) = 0.5. la frontera supenor de clase puede representarse como x + 0.5. L a amplitud de la pnmera ciase se encuentra restando la r'rontera infenor de clase de la frontera superior de clase, por lo tanto. w = (x *0. 5)-1 .5 Como w = 20, tenemos 30=x-1 A l resolver esta ecuacin encontramos que el lmite supenor de clase es x = 21. E n consecuencia, la primera clase resulta 2 - 2 1 . Poso 4. Para obtener cada una de las clases siguientes a esta pnmera, sumamos w = 20 a los lmites inferior y superior de la clase precedente. As, 2-21 22-41 42-61 62-81 (Note: 41 = 2 1 + 2 0 ) (Note: 42 = 22+ 20) 36-39 40-43 48-5! Advierta que el valor U = 52 no pertenece a ninguna clase; para remediar lasituacin debemos escoger el mnimo entero mayor que 4. que es 5. Por4o tanto, el ancho de la clase debe ser iv = 5. * Paso i TABLA 2.6 r a b i a de frecuencias agrupadas para los datos de ia aplicacin 2.5 La tabla 2.6 es la tabla completa de frecuencias agrupadas. Clase 28-32 33-37 38-42 43-47 48-52 53-57 Cuenta f 5 5 no contener todos los datos. Con - = 4. no hay una clase que contenga al , v vaior mayor de los datos o ei valor menor. Como hemos convenido en comenzar el pnmer intervalo con el valor menor de los datos, nos arriesgamos a que el valor mayor de ios datos no pertenezca ai ltimo intervalo. Para ver por qu es ste el caso, supongamos que el aneno es w - 4. La primera ciase es 28-31, y las seis ciases sern: Clase

8-0 21 1

_ (NoieMOl = 81 +20)

Paso 5. Para detenninar la frecuencia de cada ciase usamos una columna de marcas de cuenta. Si uno de los datos cae en una clase, anotamos una marca (1) en la columna correspondiente a esa clase. La tabla 2.5 contiene nuestra tabla de frecuencias agrupadas para los 50 puntajes del examen. TABLA 2.5 Clase Cuenta Frecuencia

un
Hfl

ni ni
IHI

3 3 6
0

Tabla de frecuencias agrupadas de los puntajes del examen final

2-21 22-41 42-61 62-81 82-101

un

HI

un ni

18
8

IHI III

En este caso la ltima clase est vaca. Para remediar esta situacin podemos empezar la primera clase en un valor menor, digamos 26. L a tabla de frecuencias sera entonces:
1

6 un wi Hfl III 10
8

50

Clase 26-30 31-35 36-40 41-45 46-50

3
2 n

APLICACION 2.5

Los datos adjuntos representan el nmero de cuentes que visitan una tienda en un penodo de 22 das. Use seis clases y construya una tabla de frecuencias agrupadas para ios datos.
2S 33 33 52 50 32 29 57 ?! 54 43 45 48 58 34 28 49

S [.S
-i 6 49 varca ae ciase

a?

El punto media dcada ciase se denomina marca de c l a s e y se denota por X Cuando los datos se condensan en una tabia de frecuencias agrupadas se nierde informacin y no sabemos ei valor exacto de as medidas que caen en cada ciase: por eso lo mejor que podemos hacer es permitir que cada una de as medidas de una clase dada est reresentada or la marca de esa ciase: ai

Solucin: Paso i. L a medida mayor es U = 52. y ia menor es L = 28. Determinamos ei ranao:

34

Estadstica aescnptrva: organizacin de datos

Seccin 2.2 Organizacin de datos medame tablas > 35

usar marcas dcc!;:se en lugar de ios datos sin agrupar, los clculos se facilitan aunque se pierde precisin. Para una ciase dada, ia marca de clase se encuentra usando la frmula

Paso 2. Calcule ei ancho de clase \\ Como c = 5. tenemos R _ 6f_BZ _

Ei mnimo entera mayor que 12.96 es 13. En consecuencia, el ancho de clase donde es el lmite inferior de clase y l-_ es cl lmite supenor. es u' = 13. Paso 3. Comenzamos con L = 17.89 y construimos una ciase con ancho EJEMPLO 2.75 Para ia pnmera clase de 'a tabla 2.5. a marca - !e clase es = 13. La unidad es 0.01 y(Q.5)()'0)= 0.005. Representemos con x la frontera superior de la primera clase. Entonces, ei ancho se obtiene restando la frontera inferior de clase de ia frontera superior. 2-21 = .v + .005i =.v -0.005

.885 '.885

Para ia segunda clase, la marca de clase es

,v= 30.88

=t-

17.88

En consecuencia, la pnmera ciase es 17.89-30.88. Paso 4. Para obtener las clases restantes, sumamos 13 a los limites de clase 22-41 = ; = 31.: Adviena que la marca de ciase para la clase 2 tambin se puede encontrar sumando = 20 a la marca de clase para la clase 1 (11.5 + 20 = 31.5). En general, cada marca : de ciase para las clases siguientes a la primera puede encontrarse sumando w = 20 a ia marca de clase precedente, por lo tanto, resulta que las tres marcas de clase restantes son 51.5, "1.5 v 91.5. La tabla 2.7 muestra una tabla de frecuencias agrupadas que contiene las marcas de clase. Nmero TABLA 2.7 Marcas de clase para ia tabla de frecuencias agrupadas de la aplicacin 2.4 o de la tabla 2.5 de clase Clase 22-41 42-61 62-81 32-101 Cuenta
Wt 1H1JH1 1H1

precedentes. Clase 17.89 - 30.88 13 13 13 3 30.89 - 43.88 43.89-56.88 / Pnmera clase * sume w - 13 en ambos lados de la nnmera clase i { Segunda clase
1

sume iv = 13 en ambos lados de la segunda clase

| Tercera clase

Las aos ciases restantes se encuentran de manera anloga. Son: Marca de / la dase X 56.89 - 69.88 69.89 - 82.88 Paso 5. Las frecuencias para las cinco ciases se encuentran usando marcas de cuenta como se ve en la tabla 2.8. Paso . Las marcas de cada ciase se encuentran usando la frmula para el punto medio dada previamente. La marca de clase para la primera es

11 1

m I mm m

ni

APLICACION 2.6

E l conjunto de datos siguiente representa los totales de efectivo ten dlares) gastados en un cierto fin de semana por 25 estudiantes graduados. Construya una tabla de frecuencias agrupadas que contenga cinco clases.
31 2S.30 2S..-1

7 8 9 - 30.88

= 24 38:

44 4"
4S.59

afc'roaft>de-cfSliWHBfciva se encuentra sumando w - 13 a la mar el anterior*La tabla 2.S de frecuencias agrupadas de los datos, muestr; i tambin ios marcas de dase. TABLA 2.8
T

6.o5

}\A~.

.-.J5 35 "0

i".59 :.- :5 aoia de <recu ar ^y* z

48.14

s.;:

Nmero ce oase

Ciase ,~.S -30.s8 , 0.'9"-3.i8


;

Cuenta

.V 24.3S5 3 ".5 85 5'!. 585 6- ^ * "6.585

Solucin: Paso- . Calcuie ei raneo R. Como "= HJl \ ei rango es

agruparle: -i* " 2.6

/? = r =

45 >>9-:6.,-^
:

itfllll

56.S9-ci9>8

36 Estadstica descriptiva: organizacin de datos

Seccin 2.2 Organizacin de '.'tos mediante tablas t 37

Tablas de frecuencia relativas

A veces

,.u) expresar cach valor o ciase de una tabla de frecuencias como


! :

una fraccin o porcentaje de!

al de las medidas. L a frecuencia relativa

fin la tahiimit frtiMHWMB wtani i a v a i r t i n e r r o r l 8 8 S t es siempre U i o cual no es sorprendente pues una frecuencia relativa equivale a un porcentaje: para convertir una frecuencia relativa en un porcentaje, la multiplicamos por 100%. Encontraremos de utilidad(3Slablas de frecuencia relativa cuando estudiemos probabilidad en ei captulo 5. donde la suma de las probabilidades estudiadas ser siempre ieual a l. as de ao/muiada trecuenqa' fc-de cualquier medida, o clase, es la suma de ias frecuencias de esa misma medida o clase, y de las frecuencias de todas las d e m s de menor valar. En muchas ocasiones estaremos interesados en el nmero de observaciones menores o iguales que algn valor dado. L a tabla 2.12 ilustra una tabla de frecuencia acumuiada para los datos de la aplicacin 2.4. EJEMPLO 2.18 En ei caso de que la frecuencia acumulada sea de inters, se incluyen los siguientes ejemplos: 1. Un ingeniero especialista en controi de calidad deseara conocer el nmero de das en que un proceso de produccin origin, cuando mucho 100 artculos defectuosos. 2. Un maestro puede estar interesado en conocer el nmero de estudiantes que obtuvieron un puntaje menor o igual ai 7 0 % en un examen. 3. A un entrenador de basquetbol le interesara saber el nmero de juegos en que los contranos anotaron a lo ms 60 puntos.

de una medida o clase se encuentra dividiendo la frecuencia / de dicha medida entre el total n de medidas; entonces a la tabla se ie llama tabla de frecuenciareiativa < vase ei ejemplo 2.16). Una tabla de frecuencia relativa tiene vanas ventajas sobre otra tabla de frecuencias cualquiera: una ventaja importante es. como se ve en el ejemplo 2.17. que podemos hacer comparaciones llenas de significado entre conjuntos similares de datos que tengan ias mismas clases rjero frecuencias totales distintas. EJEMPLO 2.16 La tabla de frecuencias relativas para la clase i de la tabla 2.8 es n = 8/2; = 0.32. La tabla 2.9 nos ensea una tabla de frecuencias relativas para los datos de la aplicacin 2.6. Note que la suma de la columna de frecuencias relativas es i ,00,TABLA 2.9 Tabia de frecuencia relativa Ciase 17.89-30.88 30.89-43.88 43.89-56.88 56.89-69.88 69.89-82.88 Frecuencia relativa 0.32 0.32 0.28 0.04 0.04 1.00 EJEMPLO 2.17 Considere la tabla 2.10. que exhibe los slanos iniciales de matemticos recin graduados en dos universidades estatales, A v B. TABLA 2.10 Tabla de frecuencias para los salarios iniciales en dos universidades \d A ' | i i Clase salarial 510,000-12,999 13.000-15.999 16,000-18,999 19.000-21.999 22,000-24.999 25,000-27.999 ... Uniyersidiidli Clase salanal SI 0,000-12,999 13.000-15.999 16.000-18,999 19,000-21,999 22.000-24.999 25,000-27,999 / 1 1 2 2 3 1 TABLA 2.12 Tabla de frecuencia relativa acumuiada para los datos de la aplicacin 2.4

/
0 2 7 6 3 i

Tabla de frecuencia Clase 2-21 22-24 42-61 62-81 82-101 / 18 8 6 10 8 1~

Tabla de frecuencia acumulada Clase 2-21 22-24 42-6! 62-81 82-101 Frecuencia acumulada 18 26 = 118*8) 32 = i26 + 6) 42 = i32+10) 50 = (42 + 8)

Al examinar las dos panes de la tabla vemos que en cada universidad hay tres matemticos recin graduados con salarios iniciales de entre 22.000 y 24,999 dlares. Pero si comparamos las frecuencias relativas, vemos que la universidad A tiene un 3/20 = 15% de sus matemticos ganando entre 22,000 y 24,999 dlares, mientras que la universidad B tiene a un 3/10 = 30% ganando entre 22,000 y 24.999 dlares ivase ia tabla 2.11 i. TABLA 2.11 Frecuencias relativas de salarios iniciales en dos universidades Universidad A Clase salanal 510.000-12,999 13.000-15.999 16.000-18.999 19.000-2 i. 999 272.000-24.999 25.000-2~.999 Relativa ; 0/20 = 0 2/20 = 0.10 720 = 0.55 6/20 = 0.30 5/20 = 0.15 2/ZQ - o. 10 Universidad B Clase s aianal S 10.000-12.999 ; 3.000-15.999 16.000 18.999 22.000 24.999 25.000 27999 19.000 21.999 Relativa ; 1/10 = O.iO 1/10 = 0.10 1710 = 0.20 5/10 = 0.30 1/10 = 0.10 TABIA 2.13 Tabia de frecuencia relativa acumuiaaa oara ios datos de ia aplicacin 2.42-61 o2-8l relativa acumulada

Tambin pueden construirse tablas de frecuencia acumulada para tablas que contienen frecuencias relativas o porcentajes. Cuando se hace esto, la tabla
se denomina t a b l a de f r e c u e n c i a r e l a t i v a a c u m u l a d a . Una tabla de esta

naturaleza para los datos de ia aplicacin 2.4 se muestra en la tabla 2.13; se obtuvo de la tabla 2.12 calculando frecuencias relativas acumuladas para ia frecuencia acumuiada. Clase Frecuencia reiauva acumuiada,. 18/50 = 0.36 26/50 = 0.52 32/50 = 0.64 42/50 = 0.84

3S i

stadsica descriptiva: organizacin de datos

Seccin 2.2 Organizacin de datos mediante tablas 39

Las frecuencias relativas acumuladas tienen muchos usos, uno es ia calificacin de pruebas escolares de aplicacin generalizada, como la Prueba de Aputud Acadmica i P A A ) y muchos otros exmenes de ingreso; los puntajes de esas pruebas suelen darse como percentiles. Un puntaje percen nos dice que pane de ia poblacin examinada qued abajo dei pntate dado.

y asociado a l tenemos dos medidas, altura en pulgadas y peso en 'libras; si asignamos a la variable x la representacin de la altura de un jugador, v a ia variable y el peso del mismo jugador, entonces la pareja ordenada (x. vi

representar ia altura y el peso, respectivamente, de un miembro. Hasta ahora, habamos estado midiendo solo un aspecto de cada miembro de una poblacin, por eso usamos una nica variable para representar las medidas:

Si se dice que 590 es ei nonagsimo percentil en ia pane de matemticas de a PAA: eso significa que 90%. de ios puntajes en ia porcin de matemticas de esa prueba estuvieron abajo de 590. EJEMPLO 2.20 La tabla 2.14 registra las estaturas en pulgadas de 200 alumnos de nuevo ingreso del sexo masculino, en una preparatona. EJEMPLO 2.22
:

cuando se usa slo una variable para representar los datos obtenidos .Afilo miembros de una poblacin, los nombramos amm'egt^$i

EJEMPLO

2.21

Datos univanaaos. Si los datos son los DSSOS en 'libras de un grupo ue 30 estudiantes de estadstica, entonces un miembro es un estudiante y el aspecto medido ei el peso dei mismo.

TABLA

2.14 Estaturas ^9 f f 2 12 24 46 62 36 16 2

Estaturas en pulgadas > alumnos de nuevo ingreso

Frecuencias relativas 0.01 0.06 0,12 0.23 0.3! 0.18 0.08 0.01

Frecuencia relativa acumuiada 0.01 0.07 0.19 0.42 0.73 0.91 0.99 1.00

' Datos bivariados. Supongamos que estamos interesados en ei promedio diario de ! precipitacin pluvial y temperatura ambiente habidos en Athens, Georgia, durante los diez aos pasados. La poblacin consiste de os diez .aos pasados, donde un miembro de la poblacin es cada ao, y en este caso, un ao es una fuente para dos piezas de la informacin que vendran a ser el promedio diano de la precipitacin pluvial y ei promedio diario de la temperatura ambiente. Cada ao da lugar a dos medidas. Una tabla de frecuencia b i v a r i a d a es un arreglo de datos clasificados e% dos categoras;, la informacin usada para construir las tablas de frecuencia bivanada se obenen generalmente de contar frecuencias. Cada categora se identifica con un smbolo llamado variable, cada variable-representa datos de una categora; las categoras pueden ser nmeros discretos, intervalos numncos o valores cualitativos como gnero, color de cabello o religin.

62.5-65.5 65.5-68.5 68.5-71.5 71.5-74.5 74.5-77.5 77.5-80.5 80.5-83.5

Esta tabla, que utiliza fronteras de clase y frecuencias rehuyas acumuladas, se puede usar para determinar percentiles. Las conclusiones siguientes son manifiestas en ia observacin de la tabla anterior: 1. Una estatura de 74.5 pulgadas es el percentil septuagsimo. EJEMPLO 2.23

. Vamos a suponer que la informacin se obtuvo de una muestra de votantes a los que ; se pregunt su filosofa poltica y su filiacin partidista; a cada uno se le pidi
!

2. Ei percentil nmero cincuenta est entre 71.5 y 74.5 pulgadas. 3. El percentil 19 es 68.5 pulgadas.

idenficar sufilosofapoltica como: liberal, conservadora u otra, y su filiacin partidista como demcrata, republicana u otra: las dos variables de clasificacin son

4. El septuagsimo quinto percenl se ubica entre 74.5 y 77.5 pulgadas.

filosofa poltica y filiacin parodista. La variable filosofa poltica uene tres categoras o niveles de clasificacin: liberal, conservadora u otra; la segunda variable tiene tambin tres categoras o niveles: demcrata, republicana, otra; los datos estn
1

APLICACION 2.7

Supongamos que el percentii nmero setenta de peso de los hombres adultos es 175 libras y que el 85 es 195 libras. Qu porcentaje de hombres tienen
G

tabulados en la tabla 2.15. Filosofa poltica Filiacin partidista Demcrata Republicana Ou-a Total Liberal "8 34 38 200 Conservadora 65 "9 46 190 i6 60 Otra 37 Total ISO l"0 !00 "50

pesos mayores que 175 libras y menores que ]95? Solucin: Por definicin. 7 0 % de los hombres adultos pesan menos de 1":

TABLA 2.15 Tabia de frecuencia Divariada

libras y 8 5 % pesan menos de 195; por lo tanto: 0.85-0.70 = 0.15= 15% de los hombres adultos tienen pesos comprendidos entre 175 y 195 libras, Tablas biv aadas i

Si tenemos datos resultantes de medir dos aspectos distintos de los rniembrrfs de una poblacin, entonces os llamamos datos b i v a r i a d o s / S e usan dos variables para representar los dos aspectos de cada miembro; un miembro puede ser un objeto, persona o fuente: Supongamos que queremos investigar ia altura y ei peso de todos los jugadores de basquetboi de ias preparatorias en Allegany County. Marviand: :aaa miembro es un iucador de basquetboi La informacin que sigue, entre otras, pueae leerse fcilmente ce ia taoia: 1. Hoo "75 votantes que dijeron ser liberales demcratas. 2. "9 oersonas manifestaron .-.er conservaoores republicanos. 3. Se entrevist a 450 individuos.

40 i Estadstica descriptiva: organizacin de datos

arcin 2.2 Organizacin de datos meaiante tablas i

41

4. Hubo 1 0 republicanos entrevistados.


7

Actitud haca 1 c r.'.o colectivo Czio Profesor Prof. Asociado Pro;. Asistente Instructor Total A favor ^5 : 42 121D En contra 8 16 19 4 Abstencin 2 5 4 u _23_ Total 55 50 65 ?n_ 200_

5. 60 votantes clasificaron su filosofa poltica como otra. APLICACION 2.8

En la tabla siguiente estn anotadas ias calificaciones en estadstica y ei sexo de 32 estudiantes universitarios. Construya una tabla de frecuencia para ios datos bivariados. Estudiante 1 i 4 5 6 8 9 10 11 12 13 14 15 16 Solucin: Paso 1. Usamos marcas de cuenta pan Hp.rpn de las diez combinaciones sexo-calificacin. nardos-totales-para-cada una Calificacin B C Sexo M F F M F F M M F M F F M F F F 18 19 20 21 22 23 24 i^ 26 2" 28 29 30 31 32 Esrudiante C"alineado n C E C B D E B B C C D B D A E A Sexo p p M F .VI M M M M p M F F M M F .

Use la labia para responder cada una de estas preguntas; a: /.Que porcentaje ue los acadmicos esta en contra uei contrato colectivo 0/p b i Qu porcentaje corresponde a profesores asociados
1 1

c c
B B A

ci Qu tanto por ciento de ios profesores estar, a favor de! contrato colectivo? A & d.Instructores que estn a favor de dicho contrato, en porcentaje'
1( 1

c
C B

e i .Quienes se oponen al contrato Qu tanto por ciento corresponde a protesores

A C D D A

. . ^

f) Qu porcentaje del total de los acadmicos representan los profesores. asociados o de rango supenor. que estn a favor de! contrato?

Solucin: 3)47/200 = 23.5%. bi 50/20 = 25%. cl 45/55 = 81.8%. d) 12/30 = 405. el Cuarenta y siete acadmicos se oponen al contrato colectivo de trabajo y. de ellos. 8 son profesores. En consecuencia, os profesores constituyen el 8/47 = 17.02%- de quienes se oponen al contrato coiecnvo. 142 -r 31 +451/200 = 59%. ^ ^ '

Calificacin Sexo H M C
W1

Paso 2. A continuacin encontramos los totales para los dos renglones, cinco columnas v diez combinaciones sexo/calificacin. Calificacin Sexo H Ai Total D Total';
15
:

GRUPO

DE EJERCICIOS

2.2

Habilidades i.

bsicas c i L = ?9. U= 130. f = 13 d ) L = 13.64. U = ~5.24.;= !0

Determine la amplitud de ciase w para cada uno de ios conjuntos guienies:

a!=!7. i ' = S i . c = 8

Calcule los limites supenores pane: primer intervalo ue ciase en cada una ue ias siguientes condiciones: APLICACION 2.9 ai L - U. i = !<!. c = S. unidad de mecida = i Se nizo un estudio entre ios miembros dei colegio de acadmicos Dura considerar'sus actitudes hacia ei contrato colectivo de trabajo, celebrado entre ia administracin y el sindicato dei personal acadmico; ios resultados se resumen en ia tabla sisuiente. ermme ei ancho de ciase ara cada uno ce estos
n

? . = 4.5. C- 102.2. c = ". unidad de medida = 0.1 c 2 = 23. ' = 204 ..= i ! , unidad de medida = . di L - 23.65. ,' = o".24. -' = 10. -anidad de medica =

junto ae condiciones:

Estadstica descriptiva: organizacin de datos

Seccin 2.2 Organizacin de datos mediante tablas 43

Realice o mismo que en el inciso antenor. a i L = 2". U = S7. c = 7. unidad de medida = i bi = 24.5, U- i 12.5. c-9. unidad de medida = 0.1 c) L = 39. U - 130. c = 13. unidad de medida = 1 d) = 13.64, (/ = 75.24. c = 10. unidad de medida = 0.01 e i L = i 5.2. 3 = 75.2.c= 12. unidad de medida = 0.1 Con referencia al ejercicio 3. determine las fronteras dei primer intervalo de ciase para cada conjunto de condiciones. Basndose en el ejercicio 4. determine as fronteras del primer intervalo de clase para cada conjunto. Use la tabla que se ilustra a continuacin para construir: a) una tabla de frecuencia relativa; bi una tabla de frecuencia acumulada; cl una tabla de frecuencia relativa acumulada. Clase 1-4 5-8 9-12 Til 17-20 f 14 18 12 ~16 20 i

14. Haga lo mismo que en ei ejercicio anteric cara una coleccin de datos de tamao igual que: a) 35. \ b) 80. ci 95. di 100. 2 Ms ei 1000.

nan en su domicilio en 1988 hs propietarios de casas dlos 50 estados/ 26.3 20.8 19.2 18.5 18.5 8.2 7.2 16.1

15.9

15.2 14.7 14.5 14.1 1 4 ;

13.9

9 10

12.2 12.2 12.2 12.0 11.9 11.6 11.5 1.5

10. La tabia de frecuencias no agrupadas de este inciso ie servir para construir: ai una tabla de frecuencia relativa: b) una tabia de frecuencia acumulada; c u n a tabla de frecuencia reiauva acumuiada. i2 15 20 22 35 40 S 10
7

aplicaciones

10.9
9.1

14

11.4 11.4 i l . l

i 0.3 10.2 10.2

15. Los datos-anotados en seguida representan los totales, en dlares, gastados en golosinas por una muestra de 25 estudiantes durante un penodo de exmenes. 57 28 63 38 29 89 77 72 39 47 64 84 88 42 36 72 69 68 41 52 39 72 45 52 84 Mediante seis clases construya una tabia de frecuencia agrupada. 16. Las observaciones siguientes representan las velocidades en millas por hora mph), de 30 coches registrados por el radar de la polica en una carretera interestatal muy transitada: 57 63 70 53 61 60 67 79 64 62 66 73 71 78 84 53 48 80 54 60

8.8

8.5

8.5

9.9 9.8
8.4

11.0 8.0

10.9

7.9

9.4

Con estos datos y siete clases construya una tabla de frecuencia acumulada agrupada. 21. Los datos adjuntos representan una muestra de precios, en centavos, de la gasolina con piorno en una cierta ciuaad durante un mes en particular, 123.9 127.9 130.9 121.9 32.o 120.8 115.9

13 10 2

117.9 131.9 121.9 126.9 122.8 126.9 137.9 115.9 115.9 121.9 126.9 119.9 118.9 119.8 116.9 129.9 122.8 119.9 Utilice estos datos y cinco clases para construir una tabla de frecuencia relativa acumulada agrupada. 22. Use los datos del ejercicio 20 y cinco clases para construir una tabia defrecuenciasrelativa acumuiada agrupada. 23. Se pregunt a un grupo de 30 estudiantes cuntos libros haban compado para el ltimo semestre. Sus respuestas fueron: 5 6 5 5 4 5 4 5 3 6 4 4 4 6 2 9 5 4 3 3 8 117 agrupada, y b) una tabla de frecuencia relativa acumulada no agrupada. 24. Los datos anotados abajo representan el porcentaje de los ingresos familiares gastados en 1988, en alimentacin en ias reas metropolitanas ms grandes de Estados Unidos. 14 12 4
10

1!. En la tabla adjunta, identifique: a) las marcas de ciase: bi ias fronteras de clase. Clase 1-4 53/ 14 n3 12 16 20 '

67 65 62 55 52 69 73 72 66 58 Construya una tabla de frecuencia agrupada usando siete clases. 17. Use los datos del ejercicio 15 y la regla de Sturges para construir una tabla de frecuencia relativa agrupada. 18. Con los datos del ejercicio 16, use la regla de Sturges para construir una tabla de frecuencia relativa agrupada. 19. Las temperaturas del medioda, en grados Farenheit. registradas el 1 de juiio durante los ltimos 28 aos en un pueblo pequeo, son las siguientes: 66 83 77 90 78 84 83 80 ~7 ''9 "5 88 "2 66 83 85 94 88 79 .-9 "2 78 "6 84 SI 73 80 90 Use estos datos y seis clases para construir una tabla de rrecuencia acumuiada agrupada. 20. Las nersonai con casa propia en Estados Unidos parecen cambiar de domicilio frecuentemente. Los datos siguientes indican cunto tiempo, en aos, te-

9-12
13-16 17-20

Con base en la tabla de frecuencia agrupada siguiente construya: a) una tabla de frecuencia relativa; b) una tabla de frecuencia acumuiada; c) una tabla de frecuencia relativa acumulada. Clase 10-15 16-21 22-27 28-53 24-39 410-45 13 10 9

12. Igual que en el antenor, identifique: a) las marcas de clase; b) las fronteras de clase. Clase 10-15 16-21 28-33 34-39 4045

8 7 4 10 4 3 6

a) Construya una tabia de frecuencia relativa no

/
13 10 9 17 22 6

i ; . Utilcela regla de Smrges para determinar el nmero de clases para una coleccin de datos de tamao igual que: ai 25. bi 50. d' 00

13 29 22 14 12 15 2 15 16 9 19 17 16 11 15 15 14 2 15 13 13 i ! 3 14 3 3 2 14 11 12 13 12 11

16 16 16 17 17 12 12 1! 14 12

9. Utilice los datos de este ejercicio para efectuar ia misma actividad dei inciso 8. ai una tabla ce frecuencia reiauva; D una tabla ae frecuencia acumuiada: c: una taola de frecuencia reiava acumuiada.

2 14 15 I I

ai Haga una tabia de frecuencia reiauva no agrupada. b: Tambin una taola de frecuencia relativa acumulada no agrupada.

44 i Estadstica descriptiva: organizacin de ditos

Seccin 2.3 Representacin grfica de datos

45

Se clasific a los esrudiantes de una e cuela pequea de acuerdo con su categora escolar y su preferencia musicai. Los resultados estn registrados en la tabla siguiente. Preerencia mus- Pnmer cal ao Rock Country Clsica Jazz Folklor Total 16 10 3N

e; Que porcentaje de electoras femeninas prefieren al candidato B" f; Qu tanto por ciento de electores prefieren c ios candidatos A o C?

5;.10 56.17 50.25 69.48 58.32 51.42 55.45 60.37 64.00 48.10

70.89 66.94 46.39 46.02 50.82 58.76 58.14 52.41 47.75 59.62

59.17 67.08 55.01 54. i 6 45.45 46.57 57.14 74.13 52.59 59.46

60.08 58.10 68.81 65.07 57.20 47.16 58.63 62.38 42.73 57.16

49.16 71.28 58.70 48.09 62.30 65.51 55.14 51.15 60.32 58.19

3.5 l.S

2.3 0.7 5.2 0.9 0.9 0.9 3.0 1.1

1.2 2.5 1.7 3.2 I T 0.4 1.a 0.7 1.2 0.7 1.6 0.5 1.0 1.0 0.5 0.6 2.8 2.4 0.3 3.1 0.8 1.2 1.7 1.2 0.2 4.0 2.5 1.9 0.8 1.2 0.2 1.3 0.6 0.6 1.8 0.7 1.5 1.3 1.4 I.i

Categora escoiar Segundo Penltimo Ultimo ao i1 12 1 il 0 35 ao


r

2". Los siguientes datos representan las cuentas telefnicas mensuales, en dlares, de 25 residentes de una pequea comunidad: JMT 25.12 36.05 2S.50 21.48 21.15 23.47 27.81 26.66 2e> _ W

ao Tota! 6 5 4 4 1 20 40 30 10 40 10 130

ai Construya una tabla de frecuencia reiauva con diez clases, que tenga el ancho de clase mnimo. bi Qu porcentaje de los datos cae en la pnmera clase?. c i y en la pnmera o en la ltima clase? 33. Para los datos de! ejercicio 2!. realice una tabla de frecuencia agrupada con siete clases que tenga ei mnimo ancho posible, y en donde as marcas de clase terminen en 0.9 centavos. 34, Los datos siguientes representan los puntajes promedio, basados en un sistema de cinco puntos del ltimo semestre para un grupo de! penltimo ao de una escuela de psicologa. 1.3 1.4 2.0 3.7 2.4 3.6 4.0 3.8 1.9 1.1 1.7 2.3 4.2 4.3 3.4 3.0 4.0 4.1 3.6 2.1 2.0 1.5 2.7 2.6 3.6 1.2 3.5 3.3 4.0 3.8 2.6 1.9 Construya una tabla de frecuencia agrupada que tenga ocho clases, con el mnimo ancho posible que concuerde con la unidad de medida y donde la pnmera clase empiece con 1.0.

3 2 2 20

-3 3 53

30.22 25.49 2ji8fT 23.83 25.35 23.48 25.81 26.83 Ztyrf 35.87 22.02 res? b i Qu porcentaje pag ms de 24 pero menos de 28 dlares
1

Construya una tabia de frecuencia agrupada con el mnimo nmero de ciases para las que la amplitud de ciase es w = 2.75. 31. Los clculos en millas por galn en 40 cargas dei tanque de un automvii nuevo son como sigue: 26.6 30.0 28.8 28.4 28.7 29.2 26.4 29.3 25.8 28.7 29.0 28.1 28.3 27.8 27.6 31.9 26.6 28.4 27.1 28.9 31.2 30.2 29.2 30.3 32.0 30.3 29.5 28.4 27.4 30.8 29.5 31.5

30.96 33.38

ai Qu porcentaje del grupo pag ms de 20 dla-

ai Qu porcentaje de los estudiantes de pnmer ao prefieren la msica clsica? b) Qu porcentaje de los aficionados al rock son de segundo ao'
1

cj Qu tanto por ciento del total de los estudiantes prefieren la msica country ?
1

28. Basndose en los datos del ejercicio 20, determine: a) Qu porcentaje de propietarios en Estados Unidos permanecieron en sus casas durante 10 aos?
1

30.3 30.4 29.2 29.3 26.5 28.7 28.8 28.3

d) Cunto, en por ciento, de los estudiantes son de penltimo ao? ej Qu porcentaje del total de estudiantes son de penltim" o de ltimo an tolkinca? 26. Una muestra de electores fue interrogada sobre su preferencia entre tres candidatos a alcalde. Los resultados estn registrados por sexo en la tabla siguiente. Candidato Sexo Hombre Mujer Total
: 1

b) Qu tanto por ciento permanecieron en sus casas ms de 12 aos pero menos de 20? 29"."Considere la tabla de frecuencia agrupada siguiente: Clases / 1 4.5-9.4 9.5-14.4 14.5-19.4 19.5-24.4 -

a) Construya una tabla de frecuencia reiauva acumulada agrupada con ocho clases. b) Use esa tabla para aproximar al quincuagsimo percentil. 32. En un supermercado se realiz un estudio de eficiencia cuyos resultados no representan los tiempos, en minutos, requendo para atender a 50 clientes en la caja:

f) Qu porcentaje prefiere la msica country o la

;
3 4 i 8

s
c

? \ 24.4-29.4

A B C 15 16 ' 5 4 20 20 4 1 5

Total 35 10 45

a) Encuentre w, la amplitud de cada ciase, bi Las cinco marcas de clase. O Localice las fronteras para la pnmera ciase, di Qu porcentaje hay de datos mayores que 19.45? ei y de los datos menores de 24.45 f Qu tanto por ciento cae en ia case 14.5-19.4" SECCIN 2.3 Representacin grfica de datos ful

Una grfica es una forma ilustrada de representar y resumir datos; a menudo, una representacin de datos mediante ilustraciones hace ms evidentes ciertas caractersticas que una tabla de frecuencia; un resultado de representar los datos en forma grfica es que frecuentemente se descubren nuevas caractersticas de ellos; la presentacin grfica de los datos ha logrado un uso creciente en los medios de comunicacin y eso se debe en parte, a la popularidad y uso de la graiicacin por computadora; hay grficas de muchos tipos, las ms usadas, son. ' r irftnrTilr-'pmraifiirrfr tmiTinr Ir '' *-_a*aiiia*fe-ite^^ de ellos con aigo de detalle.
1 1

ai Qu porcentaje de electores prefiere al candidato B" b) Qu porcentaje de electores son hombres'.' o Qu tanto por ciento de electores nombres prefiere ai candidato C? di Qu porcentaje de mujeres prefiera, ai.candiCa-to A"

Un paso ms all 50. Los uatos siguientes representan los totales semana es. en dlares, gastados en comida por 50 parejas recin casados.

y la oh va. Discutiremos cada uno

46 Estadista i descriptiva: organizacin e datos

Seccin 2.3 Representacin gra de datos

Dos de ios pos de grficas ms comunes son ias g r f i c a s de b a r r a s y las g r f i c a s de psst&.mmimmmmmmmi 0f&g$#^ Wlmittmiitmjk las grficas de pastel se usan slo para representar panes de un

TABLA 2.1; Clculos para construir a gricade pastei de ios datos vistos en ia tabla 2.1b

Beneficiario
Regin Saiud Educacin Servicios sociales Artes y humanioaoes Otros Totales

Cantidac 31.0 9.2 9.0 6.9 4.1 4.7 64.! 13.9 10.61 47.S

Grad. | i"2.l | ,0u-S x 360) 50.0 38.2 ~ - ; 100! 25.9 360.0

total y son muy populares para visualizar informacin presupuesta!. Ambos tipos de grficas se ilustrarn usando los datos de la tabla 2.16. que representa a los beneficiarios de los donativos hechos por ciudadanos estadounidenses en 1983. L a figura 2.3 nos muestra una grfica de barras
1

verticales para la informacin de la tabla 2.16. TABLA 2.76 Beneficiarios de donativos Beneficiarios Religin Artes y humanidades Servicios sociales Educacin Salud Otros Totales (en miles de miilones de dlares! 31.0 4.1 6.9 9.0 9.2 47 FIGURA 2.4

La grfica de pastei en la figura 2.4 se construy usando un transportador y la informacin de la tabla 2.17; en dicha grfica podemos ver de una oieada que la religin obtuvo la parte ms grande, una cantidad aproximadamente igual al total de las cantidades restante, mientras que las artes y humanidades consiguieron la pane ms pequea.

Grfica de pastei de los FIGURA 2.3 l_<StS b a r r a s >)&n 32 30 h 28 26 24 22 -20Z Z p i a d a s beneficiarios de donativos en 1983 Grfica de barras vertical de beneficiarios de donativos en 1983

!*
10
6

'6 1 4

Muchos programas computacionales para anlisis de datos permiten trazar grficas de pastel aun cuando se den porcentajes o datos sin agrupar.

a 3

El uso de una tabla, de frecuencia agrupada tiene una desventaja bastante obvia; los datos ongmales-se pierden en el proceso de agrupamiento; para salvar esta limitacin puede usarse d. de L h. (diagrama en forma de rbol); los d. de t. h. ofrecen una forma novedosa y rpida de exhibir informacin numnca. si un numeral tiene dos o ms dgitos, entonces se puede descomponer en una rama y una hoja. \}&Aallo
Benecianos

e..d-!HrMfe^

numeral*mientras que una hoja est formada por l o los dgitos restantes. Por ejemplo, el numeral 278 puede descomponerse en dos formas:

La tabla 2. i 7 organiza los clculos necesanos para construir una grfica de pastei de los datos sobre ios benecianos de los donativos mencionados; cada entrada en ia columna de porcentajes se obtuvo dividiendo la cantidad entre el total (6494 y muitiplicand -r^teonnerae-por' r08r tos entradas en ia columna de los grados se obtuvieron multiplicando ias entradas en la columna de os corcentaies cor 360. que es ei nmero de erados en un circulo. La exhibicin grfica de datos es muy fcil de realizar usando tallos y hojas; cada dato apona una hoja de algn tallo.

48 Estadstica descriptiva: organizacin de dalos

Seccin 2.3 Representacin grfica de daros 4 9

EJEMPLO

2.24

Confuyamos un u. de i. n. para

igcbra:

a coleccin de 25 calificaciones en un examen de

Un d. de t. h. ordenado sirve para ordenar datos y caicuiar puntos de posicin. Un punto de posicin es un punto tai que un cierto porcentaje de datos cae antes que l. Bor ejemplo, haciendo aigunas sumas simples. uno puede observar rpidamente que el punto de posicin de! 4(Fr para ei conjunto de datos de las calificaciones de lgebra es 6 8 ^ . esto es: i0.40) (25> = 10. el punto de posicin debajo del 68: un d. d e h . ordenado constituye una representacin grfica frecuencia. A veces puede ser deseable incluir menos de diez valores de hoja en una sola rama para desplegar os datos, sobre todo si pocas ramas contienen un gran nmero de hojas; cuando esto ocurre, tenemos una exhibicin visual que conesponde a una tabla de frecuencia agrupada; cuando el nmero de ciases crece, ciertas caractersticas relevantes de los datos pueden volverse ms evidentes. Si cada tallo en un d. de t. h. se divide en dos tallos, llamados subtallos. y contienen el mismo nmero de valores correspondientes a hojas, el d. de t. h. que se obtiene se denomina un d. d i. h. d doble tallo. Las e e aplicaciones 2.10 y 2.11 ilustran modificaciones adicionales de ios procedimientos de construccin para ios d. de t. h. Tcspondiente a una cierta tabia de

75 67 65 8" ""5 65 "1 54 94 64 4 82 8 i 68 85 ?6 89 98 59 5" "9 65 59 80 67


1

Como todos las calificaciones caen entre 50 y 99. usemos ios dgitos de ias decenas en cada caso como ei tallo y ios de las unidades como ia hoia. Paso 1. Coloque los tailos en forma ventea! usando un segmento de lnea vertical, llamado tronco para separar los tallos de las hojas. s 6 8 9 Paso 2. Coloque cada hoja a la derecha de su tallo. Como la pnmera calificacin es 78. colocamos la hoja 8 en su tallo 7.

i Tallo

6 7; 8 9 8 Hoja

Usemos ia coleccin de 25 calificaciones del examen de lgebra para construir un d. d t. h. de doble tallo, donde cada tallo tenga cinco posibles valores de hojas; esto se e lleva a cabo dividiendo cada tallo en dos subtallos. a y b: el subtallo a contendr dgitos d 0 a 4 en calidad de hojas, y b incluir dgitos de 5 a 9 como sus hojas. Por e ejemplo, el subtallo 5a contendr hojas del 0 al 4. y el 5b de! 5 ai 9. Ahora veamos el d. de t. h. de doble tallo resultante: 3a 5b 6a 6b /a : 7b 8a 8b 9a 9b
:

Si continuamos el proceso con cada calificacin, obtendremos el d. de t. h . _1 ; i.:_9J49 6! 7 '8 45 7 57 85 86195 5 4 2 9 7 10

9 1 8 4 i Al observar el d. de t. h. antenor podemos concluir que: 1. La calificacin ms alta es 98. 2. La menor es 54. 3. Las calificaciones varan de 54 a 98. 4. El tallo 9 tiene menos hojas. 5. Los tallos 6 y 8 contienen ms hojas, siete en cada uno. 6. El nmero total de hojas representa el tamao de la muestra. Note que no importa ei orden en que las hojas se coloquen en un tallo: si se * ordenan de menor a mayor, el d. de t. h. se llama un d. ae t. k. ordenado. Un d. d e t KiMSiKPto para las ca|tjcaej|)nes del examen de lgebra es como sigu r o o

4 799 4 55 57 i 5 68 9
0

1 24

579 8

Un estudio nacional sobre la uniidad de los reguladores de comente, revel que los costos de la energa elctrica varan ampliamente a io largo de Estados Unidos. Estos costos en ias 25 ciudades mas caras, medidos por ei precio promedio en centavos y por kilowai/hora. en 1984 fueron:

)0 Esudistic} descnpavi: organizacin ae datos

Seccin 2.3 Representacin granea de dalos

51

Construya un d. de t. h. con estos datos. Solucin: Ignoraremos los puntos decimales: cada valor en el arrelo final

tallos; para usar una de las subrdenes disponibles debemos escribir un punto y coma despus de la orden; MlNlTAB responde con el smbolo de suborden, S U B C > . La suborden se escribe seguida de un punto, el cual informa a MlNlTAB que no siguen ms subrdenes y que deben ejecutarse la orden principal y la suborden, si no se escribe e! punto, MlNlTAB responde con otro smbolo de suborden, S U B C > . MlNlTAB usa tres columnas en la respuesta; la columna del extremo izquierdo, llamada de profundidad, nos dice cuntas hojas estn en la lnea o acumuladas de esa lnea hacia atrs o hacia adelante, dependiendo de qu extremo est ms cercano. Por ejemplo, el 9 de la tercera lnea contando de arriba a abajo, significa que hay nueve hojas en esa lnea o debajo de ella; el 3, en la tercera lnea partiendo de abajo significa que hay tres hojas en esa lnea o debajo de ella. La lnea con parntesis contiene la observacin central si el nmero total de observaciones es impar, y las dos observaciones centrales si el nmero total de observaciones es par. Los parntesis encierran el nmero de hojas en esa lnea. E! segundo rengln de arriba hacia abajo contiene nueve valores y la mediana; siete valores caen arriba del segundo rengln y nueve valores caen despus de ste. La segunda columna muestra los tallos, mientras que los nmeros a la

puede llevar a su valor origina! multiplicando por O.i. As. trataremos los nmeros como de tres dgitos comprendidos entre 106 y 165. Si usamos taiios de dos dgitos, obtenemos el siguiente diagramn ordenado: 10 6 67 8 8 8 3 11
2

! 1 2 2 3 3 4-6 8 0 18 139
;

13 14 i5 16

3 3 5

La hoja 5 en el tallo 16 representa 16.5 centavos. Podemos determinar fcilmente que un 20% de los costos promedio son superiores a 13.1 centavos; en esta aplicacin no seria aconsejable usar hojas de dos dgitos v ramas de un dgito porque todas las hojas estaan en el mismo tallo, y de
L

qu servira un d. de t. h. con un solo tallo'?

La pantalla 2.1 ilustra el uso de MlNlTAB para construir un d. de L h. para los datos de la aplicacin 2.10. Pmtalk 2.7 M1B>hl C l DATA>16.5 14.5 14.3 13.9 13.8 13.1 12.8 12.1 12.0 11.3 DATA > 11.6 11.4 11.3 11.3 11.2 11.2 11.1 11.1- 10.8 10. DATA > 10.8 10.8 10.7 10.6 10.6 DATA > END MTB > STEM C l ; SUBC>INCREMENT=1. STEM-AND-LEAFOFC! LEAFUN1T = 0.10 10 6678888 11 112233468 12 018 13 189 14 33 15 16 N=25 Pama/la 2.2

derecha del tallo son las hojas. La pantalla 2.2 contiene un d. de t. h. de doble tallo para los datos de la aplicacin 2.10. Note que la suborden INCREMENT = 1 no se us en la pantalla 2.2 y que esto origin un d.tie L h. de doble rama.

MTB > STEM C l STEM-AND-LEAF OF Cl N = 25 LAFUNIT = 0.10 7 (7) 11 9 7 6 5 3 i 1 1 1 -1 106678888 11 11223341168 1201 128 131 13 89 14 3 145 15 15 16 16.5

Note que STEM es una abreviatura del trmino ingls stem-and-eai diagram, que corresponde a d. de t. h. Slo es necesario que el usuaria teclee las primeras cuatro letras de'una orden. Vea tambin que la orden STEM-AND-LEAF tiene varias subrdenes; una de las subrdenes disponibles es INCREMENT, usada para especificar los

estadstica descriptiva: organizacin de datos

Seccin 23 Representacin granea de datos

53

APLICACION 2.11

Los ciatos siguientes rcptcscian cambios porcentuales de un ao. en nmero de onsioneros en 25 sesiones federales v estatales."
0.6 10.S 7.0 11.7 -10.1 0.19.2 0.6

mbucin 1 Tallo 'iotas

Distribucin Hoias

Distribucin Hoias

68

Construya un d. de t. h. pan ios datos. Solucin: Si ignoramos el punto decimal, observamos que los datos corren

de -111 a 208. Usemos valores de tallo de - 1 , - 0 , +0,1 y 2; para lograr que iodos los valores sean nmeros de tres dgitos, pongamos un cero delante de os valores con dos dgitos; as 4.1 se representa por 041. Necesitamos dos tallos para cero para indicar los signos de los nmeros. Por ejemplo, el tallo para el valor 0.6 es -t-0, el tallo para 7.0 es +0 y el tallo para -1.7 es -0. E l valor 0.6 debe estar representado en el d. de t. h. como +006: 7.0 debe estar representado como +070 y -1.7 como -017. E l d. de t. h. se muestra aqu: -i : +0 1 2 i o ii 02 04 0606 2125 4170 88 98 08 17 29 63 92 06 08 APLICACION 2.12 Distribuciones de La idea de construir un histograma para frecuencia no agrupada de ios datos, es representar cada frecuencia por una barra cuya rea sea proporcional a ella. Tpicamente, el ancho de cada barra se escoge como 1 y as ei rea de la barra es ieual a la frecuencia de la medida. Histogramas Un histograma es un tipo de grfica de barras para una distribucin de frecuencia. _istograraas pueden construirse para distribuciones de frecuencia agrupada y no agrupada, Consideraremos primero histogramas para distribuciones de frecuencia no agrupada.

-0 \5 12 14 17 32 44

frecuencias no agrupadas

Recuerde que cada valor en el diagrama debe convertirse multiplicando por 0.1 antes de hacer la interpretacin. Las hojas en esta aplicacin tambin pueden contener decimales; en ese caso, no necesitaramos multiplicar los valores en el diagrama por 0.1 antes de realizar las interpretaciones que deban hacerse. El correspondiente d. de t. h. es: -1 j -0
j

La tabla siguiente contiene el nmero de nios en edad escolar en cada una de las 50 familias de una muestra. Construya un histograma para datos. Nmero de nios en edad escolar 0 i Frecuencia / 5
e"

0.1 1.1 0.5 1.2 1.4 1.7 3.2 4.4 0.2 0.4 0.6 0.6 2.1 2.5 4. 0.8 1.7 2.9 6.3 9.2 0.6 0.8 7.0 FIGURA 2.5

0
14

+0 | 1! 2i

9
4

Histograma para ia Los d. de t. h. tambin son tiles en otras aplicaciones, como a continuacin se indica: 1. Se pueden comparar dos distribuciones similares si uenen los mismos tallos. En este caso, las hojas de un d. de t. h. pueden colocarse a la derecha de los tallos y las hojas del otro a la izquierda de las ramas, como se muestra aqu: Hojas 86 9875 86 5430 2. Tallo 5 7 8 Hojas 3 68 27 355"6 5 345 frecuencia de los datos de a aplicacin 2.12

Se,puedan.comparar mas de dosdisnbusicnes-orreeli^-iw en forma de columnas si comparten taiios comunes; ios tallos se pueden eoiocar en e; extremo izquierdo de un diagrama y las hojas asociarse como en el diagrama sisuiente:

V
Nmero de nios

JI

i tstadistca descriptiva: organizacin de dalos

Seccin 2.3 Representacin grfica de datos t

55

Solucin:

Nuestro histograma contendr cinco barras.' Colocaremos el n-

FIGURA

2.6

Clase 5.2-6.6 67-8.1 8.2-9.6 9.7-11.1 i 1.2-12.6 12.7-14.1

Fronteras :..:-6.cc 6.65-8.15 S.15-9.65 9.65-11. i: 1 .15-12.6: 2.65-14.::

mero de nios

en

\ud escolar

io

largo

del eje horizontal, la frecuencia a

Histograma para ios datos de desemoleo

lo largo del eje vertical y el punto cero t'.Oj en el eje horizontal, a la derecha de su posicin usual, la interseccin de ios dos ejes. Esto nos permitir centrar las barras sobre los valores de manera q e el eje vertical no pase por ia u pnmera barra. Si escogemos el ancho de cada barra como 1 y ia altura de cada barra como la frecuencia, entonces el rea de cada barra ser igual al producto de la frecuencia por 1. La suma de las reas de las cinco barras sera igual a la suma de las frecuencias; el histograma se ilustra en lafigura2.5. Adviena que el eje horizontal se rompe para llamar ia atencin sobre el hecho de que la escala horizontal no comienza en cero; rompemos el eje para indicar que no estamos tratando de distorsionar la perspectiva deliberadamente.

Paso 2. Se traza luego una grfica de barras usando las fronteras de clase y las frecuencias; las fronteras se colocan a lo largo del eje horizontal y las frecuencias a lo iargo del eje vertical, como lo muestra la figura 2.6.

Histogramas para frecuencias agrupadas por datos

Para construir un histograma para datos medidos en una escala de intervalo o en una escala de razn, se acostumbra seguir dos pasos. 1. Se organizan los datos de una tabla de frecuencia agrupada. 2. Se construye una grfica de barras usando las fronteras de ciase para colocar las barras, y las frecuencias para indicar las alturas de ias barras.

Un histograma mejora nuestra habilidad para comparar las frecuencias de ciase correspondientes; se puede comparar con facilidad la frecuencia de una clase con las de las clases vecinas; podemos ver inmediatamente que la segunda clase del histograma ilustrado en la figura 2.6 uene la mayor frecuencia, y que la frecuencia de esa clase es el doble de la que est representada en la tercera clase: hay una declinacin rpida en el nmero de ciudades representadas en las clases cuya tasa de desempleo est sobre el 8.15 y el 11.5 por ciento. La forma de un histograma puede cambiar drsticamente con una variacin

APLICACION 2.13

La tabla de frecuencias agrupadas siguiente representa la tasa de desempleo, en porcentajes, para 27 ciudades del este.'" Tasa de desempleo (en porcentajes! 3.7-5.1 5.2-6.6 6.7-8.1 8.2-9.6 9.7-11.1 11.2-12.6 12.7-14.1 12 6 1 0 EJEMPLO 2.26 1 Nmero de ciudades

en el nmero de intervalos n o en la amplitud de los intervalos w. Por esta razn, debemos ser cuidadosos al sacar conclusiones usando la forma de ias distribuciones mustrales.

Los tres histogramas mostrados en la figura 2.7, representan una muestra de 100 medidas para valores distintos de n y w. El histograma en ia parte la) tiene n = 5 y n- = 9.95; el de la parte (bl tiene n = 8 y w = 6.22; y el histograma en la parte (c) tiene n = 5 v w = 4.60. Advierta cmo cambia la apanencia cuando cambiael numero ': de intervalos v el ancho de clase. Jr i
35 . 30 25 20 !5 10

T
27

Realice un histograma con estos datos. Solucin: El histograma se construye colocando primero las fronteras de

FIGURA2.7 Efectos en la apariencia del histograma al cambiar el nmero de intervalos v el ancho de ciase. El eje horizontal representa longitudes en pulgadas

clase en el eje horizontal y las frecuencias en el eje vertical. Se traza una barra rectangular para cada clase usando las fronteras de clase para medir el ancho de la barra y la frecuencia para medir la altura; como todas las ciases en una tabla de frecuencia agrupada tienen ei mismo ancho, las reas de las baas sern proporcionales a su altura; es decir, a las frecuencias de las clases. Para construir ei histograma seguimos estos pasos; Paso . Primero caiatiamos asfronteras de case. Sote que ia unidad de 10.5n0.1)

medida es 0.! de porcentaje, por o tanto, para cada ciase se resta:

= 0.0:- dei lmite interior de dase-p ara encontrar ia frontera interior de eme y se aade ftft> al lmite superior de ciase para encontrar ia frontera

supenor de ciase.

00

6 Estadstica descriptiva: organizacin de datos

Seccin 2.3 Representacin granea de datos

57

Note que la suborden INCREMENT = 8 especifica que el ancho de cada intervalo de clase va a ser 8, y la suborden START = 21.5 indica que el punto medio de la primera clase va a ser 21.5, por lo tanto, la primera clase comienza con 17 y ei primer intervalo de clase es 1 8 - 2 MINITAB no muestra los intervalos, slo los puntos medios o marcas de cada uno.

Histogramas relativa
(C)

de ryecuencia

Se puede construir un h i s t o g r a m a de f r e c u e n c i a r e l a t i v a cambiando ia escaia vertical de un histograma de frecuencias. En lugar de empezar con una tabia de frecuencia agrupada comenzamos con una tabla de frecuencia relativa agrupada; la altura de las barras en un histograma de esta naturaleza indicar la proporcin dei total representado por cada clase. Su forma bsica

Se puede usar MlNlTAB para construir un histograma de datos sin agrupar. La pantalla 2.3 contiene un histograma hecho con MINITAB para los datos adjuntos, que representan as edades en aos de una muestra de 40 turistas que viajaron recientemente a japn por American Airlines durante un periodo de un mes. EJEMPLO 2.27

se parece a la del histograma de frecuencia conespondiente.

La tabla de frecuencia relativa correspondiente a los datos de la aplicacin 2.13 se muestra en la tabla 2.18, y el histograma de frecuencia conespondiente aparece en la figura 2.8.

67 36 62 60 Pana/la 2.3

18 63 74

28 44 41 62 72

60 69 44 66 58 68 43 54 65 61 57 61 51 52 TABLA 2.18 Tabla de frecuencia relativa para los datos de desempleo

26 50 34 44 43 54 63 61 45 66 71 80

Clase 3.7-5.1 5.2-6.6 6.7-8.1 8.2-9.6 9.7-11.1 11.2-12.6 12.7-14.1

Fronteras 3.65-5.15 5.15-6.65 6.65-8.15 8.15-9.65 9.65-11.15 11.15-11.65 12.65-14.15 0.19


0.44

65 70

0.22 0.04 0.00 0.04 0.07 1.00

MTB> SETC1 DATA > 67 18 63 74 28 44 60 69 44 66 DATA > 36 26 50 34 44 41 58 68 43 51 DATA > 62 43 54 63 71 62 54 65 61 52 DATA > 60 61 45 66 80 72 61 57 65 70 DATA > END MTB>HISTC1; SUBC > INCREMENT = 8; SUBC>START = 21.5. HISTOGRAM OFC1 N=40 MIDPOINT 21.50 29.50 COUNT 1 2 ** FIGURA 2.8

0.45 0.40 0.35 0.30 0.25 0.20 0.15 0.10 0.05 0

Frecuencias relativas para los datos de desempleo de la aplicacin 2.13

Extensin de desempleo

38

Estadstica descriptiva: organizacin de datos

Seccin C.3 Representacin grfica de los ditos

59

Grficas lineales polgonos

Una grfica lineal o polgono de frecuencia se construye usando una taola de frecuencia agrupada con marcas de ciase. La grfica de lneas ofrece una alternativa til respecto ai histograma: la eleccin de cul se usar es generalmente de upo personal: una grfica lineal crea ia impresin de que las frecuencias cambian ms suavemente, mientras que un histograma sugiere que las frecuencias cambian abruptamente: puede construirse una granea lineal o un polgono de frecuencia para ios datos exhibidos, en una tabla de frecuencia agrupada identificando cada marca de ciase y su correspondiente frecuencia > X.f) con un punto de la grfica. Estos puntos se unen formando una sucesin de segmentos, como se ve en la aplicacin 2.14.

FIGURA

2.9

de frecuencia

ingresos promedio de trabajadores fabriles

APLICACION 2.14

ingreso! promedio (tasa ias 100 mas cercanos)

La tabla de frecuencia agrupada siguiente reporta los ingresos anuales promedio, hasta ios 100 ms cercanos, de los trabajadores fabriles en 27 ciudades del este de Estados Unidos. " Construya un polgono de frecuencia
1

Las caractersticas notables de ios datos estn exhibidas en ia grfica lineal de la figura 2.9. 1. La mayora de las ciudades caen entre los extremos de la escala. Slo una ciudad tiene trabajadores fabriles con un ingreso promedio anual de aproximadamente 13,400 dlares y slo una ciudad posee trabajadores que ganan un promedio anual de alrededor de 26,700 dlares. 2. Los datos parecen tener su centro aproximadamente en 19,000 dlares.

para esos datos. Ingreso promedio $12.500-14.300 14.400-16.200 16.300-18.100 18.200-20.000 20,100-21,900 22.000-23.800 -_S9flO- 25.700 ~ 25.800-27,600 '
i

Nmero de ciudades 5 3 7 6
,

Ojivas

Una grfica lineal construida a partir de una tabia de frecuencia acumulada o de una tabla de frecuencia relativa acumulada, se llama ojiva. Las ojivas ofrecen un medio grfico para interpolar o aproximar el nmero o porcentaje de observaciones menores o iguales que un valor especfico. Para localizar los puntos de una ojiva, se usa una frontera supenor de clase

1 1

Solucin: Poso 1. Encontramos primero las marcas de clase, designadas por X. Ingreso promedio SI 2,500-14,300 14,400-16.200 16,300-18.100 18.200-20.000 20,100-21.900 22.000-23.800 23.900-25.700 25,800-2 .600
7

y su correspondiente frecuencia acumulada o frecuencia relativa acumulada; despus se unen los puntos consecutivos por segmentos de recta; las frecuencias acumuladas o las frecuencias relativas acumuladas, se colocan siempre en el eje vertical. La aplicacin 2.15 ilustra la construccin de una ojiva

/ !
5

X 13,400 15.300 17.200 19.100 21.000 22,900 24.800 26.700

3 7
1 3 1

APLICACION 2.15

Trace una ojiva usando frecuencias acumuladas para los datos de la aplicacin 2.14. Solucin: Paso 1. Primero encontramos ias frecuencias acumuladas. Ingreso promedio S12.500-14.300 14.400-16.200 16.300-18.100 8.200-20.000 20.100-21.900 22.000-23.800 23.900-25,700 25.800-Z .600
1

Frontera supenor 14.350 16.250 18.150 20.050 21.950 23.850 v -so 27.650 ..

/
i 5

Frecuencias acumuladas 1 6 9 !6. . 22 -3 26 2"

Paso 2. Ahora construimos la grfica de lneas mostrada en la figura 2.9. Las marcas de clase se colocan en el eje horizontal y as frecuencias en el eie vertical. Note que la grfica de lneas se "baja" en ambos extremos, concertando ei primero y el itimo puntos a puntos del eje horizontal aue distan w = 1900 de las marcas de clase ms cercanas.

60

Estadstica descriptiva: organizacin de datos

Seccin 2.3 Representacin grfica de ios datos ,

61

Poso 2.1 ,amos las f r o n t e ! ! e ias clases para marcar los pumos en el eje
r

horizontal y ias frecuencias pr.i ios punios en ei eje vertical. Paso.'. Construimos la ojiva i figura 2.10). Vea que ia frecuencia acumulada para a frontera inferior de ia primera clase es 0. Podemos determinar de un vistazo el nmero de ciudades donde os trabajadores fabriles tienen ingresos promedio inferiores a una cantidad especfica. FIGURA 2.10

Paso :. Construimos ia ojiva ;Fig. 2.11 ?. Vemos que P , percentil est entre 18.150 y 20,050 aproximadamente 19.500 y que ?-,, el 75c
i0

percentil. es un poco menos que 22.000; por lo tanto, casi 5 0 % de las ciudades uene trabajadores fabriles que obtienen un ingreso promedio menor de 19.500. y " 5 % de las ciudades cuentan con trabajadores fabriles con un ingreso promedio menor de 22.000. Como resuitado. aproximadamente 2 5 % de los trabajadores fabriles ganan entre 19.500 y 22.000 dlares. 1

Una ojiva para ios ingresos anuales de los trabajadores fabriles de 2~ ciudades del este de Estados Unidos

FIGURA

2.11

Ojiva de ingresos de trabaiadores fabriles

Ingresos promedio (hasta los 100 ms cercillos)

Ingresos promedio (hasta los 100 ms cercanos)

Histogramas, formas de -so^e-o/ivas-para determinar percentiles SP. pnerle iKar una ojiva de frecuencia relativa acumulada para determinar percentiles, como se describe en la aplicacin 2.16.

ojivas y poblaciones

Los histogramas y las ojivas para datos mustrales proporcionan a! investigador una idea de la forma de ia poblacin de la que se seleccion la muestra. El histograma de una muestra sugiere la fonna de la curva de frecuencia poblacional conespondiente; un histograma de irecuertaa relativa para una muestra debe tener una forma asimilar a ia de la distribucin poblacional de frecuencia relativa, y una ojiva para una muestra debe tener aproximadamente la misma forma que la ojiva de la poblacin. Como ias poblaciones se representan a menudo por curvas de frecuencia relativa o por curvas de frecuencia relativa acumulada, es mponante que entendamos sus contrapartes mustrales.

APLICACION 2.16

Construya una ojiva de frecuencia relativa acumulada para los datos de la aplicacin 2.15, y sela para aproximar el 500 percentil (P$) y el 75 percentil (P ).
7i 2 Q

Recuerde que el 75 percentil es la medida por debajo de ia

cual cae el 7 5 % de las medidas.


Solucin:

Paso . Primero encontramos la frecuencia relativa acumulada usando la frecuencia acumulada. Frontera Ingreso promedio 512,500-14.300 14.400-16.200 16.300-18.100 18.200-20.000 20.100-21.900 22.000-23.800 23.900-25700 25. SO-27.600 supenor 4.350 16.250 18.150 /acumulada 1 6 9 16 2" 23 26 /relativa acumulada 0.037 0.222 0.353 0.593 0.815 0.852 0.963 1.000

EJEMPLO

2.28

Suponga que un llenador automtico de botellas en una lbnca de cerveza se programa para venir 12 onzas del lquido en cada botella. Una muestra de 50 botellas proporciona los contenidos siguientes en onzas: 12.335 12.111 12.166 11.900 12.151 11.717 11.584 12.497 12.187 2.185 11.629 12.082 12.491 11.929 12.520 11.988 12.080 12.001 11.912 ! 1.786 11.853 11.923 i 1.889 12.057 11.848 12.083 12.018 11.704 12.335 1.856 1.886 2.130 2.408 1.743 12.035

! 1.990 11.748 12.103 11.655 .853 12.101 1.919

Yl KQ
21.950 25.850 25 7 5 0 2" .650

12.100 11.846 12.240 12.339 1.611

12.410 1.956 2.108

El' histograma de a figura 2. 2iai lustra a distribucin dei contenido de una botella para ia nuestra de 50 boteiia de cerveza: este histograma nos aproxima a una poblacin de forma acampanada, aue es llamada distribucin normal: esto 1 0 estudiaremos con detalle en ei canitulo " v se ilustra en ia figura 2.2(bi.

Paso 2. Usamos las fronteras de ciase para coiocar los puntos en ei eje honzontai v ia frecuencia reiauva acumuiada oara ios puntos en ei eje vertical.

62 Estadstica descriptiva: organizador! de ditos

5ecor 2.1 Reoresentacior granea de ios datos

62

FIGURA

2.12

| GRUPO Habilidades

Di EJERCICIOS bsicas

2.3 9. Construva un histograma de frecuencias relavas para ei histograma adjunto.

Histograma muestral, distribucin pobiacionai v ojiva para ios datos de contenido de cerveza

Considere la mugir de calificaciones siguiente: A C D B C C C D F F D F A D C B C D D B Construya una ai grfica de barras y b I una grfica de pastel.

t
u h
II -

10 -

IT:
Contenido (en onzas) Contenido (en onzas) (ai Histeramamuestra b) Curva relativa de frecuencia poblacional

2. Considere la muestra de tasas de movimiento que siguen: X R X P G P G X X R G G PG12 Trace: a luna grfica de barras y b) una grfica de pastel. 3. Construyaun histograma de frecuencia para los datos listados a conunuacin: use seis barras: 17 14 16 8 31 16 14 9 17 11 PG13 G PG

R R R G R G

a <N c r r.' p IN N r i f * c o. h (N c (
1

Prueba de inteligencia

Prueba de inteiisencia ae una seleccin alearon:, entre estudiantes de la escueia ABC.

25 24 28 10 48 24 12 13 43 24 32 37 33 42 11 34 16 41 21 15
Contenido (en onzas) (O Curva de frecuencia relativa acumulada muestral Contenido (en onzas i
l d )

10. Construya una ojiva correspondiente a ia siguiente tabla de rrecuencia agrpala: Clase 4 5-8 9-12 13-16 17-20 14 18 ilo 20

4. Grafique un histograma de frecuencia que contenga 7 barras para los datos dei inciso 3. 5. Dibuje un polgono de frecuencias para los datos de! ejercicio 3 usando ocho puntos, incluidos los puntos finales. 6. Construya un polgono de frecuencia para ios datos del ejercicio 3, usando nueve puntos; incluya los puntos finales. 7. Trace un J. de t. h. para los dato> adjuntos: 49 62 53 61 51 51 49 61 54 52 48 49 62 60 45 62 49 53 51 45

Curva de frecuencia

relativa acumulada poblacional

La ojiva de la muestra ilustrada en la figura 2.12to. aproxima la forma de S de la distribucin de frecuencia relativa acumuiada para ia distribucin normai que apreciamos en la figura 2.;2d). Una distribucin de frecuencia relativa acumulada para una poblacin de forma acampanada o normai. tendr siempre una torma con a apariencia de una S.

11. Diga la ciase de grficas que son aprooiaaas para ai datos cualitativos y b> datos cuantitativos.

A menudo, ios datos resultantes de un proceso o aplicacin particular tendrn una forma conocida, como lo es una distribucin acampanada: posteriormente veremos que esta informacin puede usarse para evaluar datos mustrales lomados de una poblacin. v

52 61 61 62 63 53 6l' 59 62 51 50 50 65 54 67 o 59 "2 "5 o2 Haga ur. a. de t. h. con los datos del inciso 5.

12. Que ciase de graneas son apropiadas para: ai datos nominales?, b) ordinales?. : i uatos de intervalo y de razn
1

64

Estadstica descripova: ortanizan de datos

Seccin 2.3 Representacin grfica de los datos 65

Mis

aplicaciones

A C

B C

B C

B 3

C B

D C

D D D

D D A

A B A

A C

.0. i 4 inrormacin adjuma representa ei rendimiento promedie en millas por aln estimado por ia Agencia e Proteccin Ambiental CEPA) para 30 coches nuevos. 22 31 20 27 21 29 2" 35 4" 29 27 23 51 41 30 34 27 35 2" 27 31 58 25 27 44 35 34 32 2! 19 Efecte un d. de i. h. con los datos citados. 11. Con respecto ai ejercicio 20. construya un histograma de frecuencia relativa usando siete ciases. 12. Construya un histograma de frecuencia reiauva usando seis clases para los datos del inciso 19. 23. Realice un histograma para los datos que siguen; stos presentan el nmero de automviles vendidos por semana al ao pasado por un agente de ventas. Nmero de coches vendidos 0 1 Frecuencia (f)

Con-.;i-a la grfica de barras adjunta en una grfica de pastel.

13. El nmero de caloras consumidas cada hora por una mujer de 130 libras en a realizacin de diez actividades, se muestran en ia tabla siguiente:" Caloras consumidas Actividad Acostada, despierta Sentada en reposo Trabajando ante su esentono Vistindose, desvistindose Caminando a 2.6 mph En bicicleta a 5.5 mph Jugando tenis Nadando en crawl lento Trotando, sin carga Cornendo a 5.3 mph por hora 72 95 128 140 190 295 384 450 425 550

C C D D D D F

B C B B . A A F C C D D F F . A A C C B B C Con estos datos, construya: ai una grfica e barras; b.i una grfica de pastei. 7. La tabla siguiente muestra las diez operaciones de ciruga plstica ms comunes. Operacin Ciruga de mano Reparacin de desgarres Remocin de tumores Aumento de senos Accidentes industriales Ciruga de prpados Ciruga de nanz Eliminacin de quemaduras Reconstrucciones Faciales Nmero realizado 160.000 150,000 100,000 75.000 70,000 57,000 55,000 45.000 45.000 40.000

40

35 30

25 z 20 15 2 10 5 0
A B C D E

Empleado Ventas del ltimo ao (en cientos de dlares) Remtase al histograma ilustrado en el ejercicio 9 \ encuentre: a) El nmero total de puntajes de la prueba de inteligencia. bi Los puntajes de esa prueba que caen entre 97.5 y 102.5. c) El ancho de cada barra. d) El porcentaje de puntajes de pruebas que caen debajo de 117.5 Bsese en la grfica linea] adjunta para ubicar: a) El total de familias estudiadas. b) El total de nios estudiados. c) El porcentaje de familias que tienen cuatro nios. d) Familias que uenen menos de tres nios, en por ciento.

Construya-una grfica de barras a partir de estos datos. 14. La tabla adjunta enlista el nmero de estudiantes de diez pases distintos que estudiaron en universidades de Estados Unidos durante ei ao acadmico 19881989.
16

t.
17 12

Haga una grfica de barras con la informacin dada. 1JL Construya una grfica de barras para los datos siguientes, que indican los precios de un pasaje, en dlares, para los sistemas de transpone subterrneo ms utilizado en el mundo:' Sistema subterrneo Mosc Tokio Nueva York Mxico Pars Osaka, Japn Lenin grado Londres Sel Hong Kong
8

4 5 6 7

1 3 i
0 1

Pas de origen China Taiwn Japn India Corea Malasia Canad Hong Kong Irn Indonesia

Nmero de esUirlianies 29.040 28,760 24,000 23,350 20,610 16,170 16,030 10,560 8,950 8,750

24. Construya un histograma de frecuencia relativa con los datos del ejercicio antenor; qu nota con respecto a las formas de este histograma y el del ejercicio 23? En qu difieren?
6

Precio dei pasaje le 78c $1.15 lie 87c 78c le 51.17 28e 32c

Un paso ms all 25. Convierta la grfica de pastel adjunta en una grfica de barras.

Trace una grfica de barras con los datos de arriba. 15. De 100 pacientes hospitalizados: 30 enen sangre upo O. 38 upo A. 22 upo B y 10 enen sangre upo AB. Con estos datos construya: ai una grfica de baas: b) una grfica ue pastel. 16. Los datos adjuntos indican las calificaciones rales en rnstona estadounidense para una muestra e 50 estudiantes.

19. Construya un d. de t. h. para los datos siguientes, que muestran ios puntajes obtenidos por 20 estudiantes en un examen de ingls. 57 " I
7

90 46 51 "4 34 65 55 65 Territorio ocupado en 1975 por agencias eaeraies. de un total de "61 millones de acres.

1 66 54 46 22 o9 61 5" 46 84

Numero Ue nios

66 Estadstica descriptiva: organiiaan de datos

Seccin 2.3 Representacin granea de los dalos

67

La labia adjunta muestra ei uempo en horas y minutos que debieron trabajar ios choferes de cio ciudades para comprar hamburguesas, papas fritas corresponden a os aos !9~9 y 98." Ciudad C!. i cago Tokio 979 0:58 '.:29 :41 2:02 2:24 1984 reseos 0. para una familia de cuatro miembros. Lis cifras
:

Constn;} a una sola grfica de barras que compare ios


ueir/vS e ios choferes, ; ra las cinco ciudades, y
:

/, frecuencia H>, amplitud de clase c, nmero de clases n, nmero total de medidas

SIMBOLOS IMPORTANTES

los Jes aos.

R, rango 7, medida mxima L, medida mnima

X, marca de clase j, lmite inferior de clase h, lmite superior de clase

Construya una ojiva de frecuencia reiauva para 'os datos aesentos por a grfica lineal del ejercicio 1S

HECHOS Y FRMULAS IMPORTANTES

Pans
Dusseldor Londres

Para una tabla de frecuencia agrupada todas las clases tienen la misma amplitud Para una tabla de frecuencia agrupada, el nmero de clases debe estar entre 5 y 15, inclusive.

E l ancho o amplitud de clase se encuentra dividiendo el rango entre el nmero de clases y redondeando el resultado al rrirmo entero mayor que RIc. Para una tabla de frecuencia agrupada, la prime-

Regia de Sturges: el nmero de clases necesarias RESUMEN DEL CAPTULO grficas que permiten usarlos y entenderlos ms fcilmente. Estudiamos tambin tablas de frecuencias agrupadas y no agrupadas: ademas, vimos que la distribucin de los datos puede representarse grficamente mediante grficas de pastel, de barras, histogramas, d. de t. h.. polgonos de frecuencias o grficas lineales y ojivas. 1. Las estaturas en centmetros de 50 esfumantes mujeres de preparatoria, son las siguientes: 157 155 171 150 163 150 172 161 154 174 163 148 152 163 149 158 REPASO DEL CAPITULO 176 164 157 153 169 161 160 164 155 162 51 167 67 167 170 158 TERMINOS IMPORTANTES 163 175 169 169 158 150 156 15" 174 162 150 151 165 170 156 170 153 154 a) Construya una tabla de frecuencia agrupada usando 10 clases. b) Trace un d. de t. h. c) Grafique una ojiva usando el resultado de la parte a. di Construya un histograma usando ei resuitado del inciso a. 2. Clasifique los datos siguientes como cuantitativos o cualitativos: ai pesos en onzas de 20 manzanas; b I coiores de diez coches: o longitud en centmetros Je una regia de. i 2 pin-. gaaas; d) preterencias religiosas de 15 personas; EJERCIOOS DE REPASO en una tabla de frecuencia agrupada es aproximadamente igual a c - 3.3flog n) + l, donde n es el nmero de medidas.

ra clase siempre comienza con la medida rrinima. Las fronteras de clase se usan para construir histogramas y ojivas.

En este captulo aprendimos que los datos pueden clasificarse en cuantitativos y cualitativos; los primeros son susceptibles de clasificarse en discretos o continuos, dependiendo de que puedan contarse o no. Tambin puede clasificarse a los datos segn la escala de medicin usada; las cuatro escalas usadas comnmente son la nominal, la ordinal, la de intervalo y la de razn. Para organizar los datos se usan tablas y

e) calificaciones con letra de los estudiantes de equis ciase; f) calificaciones porcentuales de los estudiantes de una clase; g) ei sexo de 50 profesores: h) la posicin apagado/encendido de 30 interruptores de luz; i) las calles en que viven 100 parientes; j) talla de las camisetas de los miembros del equipo de ftbol: k) ei nmero .7 tpii. 3. Para el ejercicio 2, clasifique los datos como nominales, ordinales, de intervalo o de razn. 4. En el ejercicio 2. clasifique los datos cuantitativos como discretos o continuos. 5. Se les pidi a 20 personas que identificaran su preferencia religiosa. Los resultados son: C C P J P J J C J P A j P C P C P J

Los trminos siguientes del captulo estudiado se han mezclado para proporcionarle una mejor prctica de revisin. D una definicin de cada uno con sus propias palabras y despus verifique susrespuestascontra las definiciones del texto. histograma de frecuencia relativa grfica de barras tabla de frecuencia bivariada grfica de pastel diagrama de doble tallo fronteras de clase datos marca de clase lmites de clase amplitud de clase frecuencia acumulada datos sm agrupar tabla de frecuencia relativa acumulada tabla de frecuencia no agrupada frecuencia polgono de frecuencia tablas de frecuencia datos bivariados grfica tabla de frecuencias agrupadas histograma datos connuos rango profundidad datos de intervalo grfica linear datos nominaies ojiva datos ordinales percendles datos cualitadvqs datos cuantitativos punto de posicin datos de razn frecuencia relativa tabla defrecuenciarelativa diagrama de tallo y hojas regla de Sturges marca de cuenta unidad datos univanados datos discretos

A P

uonde C denota catlico. P protestante, j judo > A aleo. Construya una. ai taola de frecuencia: b) grfica de barras; o ricade pastel.

68

Estadstica descriptiva: organizacin de datos

Seccin 2.3 Representacin grea de los datos 69

6.

Dados sus
a) 7-16 b) 3.4-7.8 c) 1.3-4.5

lmites, encuentre

as

amplitudes de

as

12. La siguiente tabla presenta la esperanza promedio de


vida en Estados U nidos para los ai.os 1950 y 198! 9 50 H Recin nacidos 5 aos de edad 2: aos de edad 35 aos de edad 45 aos de edad 65 aos de edad M 98 H 70.9 72.2 72.9 "3.7 74.5 79.5 M 78.3 79.3 79.6 80.0 80.5 83.8

Aplicaciones

de

computacin

2. Los datos siguientes muestran los puntajesde pruebas de inteligencia de una muestra de 100 estudiantes de 10 grado de la University High School:
2

siguientes clases:

Los datos siguientes presentan los puntajes en matemticas en el PAA, de una muestra de 100 estudiantes novatos de una universidad. 411 606 425 444 507 300 548 387 432 527 508 294 578 469 640 444 261 436 442 508 520 423 556 546 363 569 457 554 624 515 527 450 509 506 374 316 566 415 576 298 401 589 474 571 455 615 439 404 447 676 333 496 559 430 660 494 449 421 690 682 349 485 505 648 475 309 531 499 503 400 550 522 553 555 473 372 505 460 550 653 560 327 458 490 557 337 513 579 403 489 454 470 495 552 600 651 519 698 568 408 Use un programa computacional paira construir: a) una tabla de frecuencia agrupada que tenga diez clases; b) un d. de t. h. para los datos; c) el histograma correspondiente a la tabla de frecuencia de la parte a.

65.5 71.0 68.6 73.5 69.4 74.0 70.2 74.5 71.6 75.6 80.0

132 89 87 94 117 71 124 123 75 95 130 120

103 112 120 99 115 95 87 117 94 83 99 92

94 95 107 89 91 86 80 114 94

78 82 95 93 90 87 71 90 83

108 86 104 86 97 97 92 109 100 116 135 93

105

98

114 120 91 78 104 149 121 86 116 69 102 80

d) 1.23-4.78 e) 0.03-0.09 7. Si una tabla de frecuencia agrupada debe contener ocho clases y a medida menor es 14 y ia mayor 94. encuentre la amplitud de cada clase. 8. Considere la siguiente tabla de frecuencias bivariadas: Aprobado Hombre Mujer Total Encuentre: a) nmero de mujeres que aprobaron; b) porcentaje de hombres que reprobaron: c) porcentaje de aprobados que son hombres. 9. Se realiz un experimento para determinar el efecto de un cierto frmaco en ios niveles de colesterol en ia sangTe. e mg/lOu mi. en nombres de 30 aosrSiT obtuvieron las medidas: 245 245 160 235 190 185 165 240 120 220 230 195 285 145 225 170 175 185 265 210 205 225 260 225 195 210 195 ... 11 14 25 Reprobado Total 15 26 10 24 25 50

124 113 100 81

98 122 79 107 97 78

a) Trace una grfica de barras para la esperanza de vida promedio de los varones en 1983. b) Construya una grfica de barras para la esperanza de vida promedio de las mujeres en 1983. 13. Los datos siguientes representan los pesos en libras de una muestra de estudiantes en una preparatoria. 114 115 116 120 123 126 128 129 131 132 132 133 134 135 135 137 138 139 142 142 143 146 147 152 157 158 161 164 165 167 168 168 170 170 172 174 174 174 175 175 176 177 177 178 180 184 184 184 186 187 189 194 195 195 200 201 202 206 207 709 a) Construya un d. de t. h. b) Construya un d. de t. h. de doble tallo. Revela este d. de t. h. algunas caractersucas de los datos que no fueron reveladas por el d. de t. h. de la parte a? Ofrezca una explicacin para la diferencia de las formas. c) Use un diagrama de la parte a, para construir un histograma de los datos sin agrupar. 14. La tabla de frecuencia adjunta connene las velocidades en millas por hora, de una muestra de 60 coches que recorren la !4a. Avenida en Nueva York, segn el registro del radar de un polica. Clase 54-39 40-45 46-51 .

80 106 90 72

86 105 128 88 94 88

93 109 116 94 99 94 73 80

134 111

98 110

Use un programa computacional para construir a) una tabla de frecuencia agrupadas que tenga doce clases.
b)

un d. de t. h.

c) el histograma correspondiente a la tabla de frecuencia del inciso.

140 215

a) Construya un d. de t. t i b Haga una tabla de frecuencia agrupada con diez clases. ci Trace un histograma de frecuencia relativa usando la tabla antenor. 10. Las estaturas, hasta la pulgada ms cercana, de 33 estudiantes son las siguientes: 66 65 64 68 69 65 68 68 64 6 64 o3 "1 "0 67 69 " i 59 67 "2 "0 67 69 69 66 65 67 70 66 "0 67 64 30 Construya, UE histograma s recue-ricta grupaduquetenga ocho barras. 11. Grneme un . de:. h. de doble tallo rara los datos

. EXAMEN DE CONOCIMIENTOS

DEL CAPITULO

Los datos siguientes indican los pesos en libras rebajados por un grupo de mujeres en las dos primeras semanas de un programa de ejercicios dianos: 1 3 5 10 2 5 " 9 a 12 0 3 5 ^ p 5 ! 12 5 12 17 9
3

2. Construya una tabla de frecuencia agrupada con cinco clases. 3. Trace una ojiva usando frecuencias relativas y la tabia construida en punto 2.

1! 3 SIS '

3 2 11

4 5 9 9

4. Grafique un histograma de frecuencia con cinco barras usando la misma tabla del ejercicio 2. 5. a) Encuentre el ancho de la clase 10-20. uonde 10 y 20 son ios lmites de ciase, b) Si L = 52.1. / = 89-7. c - 5 y a unidad de medida es 0.1. determine si lmite supenor ue la pnmera ciase.

11!

9 8

Use ei conjunto oe datos para cubrir los ejercicios

Lonstruva una ouva ue recuencia reiauva.

dei i ai 4.

1. Construya un d. de t. h.

Estadstica anlisis de

d e s c r i p t i v a : datos univariados

DESCRIPCIN 3.1 Medidas de tendencia centra/ v colocacin 3.2 Medidas de dispersin o variabilidad 3.3 Tendencia central y dispersin para datos conteni-

OBJETIVOS

DEL

CAPITULO estudiaremos:

En ene capitulo > >

C^atro medidas de tendencia cer, -jal. Cmo calcular las medidas de tendencia central zara datos agrumados y no agrupados.

> > > > > >

Cmo encontrar percentiles

para datos agrpanos v no csruoaaos. centra..

Ventajas y desventajas del uso ce cada medida de iender,c El concepto de sesgo. E! concepto de suma de cuadrados. Cuatro medidas de dispersin. Como calcular as medidas de dispersin para datos no agrupados.

dos en tablas de frecuencia agrupada 3.4 Puntajes estndar y observaciones aberrantes

agrupados;.

> > >

Teorema de Chebichev. Puntajes estndar. Cmo construir y usar grficas ce caja.

Ce ^

s o s p e c h a que u n a gran u n i v e r s i d a d d i s c r i m i n a a las m u j e r e s e n s u s p o l t i c a s de c o n t r a t a c i n . P a r a investigar los cargos, una C o m i de h o m b r e s y

s i n de D e r e c h o s H u m a n o s d e t e r m i n a e l n m e r o

m u j e r e s que h a n r e s p o n d i d o a l a o f e r t a d e puestos docentes durante u n periodo de tres a o s , y c a l c u l a los porcentajes de h o m b r e s y m u j e r e s c a l i f i c a d o s . L o s datos o b t e n i d o s s o n los de ia tabla siguiente:

Hombres Nm.de rea Matemticas Qumica Fsica Ingls Total 75 100 50 25 250 15 35 9 1 50 20 20 35 18 20 30 50 400 500' Nm. de Porcentaje

Mujeres Nm. de Nm. de Porcentaje solicitudes aceptados aceptado 8 21 18 32 79 40 70 36 8 lo

solicitudes aceptados aceptado

Seccin 3.! .Medidas de tendencia centra! y de cok- ct> .

73

Estadstica descriptiva: anlisis de datos umvanados Para describir las medidas centrales en los cuatro ejemplos que acabamos Proporcionan ios datos evidencia de ia discriminacin contra ias mujeres'? Note que. para cada rea, la proporcin de mujeres contratadas duplica ia proporcin de hombres aceptados, pero ios datos combinados de todas ias categoras indican que a proporcin de hombres es mas alta. Despus de que usted concluya ei estudio dei captulo, ser capaz de responder ia pregunta inicial. Media Panorama del captulo En el caotulo 2 presentamos tos mtodos para organizar os datos mediante tablas y graneas, tsas tcnicas representan medios visuales de descubrir relaciones, modos de comportamiento y tendencias en los datos; en este captulo queremos complementar las interpretaciones visuales, hecnas posibles por labias y grficas, con medidas numricas de caractersticas posedas por muenas colecciones de datos cuantitativos: dichas caractersticas inciuven ei centro, la dispersin y los puntos de posicin de un conjunto de datos. .7-6 + 6-810 EJEMPLO 3.1 rbasqttbolporeijugador A:6. , 0 , 3 . 7 . 6 . 6 . S . 5 . 9 y 10. Larnea,aes _!0_70 " io
;

ce dar. usaramos la media ara el ejemplo I . la mediana para ei ejemplo 2


P

vlamociapanlosqen^ de tendencia central y conozcamos Lis razones de ia eleccin en ios cuatro eiemios.

L a media o promedio aritmtico de un conjunto de nmeros se encuentra sumando ios nmeros y dividiendo despus ia suma entre . el numero ae medidas.

El valor ~! representa, en aign sentido, el numero central o "medio" de los puntos anotados en diez juegos por el jugador A.

SECCION

3.7 de tendencia

Medidas

de tendencia

central y de

colocacin

La media se puede calcular tanto para muestras como para poblaciones, de! mismo modo, pero se denotan en forma diferente; la media muestral se denota por x y la media poblacional por la letra griega u (pronuncese mu i. Una frmula para calcular la media de una muestra de datos numricos est dada por

Medidas central

L a primera caracterstica de un conjunto de datos que deseamos medir es el centro o la tendencia central. E l propsito de una m e d i d a d e t e n d e n c i a c e n t r a l es resumir un conjunto de datos de forma que podamos tener un panorama general; una medida tal sirve como representante del resto de JajnfjKmiorjjiJL^ de datos proporciona tambin una idea del valor central de un conjunto aparentemente desorganizado de observaciones. Considere los cuatro ejemplos siguientes: 1. Pesos en libras: 5,6,12,15 y 20. 2. Calificaciones para un examen: 31,73,78.79, 80 y Si. 3. Colores de coches: tres blancos, cuatro rojos, siete negros y uno azul. 4 Puestos acadmicos: siete profesores, tres profesores asociados, dos profesores asistentes v diez instructores. En los ejemplos 1 y 2. la escala usada es de razn; en el 3. nominal y en el 4, ordinal. Qu medidas usara usted para describir el valor central o para representar el conjunto de datos de cada ejemplo? Hay muchas medidas de tendencia central que se usan para encontrar un centro de un conjunto de datos; cuatro son las ms comunes: ia media, la mediana, la moda y el rango medio. | La media es el promedio antmetico. La mediana es el puntaje ordenado medio.
1

VIedia muestral _ Ix

donde 7 denota la media muestral., denota una medida de la Una frmula para encontrar la media poblacional esta dada por

denota la suma de ias medidas de la muestra y es el tamanode lamuestra.

Media poblacional I.v

* * .

U . * * 1 *

poHacon y . V el

de

>

a s a r e s l a o r a u i i a d e b e c o n o c e r s e a m e d i d a de c a d a e t o K M d e l a p o b a

La moda, si existe, es ei puntaje ms frecuente. El rango medio es ei promedio aritmtico de las medidas mayor y menor.

l e

u t e

.M.. -

e m b a r . a o * * *

* *

para r o t o l o DOS de datos, c o m o t e r e m o s en el e m p i o

y s t o t

a i e s anuales e n m i

Secdtin 3.? Medite de tendencia central y de co/ocacirin wson;2]


a r n e d i

^ 3 9 . l 3 3 7:0
J v

a , y

9 n n ,
9 9

n a c

'ones
4

^poblaon.

'

^nej

' :; - '--0.23.6.:Q

Para encontrar la media de datos mustrales exhibidos en una tabla de frecuencias, usamos la frmula sisuiente: Media muestral para datos en una tabla de frecuencias

nacionales

" ' ^ ^ ^ ^ ^ - ' ^ - ^ consecuencia


u e n c , a

-_lfx
X

- a media Desventajas de la media del uso

l f

A'

L a media tiene una seria desventaja:

se ve afectada por los valores

extremos dei final de una distribucin. Como depende dei valor ae cada medida, los valores extremos pueden llevarla a representar defectuosamente los datos.

'"~10"
P o r l

tanto, el r , ,
nr

EJEMPLO

3,2
S u

Ponea

q u e

^
'
P

^
^ c u ^

/ f M P t O 3.3

Suponga que un corredor de maratn ha corrido en seis de los maratones ms grandes del pas, quedando en las posiciones siguientes (el orden es el de los maratones y. 2 85 En la luma carrera, en la que i ocup el 85 lugar, fue todo el tiempo tratando de ganar la carrera. Como en pnmer lugar las primeras 22 millas, pero le dieron calambres y tuvo que caminar parte de las ltimas cuatro millas. Si la media se usa para descnbir la habilidad del corredor, entonces debe usarse el valor 17.5, pero como termin a lo ms en sexto lugar en las cinco pnmeras carreras, no parece razonable usar la media para medir su capacidad de correr. Quiz la mediana proporcione una medida mejor, pues en este ejemplo la media se afecta mucho por el vaior extremo 85. Para datos medidos en al menos una escala de intervalo, la mediana es el puntaje medio ordenado. Por ejemplo, la mediana de los puntajes ordenados de un examen 9 , 22,37,45 v 57. es 37.

En ocasiones muchas observaciones comparten valores comunes, como en las distribuciones de frecuencia no agrupada. Suponga que tenemos la muestra siguiente de edades en ao de principiantes de una universidad: 1 8 1 8 1 8 1 8 1 9 1 9 1 9 20 20 21

^ ^ ^ ^
S l a

Pcamos h A,r

Mediana n -1 0
9 1

' estos
a

= 19

Cmo determinar la mediana Para encontrar Ix, es ms simple sumar los cuatro productos (4)( 1 8 1 (3)(19), (2X20) y (1X21). Cada producto puede escribirse como fx, donde f es la frecuencia con que aparece una edad x (vase la tabla 3.IV, la suma de ios * gual i " y Ja valores de / es igual a n la suma de los valores de f.r es igual I x.
e s v

Ordene los datos. Si el nmero de medidas es impar, entonces la mediana ser la medida en ei centro, pero si el nmero de medidas es par. la mediana es la media de las dos medidas que ocupan posiciones centrales.

edades de 0 estudian^, ^ a n t e s de reor, egreso


uu|

~-L_jajJa ''
1 9 8

.V

li^e^cia L a mediana de una poblacin se denota por u y la mediana de una muestra


4

lili 1

18 19 20 2J
3

?T

se denota por .7.

20
2 1

JO 2!

EJEMPLO

3.4

Suponga que en los ltimos siete juegos los Bobcats anotaron los nmeros siguientes de Dtinios: o 10 3 21 0 35 14

mediana ue ios puntos anotados,se .encuentra ordenando primero los puntajes: , A

'~' = i90/i

0 =

,o

5 o 10 4 2! 55

Seccin 31 .Medidas detendenciacentral y de colocacin .

77

Se ve ciimente que e! puntaje correspondiente a ia mediana es 0. pues soto un puntaje ocupa la posicin central. Si en ei prximo juego los Bobcats anotaran, 4 ; puntos, entonces ios ceno puntajes formaran ia secuencia sieuiente0 2 6 10 )2! 3: 42

extremos al final de la distribucin; sta fue ia razn de escoger ia mediana para : .presentar ia medida ''de en medio", para los datos de calificaciones ustr-ad.* en el ejemplo del principio de ia seccin: la desventaja dei uso de la mediana reside en que no es fcilmente deterrrunable si el conjunto de datos es rtiiide, puesto que las medidas deben ordenarse pnmero. ponerse en orden numrico de menor a mayor o ai contrario. Para conjuntos grandes de datos que han sido organizados en una tabla de frecuencia donde los valores de x estn ordenados, o un diagrama de tallo y hojas ordenado, ia mediana se encuentra as: j i mediana es el promedio e las medidas en ios lugares n/2 y n/2 - 1.
;

Como ahora hay un nmero par de puntajes, los valores 10 y i 4 ocupan las posiciones de en medio, y resulta que ;a mediana es 12. el promedio de 10 v 14.

La pantalla 3.1 ilustra el uso de MlNlTAB para determinar la media v la mediana para los datos de los Bobcats (6,10, 3,21 0 35 v 14) del ejemplo 3.4. ' Pantalla 3.1 MTB> SETCl DATA >END DATA>6 10 3 21 0 35 14 MTB > MEAN Cl

j Si n es impar, la mediana es la medida en el lugar m + ! i/2: y si n es par. la '

Note que in - ll/2 no representa una de las medidas, sino el nmero de valores que deben contarse para llegar a la mediana. Para los cinco valores ordenados 4.8,12,13 y 14, la medida con rango (5 4 i )/2 = 3 es 12. Encuentre la mediana para los datos mustrales organizados en la tabla 3.2. una tabla de frecuencia que representa el nmero de faltas en cada periodo

MTB > MEDIAN Cl MEDIAN = 10.000 APLICACION 3.2

MEAN =12.714

Las primeras tres lneas se usan para introducir los datos. Despus del smbolo del sistema MTB>, el usuario escribe la orden[slfTcTI para crear una columna etiquetada C1 que contendr los datos; el sistema entonces responde con el smbolo de datos, DATA, en la segunda linea; en seguida el usuario escribe los datos (los nmeros se separan usando un espacio o una coma). La orrirn FNR rlrhr n.i i i i u u J d r "
I V \i usudtiu -JJOI el W I I H

i j

de clases durante la primavera de 1988 en un grupo de introduccin a la filosofa.

' | ! I

TABLA 3.2 Datos de faltas para la aplicacin 3.2

Nmero de faltas Frecuencia 0


1

/acumulada

pala

I :_ J-l indicar el

fin del

, , conjunto

. de_ datos.

En la

l cuarta

lnea, la ordenMEAN"ClI proporcionada por el.usuaria indica que se pide el valor de la media,-el sistema responde en la lnea siguiente con el valor de la media (MEAN = 12.714). Anlogamente, en el siguiente rengln se pide el valor de la mediana mediante la orden) MEDIAN C1) dada por el usuario. El sistema responde con MEDIAN = 10.000. Recuerde que, al finalizar cada orden, el usuario debe oprimir la tecla enter o return para registrar la orden en el sistema de la computadora.

2 40 Como consecuencia de la regia dada y el hecho de que haya 40

I
Solucin:

medidas involucradas, la mediana es el promedio de las medidas vigsima y vigsima primera; note que como hay un nmero par de medidas, dos de las medidas ocupan las posiciones de en medio; para llegar a la mediana podemos contar ya sea en direccin de la medida menor a la mayor, o viceversa. Como el valor nmero 20 contando desde la medida menor, es el valor 21 contando desde la medida mayor, slo necesitamos promediar esos valores contando desde el valor menor, por lo tanto, la mediana de los datos es i i +2V2 = 1.5 faltas.

EJEMPLO

3.5

Como la mediana es el valor de en medio para una distribucin, puede no haber tanto valores por debajo como por encima de l. Por ejemplo, considere la muestra siguiente de cinco valores: 6 6 " 8

El valor b de la mediana no nene valores cor abajo de l, pero nene do.- valores que lo superan. Moa El uso de la mediana para datos j e intervalo posee tanto ventajas como desventajas. Una ventaja es Que ia mediana no se ve afectada porpuntaies La moda, si se da. es ia medida ms frecuente: nene dos ventajas: para cieas muestras oequeas. se le determina fcil mente y. en general, no se ve alectada por ios valores extremos al final de un conjunto de datos ordenados, como

Seccin 3.1 MM'IMJ de tendencia central v de co/ocarin 79

en el ejemplo 3.7; cuando se analizan datos cualitativos, como en ei eiempio 3.8. la moda es a nica medida de tendencia central que pue-.ie uuhzar'se. Finalmente, ia m a l a puede usarse como una medida de tendencia central para datos numricos empleados en sentido cualitativo vase el ejemplo

para esta aplicacin es ia moda; el valor de ia moda es 324. Esto puede servir para representar el vaior central de ias diez observaciones. Una moda para datos en una tabla de frecuencia, se encuentra localizando ei valor de frecuencia mxima, si no todas las frecuencias son iguales. Ei vaior de .v que corresponde ai valor de frecuencia mxima se toma >rno una

EJEMPLO

3.6

Con las medidas

m i d a . Para la aplicacin 3.2. se ve fcilmente que as modas son y i .

D e s v e n t a n ae k moda la moda es 3.

La moda tiene varias desventajas como medida de tendencia central; una de ellas es que para un cierto conjunto de datos puede no haber moda; esta situacin surge cuando todos los datos tienen la misma frecuencia; otra Desventaja es que la moda puede existir pero no ser nica, como en el ejemplo 3.11.

EJEMPLO

3./

La moda no se ve afectada por medidas extremas, como se observa en as dos muestras siguientes, A y B. caaa una con una moda de 2. A: 1.2, 2.2.2,78 B; 1.2, 2, 2,3.8 La medida extrema de 78 en la muestra A no tiene efectos en el valor de la moda. tampoco uenen moda. no tienen moda. Las medidas 4 4 EJEMPLO 3.W Las medidas rojo negro caf azul

EJEMPLO

3.8

Suponga que los tipos de sangre para un grupo de 12 estudiantes de enfermera son A, A, B, A, AB, O, O, B, 0 . A, B y AB. La moda, o el upo de sangre ms frecuente, es el upo A, para estos datos, no uene sendo usar la media o la mediana para localizar una observacin central, ya que la moda es la nica medida de tendencia central que tiene sentido aqu. Rango medio El rango medio de un conjunto de datos es el promedio de las medidas mayor y menor. Los siguientes son los nmeros de torceduras necesarios para romper ocho barras forjadas de una aleacin: 32.38. 45.44, 27. 36,40 y 38. Determine el rango medio. El rango medio es el promedio de las medidas mayor y menor. La EJEMPLO 3.77 Con ias medidas: rojo. roto. rojo, negro, azul, blanco, blanco y blanco: tanto rojo como blanco son modas. En este caso la coleccin Je observaciones se llama bimodal

EJEMPLO

3.9

La C ai P Tdepliuilet2OTpany^iroporciona7ervicio local slo a puntos ubicados en un rea geogrfica especfica; cualquier llamada hecha desde un punto dentro de ese circuito de llamadas a un punto fuera de l tiene un cargo adicional que hace la compaa mencionada. Los primeros tres dgitos de un nmero telefnico de siete indican el rea a a cual se llama, y los ltimos cuatro el lugar dentro del rea de la llamada; los lugares a los que se pueden llamar desde un telfono localizado en una cierta rea se idenftcan porque el nmero telefnico comienza con 689. Cada uno de los nmeros siguientes representa los pnmeros tres dgitos de una muestra de llamadas hechas por un negocio desde un telfono localizado en el rea ae llamadas de Frostburg, durante un penodo de una hora: APLICACION 3.3

264 324 463 689 697 722 724 729 759 777 895

Mt. Savage Wellersburg Lonaconing Frostburg Cumberiand Cumberland Cumberiand Cumberland Cumberland Cumberland Gran ts vi He

Solucin:

medida mayor es U = 45 y la medida menor es L = 27, El rango medio es

Ranao medio 264 324 463 689 697 722 689 895 324 324

L-U

"7 -45
!

Cul observacin deberemos usar para representar el valor central de esta muestra'

Aunque las observaciones son nmeros, stos representan datos medidos en una escala nominal y se usan en sentido cualitativo: slo representan etiquetas y el orden no est involucrado, en consecuencia, la mediana no uene sentido porque los datos no toman un orden particular. Por ejemplo, no tiene sentido preguntarse por ia relacin de orden entre 264 y 524, o entre Cumberland y Cumberiand: tampoco tiene sentido promediar as diez observaciones porque los nmeros no se usan en un sentido cuantitativo y no uene caso sumarlos. .Qu interpretacin \i aar.arr.es a. 2L"~ 524.'
t

A P L I C A C I N 3.4 j

Q u medida de tendencia central oebe usarse para indicar el salario

central de iodos ios trabajadores en Estados Unidos'.' Solucin: La medida preferible es ia mediana. Debido a los salarios eleva-

dos enun extremo-de-ia escalar ni i a media ni'ci rango medio deben usarse:' desde luego, ia medida apropiada depender de cmo se le '.'aya a utilizar: para indicar ei estado financiero en el mercado internacional, a los estadou-

ene , contexto-de este ejemplo'' La nica medida de tendencia central quee> aoromaa
1

Seccin 1 1 Medidas de tendencia cenrai / de colocacin

81

,30%t'32i = ai me.no- 9.6 valores en o por debajo de eila nidenses les gustara usai la media, una razn para no u :.i !a moda es que
r

no hay garanta de que exista una nica moda; puede

existir o haber . i

i"0%i(32) = ai menos 224 de ios vaiores en o por encima de eila Como en el croceso de contar se obtienen nmeros enteros, ei trigsimo oercenui debe tener ai menos 10 valore? en o debajo ae el \5 vaioic; en o encima de i. Cuando menos en ambos casos hemos escogido ei mnimo omero mayor que el orcxiucto, al examinar ei diagrama de tallo y hojas del ejemplo 5.18. determinamos que 50 satisface ambas condiciones. As. Py = 50.
:

eran nmero de valores oue o-.-.-iran con mavor frecuesua.

Medidas

de

colocacin

U n punto de posicin, para una distribucin, es aquel vaior para ei cual una porcin especfica de la distribucin queda en o debajo de l: la mediana es un ejemplo de punto de posicin, y tai -.bien o son los percentiles. deciles y cuartiles.

3 U 5 6 8

u ? 0 i 4

i ti ' 0 5 6

6 7 i 4 8 8

9 S 5 4 8 8 9 7 " 8 9 " S 9

EJEMPLO

3.72

Un 50% de la distribucin es menor o igual que ia mediana, y otro 50% es mayor o iguai que la mediana, por lo tanto, la mediana es un punto de posicin.

Percentiles

El n-simo percentil, denotado con P-. es el valor para el cual ai menos rfii de la dismbucin cae en o por debajo de l y al menos ti 00 - n)% cae en o por arriba de i. Cuarti/es y dea/es Un conjunto de datos tiene 99 puntos percentiles que lo dividen en 100 partes: cada parte contiene aproximadamente 1 % de las medidas. Estos puntos percenles se etiquetan con P, P , P, P
2 M

i Los cuartiles son nmeros que dividen en cuatro panes a un conjunto ordenado I demed,das.extendtndosedesdelamnimahastaiamiximamed,da.porioque I cada pane cuenta con aproximadamente 25% de las medidas.

....PQQ.

EJEMPLO

3.13

Supongamos que queremos encontrar ei vigsimo quinto punto percentil. o percentil 25, de la muestra exhibida en el siguiente diagrama de tallo y hojas ordenado: 3 : 4 5 6 ^ 0 7 . 1 8 : 4 0 1 0 5 6 4 6 1 4 8 9
:

Hay tres puntos cuartiles. denotados con el percentil 25, el

Q-,, Q-_, Qh Ei primer cuanil Q. es segundo cuanil, ( X es el percentil 50 o la mediana, y ei tercer cuart. Qh es el 75 percentil. Q = Pl5
fi: = =P5o

^T-cT Tf][9]"" 5 4 8 7 7 8 9 7 8 9

8 8 \s deciles son nmeros que dividen en diez panes a un conjunto de medidas | que van desde la menor a la mavor, de tal forma que cada parte conuene I aproximadamente \ 0 % de las medidas.

El tamao de la muestra es n = 32. El percentil 25 es aquella medida para la cual al manos 25% de la muestra cae en o debaio de l y al menos el 75% se ubica en o por encima de l. (25%1(32) = al menos 8 valores en o debajo de l. (75%it32l = al menos 24 valores en o por encima de l Si contamos ocho hojas desde ta punta del tronco, llegamos a ia hoja 8 en el tallo 4. El valor 48 tiene 8 valores en o debajo de i y 24 valores encima; el valor 49 tambin sausface esas condiciones porque 8 valores estn debajo de l y 24 encima. El percentil 25 es ei promedio de 48 y 49; por lo tanto, P = 48.5.
:;

Hav nueve deciles. denotados con D , D , D ..~ y a ; Dn es el n-estnto deciL


?

cada punto decil corresponde a un punto percentil. Por ejemplo. D, D- - P-. y as sucesivamente.
n

i0

steneT-irmememe-utrobiero: tos meaifc. ordenadas , e r n ^

; ; g

EJEMPLO

3.14

Supongaque queremos encontrar ei trigsimo percentil de los datos del ejempio 5.13. Ei percentil 30 ser aquella mecada aue tenga-ai menos 5 0 % de ia muestra en o por aeoajo ae ella y al menos " 0 % ue la muestra en o por encima ue ella.

nieron80.,S9.9. 1014, 102.. 115.0. 120.1.12c... i 151 6 v 160.5. Determine: ^ _ ^

y-ccin

! e n d e n c i a c e n t r a

'" *

r o

'

o c a C

'"

'

8 3

a i ei pnmer cuarta, bv el segundo euart. o di ei tercer cuaru':. el segundo decii.

a , - iismbucin simrnca. considere os datos siguientes y su Como ilustracin de i-.-, dismouciou correspondiente his-. .gramade frecuencr,

Solucin: ai El pnmer cuartti es ei vigsimo quinto percentil. Qi tendr cuando menos (0.25 encima de el. Al menos tres observaciones deben estar en o por debajo de Q y al menos
;

i! 12i = 3 valores que caen en o debato de 1.


7

Q: tendr tambin ai menos i0. 5 )(1 2'i = 9 valores que caen en o por Podemos ver de ia tabla que x - 4. x - 4 y la moda es igual a 4. El histograma ue frecuencias correspondiente se muestra en la figura 3.1 Podemos ver que un histograma simtnco uene su media igual a su mediana, de hecho, para ei histograma de la figura 3.1. la media, la mediana y la moda son todas idnticas, pero esto no siempre ocurre con un histograma simtnco. como lo indica la figura 3.2; ah la media y la mediana son iguales a 8, pero la distribucin es bi modal, con modas 7 y 9. Figura 3.1 hi El segundo cuartii es la mediana; la mediana es el promedio de la sexta y la sptima medidas: de esta manera, el segundo cuartil es: P01 -P3 4 cj El tercer cuartti es el percentil 75. Dei inciso a, podemos determinar que el nmero de observaciones en o encima de Q es al menos 3. y su nmero de observaciones en o abajo, es 9: dos valores cumplen estos requenmientos: 131.8 y 138.6. As Q es^ejjrorjjedj^d
;

nueve en o por encima de Q. los valores 101.4 De aqu que:

y 102.6 cumplen ambos estos

requenmientos. El primer cuartti Q- es por esto el promedio de 1014 y 102.6.

Histograma simtrico frecuencias

1 2 3 4 5

= 135.2

Figura 3.2_ Histograma simtnco bimodat de frecuencias

di

El segundo decil ser el vigmiso percentil. ya que (0.21(121 = 2.4 valores deben caer en o debajo de D y al menos (0.81(12) = 9.6 valores deben estar
:

en oencima de ste: el valor 2.4 debe redondearse a 3 y el 9.6 a 10; el resultado de contar debe ser un nmero entero por lo que. siempre redondearemos para satisfacer el criterio '"al menos"; entonces, al menos tres vaiores deben estar en o debajo de D- y al menos diez valores en o encima de D : la medida 101.4
:

satisface estas condiciones. Por lo tanto. >;= 101.4.

La forma de un histograma depende de la posicin relativa de la media la mediana y la moda. En un histograma simtrico, ambos lados, determinados por la media, son idnticos i vase el ejemplo 3.15'v, cuando los lados de un histograma no son idnticos, tenemos lo que se llama un histograma sesgado. Un histograma. o conjunto de datos, para el cual hay menos medidas debajo de la media que arriba de ella, se dice que est seseado a ia i^iuieraa, como en ei ejemplo 5.16. Por otro lado, como veremos en el ejemplo 3.1". un rustograma o conjunto de datos, para ei cual las medidas-per arriba dla media aparecen con menor frecuencia que las meadas por debajo de ella, se dice que essesiado a iu derecha. ' V 7 8
9

uwnpttva: an,li

Sls

u m a r j < d m

Seccin 3.
L a r a

Hedidas de tendencia centra/' v de coiocacin

85

^ a es 6.9^. ; mediana
a y

valere^ -riba d e r = 6 9 ' . . ?o . ' " - ' alores aoaio de r - O n


c

estaa,st

p i e r d o ; ce un nistomma cono t mas grande que su media.

1*-

* datos se muestra en la W

n D u c i n hav 7< v ^
? a r a e s t e e n s i

GRUPO DE EJERCIOOS

3.1

^
P

q U e

5 2

Habilidades bsicas : Calcule la media, la mediana, ia moda y ei rango medio para cada una de las muestras siguientes: 3)3.9.12,7.16. 20,35.5

restantes son 76.35.43. sQ y f>5, y la media de las seis es 0 . Encuentre la calificacin que se borr.
7

e n e

s i e

su mediana

10. El salado medio anuai que se paga a cuatro ejecutivos oficiales en jete de una gran corporacin es 125.000 dlares. Puede llegar a ganar alguno de ellos 600.000
L

Distrubucin sesgada s la izquierda

b) 5,7 22.17.5,7. 20 c) 8.5.0. 1". 2,-, 5 di-4.0.15. 9.4.14.20. 15

dlares? Ms aplicaciones

30 L i

2. Calcule la media, la mediana, la moda y ei rango medio para cada una de las muestras siguientes: ai 12,7,3, 20.53. 2.12 b i i 2 . 15.23,7. 12.40, 22. 16 0 5.0.7.7.13. 16.9 di-5,6.13,26. 0.14, 25.13 3. Calcule la media para una muestra donde: ai I r = 3 7 y n = 12 b) Lx = 20.6 y n = 56 y

11. Si el ingreso medio de 20 trabajadores es de 40.000 dlares, cul es su ingreso total? 12. Si ia estatura media de una muestra de 25 jugadores de basquetbol es 6.9 mes. cul es ia suma de estaturas de ios 23 jugadores'.' 13. En un esfuerzo por reducir su consumo de cate, un trabajador de oficina registra los nmeros siguientes de tazas de caf consumidas durante un periodo de 20 das: 4 6 5 5 3 8 6 4 7 u 1 2 2 3 3 7 0 5 5 6

ol EJEMPLO 3.17

ci Lr = -12 y n = 33 , ^ 4. Calcule la media para una muestra donde:


o b K T O

C o i t a n c . de

d i s

t a o 6

s e s

as I r =12.5 y

n = 16

Qu medida de tendencia central le servir mejor a su propsito? Cul es el valor numrico


7

b j L = 19yn = 22y 4 ^
: 3 0

5
1 0 5 5 ?

8 ,

c) L i = -43.2yAi = 50 5. Calcule la media, la mediana y la moda para cada una de las muestras siguientes: a) 0,0.1,1,1,0.0,0 bi3.3.3.2. 2,2.4,5,3 clO. 1,1,2.2.3,3.4.4 d) -1.0. 0.0,-1.2, -2,3 6. Calcule la media, la mediana y la moda para cada de las muestras siguientes:

14. A continuacin hay una coleccin de calificaciones del examen de estadstica de 25 estudiantes, en un examen de 50 preguntas, 38 39 33 37 34 3l'*38 36 35 5

-5

20

15

Cul medida de tendencia central es ms til para describir el valor central Cul es su valor numrico?
0

fecho:

tt

s e

des J

"

'

S t

e l

15. Un jugador de boliche ha estadojugando regularmente durante los ltimos cinco aos. Sus puntajes para los seis ltimos juegos son: 201 187 162234208 198; para esta muestra calcule los valores de los estadsticos siguientes, si existen: al media es moda e?, Q:yQi bi mediana di rango medio UD

[jgural4_ Distrubucin sesgada a la derecha /

aiO. 1,2,3,8, 10 biO. 1.2.3,8, 12,50 ci-12.-6.-5,0, 13. 16,0 d ) 0 . 0 , 0 , 1 . 1 . 1, i, 1.0 7. Determine el sesgo de estas muestras: ai 12.7, 16.22. 17. 3. 16.7, 10 bi 14.17,2.", 13. 17,22.37,0. 15 c5.10. 15,25.40. 65, 100 d)5, . 95, 90. 50 8. Determine el sesgo de las muestras anotadas abajo:

16. En una investigacin realizada por ia secretaria de un mdico para averiguar los tiempos de espera en minutos de los pacientes que acuden con el doctor, una muestra de pacientes de un da arroj los resultados: 55 5 rxi 25 5 25 35 60 25 50 35 -0 25 50 80 55 30 20 50 25 20 50 55 5 35 30 5 35 20 10

cj0,0.0. . ; , ; . : 3 4

Descnba un uempo tpico de espera usando ia media


1

j ; 2.2.5.4.4. ;. 5 5 g
Q '
R

? Descnba un uempo tpico ue espera usanuo iamedi ana. ' : Cual mecida, media o mediana, considera usted que es mas representativa dei conjunto de cutos? Explique.

9.

L'n instructor corra jcuMemaimeme a cai ticacin ue uno de sus seis estudiantes: ias cinco calificaciones

Seccin 3.7 Wiaas de lendwci central v de coiocscin

87

d) Determine en tres cuarres. ") Determine en cuatro deciies. La tabia siguiente connene ios slanos en cientos de adiares, de 25 trabajadores. Salario anual 60 70 80 300 ai Cul es ia moda' ci Diga la mediana i) Y el rango medio ej Determine el sesgo i Cul medida de tendencia central usara para determinar el valor central'? Expiique. gj Cul es QP. h i Cul es O*
0 1

19. -Diga y explique ia medida ce tendencia central que utilizara para seleccionar un termmetro preciso o;-;e debe comprarse en una t>:ewra local. Un paso ms a/f 20. S> 20 puntajes tienen una media de 15 y 30 puntajes, una media de 25. cul es la menta dei grupo total de 50 puntajes? 21. Suponga que es la media de una muestra de cuatro oun tajes. ai Si se suma 5 a cada puntaje cul es ia media dei b) Si cada puntaje se multiplica por 5, cul ser la media entonces?* nuevo conjunto! Sugerencia.' ensaye en un ejemplo,

carburacin. Cju tan rpido debe conducir en ei segundo recorrido para lograr su comeado inician 28. Suponga que un inters fue ijaao en 2 dlares en 1988, 4 en i 989 y 2 en 1990. Ei cambio de porcentaje e 1988 a 1990 es 200. y de 1989 a 1990 es e 50. Encuentre ei porcentaje promedio dei cambio en ei apo de inters para el penodo de los tres aos y justifique su respuesta. 29. La ra: de la media de ios cuadrados rmsi de un conjunto de Jatos se defme como la raz cuadrada del promedio de la suma de ios cuadrados de las medidas'

Si sus oins habilidades e- el juego son iguales v est


:

negociando ei contrato par.i ia siguiente temporada, cuii jugador debe recibir el salario ms alto, con base en ei mejor porcentaje de cateo Expiique.
1

3 5. La media de una muestra es muy sensible a ia presenc: a de puntajes extremos, llamados puntajes aberrantes, mientras que la mediana no io es. En estos casos, ninguna deestas medidas es satisfactoria como medida de tendencia central; una alternativa es una media ajustada, se afecta menos por los puntajes aberrantes que a media, y an no tiene ia insensibilidad de ia mediana. Una media ajustada se encuentra ordenando las medidas de menor a mayor, borrando un cieno nmero de medidas en ambos extremos de ia lista ordenada, y promediando las medicas restantes: a porcentaje de valores borrados en cada extremos de la lista se le llama porcentaje de ajuste. Por ejemplo, si /i = 10 y se han borrado las medidas mxima y mnima, entonces ei porcentaje de ajuste es 1/20 = 0.05 = 5%. Encuentre la media ajustando un 10% para ias muestras de asios:
35 5 25 25 5 40 35 60 30 50 35 20 25 30 20 55 25 30 55 50 30 100 4 20 95 35 60 30

Frecuencia

5
6

4 3

b) Cul es la media"?

22. Si las medidas x) en una muestra se transforman mediante la frmula v = ax + i>. determine una frmula para la media de las medidas transformadas (y). 23. Una maestra hizo un examen con el mismo grado de " dificultad en cada uno de sus tres grupos; con los resultados determin las tres medianas y las promedi para estimar el punto central de su habilidad profesional. Puede engaarse al hacer esto? Diga por qu. 24. A l promediar porcentajes, a menudo se utiliza la media geomtnca x,. La media geomtrica se define por

Esio es uulizado para describir picos de voltaje de comente alterna en electrnica. Determine la raz de la media de los cuadrados de la muestra de voltajes: 120,130, 140. 110 y 105. 30. Si a cada medida de un conjunto de datos se le suma una constante C, demuestre que la media del nuevo conjunto es igual a la suma de la media del conjunto original ms la constante C. 31. Si cada medida de un conjunto de datos se multiplica por una constante C. demuestre que la media del nuevo conjunto es iguala C veces iamediadel conjunto original. 32. Suponga que tenemos una muestra de n Is y m Os. Demuestre que ia media es igual a la proporcin de I s en la muestra. 33. Suponga que una muestra consiste de todos los pares enteros entre 238 y 874 inclusive. Encuentre la media y la mediana. 34. Dos jugadores profesionales de bisbol tienen ios porv

18. Se escogi una muestra de 705 conductores de autobs y. se registr en la tabla siguiente el nmero de accidentes de trnsito que tuvieron durante cuatro aos. Nmero de accidentes
0

5 10

Frecuencia 114

En este caso, es ms precisa la descripcin que proporciona del centro e la muestra, la media ajustada, que la resultante de la media Explique.
0

- - jff=fT.ti 2 *3 .. .t donde x,, x ,.... x, son nmeros positivos. Encuentrex\


2

115 7
8

para los porcentajes; 95,125.140 y 100.

36. Considere esta pantalla de MINITAB:

44 21 6 1 3

25. La media armnica 7, que a menudo se utiliza para promediar velocidades desarrolladas en distancias iguales, se define como el recproco del promedio de los recprocos de los datos, esto es. ti I(l/.r) donde los n valores de ,v son positivos. Suponga que se maneja a lo largo de 20 millas, a 30 millas por hora, y en un tramo de 20 millas, a 60 millas por hora. Cul es la razn promedio de la velocidad en un viaje de 40 millas
0

i i |

MTB>SETCI DATA> 9 14 12 17 11 20 13 18 22 12 15 16 5 7 9 19 8' DATA >END MTB> DESCRIBE Cl


N MEAN M E D A N TREAM STDEV SEMEAN

centajes de carrera que muestra ia tabla siguiente: Jugador A Ao Veces al Hits bat 1973 i 974 1975 1976 19" 1978 19 9
7

Jugador B Prom Ao Veces al Hits Prom bat 0.302 1973 85 144 53 2 / 0.318 42 19 ?2 19
"
a

1 0

11 a) Cul es la moda?
c

j | |

Cl " 7 f3".3 1 MM MAX Cl 5.00 32.00

1J.0JT" Ql 9.00 03

4.89" T18 ' 17.50

189 80 212 71 -i97 28! '29 i'S"!' 120 1552

57 21 72 ;? 64 26

bi Seale la media, ci la mediana y d) el rango medio, ei Determine ei sesgo. ! Cul medida de tendencia central usana para dte gi Cuanto vale Qy minar el valor central' Explique su respuesta
1

0.263 1974

0.292 0.358 0.251 0.345 0.2S1 .22. 0.297 0.276

0.340 1975

26. Cul de os valores .t o 1, sera apropiado para 'os datos ei ejercicio 24

0.239 i 97 6 207 55 0.302 197'

Determine el porcentaje de ajuste para la media ajustada .yREAM. por ei termino en ingls mmme mean.. i o s datos del mottvador 3 ia existencia de
0

0.268 197S S9 0.317 1979

263 i 07 175 165

35

2". Un piloto de coches de carreras quiere cromediar oQ millas por hora i mph i. en dos recorraos con un trayecto de una milla; en ei primer recorrido, su aemoo fue de 50 nroh debiGo a un problema eictnco con e sistema de

1980 1981' 1982 Totai

3" 0.28" 1980 " 5~ ' O.';" T981 -4 0.262 1982

h i Cunto vale & ?

"5" ' 29 0.5'S" ;oa


-7
a

acriminacin contra ias mujeres Diga oor aue.

u-4

3.30C Total

0.29"

Secn 3.2 Medidas de dispersin o variabilidad 89

Pantalla 3.2 MTB>SETC1 DATA> 2(10) 3(9) 4(8) 7(7) 2(6) 5 4 3 2(2) 2(1) DATA>END MTB>SETC2 DATA> 5(8) 8(7) 5(6) 4(5) 3(4) DATA>END MTB> AME Cl 'DAVID' MTB> AME C2 'RICARDO' MTB>DOTPLOT 'DAVID' 'RICARDO'

DAVID 0.0 2.0 4.0 6.0 8.0 10.0

|00

> 4.80 5.60

-i 6.40

i 7.20

+. J.20

RICARDO

MTB>

Pantalla 3.3 MTB> DOTPLOT 'DAVID' 'RICARDO'; SUBO SAME.

DAVID

RICARDO 0.0 4.0 6.0 8.0 10.0

MTB>

Debe mandar el entrenador Wells a Jones como bateador emergente? Su

porcentaje es 0.310. pero en algunos juegos lo ponchan todo el tiempo y en otros logra un hit en todas sus veces al bat. O debe poner a Smith. quien tiene un porcentaje de bateo de 0.290 y logra al menos un hit en todos los juegos en que participa? La respuesta parece obvia: mandar a Smith porque su capacidad de bateo es menos variable. Cualquier coleccin de medidas hechas con una misma unidad variar segn la precisin del instrumento de medicin: Porejempio. en una caja de 24 barras de caramelo ue 2 onzas, no todas las barras pesaran exactamente 2 onzas: si eso ocurre, ia escala no es sensible o suficientemente precisa; si las mismas barras de caramelo se pesan en una baianza analtica sensible no tendrn todas el mismo peso, mostraran

Seccin 3.2 Medidas de dispersin o variabilidad

91

cierto grado de variabilidad y esto no es deseable, porque si los pesos exceden de 2 onzas, el fabricante perder dinero en la produccin y venta de las barras de car; i.elo; por otro 1 ^ ' qlos pesos de las barras son menores de 2 onzas, el consumidor estar siendo engaado, lo cual causar quejas del cliente y una prdida potencial de negocios. E n cualquier caso, una gran variabilidad en los pesos de las barras de dulce no puede ser tolerada administrativamente. L a variabilidad es un concepto fundamental en estadstica. Hay muchas medidas de variabilidad o medidas de dispersin para una coleccin de datos cuantitativos. Entre estas medidas estn incluidos:
ai el rango

o onnrerctnrt// Rango /nrercu,

Unamedidadedispersinqueesindiferemedelapicsenciadeobservaciones ^ ^ ^ ^ , ^
I Q R ( p Q r e n

ingls

interquartiie ranee).

Se defme como: Rango intercuartil

donde Q es el tercer cuartti y Q, es el pnmer cuan.


}

bi el rango intercuartil o lavananza


di ia desviacin estndar

EJEMPLO

3.20

Considere el siguiente coniunio ordenado de datos que representa los valores de oxiaeno reastrados (en m i A g min> ae 21 cndores de mediana edad dei sexo masculino, mientras pedalean en una bicicleta fija a 100 watts:
.81 0.88 14.95 20.93 15.83 20.98 15.97 20.99 19.90 21.15 18.27 2116 18.3a 22.24 19.82 23.16 19.94 23.56 20.62 3^8 367

Examinaremos ahora en detalle estas cuatro medidas de variabilidad. Rango Dada una distribucin de medidas mustrales o poblaciones, el rango se define como la diferencia entre la medida mxima U v la medida mnima L es decir: R EJEMPLO 3.18

Los valores 35.78 y 36.73 aparecen como valores extremos u observaciones aberrantes, para este conjunto de datos. Por la definicin de rango intercuartil, est claro que estos valores no tendrn efecto en el valor dei rango intercuartil; esos dos valores pueden reemplazarse por otros dos cualesquiera que ocupen los lugares 20 y 21 del conjunto ordenado, lo que no afecta el valor del rango intercuartil. Calculemos el [QR usando los tres pasos siguientes: 1. Calcule el pnmer cuanil. El primer cuartil es aquel valor para el cual al menos (0.25)(21) = 5.25 de las medidas caen en l o debajo de l y al menos (0.75X21) = 15.75 valores por arnba: as. 6 valores estn situados en o debajo de 18.27 y

V -

Las edades en aos de un grupo familiar son: 30,2,1,7.4,32 y 10. El rango es

E n la seccin 2.2 usarnos el rango R para determinar el ancho de los intervalos para una tabla de frecuencia agrupada. Como es fcil determinar el rango, a menudo se usa para estimar otras medidas de variabilidad, como la desviacin estndar, que no se calcula fcilmente (vase el ejercicio 52 al final de esta seccin). Sin embargo, el rango no siempre es una medida sensible para la dispersin de una coleccin de datos, como se ve en el ejemplo 3.19; y tiene otra desventaja: puede afectarse drsticamente por la presencia de valores exuemos de los datos, llamado en ocasiones observaciones aberrantes. 3. EJEMPLO 3.19 Para los dos conjuntos de datos ilustrados en las rectas numricas de ia tkura * 6 cual ms disperso, A o B? La respuesta es, claramente, el comunio A, ero note que A y B tienen e! mismo rango: este ejemplo ilustra que el raneo no es una medida sensible de dispersin, por esta razn, no se considera como una media de dispersin demasiado til. FIGURA 3.6 Ei rango como una mnedida de dispersin

16 valores en o encima de 18.27. En consecuencia, el pnmer cuarnl es 2; =18.27 2. Calcule el tercer cuanil. Contando seis valores desde el extremo derecho en el arreglo ordenado, determinamos que el tercer cuarui es 63 = 22.16' Calcule el valor de IQR. El valor de! rango iniercuarai es 1QR = (2)-G. = 22.16- 18.27 = 3.89 El rango mtercuami no se aiecta por ias observaciones acerrantes 55."8 y 5673. mientras que s se afecta por 36.73. Usaremos el rango,imercuarol-en lasecsin--3.^r^assrs^k-grl>g2s--tk- caja, resmenes de datos que proporcionan informacin sobre el centro, la dispersin, ia simetra contra e! seseo y la presencia de observaciones aberrantes.

Secdn 3.2 Medidas de dispersin o unabilidad .

93

La media de un conjunto de nmeros puede describirse geomtricamente como e, H rango y el rango inv.icuanil no son medidas sensibles de variacin. El. rango es dependietv.<: o en los valorea extremos L y U. mientras que ei rango intercuartil no toma en cuenta las medidas debajo de 2; o arriba de {%. La varianza y la desviacin estndar son ambas medidas mas sensibles de variacin que el rango o ei rango intercuam!. pues tomar, en cuenta todas las medidas en un conjunto de datos, pero comparten una desventaja comn consistente en que a ambas las influyen por puntajes extremos. Examinaremos estas medidas .que se refieren al concepto de desviacin de un valor ms adelante. En estadstica, la cantidad - ~ se llama desviacin. Desviacin = Media x ff/EMPL0 3.2t punto en ia recta numrica que sirve como ''centro de gravedad" para os nmeros. 5 imaginamos que la recta numrica est apoyada en un punto ipumo de apoyo i. iocaiizaao en ia media y que en ios nmeros de la recta correspondientes a os nmeros dados se coiocan pesos de 1 unidad, entonces ia ecuacin 2.3 implica que '.os pesos debajo de la media compensarn perfectamente a ios pesos arriba de la media: en otras palabras, ia media sirve como csntro de gravedad de los datos. Considere ei diagrama siguiente para los datos sobre los defectos e los automviles.

Desviacin

de un valor

Una desviacin positiva para una medida, indica que la medida est por encima de la media, mientras que una desviacin negativa nos seala que est por debajo de la media: una desviacin de 0 para una medida indica que la medida es igual a la media. APUCAGN 3.7 datos 1.4.6.6 y 8. Los datos siguientes representan los totales anuaies. en billones de dlares, erogados por Estados Unidos para exportaciones agrcolas desde pases extranjeros entre 1974 y 1983, respectivamente: 10.2,9.3.11.0.13.4.14.8. 16.7,17.4,16.8.15.4 y 16.27" Encuentre la desviacin para cada uno de los totales y verifique que ia ecuacin 3.3 es vlida para ei conjunto de datos. i mpriin T = 14 12. Las desviaciones de los Solucin: Se encuentra que lamed, es x 14.1 valores estn contenidas en la tabla 3.3.
K

APLICACION 3.6

Calcule la desviacin de los puntajes para los datos siguientes, que representan el nmero de defectos encontrados por un inspector de automviles en una lnea de ensamblaje en los ltimos cinco automviles producidos: 1, 4. , 6 y 8.

Solucin:

Es fcil determinar que la media muestral sea I = 5. Las desviasiguiente: x- x 1 -5 = -4 6-5= 1 6-5= 1 8-5=3 TABL4 3.3 Datos y desviacin para la aplicacin 3.7

dcmesuie.0s-vatef-se^rese^

Ao 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983

Total 10.2 9.3 11.0 13.4 14.8 167 17.4 16.8 15.4 16.2

Desviacin -3.92 -4.82 -3.12 -0.72 0.68 2.58 3.28 2.68 1.28 2.08

Podemos observar que: ai Las medidas 6 y 8 estn arriba de la media y sus desviaciones son positivas, bi Las medidas 1 y 4 estn debajo de la media y sus desviaciones son negativas, ci La suma de las desviaciones es 0. I

Sumando ias desviaciones de los valores tenemos

Se puede demostrar fcilmente que la suma de ias desviaciones de ios valores para cualquier conjunto de nmeros es 0; esto es. I I (x - x) = 0, paia.cualqacreflrriffitO ae datos | 3 5: Suma de

i x

_j,-0.

cuadrados

disdbucin dada de datos cuantitativos. Recuerde q

La ecuacin 3.2 tiene una interpretacin fsica interesante.

Seccin 2.2 Medidas de dispersin o mMlidid

| valor representa ia distancia dirigida entre una medida y la media de un conjunto de datos; en consecuencia, podramos pensar que el promedio de todas las desviaciones de los valores proporciona u;a medida de la dispersin de todas las medidas respecto a ia media, peroeso no ocurre, pues ia ecuacin 3.3 dice que a suma de todas ias desviaciones de los valores es 0. Ai sumar, las desviaciones positivas de valores se cancelan con las desviaciones negativas. Para evita: este problema causado porque las desviaciones de valores negativas cancelan las posith as, poaemos elevar primero ai cuadrado cada desviacin antes de sumar; la suma de los cuadrados de las desviaciones que se obtiene se llama la suma de cuadrados y se denota SS. Como veremos posteriormente, SS es muy til en estadstica para describir la dispersin de una coleccin de medidas respecto a su media. Podemos calcular una suma de cuadrados ya sea para una muestra o para una poblacin. Las frmulas para ambos casos son las siguientes: Frmalas de suma de cuadrados SS = L(x-52) Muestra SS = ( x - | i ) Poblacin 3.4!

~ ^ ^ s ^ a r a el clculo de SS

donde 1 x' es la suma de los cuadrados de los datos, n es el tamao de la muestra y ,V el tamao de la poblacin. Las dos frmulas dadas en 3.5 pueden verificarse algebraicamente usando las propiedades de la suma que se encuentra en ei apndice A. Note que 23A' * ilx)'. Esto puede demostrarse observando que

13 = 25. Con referencia al ejemplo 3.22. usemos la frmula 3.5 par;, calcular SS de ios puntajes de! examen de histona de Amrica. Organizamos primero ios clculos usando la tabla siguiente con dos columnas x 62 3.844 6.400 6,889 5.184 5.329 27.646

Las frmulas difieren, pero los procedimientos del clculo son los mismos. Encontremos ia SS para la muestra siguiente de puntajes en los exmenes sobre la histona de Amrica hechos por cinco estudiantes: 62. 8C, 83. 72 y 73. Pnmero encontramos x: , -62 * 80 - r n T 7 T ~ T " " ' :

80 83 73 370

x=

= 74

Al usar la frmula 3.5 para calcular SS. obtenemos:

Entonces, usando la frmula 3.4 tenemos: ss = K.t-.x r = i 62 - 74V + (80 - 74r * 83 - 74) +172 - 74) +173 - 74 r
: : =

n
= 2 7 . 6 4 6 - ^ - =266

144 + 36-81 - 4 - 1 =266

Para propsitos de clculo, se acostumbra

prder

las frmulas dadas en 3.5

En general, una suma de cuadrados SS se puede encontrar como sigue:

a las dadas en 3.4. Por un lado, las frmulas en 3.5 son ms fciles de usar con una calculadora, pues hay menos

resids en ellas y no requieren encontrar la

media. Si se usan las frmulas 3.4 en situaciones donde la media no termina y ! 1 i i ai Determine ia media. b) Encuentre la desviacin para cada medida, O Eleve al cuadrado cada una de ias desviaciones, di Encuentre la suma de ios cuadrados. Cmo determinar SS se requiera redondearla, los

clculos llevarn a resultados faltos de precisin. Es

fcil encontrar un ejempio donde 3.5 da mayor precisin que 3.4. Encontremos SS para os valores 0. 5 y S Si ia media se redondea al dcimo mas prximo, entonces .?= 3:3 = 4.5. Entonces usando ia frmula 5.4 resulta: SS = 5 2

Para simplificar el procedimiento necesano en el calculo de SS. sern miles ias trmuias:

Seccin 3.2 Medidas de dispersin o variabilidad

97

., , ,

0 S l 0 S

por litro, c . centavos de dter de ia gasolina de ;

= 3 9 - ^ - = 32.667 Ai milsimo ms prximo, las dos respuestas difieren por O.i L a varianza de una poblacin de medidas se define como ei promedio de ios cuadrados de ias desviaciones de los valores y se denota por o" (lase sigma cuadrada!. Ei smbolo es la letra griega minscula sigma. L a varianza de la poblacin est dada por la frmula 3.6. Varianza de una poblacin , SS

TABLA 3.4 Costo de a gasolina en 9 ciudades del mundo Ciudad Amsterdam Bruselas

Coso por -8
7

Varianza

Buenos Aires Hong Kong Londres Madnd Manila Mxico Montreal Nairobi Nueva York Oslo

johannesburgo -18

59
4b 25 47 >7 40 65 58 42 76 59 43 79 Usaremos la frmula 3.5 para calcular SS. Con este propsito,

L a varianza de una muestra se denota por f siguiente:

y se define por ia frmula

Pars Ro de Janeiro Roma Singapur Sidney Tokio Solucin:

(3.71
En los captulos del 8 al 15. usaremos la varianza muestral s" para estimar la varianza poblacional desconocida a". Note que si furamos a calcular ia varianza muestral s~ dividiendo SS entre n en lugar de n - 1. estaramos subesnmando c7 en promedio. Algunos estadsticos calculan la varianza muestral, nicamente con propsitos, dividiendo SS entre n; desde luego, para valores grandes de n hay poca diferencia entre los valores de SS/n y SS/(n - 1). Si la varianza se usa por s misma como medida descriptiva de la dispersin, es difcil interpretarla porque las unidades de la varianza son el cuadrado de las unidades de medida.

primero calculamos I x y 1 x~; con la ayuda de una calculadora determinamos que I x - 1005 y 2 x~ = 56,171. As. la suma de cuadrados es: 7

n
1005 = 56.171 -
2

= 3011.7895

Ahora aplicamos ia frmula 3.6 para obtener:

n-

30117895 167.32

APLICACION 3.8

Suponga que los puntajes de los exmenes de historia de Amrica dados previamente: 62, 80,83. 72 y 73 constituyen una poblacin. Encuentre la varianza poblacional o". Al usar ia frmula 3.6. leemos: EJEMPLO SS 366

. u IQ nrecio< de gasolina es 167.32 centavos L a varianza muestral de los 19 precios


( e

cuadrados.

Solucin:

- nnr uiro d* ia gasolina de ia aplicacin 3.9, el 3.26 Paa los daros de ios conocimiento de que s = iO. - ,
A

-i

izwtvumv****-

st mismo, si e s . q u e ^ ^ ^ ^ m a e'oeoueo hay muy poca entonces las medidas estn muy dispersas, mientras aue variabilidad en las medidas.

Seccin 3.2 Medidas de dispersin o vatbiliad 99

EJEMPLO

3.27

Si k varianza es 0. tocias ias medidas son iguales: esto es consecuencia de que SS * siempre mavor o u a ! aue 0 j es iguai a 0 slo si cada - uida es igual a a meca.
lg

medida. Como vimos en la aplicacin 3.9. si ei conjunto de datos se refiere a medidas en centavos, entonces ia unidad de ia vananza es centavos aj cuadrado y a unidad de la desviacin estndar es centavos: por io tanto, una expresin como .v-*-tendra significado, pero una expresin como . t - r no lo tendra porque en el pnmer caso las unidades coinciden, pero en ei segundo no. En ia seccin 3.4. cuando estudiemos puntajes estndar, us ?mos ei hecho de que una ciea medida de una distribucin y la media y ia desviacin estndar de la distribucin tengan todas las mismas unidades de medida. Las aplicaciones 3.10 y 3.11 mostrarn el uso de la vananza muestra! y la desviacin estndar mue.su"ai para hacer comparaciones relativas. APLICACION 3.10 Los datos adjuntos representan el promedio de millas por galn diario por cinco das para los coches A y B. en condiciones, en condiciones similares. A ' 20 25 30 15 35 B . 1 27 25 23 55 5 ai Encuentre la media y ei rango de millas por galn para cada coche, b) Cul coche parece haber logrado un rendimiento ms consistente si la consistencia se determina examinando las vananzas' Explique.
1

EJEMPLO

3.28

f
i t S

e m 6 a r g 0

5 1

a !

d o s

ae datos A y B. nuciramos encontr


ue i 2 s

resoecto a su media de lo que lo estn as medicas de muestra B resoecto a M


a

'
:

5 i =

s a b r a m o s

adidas de la muestra A estn mas u W < ,< vpr-v >


v

meaia. La varianza se usa ia mavori'Me '

J e , a i

i e c e

comparaciones como una medida reLiiva de variacin. Dacin estndar

eon renosnos cescnnu vos iara

Otra medida de dispersin, relacionada con la varianza. es la desviacin estndar. La desviacin estndar se define como ia raz cuadrada posva de ia vananza. La desviaron estndar poblacional se denota con a v la desviacin estndar muestrai con s. En consecuencia, tenemos ias frmulas siguientes: Desviacin estndar muestral s _ v r = V varianza muestra!

Desviacin estndar poblacional o = Ver = / varianza poblacional EJEMPLO 3.29

Solucin: Para los datos de la aplicacin 3.8. la desviacin estndar poblacional es a = vTvT ^_para los datos de la aplicacin 3.9. ia desviacin estndar muestral e s " i v

ai Para el coche A tenemos: f? = 35 15 = 20 = 25 Para el coche B:

567.32 = 12.94 centavos.

La pantalla 3.4 ilustra el uso de MINITAB para losdatos 3.9. Note que MlNlTAB noda l a - v a n a n l ^ S e MTB> STC1

enlaanlirari
?

= 35 - 15 = 20
t

x = 25 Note que ambos coches tienen ia misma media y el mismo rango en el registro de millas por galn, b) Calculamos la vananza para el coche A, s\. X 20 25 30 s 35 v - V 5 0 5 -10 10 i X ~ X I* 25 0 25 100 00 SS = 350

DATA> 57 53 38 57 48 56 59 46 25 47 57 40 65 58 42 76 59 43 79 DATA>END MTB>MEANCI MEAN = 52.895 MTB> STDEV Cl ST.DEV. = 12.935 MTB> JET K l = STDEV(Cl)**: MTB> PRINT Kl K l 167.322. .

6 5e ' V a ' r d e I a V 3 r i a n z a - K 1 s e l l a m a constante en MINlTAB;lasconstantessellamanporsunombre Kl K2 K3 cada una puede almacenar un nmero y pueden crearse usando la orden

MZ?A \?
1

^
l a

Como consecuencia de ia formula 3." tenemos:

o ^ n t e Kl "M!? , t * ^ smbolo ciacion o elevar un numero a una potencia.


= A d v i e r t a e l

> en la significa exponen-

.Por aue'necesitamos tanto la vananza como la desviacin estndar -orno medidas de dispersin? Una respuesta a esta pregunta involucra ia unidad ue

cneddar:Ix = 58.36.I.v-106.6-.^: Datos del queso : L a vananza en ei rendimiento de la gasolina para ei coche A es de 62.5 millas cuadradas. Calculamos ahora la varianza para el coche B.s .
:B

Ycomounaconsecuenaadelasirmuias:.

".tenemos

x 1: 25 2: 35

x -x -10 0 -2 10

\ 3 f3 00 0
4

Datos del asado de cerdo SS = - x


=

34.4635

100

U vananza de ios dato, del asado de cerdo es:

Como resultado de la frmula 3.7 tenemos: SS

r'

" n=

^ . 2 . 4 6 14

Datos dei queso La vananza en el rendimiento de la gasolina para el coche B es de 52 millas cuadradas; como la varianza para el carro B es menor que para el carro A, el carro B result ms consistente en el rendimiento. Si hubiramos usado el rango, habramos concluido que ambos coches tenan un rendimiento igualmente consistente. H 14 = 0.60 Y la vananza de los datos del queso es: SS, = 106.6^ (38.381 = 8.46W 7]
2

APLICACIN 3.11

Los datos en la tabla 3.5 indican los precios, en dlares, por libra, de asado de cerdo y queso cheddar en 15 capitales del mundo." __3CapuaL -G^re-as^toi^rrrmsl S6.1 2.38 1.27 1.36 2.06 1.56 2.33 1.08 1.99 2.47 1.95 2.46 5.35 4.19 3,29 3.98 2.37 1.76 2.96 2.54 2.38 2.69 ion des Estimacin R Queso cheddar S4.00 2.74 1.08 2.03 2.60 1.81 3.15 Estimado de s Es,nteresantenot ^ ^ . o e m o s la estimacin
4

rcos del asado de cerdo v del queso en capitales del mundo


5

que los del asaao de cerdo.

Berna Bonn Brasilia Buenos .Aires Camberra Londres Madrid Mxico Ottawa Pars Pretona Roma Estocolmo Tokio Washington

a c a m p a n a d a

desviacin estndar muestral:

>3.81

Para cual alimento, el asado de cerdo o el queso cheddar. son menos E' sifnutcaoode dividir e . r a i i ; examinemos ias distribuciones normales.

variables y ms estables ios precios' Solucin: ladora: Datos de! asado de cerdo: lx = 40.55,22 . r = U3.01.n= 13 Determinamos ias cantidades siguientes con ei uso de una calcu-

^ , o l o n e c e APLICACIN! 3.12 j Para ios datos dei queso cheddar en la aplicacin 3.11. estime; usando la frmula 3.S, y verifique la estimacin calculando ei valer de s. Solucin: E l rango para los precios del queso cheddar es:

n c ^

Como lamenta de ios cinco datos es :.-.cner.^. SS = 23U--xT= 4(2 - 3) = 20


1

R =

L-

= 4.00 - 1.08 = 1 9 : Como consecuencia de la frmula 3.8. tenemos:

-m- &

' ~ 4 ~ , - ^ P del eiemolo i 30. tenemos las frmulas siguientes

Como a desviacin estndar es la raiz cuadrada de la vananza. podemos usar el resultado de la aplicacin 3.11 para obtener:

tabla de frecuencia:

s]

= 0.60 SS = L f * - x f SS=I/(x-H)

st = ', CLO = 0.77 Como /?/4 = 0.73 est en la misma "cancha" que s - 0,77. tenemos poca
c 2

razn para sospechar que se ha cometido un error; no creamos que hay un error salvo que un resultado sea al menos el doble del otro, i

APLICACIN 3.13 | -

Suponga que en una muestra la medida mayor es 90 y la menor 30; se ha calculado que la desviacin estndar es 185, s razonable este valor?
0

APUCACJNJ/U

Las medidas siguientes representan los das que tarda el correo expreso, enviado desde ia costa oeste, en llegar a su destino en la costa este en los pasados diez envos: 2 , 2 , 2 , 3 , 3 , 4 . 4 . 5 , 5 y 10. Use las frmulas 3.9, para determinar SS.

Expliqoe"

"

Solucin:

No, el valor no parece razonable. E l rango es 90 - 30 = 60 y jR_ _ 60 _


S

la frmula 3.8, vemos: ~ 4 ~ 4

Solucin: Pnmero construimos la tabla 3.6 que nos ayudar en los clculos. Se encuentra fcilmente que la media muestral es x - 4.

As. sospechamos que se ha cometido un error al calcular s como 185 y debe verificarse el procedimiento.

U
n

r x lABLA^ Tabla de frecuencias ;


4

-V L J 12 ^

f ^ , 2

^ 0

i 7 i 0 36

I I

Varianza y

desviacin

A menudo tendremos ocasin de encontrar ia varianza y la desviacin estndar para datos desplegados en una tabla de frecuencia. Ambas medidas pueden calcularse una vez que se conoce S S : para encontrar SS en datos que tienen medidas con repeticin, determinamos primero la frecuencia de cada medida.

\ para la aplicacin 3.14

estndar para datos en tablas de frecuencia

36. SS = 52

EJEMPLO

3.30

| |

Para encontrar la suma de cuadrados SS para los datos 2. 2. 2.2 y ~. que representan ei numero ae carreras conceidas.por un pucher de beisDol en los ltimos cinco frmula 3.4 y la tabla:.;-

Seccin 3.3 Tendencia centra! y dispersin para datos contenidos en tablas de frecuencia agrupada 105 Clculo de SS usando la frmula 3.4 Como consecuencia de ia frmula 3.10 tenemos:

2 fx) 2
SS = I 7 . r - - t - =
4

QS

368 _ ,
:

/ J ~ - y i:j(0) = o

Luego, la vananza muestral es:

'

- y (2)1!) = 2
= j 6

/ = ! y (1)136)
Vemos que SS = ^ = te primeras b . . ^ . , , r ; : ! ^ ^ ' . ^ e i a
d 7 t e m d

i !
a U M l a

Advierta tambin que las entradas en ia columna fx pueden encontrarse ya sea 11 multiplicando las entradas correspondientes en las columnas x v fx. o 2) elevando al cuadrado las entradas en la columna x y multiplicando despus por los valores adecuados de /. i

-') asi sucesivamente.

-'"msponde a la suma , ; columna de a tabla


m

Desventajas de a vananza y de la desviacin estndar en una tabla de frecuencia. Frmula para c a l c ^ ^ ^

La vananza y la desviacin estndar tienen una limitacin sena: pueden verse gravemente afectadas en presencia de observaciones aberrantes, pues ambas dependen de la media, que se modifica por las medidas extremas. Cuando en un conjunto de datos estn presentes observaciones aberrantes y se requiere una medida resistente a ellas, debe utilizarse el rango intercuartil.

(3.10)
Muchas veces es mas conveniente usar la frmula 3.10 que las frmulas 3.9. Vea que en 3.10 slo aparece una resta y que no es necesario calcular primero la media.

Teorema de Chebichev

La desviacin estndar muestral S indica la dispersin de los datos respecto a la media muestral. Si los valores de los datos se acumulan cerca de la media, entonces S es pequea; si se dispersan considerablemente respecto a la media, entonces S es grande; pero, cmo podemos determinar cules valores de S
G

son grandes y cules son pequeos? Un teorema que lleva el nombre de! r Encuentre la vananza muestral para los datos siguientes referentes al nmero de cigarros fumados durante un fin de semana por un grupo de 15 fumadores: matemtico ruso Pafnuty Lvovich Chebichev (1821-1894), nos da alguna informacin til sobre cmo la magnitud de ia desviacin estndar de cualquier conjunto de datos se relaciona con ia concentracin de stos en torno a la media. Segn el teorema de Chebichev, la afirmacin siguiente es cierta para cualquier conjunto de datos cuantitativos, tanto poblacionales como mustrales:

3
Solucin:

4
culos:

L a tabla si guente se usa para organizar los cal

Teorema de Chebichev La expresin \-\lk~ representa la proporcin mnima de os datos que dista no ms de k desviaciones estndar de la media si k > i,

Note que el resultado dei clculo i - 1 ik~ es una fraccin: ai multiplicarla por 100 se, obtiene .eLpotccntate mnimo de- los datos que distis no-ms-de kdesviaciones estndar de la media, de acuerdo con el teorema de Chebichev. para cualquier conjunto de medidas.

?><. ananas

o e a i o s

u m a n i d o

Seccin 3.3 renderraa central y dispersin para datos contenios en talas de irecuencia grupada l Si k = i. entonces! - /Ir = -!/!" = 0. Entonces, ai menos OTc de ios datos dista no ms de una des vi acin estndar de a media por ejemplo, cae dentro de x z s i. As. para fcsl.la inteiptcacin no ofrece informacin til respecto a la dispersin de los datos. Si k - 3/2. entonces - l/3/2r = 1 - 4/9 = 3/9 = 569c. por lo tanto, al menos ei 56% ae los datos distarn no ms d e ! .5 desviaciones estndar de la media! por ejempio. caern dentro de 1 z 1.5s). Si k = 2, al menos 1 - i/2" = 3/4 = 75%. Emoces. al menos 7 : % de ios datos deben distar no ms de 2 desviaciones estndar e la media ipor ejemplo, caern FIGURA 3.7 dentro de .7 2s). como se ilustra en la fisura 3.7. Solucin: a) Con la ayuda de 'ana calculadora, podemos determinar tacamente que a media es 7 = 52.89 centavos. Anteriormente de te i minamos el valor de la vananza muestral. i* = 167.32. As. la desviacin estndar es s'= \ 167.32 = 12.94 centavos. De acuerdo con el teorema ue Chebichev, ai menos 1 - 1 4 = 3/4 = " 5 % / de los datos distar menos de dos desviaciones estndar de la media, para el conjunto de datos. 35-21 = 52.89- 2(12.94. = 27.01 Para k - 3, | menos (l - J/VJ
a I M =

107

ai Determine el intervalo especificado por el teorema de Chebichev oue contendr ai ...caos 7517 de ios datos. b) Qu por.taie de ias medidas dista realmente menos de dos desviaciones estndar de ia media'
1

Ilustracin del teorema de Chebichev para k=2 al menos 7 5 % de los datos

Q C

. ,

.T * 2 J = 52.89-r2fl2.94) = 78.77 En consecuencia, el intervalo 27.01,78.77 contendr al menos 75% de los

* * * HGURA 3.8

3 , como se muestra en ,a

f l g u n

"

* * *

datos, como se ilustra en el diagrama. al menos 75 % de los datos

Ilustracin del teorema de Chebichev para k = 3 aJ menos 8 9 % de los datos


27.01

65.83

.\ s

- - Is v i -

r - 2J

b) Se encuentra que diecisiete de ios 19 precios de gasolina, 89.14%. cae entre 27.01 y 78.77. Esto es consistente co.\s resultados en la parte a: el teorema de Chebichev especifica slo una cota inferior para el porcentaje de datos que distan no mas de dos desviaciones estndar de la media, como tal, proporciona una esmacin conservadora, debido a que se nene poca informacin sobre la forma de la muestra.

"i j o l i n a de la a p l i c a c i n 3.9.

Ci

"dad

Costo

P 0 r

rro

Amsterdam Bruselas Buenos Aires Hong Kong Johannesburfo Londres Madrid Manila Mxico Montreai Nairobi Nueva York Osio Pars Ro de Janeiro Roma Singapur Tokio Sidney

57 53 38 57 48 56 59 46 25
**7

APLICACION 3.17

Suponga que la asistencia promedio a un parte de bisbol de ligas mayores para juegos locales es de 35.500 personas, con una desviacin estndar de 4,200. Use el teorema de Chebichev para determinar: a) un intervalo que contenga al menos 80% de las asistencias a los juegos lo-

cales. b) la proporcin mnima de los juegos locales que tiene una asistencia de 25.000 a 46,000 personas.

57 40 65 58 42 ^6 59
47 1

Solucin: ai Establecemos - \lk~ Isuai a 0.80 v espeiamos k.

- - = 0.80

"9

'

: 0

IU

tstidisiia descriptni: niisis de ditos unndos

Seccin 3.3 Tendencia

ontrtly ^pers'n O

d s l o s

contenidos en tablas de frecuencia grupada

. 109

la validez del teorema no depende de ia forma de la distribucin, por eso resulta til y poderoso. La carta siguiente resume' J. notacin ms frecuentemente usada en relacin con muestras y poblaciones: Media Muestra b) Note que los intervalos ue Cheoichev son simtricos respecto a la media. El indio de un intervalo es: Poblacin J u Mediana x M Vananza r <r Desviacin estndar s a Tamao n / V

Resumen El intervalo tsxzZlis = 35JOO r 2.24 K 4200) = 35.500 - 9.408 es decir


usa

de la notacin

cla

26.092. 4.908,. Asi. ej teorema ce Chebiche\d que ai menos 80% de las asistencias est entre 26.092 v 44.908.

Note que~, Je. i", y n son ejemplos de estadsticos, mientras que d. J.. o'.o IV = I I - iis\ \J-ks) - Zks y A' son ejemplos de parmetros. Recuerde del captulo 1 que los estadsticos son los valores calculados a partir de una muestra, y que ios parmetros son valores medidos a partir de una poblacin; en estadstica, el uso de letras griegas para denotar muchos parmetros es una convencin generalizada, una excepcin a la regla es la notacin para e! tamao de a poblacin.

Primero determinamos el ancho del intervalo 125,000. 46.000>. El ancho es: v = 46.000 - 25.000 = 21,000 Planteamos Zks guai a 21,000 y resolvemos laecuactn resultante para k: 2fa = 21.000 2Ai4200) = 21.000 8400fc = 21.000 21.000 _ , . 8400 En consecuencia. a i j ^ n o j ^ - ^ J C L ^ ^ = 0:84 = m de los

GRUPOS DE EJERCICIOS 32 I r = 48 Le =7.5


1

_ j
n = 20

Habilidades bsicas

Son razonables'

1. Encuentre el rango, la vananza y a desviacin estndar de la muestra: 5 2 2


(

9. Suponga que hemos calculado la varianza de una muestra de tamao 15. y obtenido 10 dividiendo SS entre 15 en lugar de 14. Encuentre el valor correcto de r . 10..Si una calculadora uene interconstruido un programa para calcular la vananza. cmo podra determinarse fcilmente cul vananza, (s~ o rr) se est calculando'
7

1 5

3 2 3 4

juegos locales enen asistencias entre 25.000 y 46.000.

2. Encuentre el rango, la vananza y la desviacin estndar de: 9 6 4 6 5 8 7 6 7 0

A veces es conveniente interpretar el teorema de Chebichev en trminos distintos. L a afirmacin siguiente equivale al teorema de Chebichev.

3. Determine la vananza y la desviacin estndar de la muestra 1,3.11,15 y 20. 4. Determine la varianza y la desviacin estndar la

1 [..Cul es la suma de as desviaciones de los valores respecto a la media para cualquier conjunto de datos'.' 12. Cul es el promedio de cualquier conjunto de desviaciones de vaiores? 13. Es siempre menor el valor de !a desviacin estndar que el de la varianza? 14. Por qu carece de sentido la expresin x - s- : 15. Es posible que sean iguales ei rango y la desviacin estndar de una poblacin'.' Si lo es, d un ejemplo. 1 . Es posible que sean guales el rango y la vananza? Si lo es. de un ejemplo. '.". Si ia desviacin estndar de un conjunto de datos es 0. qu puede afirmarse de dicho conjunto;
1

Forma alternativa del teorema de Chebichev A lo ms ( 1 / 0 0 0 % de los datos de cualquier conjunto, distan mas de lides vi aciones estndar de la media.

muestra 1.2.4, 10, 18 y 19. 5. Calcule x, s' y s para: ai I r = 232.22* = 25, y n = 15. b ) I r = 5 ! 5 , L r = 101.yn = 20.

Para k = 2 leemos el diagrama siguiente: Al menos 75% de ios datos

6. Calcule la media muestra!, la varianza muestral y la desviacin esiandar muestral para la situacin: a i l r = 52.Lr = ". y n = 9. bi 22.v" = 25.Lv = 12, y n = 12. Para una muestra se han encontrado os siguientes valores:

**

~*

A io mas 25% de los datos

*.

I r = 428

I.i = "5 . i = 1 0

^.Son razonables 3 E teorema de Chebichev da una explicacin de como ia desviacin estndar proporciona una medida de la variacin para una sola muestra de poblacin: 8. Para una muestra >e han encontrado los siguientes vaiores:

8. Qu puede decirse si ia desviacin estndar e una muestra es negativa?

Seccin 2.1 Tendeada centra! y dispersin para datos contenidos en tablas de frecuendi agrupada .

111

19. Suponga que una muestra nene como media x = 2:- y como desviacin estndar s - 3.2. a) Determine un intervalo que contenga ai menos 90% de las medidas de la muestra, tn Cul es el porcentaje mnimo de la muestra que est contenido en el intervalo 17.33? 20. Suponza que una muestra tiene como media 3 = 540 y 3 como desviacin estndar s - 10.5. a) Determine un intervalo que contenga ai menos 92% de las medidas de la muestra, b Cul es el porcentaje mnimo de la muestra que est contenido en el intervalo 524.25, 566.25 Ms aplicaciones 21. El conjunto de datos siguiente representa ias calificaciones del examen final para un grupo de 30 estudiantes de filosofa: 98 85 94 97 94 92 97 57 90 83 58 87 74 88 80 64 97 97 79 94 93 96 87 85 69

a) Encuentre ei promedio de ios tiempos de para cada uno de los coches. A y B.

recorrido

ai Encuentre el rango. bi Localice la vananza. ci Ubique ia desviacin estndar. d) Cul es ei rango intercuartil? 29. Una gran lechera vigila continuamente ei nivel de contenido graso en su producto: el porcentaje de grasa no debe desviarse mucho dei 2%- de la leche, siendo aceptable 'ana desviacin estndar del 10%-; se obtuvo una muestra de 20 cartones de leche y se registr el porcentaje de grasa en cada uno. Los resultados se .ip.'-r::i a continuacin. 1.85 1.80 2.02 1.93 2.25 2.05 2.09 2.08 2.01 2.23 2.17 1.90 1.65 1.91 1.97 1.86 1.93

52. Para cualquier coleccin finita de datos, determine ei vaior de c c e hace lix - t" tan pequea como sea posible. 54. Considere ios tres conjuntos siguientes de datos. A: B: C: 20 -20 30 -10 2 40 0 1 50 0 0 : 60 20 2

b i Calcule ia vananza de os tiempos t. ecorndo para A y B, respetivamente, c; Cul cuche tuvo un tiempo promedio menor e recorrido? a) Qu coche tuvo un desempeo ms consistente, si la consistencia se mide por la vananza
0

e i Encuentre el rango intercuan para las muestras A y B. 26. La tabla siguiente da una muestra de tiempos de recorrido, en minutos, de un camino de 3 millas para dos coches. C y D. C: D: 1.1 1.2 0.8
1.4

ai Encuentre SS para cada conjunto oe datos: note aue os valores del conjunto B se obtuvieron aadiendo -40 a cada medida en el conjunto A, y que ios valores en el conjunio C se obtuvieron dividiendo cada medida dei conjunto B entre 10. b) Qu relacin existe entre SS y SSB Y entre SS ySSc
A 0

1.1 1.3

0.9 0.9

1.0 1.1

1.0 0.8

0.9 1.5

1.1
1.4

a) Encuentre el tiempo promedio de recorrido para cada uno de los coches. C y D. b i Localice la vananza de los tiempos :1c recorrido para cada uno de los carros. c) Cul coche tuvo un promedio menor de recorndo
1

2.04 2.07 2.14

c) Qu relacin hay entre

y j? Y entre ,r y j *
A A 1

Calcule la media y la desviacin estndar para la muestra de contenidos de grasa. Hay evidencia de que el contenido de grasa es demasiado alto? Explique. Un paso ms all 30. Qu efecto tiene el tamao de la muestra en la desviacin estndar y en la vananza
7

di Qu reiacin se da entre s y JB? Y entre s y se"

35. Si se suma 3 a cada medida en un conjunto de diez que tienen una desviacin estndar de 3, cul es la desviacin estndar del nuevo conjunto de datos
9

25 100

89 98 100

Encuentre el porcentaje de calificaciones que distan menos de 2.1 desviaciones estndar de la media; use entonces el teorema de Chebichev para k - 3.6. Los resultados son consistentes con el teorema? 22. Los datos siguientes representan los precios en centavos para una libra de flor en 16 capitales del mundo: 41 28_JO__16 25 18 35 14 18 30 21 5 7fJ~3 33 24

d) Cul coche se desempe ms consistentemente? e i Encuentre el rango intercuartil para las muestras C y D. 27. La tabla adjunta indica los salarios anuales, en dlares, para una muestra de 25 trabajadores. Saiano anual $5.500 6,00(2. 7,000 8,000 30.000 Encuentre: ai el rango, bi la media. c) la desviacin estndar, di el rango intercuan. 28. La tabla adjunta muestra la distribucin para el nmero de transistores defectuosos encontrados en 215 lotes producidos por un trabajador manual electrnico. Nmero de transistores defectuosos 0 1 Nmero de lotes 25
"8

36. La calificacin promedio en un examen de estadstica fue 75 y la desviacin estndar fue 10; despus de devolver el examen a los estudiantes, el profesor determin que una pregunta haba sido mal calificada y que cada calificacin deba aumentar en 5 puntos: Encuentre la media, la vananza y la desviacin estndar para las calificaciones corregidas. 37. Considere la poblacin de medidas X: 1.233, 1.236. 1.230. 1.236. 1.234, 1.237, 1.233, 1.235, 1.238 y 1.238. Suponga que cada medida se transforma usando Y = 1OOOX - 1230, y encuentre la media, la vananza \ la desviacin estndar de las medidas }'. Adems, demuestre que: aj = lOOQu,- 1230, Como consecuencia,^, = (0.001)
t

Frecuencia 7 > 6 4 3

31. Encuentre x y j para el nmero de nios por familia de la muestra de datos ilustrada en la grfica lineal adjunta.

Encuentre el porcentaje de precios que distan menos de 1.5 desviaciones estndar de la media, luego use el teorema de Chebichev para kson consistentes con el teorema? 23. El total promedio gastado por los clien tes en una tienda - de comestibles es 8.34 dlares, y la desviacin estndar del total de ventas es 8.33 dlares. Qu puede decirse, usando la regla de Chebichev, de la proporcin de clientes que gastan ms de 25 dlares
1

\. Los resultados

Numero de nios por familia

(A,- 1230). b) o] = (1000)V. As, a] = (0.0000001 la;. c) Os = 110001a,. Por lo que a, = (0.001 K/ 38. Si a cada medida de un conjunto de datos se les suma una constante C. demuestre que la vananza del nuevo conjunto es ia misma que la del conjunto original. 39. Si cada medida de un conjunto de datos se multiplica por una constante C. demuestre que la suma de cuadrados del nuevo conjunto es igual a C veces la suma de cuadrados del conjunto onginal. 40. Si cada medida de un conjunto de datos se multiplica por una constante C. es igual ia desviacin estndar

24. El nmero de pacientes que ingresan en el Memorial Hospital por da a la semana es en promedio 32. con una desviacin estndar de 4; un da. ingresaron slo 16 pacientes. Use ia regla de Chebichev para decidir si ste es un nmero de ingresos poco usual para un da de la semana. Explique ei resultado. 25. La tabla siguiente da una muesua e ios tiempos de recorrido, en minutos, e un camino de 2.5 millas para dos coches. A y B. A: 1.0 0.9 i.O 0.8 0.9 1.0 0.9 1.0

32. En algunas situaciones, los datos son dicotmicos, consistentes slo de dos vaiores distintos. Por ejemplo, datos dicotmicos son los obtenidos cuando as respuestas se registran como hombre-mujer, verdaderoalso, amba-abajo, encendido-apagado, etc.; en tales casos, se acostumbra usar 0 para representar un valor ue 1 para representar al otro. Si 1, 0.0. 0. i. 1. i. 1, i y 0 representan una poblacin de valores, encuentre u ) o para a poblacin de ceros y unos. Si p representa la proporcin de unos demuestre que u = p y rj = \ , ) - n i .

16 2

.fjurs; a/iajia/S O (IOS urWiriJd'15 e

Seccin 3.C Tendencia central v dispersin para datos contenidos en tibias de frecuencia agrupada

113

del nuevo conjunto d C veces la desviacin, estndar del conjunto onginan . Otra medida de dispersin es la desviacin absoluta promedio MAD't. Se define por: CS =

3t.x - -I"! s Para una distribucin sesgada, ei signo de CS corresponder a la direccin de! sesgo: una distribucin simtrica tendr CS = 0. Los datos siguientes representan os slanos iniciales, en miles de diares. oe una muestra de graduados de una .;ra universidad en el medio oeste: 29.2. 2".8. 29.0. 20.3. 16.9. 28.7. 19.6. 2L8. 17 4. 20.S. 37.3. 6.2 y 7.8. Caicuie su coeficiente de sesgo. 46. Encuentre un vaior para la constante C que minimice 271 x - C i para ia muestra siguiente de medidas: 2.3. ". ~ v 8. 47. Demuestre que 3 t.v - x r = I r - I x'r in. 2 48. Si todas las medidas de una poblacin distan menos de una desviacin estndar de la media, caracterice la poblacin: es decir, determine qu clase de nmeros conforman ia poblacin. 49. Considere la muestra de mediaas: 1.2,2.3,4 y 4.9. D otra muestra de medidas que tenga una: ai media tres unidades mayor que la de la muestra original. bi vananza cuatro veces ms grande que la original, c; media tres unidades mayor y una vananza cuatro _vecesjns-grande-qtie-la-de ia muestra original. 50. Dada una poblacin, puede ocumr que la desviacin estndar sea mayor que la mitad del rango'' Explique. 51. Demuestre que para una muestra de dos medidas. s = RN2. 52. Si s es la desviacin estndar de una muestra, se puede demostrar que:

SECCIN 3.3

Tendencia centra/ y dispersin para datos a,.:, en tablas de frecuencia agrupada

nidos

Es posible calcular ias medidas de tendencia central y dispersin para datos exhibidos en una tabia de frecuencia agrupada pero sus valores no son exactos sino nicamente aproximados; eso se debe al desconocimiento de las medidas en grupo, las cuales se han colocado en intervalos de clase. Antes de que las computadoras se volvieran de uso comn, era necesano un gran trabajo para calcular las medidas de tendencia central y de dispersin para conjuntos grandes de datos; en un intento de manejar ese problema y de eliminar parte de los clculos, ios datos eran colocados en tablas de frecuencia agrupada y se deban hacer cieas hiptesis antes de realizar los clculos; la validez de estas hiptesis tena un efecto directo en ia precisin de los resultados. Hoy en da. las computadoras de alta velocidad hacen posible procesar rpidamente listas enormes de datos proporcionando resultados altamente precisos, lo cual elimina ias ventajas en los clculos con tablas de frecuencia. Usted se preguntar entonces por qu nos interesa calcular valores aproximados de ciertos estadsticos a partir de tablas de frecuencia agrupada; existe una gran cantidad de datos resumidos en tablas de frecuencia agrupada construidas por otros y la nica forma de calcular sus medidas de tendencia central es usar los datos agrupados. Si debemos encontrar la media para datos proporcionados en tablas de frecuencia agrupada, usamos marcas de clase para representar las medidas para cada clase. Entonces la frmuia 3.2 se puede usar para determinar la media muestral aproximada x, puesto que los datos onginales se desconocen y cada observacin est representada por su marca de clase. Los datos siguientes representan ei nmero de discos vendidos cada da durante un periodo de 25 das en una tienda de msica localizada en un centro comercial: 60 49 36 57 61 54 56 59 19 28 35 63 51 42 38 15 2! 24 28 35 53 46 6
T

MAD

n Calcule ei valor de M A D para los datos del ejercan ." 2. El coeficiente de variacin proporciona una medida de variabilidad que es independiente de la unidad de medida: por ello, puede usarse para comparar la variabilidad de dos grupos de datos expresados en dos distintas unidades de medida. Por ejemplo, puede usarse para comparar la desviacin estndar de ia distnbucin de ios ingresos anuales, y ia desviacin estndar de los aos de servicio de todos los empleados de una compaa. El coeficiente de variacin (CVJ expresa la desviacin estndar como un porcentaje de la media y se define como CV = j/Jr)(100). Suponga que un analista financiero de una firma de corredores de acciones quiere comparar la variacin en las razones de precio-ganancia para un grupo de acciones comunes, con la variacin en el rendimiento neto sobre ia inversin; para las razones de precio-ganancia, la media es 9.8 y la desviacin estndar 2.4, la media dei rendimiento neto sobre la inversin es 2 0 % y la desvia^jnj^^^OlM^-^yr ! Tsf "1 iftefwiftntf ( i f - ^ f f i m r ' paracomparar la variacin relativa de ias raciones precio-ganancia respecto al rendimiento sobre la inversin. 43. Suponga que la planta de directores de una gran corporacin, quiere comparar ladispersin de los ingresos de sus ejecuuvos pnncipales, contra la dispersin de los ingresos de sus empleados no especializados: para una muestra de los ejecutivos, ei salario medio es 400,000 dlares y la desviacin estndar es 50,000 dlares, mientras que para la muestra de empleados no especializados la media es 11,000 dlares y la desviacin estndar es 1200. En cul grupo es mayor ia dispersin reiauva? 44. Puede usarse el coeficiente de variacin con datos que dan lugar a nmeros negativos 3 Explique su respuesta. 45. El grado del sesgo de una distribucin se mide generalmente por ei coecieme de sesso ae Pearson. denotado por CS. Para una muestra, se define por:

Media para datos agrupados

\ APUCAGQN

3.18

30

53

21/? - I) ~

~ \ i V ,i -

donde n es el tamao de la muestra y R es ei rango. Los datos siguientes representan los niveles de colesterol en la sangre para una muestra de ocho personas: 239. 218.22?. 357, 61.286. 310 y 245. at Encuentre cotas supenores e inenores para i. b i Estime s usando el punto medio del intervalo determinado por ei resultado anterior. ci Calcule el vaior ue s y compare ei resuitaao con e! vaior es timado-en el meiso b r

Por conveniencia, los datos han sido exhibidos en ia siguiente tabla de frecuencia agrupada: Nmero de discos vendidos Nmero de das

26-36 48-58 59-69


6

Seccin 3 J Tendencia centra/dispersin para datos contenidos en tablas de rrecuena agrupada .

115

Encuentre: .y; x, el nmero promedio de discos vendidos por da. b i 77. ei nmcr.-. promedio aproximado de discos vendidos por da.

Esta hiptesis permite que ia mediana tenca h propiedad especie! siguiente para un histograma de frecuencias: Si se dibuja una recta ventcai perpendicular al eje borizona: dei V-tograrna en el valor correspondiente a ia mediana, entonces el rea de! histogruT . ubicada aiaizouierda ae la veta vertical, es igual ai rea del histograma ubi.\.da a su derecha. Considere la aplicacin 3.19 y note que los valores aproximados de la - = ~ i n 1060
=

Solucin: a Con la ayuda de una calculadora manual, determinamos que ia suma ae las 25 medidas es L t = 1060. En consecuencia, la media muestral es:

mediana producidos por los dos mtodos no coinciden: ei mtodo II es el usado tpicamente para aproximar ia mediana de datos agrupados en clases, debido a que las reas del histograma. antes y despus de la mediana, estn
= 4 1 4

i r

igualmente distribuidas. APLICACIN 3.19 | La tabla 3.9 representa las velocidades, en millas por hora, para una muestra de 37 coches que recorren una zona escolar donde se permite circular hasta a 25 millas por hora. Encuentre la mediana aproximada de la velocidad.

As, ei nmero promedio de discos vendidos por da es 42.40. b) Encontramos primero las marcas de clase X. Recuerde del captulo 2 que una marca de clase es el punto medio de un intervalo de clase. Cada marca de clase se multiplica entonces por su frecuencia correspondiente, como o mustrala tabla 3.8.

TABLA 3.9 Datos para la aplicacin TABLA 3.8 Marcas de clase multiplicadas por las frecuencias para la aplicacin 3.18 Clase 5-25 26-36 37-47 48-58 59-69 f 4 7 3 6 5 .Y 20 31 42 53 64 fx 80 217 126 318 320 3.19 Velocidad i-5 6-10 !l-!5 16-20 21-25 26-30

Nmero de coches
3

/ acmnulat

2 5 10 7 10

10

20 27 37

Solucin: Usando la frmula 3.2, la media aproximada es: Mtodo I. Las marcas de clase, denotadas por X. estn contenidas en la tabla siguiente. La _ 2 \JX) 2 pnmera marca: 25 = 42.44 Nmero de Velocidad I- 5 Note que x\ = 42.44 es slo un valor aproximado para la media de las 25 medidas mustrales onginales; la aproximacin se considera buena comparada con el vaior exacto r = 42.40, obtenido en la pane a. Hay dos mtodos generales para calcular la mediana de datos previamente W ^
0 5 e n

marc3 de ciase para la pnmera clase es (i + 5)/2 = 3. y

las otras marcas de clase se encuentran sumando 5. el ancho de clase, a ia

Acumulada A' 3 8 13 18 23 28 3 5 10 20 2" 37

coches 3 2 5 10
7

6-10 I I - 15 16-20 21 -25 26-30

10

Mediana
a

para datos
d o s

ases: o s mtodos difieren en l a hiptesis relativa a l a Desdc.esie ountc, adornos determinar h medrana siguiendo a regia uaaa en la seccin 3.1: como hay un numero impar de medidas, .a mediana muestral aproximada 37 es la medida, marca de ciase, que ocupa ia 19 posicin en > a
a

manera de agrupar los datos en clases. Mtodo I. Cualquier valor de a clase coincida con a marc de clase. Memo l Los valores en cada ciase se distribuyen uniformemente en la dase.

ola antenor. As. ia mediana aproximada es .x = 18.


:

Seccin 33

Tendencia centra/ v dispersin para datos contenidos en tac/as de frecuencia agrupada

117

Sitiad:: :!. Como n -37. queremos 'localizar ei n/2 = 37/2 = l8.5-smo valor. Al o'-'v rvar ia tablanotamos que tai vaior cae en ia clase i 6-20. porque las tres ?.-r.-:ras clases cor.rienv.< tn total tit 10 vaiores y la cuarta 10 valores: por o tanto, debemos contar i * :' - 10) = 3 i valores -n la ciase 16-20. bajo la hiptesis de que os 0 es que caen en esta clase estn distribuidos homogneamente a lo ',MSO :!> illa: en otras palabras, estamos buscando a medida en a ciase 6-20 localizada en los js.5/10 de a ciase. Como ei ancho de caaa clase es u' = 5. para encontrar ei vaior aproximado de a mediana .c cuarta ciase. As. ei valor aproximado ue a mediana es:
:

Moda para datos agrupados

Una desvntala de usar la moda con una distribucin de frecuencia agrupad.-' es oue el vaior de la moda a menudo depende del agrupamiento arbitrario de ios datos; por esta razn es que una moda para una distribucin de frecuencia aeruoada suele denominarse una moda cruda o clase modal. Si ios datos se .'.rganizan en una clase de frecuencia agrupada, una moda cruda o ciase modal, si existe, puede identificarse fcilmente: corresponde a ia marca de dase para una clase que contenga la frecuencia mayor y para datos desplegados en un histograma. una moda se asocia con a barra mas alta. Para el histograma ilustrado en a figura 3.10. se ve que as modas crudas son 20 y 40.

sio necesitamos sumar '8.5j/'!0 de! ancho vi- = 5 a la frontera interior de ia

.. -

8.5 = 15.5 - 4.25 = 1

EJEMPLO

3.32

FIGURA

3.10

Histograma con dos modas EJEMPLO 3.31 Un histograma para los datos en a aplicacin 3.! 9 est dado en la ti a r a 3.9. Podemos veriticar fcilmente que la suma de las reas de los rectngulos anteriores al valor 19.7: es igual a la suma de las reas de os rectngulos posteriores a 19.75. FIGURA 3.9 A 2"= 19.75
20 25 30

Histograma para ios datos de la aplicacin 3.19

Rango promedio datos agrupados

para

Para datos organizados en una tabla de frecuencia agrupada, el rango promedio es aproximadamente el promedio de ia frontera inferior de ciase de la primera clase y la frontera superior de clase de la ltima ciase. El rango promedio aproximado para los datos de la aplicacin 3.19 es: 0.5 + 30.5

EJEMPLO

3.33

En general, si i f es la frontera inferior de la clase en lacualcae la mediana, f es la frecuencia de la clase que contiene a la mediana, g es el nmero de valores que se deben contar para llegar a H, contando desde el valor menor, y iv es el ancho de clase, entonces, usando ei mtodo I I , la mediana aproximada para los datos est dada por: Puntos de posicin para El mtodo II para encontrar ei valor aproximado de la mediana para datos en una tabla de frecuencia agrupada, puede usarse tambin para encontrar puntos percentiles en una tabla del mismo tipo. Para los datos exhibidos en la tabia de frecuencia agrupada adjunta, encuentre P&0, el sexagsimo percentil, o 6 decil.
o

datos de una tabla de frecuencia agrupada

APLICACION 3.20
x. = J? -

Nmero de Para la aplicacin 3. i9. 1 - 15.5, % - 3.5. t = 10 y n- = 5. La sustitucin de estos valores en la expresin anterior da: Velocidad coenes

/ Acumulada

i 9. "5
ei mismo valor que obtuvimos en la aplicacin.

u u y/ a- anlisis de datos unmriados o -v.

Seccin 3.4 Punales estndar v observaciones aberrantes

119

Solucin: i . i

Usamos la pnmera columna de la tabla para contar 609c de los

datos, es decir. (0.60X35) - 21 valores. As. Pao debe caer en la clase que contensa la medida; esta ciase es 21-25. E l valor Pv se localiza dentro del intervalo 21-2: a una distancia de 2.14 de ia frontera izquierda del intervalo. L a distancia de 2.14 se obtuvo multiplicando (2M8V7 por 5. ei ancho de la clase. As. el sexagsimo nercentil es; Peo = 20.5 -2.14 = 32.64 i 4

e) Puo V

/V
J 20 23 "1 45 26

Custo de ia reparacin 0-99 100-199 200-299 300-399 400-499 Encuentre: a) la media aproximada.

Frecuencia 12 35 75 8
a

fiQiyftClase de ed.-.ees 28-52 33-37 38-42 4347 48-52

.i

i ' !

125

; |
'

'\a por ciento de los datos estn por debajo del valor 22.64.

Los datos adjuntos indican los totales quincenales, en dlares, invertidos por una muestra de 50 empleados en un plan de beneficencia comparada: Monto de la inversin Nmero de empleados 30-34 35-39 40-44 4549 50-54 55-59 1! 14 8 5 7 . ^

bi la mediana aproximada usando el mtodo 11. c) la vananza aptuximada. di la desviacin estndar aproximada. ej P~_i e! vigsimo percentil. y P , el 35. tngsimo
}

Varianza y desviacin estndar

Las marcas de clase se usan tpicamente para representar medidas que caen en las clases de una tabla de frecuencia agrupada cuando se necesita obtener la vananza o la desviacin estndar aproximadas de los datos; al hacerse esto, se usan las frmulas de la seccin 3.2 para calcular la vananza y la desviacin estndar, para el caso de distribuciones de frecuencia no agrupada.

f) Q. e! tercer cuartil. y D<. el noveno decil. 6. La tabla adjunta contiene una distnbucin de frecuencia agrupada para la duracin de 50 llamadas telefnicas de larga distancia, redondeadas al minuto ms cercano, hechas por una agencia. Calcule la vananza aproximada y la desviacin estndar aproximada para esta distribucin. Duracin de la llamada 4-7 8-11 12-15 16-19 20-23 24-27 Un paso ms all / 23 9 11 4 2 1 '

quinto percentil.

GRUPO DE EJERCICIOS 3..1


Ms aplicaciones
1 La tabla de frecuencias agrupadas exhibe las edades de una muestra de 36 personas asistentes a una pelcula- rjanradltos. Clase 8-13 14-19 20-25 26-31 32-37 2.6-3.1 3.2-3.7 3.8-4.3 ' 4.4-4.9 Precipitacin pluvial en pulgadas Nmero de aos

Encuentre: y a) la media aproximada.

^ b) ia mediana aproximada asando el mtodoll. c) ia vananza aproximada. d) la desviacin estndar aproximada. e) PO, el percentil 60, y Pa, el sexagsimo quinto percenul. - f) Qy, el tercer cuanil, y Dg, e! octavo deci!.

/
2 13 9

7
5 a) Encuentre ia media aproximada de precipitacin pluvial. b) Aproxime la mediana usando el mtodo II. ci Localice el cuadragsimo percentil, y P-s, el percentil 75. di Ubique (), el primer cuar!, y D el cuarto decil. e) Determine el sesgo de! histograma de frecuencias. f) Cul es la vananza aproximada? g) Estime la desviacin estndar aproximada.
;

5. La tabla siguiente conuene los costos de reparacin de un automvil para los reclamos de categora menor presentados ante una compaa de seguros;

7. Para los datos del ejercicio 1, cul es ei percentil


0

correspondiente a una edad de 18 aos ? Este porcen1

taje se denomina usualmenie el rango percenul de 18.

a) Encuentre ia edad media aproximada. b) Aproxime la mediana de las edades usando los mtodos i y 11. c) Encuentre P 0 el cuadragsimo percentil. y Pj, e! 4. percenl 65. di Localice Qy, el tercer cuartti. y Di el tercer decil. e) Determine ei seseo del histograma de frecuencia. f) Ubique la vananza aproximada. g) Estime la desviacin estndar . l a tabla ilustrada aqu da ladistnbucin de ia precipitacin pluvial en un cierto condado de Nlarv tana para ei mes de junio durante ios ltimos 29 aos.

SECCIN 3.4

Puntajes estndar y observaciones

aberrantes

Puntajes medidas relativa

estndar

como

Suponga que despus de hacer un examen de estadstica usted obnene su calificacin; entonces, se interesa por saber cmo es su caiificxin respecto a ia de ios dems que hicieron el mismo examen, para saber si su calificacin est por debajo o encima de la media y por cunto. Un puntaje estndar le dar inforrnxin sobre qu tan bien hizo ei examen respecto al resto de! grupo y le proporcionara una medida de su posicin reiauva dentro del mismo. Roberto obtuvo 700 en la pane de matemticas del SAT y Jaime 24 en habilidad matemtica dei examen de colocacin en la universidad iCPTpor

. La tabla de frecuencia agrupada adjunta indica as edades de compradores de coches nuevos en una gran distribuidora. Encuentre: ai La edad media aproximada, bi La mediana aproximada de as edades usando ios mtodos I y II. v i La vananza muestrai aDroxtmada. i i La desviacin estndar muestrai aproximada.

de posicin

20

Estadstica descriptiva: anlisis de daten uwariidos

Seccin 14 ?untajes estndar Y observaciones aberrantes i

121

sus siglas en ingles:. La media y la desv'icin estndar dei S A T son 500 y 100. y dei CPT 18 y 6. respectivamente. Si se supone que ambos exmenes miden algn upo de habilidad, cul persona califico ms alto?: para responder esta pregunta necesitamos algn mtodo aue nos permita comparar puntajes de distribuciones distintas. E s ciare que ia desviacin de c:tda puntaje respecto a su media no es una base de comparacin correcta en este caso, pues ia desviacin de ia calificacin de Jaime es:
-T = 24-iS = 6
_

'00 - 500 _ , LO O

La calificacin de Jaime de 24 est una desviacin estndar arriba de la media del examen CPT. y la calificacin de Rodeno de 700 est dos desviaciones estndar arriba de la media del SAT; como ambos puntajes: son positivos v ei puntaje; de Roberto es supenor al de Jaime. Roberto calific ms alto que Jaime en la habilidad medida por el examen. APLICACIN 3.21 i Suponga que un conjunto de puntajes tiene una media de 10 y una desviacin estndar de 2. a) Escriba los valores fallantes de ia tabla siguiente.

y ia de la calificacin de Roberto es: .v-1 = 700- 500= 200 Ninguna de ellas toma en cuenta la dispersin de los puntajes. Si usamos puntajes estndar veremos que Roberto calific mas alto que Jaime en la habilidad medida por el examen. Un puntaje estndar toma en cuenta ia variabilidad de las medidas respecto a su media. Una medida que nos permite hacer comparaciones entre distribuciones distintas y toma en cuenta la dispersin de los puntajes es el puntaje estndar. Un puntaje estndar se define como: . , puntaje estndar = y^e^deica-cefflft^ desviacin del valor : desviacin estancar puede expresarse como:

b) Qu significa un puntaje ; de 0 respecto ai puntaje original? c) Qu indica un puntaje; positivo respecto ai puntaje onginal? d) Qu quiere decir un puntaje: negativo respecto al puntaje onginal? el Adems de indicar que un puntaje est arnba o debajo de la media, qu inL

formacin adicional proporciona un puntaje c?

Solucin: a) De la frmula 3.1 i obtenemos los siguientes puntajes;: x | 4 6 -2 8 -I 10 12 14 16 0 1 2 3

Puntajes estndar

- x-u
o Z =

x-x
~ T Muestra

;
s

3-m j

I -3

Poblacin

b) Un puntaje; de 0 indica que el puntaje es a media. c) Un puntaje; positivo quiere decir que ei puntaje original est arriba de la media. d) Un puntaje; negauvo significa que el puntaje ongmal est debajo de la media. ti Un puntaje; tambin dice el nmero de desviaciones estndar que un puntaje dista de la media.

dependiendo de si lo que interesa es una poblacin o una muestra. Puesto que un puntaje estndar se define como la razn ue la desviacin del valor entre la desviacin estndar, representa ei numero de desviaciones estndar que un vaior dista de la media. Un puntaje estndar ^e denomina en ocasiones puntaje En relacin con el

ejemplo antenor. el puntaje estndar o puntaje : de Jaime es:

APLICACIN 3.22

Si una distribucin de nmeros obtenida de medir pesos de nios pequeos tiene una media de 20 libras y una desviacin estndar de 2. cual es ia unidad asociada con cada puntaje ;'?

- g

Solucin:

Si .t denota el peso de un nio en libras, entonces .v libras menos

20 libras es i.v - 20) libras. Al dividir ,v - 20 libras entre 2 libras se obtiene


2 4-

un cociente de \x - 201/2. En consecuencia, observamos que un puntaje; no nene unidad de medida, es solo un numero.

uuD/sJca descriptiva: anlisis de datos univariados

Seccin 14 Pontajes estndar v observaciones aberrantes . 123

APLICACIN 3.23

Repetimos aqu los datos de h .piicacin 3.11 relativos a los precios dei asado de cerdo y del queso cheddar. Ciudad capital Berna Bonn Brasilia Buenos .Aires Camberra Londres Madnd Mxico Ottawa Pars Pretoria Roma Estocolmo Tokio Washington Asado de cerdo i sin hueso < 56.61 2.28 1.27 1.36 2.06 1.56 2.33 1.08 1.99 2.47 1.95 2.46 5.35 4.19 3.29 Queso cheddar S4.00 2.74 1.08 2.03 2.60 l.Si 3.15 2.29 3.98 2.37 176 2.96 2.54 2.38 2.69

| La poblacin de todos os puntajes estndar uene una media d 0 v una e '. desviacin estndar de 1.

APLICACIN 3.24 j
ai Encuentre

uyo

para la poblacin consistente en ios

valores

1, 2 y 3.

b i Localice los tres puntajes estndar. o Demuestre que la media de ios puntajes estndar es 0 y que ia desviacin estndar es 1. ' Solucin: i) La media poblacional es:

Usamos la frmula 3.6 para obtener la vananza poblacional. , _ SS _ , (x -jtf c\ y ' 2 v u -1? c i - i l L i J l ^ i l 3 Por tanto, la desviacin estndar ser:

Use puntajes ; para determinar cul alimento tiene ei precio relativo ms alto en Washington con respecto a los precios en las otras capitales.

Solucin:

Se puede demostrar que x = 2.69 dlares y x = 2.56 dlares.


p c

Demostramos-antes que SJ^rTN^By^itrk Washington, su puntaje zP es:

comprobarse fcilmente

que sP = 1.57 dlares. Como el asado de cerdo cuesta 3.29 dlares en Parax= 1 > - -x V
: =

= 0.816 3 b) Encontramos los puntajes z usando la frmula 3.11:

I6~

1.0/

Parax = 2, 0.816 Para .t =

El queso cheddar cuesta 2.69 dlares en Washington. Su p u n t a j e e s : ,x - X

0.816
L a

media de los puntajes: es cero. Para encontrar SS para los punces

^nuestros As. ei precio del asado es relativamente ms alto en Washington que ei dei queso. Suponga que u y o son la media y la desviacin estndar, respectivamente, de una poblacin finita; cada medida x tiene'un puntaje ; asociado. Los factores importantes siguientes, que se explican en la aplicacin 3.24. ayudan
0

frmula 3.5.

124

dstica

desamtiva: anlisis de datos unrvariados

Secrin 3.4 Puntajes estndar v ooservaaones aberrantes 125

Dicha frmula ca:

Come -ion de puntajes a puntajes x

~1 I ' "sando la frmula 5.G c-tenemos:


=

' APLICACIN 3.25 j

Para algunas aplicaciones, es interesante revenir los puntajes; a sus puntajes originales. Por ejemplo, si x - 10 y s = 2, encuentre ei puntaje x correspondiente a l ; de ; = 16.

SS v Solucin: Usaremos la frmula del puntaje; y despejaremos x.

X-X En consecuencia, ia desviacin estndar de ios puntajes; es: i I i j ! j ": ~ V vananza = v'T = i Multiplicando ambos lados por 2, tenemos: 32 = .v- 10 5 x-\0

^nH JT ^ 'a media y la desviacin a n d a r de los puntajes z, en la aplicacin 3.24, son 0 y 1 S a i


B d e U S a 5 e P a r a d e m o s t r a r

Si sumamos 10 a ambos miembros, resulta: i = 42.

Pantalla 3.5

MTB>SETC1 DATA>12 3 DATA>END Mra>LETC2 = (Cl -MEAN(Cl)ySTDEV(Cl) MTB>LETKl=MEANfC2T ' " MTB> LETK2 = STDEV (C2) MTB>PRINTC1C2 ROW Cl Cl 1 2 3 1 -1 2 0 3 1. 1 MTB> PRINTK1K2 Kl K2 MTB> 0 1.00000

Cuando de la frmula del puntaje ; se despeja x. obtenemos la frmula 3.12, que puede usarse para encontrar el puntaje orrginal x dado por un puntaje estndar; (vase la aplicacin 3.2-6). De puntajes z a puntajes originales x = fi + oz i I (3.12)

APLICACIN 3.26

Si una poblacin tiene una media de 70 y una desviacin estndar de 5, encuentre el puntaje original correspondiente al puntaje ; de 1.5.

Solucin: Por medio de la frmula 3.12 obtenemos:

x = u r oz = 70-r (5X1.5) = 70-".5 = 77.5

Grficas de caja

Una grfica de caja es un diagrama que proporciona informacin sobre el centro. adispersiny lasm3etriao.sesgo;.uiilaacuartilfiS> y asLes rtsistnte., a las observaciones aberrantes; en ocasiones, a las grficas de caja se les denomina diagramas de caja y extensin. Para construir una grfica de caja se ejecutan ios pasos siguientes:

EKISr

exh be ta media y la deswacin estindar, respeclivameniP


r e S U , t a d

ri. t

i~ en

Estadstica descriptiva: organizacin de datos

Seccin 2.2 Organizacin de datos mediante tablas

35

usar marcas de c:::se en ugar de ios datos sin agrupar, los clculos se facilitan aunque se pierde precisin. Para una ciase dada, ia marca de clase se encuentra usando la lrmula

Paro 2. Calcule el ancho de ciase . Como c = 5. tenemos ,

El mnimoemero mayor que 12.96 es 13, En consecuencia, cl ancho de ciase donde .', es el lmite inferior de clase y es el lmite supenor. es n' = 13. Paso 5. Comenzamos con L - I ".89 y construimos una clase con ancho u = 13. La unidad es 0.01 y (Q.$) (i).0()= 0.005. Representemos con x h frontera supenor de la pnmera clase. Entonces, ei ancho se obtiene restando la frontera interior de clase de la frontera superior.

EJEMPLO

2.15

Para a primera clase de ia taola 2.5. la marcare clase es

"1 >

= . u 0.005 - 1". 885 = li.r< 13 = .v -0.005 - T.885 i 3 = A - 17.88 v = 30.88 En consecuencia, la primera clase es I ".89-30.88. Paso 4. Para obtener las ciases restantes, sumamos 13 a ios lmites de ciase

Para la segunda clase, la marca de clase es

22 - 41

31.3

precedentes. Clase 17.89 - 30.88 13 13 13 1 3 30.89 - 43.88 43.89-56.88 | Pnmera clase ' sume w = 13 en ambos lados de la pnmera clase * j Segunda clase
1

Advierta que la marca de clase para la clase 2 tambin se puede encontrar sumando u- = 20 a la marca de clase para la clase 1 111.5 r 20 = 31.5). En general cada marca de ciase para las clases siguientes a la primera puede encontrarse sumando w = 20 a a marca de clase precedente, por lo tanto, resulta que las tres mateas de clase restantes .SXI5.5. "1.5 v 91.5. La tabla 2.7 muestra una tabla de frecuencias agrupadas que contiene las marcas de clase. Nmero TABLA 2.7 Marcas de ciase para i a tabla de frecuencias agrupadas de la aplicacin 2.4 o de ia tabla 2.5 de clase 1 2 3 4 5 Clase 2-21 22-41 42-61 62-81 82-101 Cuenta 1W11H1W1III M III W 1 IfflJJt m ni Marca de

sume ii = 13 en amos lados de la segunda clase

| Tercera clase

Las dos ciases restantes se encuentran de manera anloga. Son; 56.89 - 69.88 69.89 - 82.88 Faso 5. Las frecuencias para las cinco ciases se encuentran usando marcas de cuenta como se ve en la tabla 2.8. Paso o. Las marcas de cada clase se encuentran usando la formula para el punto medio dada previamente. La marca de clase para la primera es

/
18 S 6 10 8

la dase X 11.5 31.5 51.5


T

1.5

91.5

APLICACION 2.6

El conjunto de datos siguiente representa los totales de efectivo i en dlares) gastados en un cieno fin de semana por 25 estudiantes graduados. Construya una tabla de frecuencias agrupadas que contenga cinco clases. 2S.30 u.65 iS.54 52.ti

*
it* -marca de :f&$8&&.v-

17.89

- 30.88 2

se encuentra sumando i r = 13 a la m a r d

antenorvLu tabla 2.3 ue frecuencias agrupadas de lo datos, muestra tambin las marcas de clase.
Nmero de ciase Ciase Cuenta / A -

Solucin: Pase /; Cuicae e raneo R. mo i; = 83?."ll v 1 = 7.39. e: raneo es

Secdon 3.4 Puntajes estndar observaciones aberrante

. 129

ias longitudes de las extensiones no son un buen indicador dei sesgo en ia poblacin, porque dependen de valores aislados. Advierta aue ei ancho de ia cata es ei rango intercuartil y por ello, 'ia una medica : la dispersin de ios datos: si una extensin fuera especialmente larga, sera seal e que ia medida extrema es una posible j FIGURA 3.12 Grfica de caja seguida observacin aberrante.

APLICACIN 3.27 ;

Considere el siguiente conjunto ordenado, visto ongmalme.;.

n el ejempio

3.20, que representa ias cantidades de oxigeno consumido unL/kg . m i m . por 21 corredores hombres de mediana edad ai pedalear en una bicicleta ergomtricade 100 watts: 1181 14.95 15.83 i5.9" 19.90 18.27 l * 34 19.82 19.94 20.62 5n."5

20.88 20.93 20.98 20.99 21.15 22.16 22.24 25, 23.56 357S

Determine si la medida 35.7S es una observacin aberrante. Solucin: Usaremos las dos reglas prcticas.

1. Regla 1: un diagrama de tallo y hojas para ios datos es como sigue: EJEMPLO 3.37 La figura 3.13 resume las caractersticas importantes de una grfica de caa. 12 FIGURA 3.13 Q mediana 0 Rasgos importantes de una grfica de caja 13 11 14 5 16 1" ms chica ms srrande 18 19 20 21 TI
:

81 Q 95 83 90 "1 82 62 15 16 34 . 94 88 24 56 yi

23 ' 16 Deteccin de aberrantes^ Una observacin aberrante, como dijimos, es una medida extrema en un conjunto dejiaios^indica-^M)easione^n^e'"se "fia cometido un error, de anotacin, por ejemplo, pero tambin puede representar una medida muy rara de la poblacin. L a investigacin de observaciones aberrantes revela a menudo informacin til y es bastante posible que una de ellas sea la "joya entre las piedras" en lugar de la "piedra entre las joyas". Estas observaciones pueden afectar tanto la media como la desviacin estndar del conjunto de datos, distorsionando as el centro y la variabilidad; no hay consenso entre los investigadores sobre los que constituye una observacin aberrante en un conjunto de datos. Una de las dos reglas prcticas siguientes son de uso tpico para detectar observaciones aberrantes en un conjunto de datos. 35 '. 78 36 1 73

observaciones

Las medidas no siguen una forma de campana y por tanto la regla no debe usarse, Pero, con ei propsito de ilustrar, calculemos el puntaje; para ia medida 35.7S. La media es .7 = 443.0/21 = 21.06. y la desviacin estndar es s = 5.75. El puntaje; para 35.78 es: 35.78- 21.06

Una medida es una observacin aberrante de una muestra si se verifica una de estas reglas

La medida 35.78 no es una observacin aberrante, pues est slo 2.56 desviaciones estndar amba de a media. A causa de las medidas extremas, la meca y la desviacin estndar se han inflado y en consecuencia, el puntaje i ha sido reduciao. 2. Regia 2: en ei ejempio 5.20 encontramos que IQR = 3.S9. Q, - 18.2". Q . =
:

Regia 1. Ei tamao de ia muestra es mayor de 10. la distribucin de frecuencia nene forma de campana y ei puntaje : para ia medida dista ms ue tres desviaciones estndar de la media. Regia I. La medida cae ms ae tres IQR debajo del cuarui menor. . mas ae tres IQR amba de: ciiarni supenor.

22.16. Como 22.it>-3t3i9i = 55.85 \8 > 35.83. podemos concluir que 3578 es una observacin acerrante.

Seccin 3.4 P i n j e s .andar v observaciones acerrantes

.133

GRUPO DE EJERCICIOS 3.4

B. Qan de ellos produjo a cantidad reiauva mayor


0

5
4

0 8 5 0 i 3 0
;

Pot qu

8 5 ! " 9 (: ' S " 9 S 9 9 S 9 9 9 ~

Habilidades bsicas \ Si = 4 " v a = 1 5 . er.; ios valores /alomeser. atabia siguiente:

Ms

aplicaciones

12. El salario medio anual de todos los programadores de cmputo hombres en una ri compaa es de 55,000 dlares, y a desviacin estndar de 500 dlares. Una mujer programador gana 20.000 iares anuales y considera estar siendo discriminada. Usted qu opina? Por qu?
b

5 7 8 9

3". Susana obtuvo 625 puntos en ei examen A en ei cual u = 600 y o - 70: Mara alcanzo 525 puntos en el examen B p?.ra el cua; u = 500 y o = 25. S; tanto Susana como Mara solicitan un trabajo y todos los otros tactores son iguales, a quin debe otorgrsele ei trabaje con base en los puntajes de los examenes A. B' i
1

5 5 5
4

"

3. Los datos siguientes indican ios montos, en centavos de dlar, del impuesto por galn de gasolina endiversis entidades de Estados Unidos: 9 11 8 15 9 12 9 i3.5 9.8 10 7 5 13 0.5 6.5 13 15.7 9 11 8 9 1 11.7 9 8 15 i 9

a> Construya una critica de caja. b> ^Encuentra observaciones aoerrantes'


1

Us^taje^s^dar-pawsttcar-^n'respuesta.

16. ^Puede un puntaje de 5 tener un puntaie estndar de 3 si es miembro de una poblacin con una media de 7? Explique. 17. Si un puntaje de 13 es miembro de una poblacin con una media de
7

David y Ricardo estn entrenando para ei maratn de Boston. David est entrenando en un camino de Cumberiand. mientras que Ricardo io hace en uno de Frostburg; la media de! tiempo para completar ei recorrido

Si ti = 35 y o = i 6. liene los valores fallantes en ia tabia siguiente:

dei camino de Cumberland es 167.4 minutos y la desviacin estndar es 25.9 minutos. La media del tiempo en el camino de Frostburg es 143.1 minutos y a desviacin estndar de 20.7 minutos: David dice que su tiempo de recomdo de! camino de Cumberland es 91.5 minutos y Ricardo dedara que el suyo es 86.2 minutos. Quien
0

8 13 14 10

y tiene un puntaje estndar de 5.

12 1

encuentre ia varianza de la poblacin. 18. Si un puntaje de 10 es miembro de una poblacin con una vananza de 9 y tiene un puntaje estndar de 5. encuentre ia media de la poblacin. 19. Una poblacin nene una media igual a" y una varianza igual a 1. Encuentre ei valor de! puntaje que tiene un puntaje estndar igual al doble de su valor. 20. Si para definir una observacin aberrante se usa slo ia restriccin sobre el puntaje ;, es una observacin
t

ai Construya una grfica de caja para ios datos, b) ,Hay observaciones aberrantes
t 1

14. La Nielson Company recaba informacin sobre ios hbitos de atencin a ia televisin por parte de los estadounidenses. Los datos adjuntos indican el tiempo dedicado a ia semana a ver televisin, en horas, para una muestra de 20 estudiantes universitarios: 16 29 36 2! 22 26 27 31 38 11 51 25 30 33 25 25 10 5

-1.4

ser ei mejor en el maratn de Boston, segn usted? Use puntajes estndar para justificar su respuesta. 9. Las medias y las desviaciones estndar de los puntajes de exmenes en cinco grupos se listan aqu: suponga que usted obtiene un puntaje de 75 en el examen. .En
t

3. Considere la poblacin: 4. 8, 12. 16 y 20. Encuentre^ -

cul grupo tendra la mejor posicin relativa? - H ( - 6 5 : r = !tr b'iu = 70.a = 5 ci i( = 5 5 , a = 15 di u = 75,o = 2 e),u = 7 0 . o = 3 10. Las medias y las desviaciones estndar de los tiempos de carrera para cuatro carreras de distancia se anotan abajo suponga que usted obtiene un tiempo de 20 minutos en una carrera. En cul carrera tendra usted

15 16

aberrante el valor un milln en la muestra: 0,0,0,0, 1,000.000)? Explique. 21. Como en el caso anterior. es una observacin aberrante
c

"~ ai.u
b) o O el puntaje; de cada uno de los puntaje en bruto c) la medida y la disviacin estndar de los puntos; en i a parte c 4. Considere la siguiente muestra: 1, 2.2.6, 8 y 11 para localizar: al! bi s. c) el puntaje: para cada medida. d) la media de los puntajes el la desviacin estndar de los puntajes 5. Construya una grfica de caja con los datos siguientes: 1.32 .26 1.41 0.99 0.95 1.26 1.06 1.10 1.18

ai Construya una grfica de caja para los datos, b) Hay observaciones aberrantes'' Un paso ms all 15. Los datos en el diagrama de tallo y hojas adjunto indican las calificaciones logradas en un examen de estadstica.

el valor uno de la muestra {0.0.0,1.1,1.2.2.2.5) ? 22. Puede encontrar una muestra de tamao 4 cuyo valor
0

mximo tenga un puntaje; mavor que 3/2?

la mejor posicin relativa' a) ii = 10, o = 2

b) =25.0 = 5
c i u = 14.a= 10 d i i i = 20. a = l i 1. Los trabajadores que utilizan ia maquina A pueden producir cantidades dianas del producto C. con una media ue "5 y una desviacin estndar ue 5. mientras que ios trabajadores que utilizan la mquina B producen cantidades enanas del producto C. con 'ana media de SO y una desviacin estancar de..*., Dicfc crouto 33" unidades con ia maouma A v Juan 92 con u macuma

6. Construya una grfica de caja con estos datos: 65


"4

77

83

92

96

95

103 109

Revisin dei capitulo

133

RESUMEN DEL CAPTULO

MCHOS

Y FRMUIAS IMPORTANTES

En este captulo introdujimos los conceptos de tendencia central, puntos de posicin y variabilidad; estudiamos cuatro medidas de tendencia central: media, mediana, moda y rango promedio. Estas medidas proporcionan vaiores centrales para conjuntos de datos. Aprendimos que en una distribucin las posiciones relativas de la media, la mediana y la moda determinan la simetra o sesgo de la distribucin; despus, estudiamos cuatro medidas de dispersin o variabilidad: rango, varianza. desviacin estndar y rango intercuartil. Estas medidas se usan para describir la cantidad de dis-

persin en un conjunto de ciatos. Vimos que el teorema de Chebichev es importante para comprender el concepto de desviacin estndar: finalmente, se introdujeron los puntajes estndar y las grficas de caa: los pnmeros expresan las posiciones relativas de las medidas respecto a su media y tambin son tiles para hacer comparaciones relativas de datos de dos poblaciones o muestras diferentes; ias grficas de caja son tiles para exhibir el centro, la variabilidad y el sesgo o simetra en un diagrama, y para ayudar a identificar observaciones aberrantes en un conjunto de datos.
: = l f x

Desviacin estndar poblacionai: Media muestral: *


=

-'5 1

o = v vananza poblacional Estimacin de: s = ^r (3-

Li Media poblacional: u = ^

Mediamues^paratodosenunatabladetrecaenci,

Suma de cuadrados para datos mustrales agrupados: W e ^ _

surradecuadradosparadat^
( 3

^ 7

'

2 )

SS-Jflx-nf

(3.9)

REViSIN DEL CAPTULO

Rango intercuartil: IQR = Q - Qi , J J

Frmula para calcular la suma de cuadrado de datos en una tabla de frecuencia:

Para una coleccinfinitade datos, la suma de desviaciones de los valores es 0; es decir, I {x - x) = 0 (3.3) , (Ifxf .

TRMINOS IMPORTANTES

Suma de cuadrados para una poblacin: S S = I {x ~n ) ' (3.4) Suma de cuadrados para una muestra: SS =l(x
r (

Los trminos siguientes utilizados en el captulo se han mezclado para proporcionarle una mejor prctica de revisin; d una definicin de cada uno con sus propias palabras y despus verifique sus definiciones contra las dadas en el captulo. constante moda cruda diagrama de caja birnodal desviacin de un valor media media de tendencia central media de depresin mediana rango promedio moda -tango puntaje original histograma sesgado puntaje estndar desviacin estndar suma de cuadrados histograma simtrico porcenl media muestral aproximada clase modal

~x)'

Teorema de Chebichev: al menos (1 - l/Jt)100% de . . cualquier conjunto j datos J - _ menosJdeIkJdesviaciode J . dista


J

nes estndar de la media, si k es un nmero real mayor o igual a l . .. . .

i Frmula para calcular ia suma de cuadrados de una


-

Puntaje z o estndar de una medida de una poblacin: : s s = i r - M (3.5)


z = i z i L { m )

vananza puntaje r rango intercuartil observacin aberrante grfica de caja cuartiles deciles variabilidad meana muestral aproximada punto de posicin

O "

poblacin: S S ^ - ^ (3.5)

..IZl

(3.11)

Una poblacin de puntajes: tiene como media cero y g<, s , varianza muestral
2

como desviacin estndar 1. (3.6) Una medida de una observacin aberrante de uaa muestra
a :

n, tamao de la muestra ! medida muestral |t, media poblacional I, usada para indicar suma N, tamao de la poblacin M media poblacional , x, mediana muestral P, n-simo percenul

SIMBOLOS IMPORTANTES Q, primer cuartil Q:, segundo cuart Qi, tercer cuanil D, n-simo decil R, rango IQR. rango intercuartil SS, suma de aladrados o~, varianza poblacional

Varianza poblacional: <T ~ r r


=

" SS Varianza poblacional: J* = " ~ ' Desviado*, estndar muestral: i = N vananza muestral r (3.7)

a, desviacin estndar pobaiaonal s, desviacin estndar muestral x, media muestral aproximada x , mediananwesoaiaproxitTra"-'a

Regia 1. E l tamao de la muestra es mayor que 10, la distribucin de frecuencias tiene forma acampanada y el puntaje; dista ms de tres desviaciones estndarde la mediar Regla 2. La rradida cae ms de tres IQR debajo dei cuartil inferior, o ms de tres IQR arriba del cuartil superior.

da

canuca

descriptiva: anlisis de datos univariados Ejercicios ae repase 135

EJERCICIOS DE REPASO 1. Calcule la media, la mediana, ia morh. el rango promedio, el rango, ia vananza y la Vjviacin estancar para cada una de las poblaciones siguientes: a) 2.7.4.6. 8.2 b) 7,8.5.2.3 3)9.6, , 1.4 d) 3, 3, 3 9. Los siguientes datos representan los cargos mensuales, en 6. Se recabaron los datos m astrales: 8 8 8 8 26 18 6 10 8 dlares, dei servicio telefnico en 19 ciudaivs del mundo: 728. S.54.15.28.5.51.3.1?, 6.34.3.80,4.59.5.12.9.98. 7.04.10.00.11.96.5.48.2.30.5.85.9.39.8.75,7.66.a) Encuentre 7. bl Determine s. cl Calcule ei puntaje: para el cargo mensual del servicio a) Encuentre I y 5. b) Si a! recabar los datos se cometi un error y l i 2. Calcule a media, la mediana, ia moda, el rango, la vananza y la desviacin estndar para cada una de las muestras: a>4.7,2.2 b) i , 8.9,4,4 c) 0.0.1.1.10 d) 3.3,3 el 8. 14.15, 16. 22 3. Calcule el puntaje c para x en cada una de ias situaciones siguientes: a) .t=22,/ = 15.a = 2 b) .t = -10, = 5,a = 8
C) .T

a) Encuentre,". b) Encuentre s. c) Cuntas medidas distan menos ae una desviacin estndar de la media? 11. Los siguientes son promedios EP.\e rendimiento en miilas por galn, para 15 auioiri';-. ties compactos v suocompactos modelo 1989:50.31,54,31,35.41.2", 35.20,47, 27. 29, 34,38 y 52. al Ubique x y s. b) Encuentre los cuantes y el cuarto decii. c) Construya una grfica de caja. 12. Los datos siguientes representan las ventas anuales de armas, en billones de dlares, de Estados Unidos a pases del tercer mundo, de 1976 a 1983: 8. 2. 9. 8, 10.1.9.2. 6.4, 6.8,7.9 y 9.7. Encuentre: a) 7 b) . ci <2 y Di
3

3 14 14 14

20 10

telefnico en Nueva York t.v = 10.00 dlares), d) Construya una grfica de caja. 10. Se seleccionaron cincuenta domicilios para determinar ei numero de habitantes homores. Los datos obtenidos se enastan aqu: 0 1 1 0 0 2 0 1 2 1 1 3 1 0 1 2 0 1 1 2 0 0 0 1 4 0 3 1 0 2 2 1 1 3 1 1 1 0

medida ongmal de 26 hubiera sido 20. deber;:: crecer o decrecer J? Explique. cl Con las hiptesis dei inciso antenor pero suponiendo que la medida original hubiera sido 8. Aumentara o disminuira J ? Explique.
1

i
1 2 0

7. Un grupo de clculo tiene 30 alumnos Las calificaciones que siguen son las obtenidas en un examen por los alumnos que se sientan en ia pnmera fila: 87.83. 89. 71 y 95. a) Esta coleccin de calificaciones es una muestra o una poblacin? b) Calcule la media y la desviacin estndar de los datos. c) Encuentre los puntajes estndar para los valores 71 y 95. 8. Para cada uno de los conjuntos siguientes, especifique una niedidaTle^en^enc7al:enfral apropiada y d su valor. Justifique su eleccin en cada caso. a) Peso en libras bl Clasificacin Profesor Profesor asociado Profesor asistente Instructor Nmero -5 1 24 1 3 0

1 1 2 0 2

1 0

Aplicaciones

de

computacin 2. Los datos siguientes representan los pasos, en centesimos de libra, de una muestra de nios recin nacidos registrados durante el ao pasado en el Memorial Hospital. 631 827 631 734 938 604 583 753 554 890 781 750 756 779 758 821 612 780 843 581 743 951 669 682 714 711 930 927 744 727 857 602 875 571 $29 759 875 902 808 766 866 590 623 986 793 835 674 77K> 842 738 838 726 609 717 657 702 916618 855 770 680 847 679 754 733 787 869 825 808 715 723 728 849 958 760 875 841 917 851 848 768 750 700 793 870 627 641 795 732 582 856 913 809 804 820 602 779 651 773 591

= 0,X = 12, s = 6

d) x = I2.5,x = 22,x = 0.4 e) .\ 17,x = 1 5 , r = 4

1. Se listan aqu las calificaciones del examen de ingreso de una muestra de 100 principiantes que acuden a una universidad en el medio oeste: 432 257 502 506 425 479 387 394 282 423 606 417 596 395 517 512 501 620 142 556 671 633 340 489 646 394 440 323 367 554 544 347 576 320 505 356 428 797 353 532 294 555 512 433 454 563 299 355 455 452 412 436 562 602 561 630 375 338 244 283 452 412 326 564 350 664 279 284 221 432 446 284 492 348 401 267 372 617 285 195 309 637 314415 546 577 282 370 353 457 394 485 276 377 170 690 583 273 393 258

desviactnestindarparalatabladefrecuenciadedato, mustrales: _j_ /__

5 Encuentre la mediana, a moda, la vananza v la desviacin estndar para los datos mustrales ilustrados por 'a grfica lineal siguiente: cj Partido Demcrata Republicano Socialista

Use un programa computacional para: Nmero d) Calificacin Nmero 200 300 50 a) encontrar la media muestral. b) hallar la desviacin estndar muestral. cl calcular el rango. d) hallar los puntos cuartiles. e) ubicar ei vigsimo percentil. f) fijar el cuarto decil, g) construir un histograma.
N'mero

Use un programa computacional para: a) encontrar la media muestral. b) hallar la desviacin muestral estndar. c) calcular el rango. d) hallar los puntos cuartiles. e) ubicar el sexagsimo percentil. fi fijar el sexto decil. g) construir un histograma. hi trazar un diagrama de tall y hojas. i) dibujar una grfica de caja.

Independiente 17

e) Velocidad Rpido Lento

h) dibujar un diagrama de tallo y hojas. ii trazar una grfica de caja.

804

I Respuestas

Respuestas

805

7. a; Ordinal, b S. Hubiera sido m tabular los resultados.

analizar \

13. ai 6 b, 7 15. Clase 28 - 38 4 39 -49 6 50 - 60 3 61-71 4 72 - 82 4 83 - 95 4 19. Clase 66-70 76-80 71 - 75 81 -85 2 10

ti !0 17. Clase

a 30/130:El porcentaje es 23.08. di 20/130. El porcentaje es 15.38. ti 40/130. El porcentaje es 30.77. 0.16 0.24 0.12 0.16 0.16 0.16 fi 40/130. Ei porcentaje es 30.77. 27. ai 23/35. El porcem..je es 92. bi 7/25. El porcentaje es 28. 29. a) 5. b> 6.95, 11.95. 16.95. 21.95. 26.95 c) 4.45 - 9.45. di 9/18. El porcentaje es 50. el 10/1?. El porcentaje es 55.56. f 4/18. El porcentaje es 22.22. Grupo de ejercicios 2.3
1. ai Distribucin de las calificaciones

0.26 0.2-1 r

')

Nmeros de departamento, etctera.

28 - 5* 59 - 4Q 50 - 60 o i - 71 - 82 83 - 9} f acum 2 6 16 23 27 28 / re. 0.4 0.24 0.2 0.12 0.04

11. S, sera de naturaleza categrica. Grupo de ejercicios 2.2 1. a i 9 3. a/25 113 ? 27.4 d i" ci 3< J) 5 f/

o.is ll.lt .4 0.12 r O.i 0.U8 '1

J) 28.64 i 19.

o.o6 p
0.04 0.02 ?5 105

5. a) 16.5-25.5 a 22.5-39.5 el 13.55-19.55 7. al Clase 1-4 5- 8 9-12 /

b) 14.45-27.45 di 23.645-28645

4 7 4

/ re!.

bi

Clase i - 4 5-8 9-12 13-16 17 - 20 18 16

' acum. 14 14 32 60 80

86-90 91 -95 Clase 115.9- 120.8 120.9 - 125.8 125.9 - 30.8 130.9 - 135.8 135.9 - 140.8 23. ti) X
2

4 0.175 18 0.225 12 0.150

12 44 20

/re. acum. 0.4 0.64 0.84 0.96 1.00


A B

13 -16 16 0.200 7 - 20 20 0.250 1.0 c) Clase 1 -4 9-12 13-16 17-20 16 20 /

10 6
S

5 1 f re!.

fre. acum. 0.175 0.550 0.750 1.000

Calificaciones

4
5 6

4
8
6

1 ":O23~
0.133 0.267 0.200 0.133 0.067 0.067 0.033 0.033 0.033

u
C D

b) Distribucin de las calificaciones

11. ai De barras, circulares. b/ Histogramas, grficas de barras v circulares, diagramas e tallo y hojas, grficas de lneas, ojivas.

3.

108 -

7 x 4 / / re!, bi x 4 7 8 9 10 f 1 3 6 4 2 16 rei. acum. facum. 1 4 10 14 16 8


9 10 11

4
2 2

"
_

AD S N T A VIS CAN! Bl TEN NAD TRO C R E R OR


Actividad

15. a)

1 0.0625 3 0.1875 6 0.3750 4 0.2500 2 0.1250 1.0000

i
1

7 8 9

0 ^

145 215 285 365 425 495

X
2 1

10

/ re.
0.033 0.133 0.267 0.200 0.133 0.067 0.067 0.035 0.033 0.033

/ re. acum.
0.033 0.167 0.433 0.633 0.767 0.833 0.900 0.933 0.967

= 20 - is

Cl

4
5

4
8 h
2 2

10 f

7
s 9

1 0 4 2
'-

0.0625 0.2500 0.6250 0.8750 1.0000

6 S
9 10

4 | : i- i

\
18 25 32 39 46 53 ;'

Tipos de sangre

10

i i

i t'.5~i.. 4.5-8.5

1.000
2-, 'v - \ i Tipos ue sansre 4 4 9 9 '

JI2.5. 0.5 10.5. 4.5 y 8.5 5.5-2.5, 12.5-16.5 y 16.5-20.5

35.Ei porcentaje es 5.45 /40. El norceniaie es 2"

806

Respuestas 9. ai !2 \ i3 ;
14

Respuestas

807

16D-r
liOrM

23.

1
20 h 18 r 16 " 14 r

I 20i-i i 10= 1001* 90h ^ 80 h : 70 f\0 h


40b 30r-

_:30r-

UOr!

Clase 0 5 !54-;-G i"i-!8~ ISo-204 205-221


""VIS

6 !7
19

| 05 ! 05 | 0 5 5

18 | 55 30 i 5

21 0 0 : 22 i 0 5 5 23 I 05
U6 150 154 158 162 166 170 174 178

-2S4

20 Y 10r
O CM RD RT AS

24 | 05 5 26 ! 05

Estatura (en centmetros i

1111
Al C? CN Tipo de operacin

SC FAC

N limero de coches vendidos

ai di g) j.i al

De razn. Nominales. Nominales. Nominales. Religin C P J A

b) e) h k)

Nominales. Ordinales. Nominales. De razn.

c) De razn. ci

i o. is r
0.17 i 0.16 0,5\ 0.14

Frecuencia (/) 5 6 2 20

Ejercicios de repaso 1. a) 19. 20 30 40


5-4-5-

Clase 148-150 151-153 5 154-156 6

b) 14b 15a 15b 16a 16b i 7b

8 9

0.13 -

f-

0 0 0 0 1 12 3 3 4 4 0 112 2 3 3 3 3 4 4 000 1244 5 6 5 7 7 7 999 55 667 7 7 88 8

o 1
1
0

- "
i 0

1 0.09 I
0.08 r
0 0 7

-1-5-7-1596- 160-162 5 4 163-165 7

60 ! 1 3 5 6 70 | 11 80 | 4 90 i 0

l"a

~ 0.06 0.05 0.04 0.03 0.02 0.01 110 130 150 170 !<W 210 230 250 270 290 Colesterol

166-168 3 169-171

172-174 3 175-177

11. 5b ! 9 21.
Preerenciareligiosa

6a 6b 7a 7b

3 3 44 4 4 5 5 6 6 6 6 7 7 7 7 8 S 8 9 99 9
7

' 0000 112

un -

0.2

~25

35

55*

' ]ib

150

154

5S

62

lb6

170

"4

Millas oor galn

Estatura (en centmetros i

808

RespuesUs

Respuestas

809

11b
12a 12b 13a 13b !4a 14b 15a 15b 16a 6b !7a 17b 18a 18b 19a 19b 20a 20b

5 6 0

17.

5.500 diares. ci 7.000 dlares. Positiva. 55 X dlares. .)

bl 9.500 diares. d) 17.500 dlares. f) Mediana. h) 7.000 diares.

Grupo de ejercicios 3.4 1. x y


I

3 68 9
7

80 2.2

65 1.2

60 11.45 0.8"-2.370 bi 5.66 3

i 2 2 3 4 5 5 8 9 2 2 6 7 2 78 1 4 5 7 8 8 0 024 4 4 5 5 6 7 7 8 0 4 4 4 6 7 8 4 5 5 0 1 2 6 7 9 a) 41.67 cJ 36.36 el 27.27 bl 25 d) 54.5: ai De intervalo. a De intervalo, e De razn. ai Discreta. ei Discreta.
;>.<44

19. Moda. Grupo de ejercicios 3.2 1. i? = 4 3. j bi Nominal. di Ordinal. f) Nominal. 5. ai x = 1.67, r = 13.60. s = 3.69 bi x =5.05. s = 0.26. s = 0.51
2 2

3. J 12 c s = 2
2

= -1.41.;, = -0.707, -, = 0. ;, = 0.707, )\a=\

J = 14

d)Lt =

= 64

s= 8

U.9 11.0 0.95

i.00 1.025

1.10

1.20 1.18

1.30 '.29

i.40 i.41

ci Continua.

7. No. SS<0.

9. 10.71

13. No. Por ejemplo, s - 1 y s - 1 o s = 0.5 y s = 0.25.


2 2

7. Calificacin de Susana = 0.36; calificacin de Mana = 1; Mara.

15. S: por ejemplo, (1,1) 17. Los datos consisten precisamente de un nmero o de repeticiones de un nmero. 19.a; (14.88, 35.12} CAPTULO 3 Grupo de ejercicios 3.1 bi 84

9. Inciso e. 11. Dick. 13. o j "

El diagrama exhibe cuntas medidas estn en la mitad inferior de una rama y cuntas en la mitad supenor. Las ramas se dividen, as que no hay muchas hojas en cada una.

21. 96.67. S. Por el teorema de Chebichev. el porcentaje es 92.28. j | ] 8.0 O =9 i flO.O 12.0
L

_ _ Impuesto a lentas

1 ~ a)-x- *4-2438r X- = 1 . 5 , moda = 3, rango promedio = 18 Q- b) x = 11.86, 5 =7,modas = 5.7,rangopromedio=13.5 3 c) x- 7.86. 3 = 7. moda = ninguna, rango promedio = c 8.5 d) 3 = 8.88, 3 = 11, moda=mnguna, rango promedio = 8 3 5 3. ai 3.08 b) 0.37 cl -0.36

23. La proporcin es a lo ms de 25 %. 25. a) A:0.94. B:1.15 b) A:0.0055, B:0.04 c} A i.) A:0.1 B:0.35 27. al 24,500 dlares. O 7.851.49 dlares. 29. x =2.00. s = 0.15, s. Grupo de ejercicios 3.3 1. a; 24.5
0

4.0 f 6.0

14.0

dj A

t a = 12 L/= 4

bi No. b) 9,300 dlares. d) 2.500 dlares. Ejercicios de repaso

Q.= 0.25

1. a) \i - 5, j = 5, no hay moda, rango promedio = 5, 7 R= 5, o = 4.67, a = 2.16


2

5. a) x = 0.38, x = 0. moda = 0 Peso ten libras) o) 3 = 3, x = 3. moda = 3 3 cl x = 2.22. x - 2. moda = 1,2.3.4 d) x =0.13, x = 0 , moda = 0 Examen de conocimientos 1. 0a 1 0 1 1 1 2 2 3 3 3 3 3 4 4 4 0b la Ib 2. | 5 5 5 5 5 6 7 ^ 7 8 8 8 8 8 9 9 9 9 ! 0 0 1 1 1 1 1 2 22 2 3 4 1 5 5 " / 8 3. -'
rei a c u n i

I /J = 5, ji = 5, no hay moda, rango promedio = 5, R = 6, a = 5.2, a = 2.28


2

c u =4, = 4. no hay moda, ranao promedio = 4.5, ) !vltodo1:22.5,mtodoII; 23.65. R = 6. o = 10.8. a =3.29
2

cl / ' . = 2 L . 9 9 . / ^ = 27.18 cJNegativo. d) Q, = 31.5. D, = 20.33 ei Positivo. 3. a) 40.92 cl 33.39 fi 53.44 g 7.31

di fi - 3. = 3, moda = 3, rango promedio = 0. R - 9, a = 0, a = 0


1

7, al Positivo di Simtnco. 9. 62 11. 800.000 dlares. 13. media. 7 = 4, i 15; .;" 98:53 d; 98 ) 98

bl Simtrico.

b) Mtodo 1:40. mtodo II: 23.65. di 5.78

3. a) 3.5 ) -2275 5.

j -1 el 1

ei ^ = 5 9 . 6 8 . ^ = 44.02 ; ( 7 = 37.7*3. D ' = 44.22 5. .i 532.58 di br 199.5- ./Ninguna. 15.28 351.29 c; 13.288.65
0

Clase

.t = 5.95. x - 6. moda = , s = 2.37. j = 1.54


1

7. ai Muestra.

bi x = 8.5. s = 8.94

i P , , = 225.10. J ,, = 291.30 i ".25

i Q. = 187. j- = 199.5. <2, = 208

810

I Respuestas Respuestas i 811

CAPITULO

4
50

Recibo

Grupo di: ejercicios 4.

iGrupo de eiercicios 42 1. aj -'0.85 3. aj Positiva. i 22.83 bi Ninguna, o 17.33 a Nineuna.

.0

10.U

!2..

leiemco

1.

a;

11. a; .r = 32.73,5 = 6.37 W fi, = 2 9 , e = 3 1 t , = 35.Z) = 31


: 4

di Negativa.
0.0 20 ~

5. 0.94

20.0 2-20

25.0

30.0

35.0 Q, = 35

40.0

45.0 ;

mpg

0 - 4
8 0

"*>

20

140

> 60

180

Tamao del motor .0; 0.0

Q. = 29

bi -195.05

Examen de conocimientos 1. aj Moda, porque los datos son cualitativos. b) C c) 29 d) 34.38 e) 72.41 2. al 9 aV 7,5 0.59 3. aj 4.7 4. al r es la media. b) x est dos desviaciones estndar por amba de la media, c) xestunadesviacinestndarpordebajodelamedia. 5. c 6. 4 ~ | so J 8 * H 1.5 /i) 6 b 2.19 96 c) 8 ./) 3.39 riTo j Positiva -i5 oT

9.

a)
0.200

-3.5

cj 14.27
I?0.i50

3. 24

t t

JO.IOO <
0.050

b) Positiva.

cl i

9.

ai

12.0 (~i JI wi si r*r

bl 10 11. ai |
48 h

Nmero de bebidas c) Positiva.

O.i)

2.0

1 =3

| 4.0

6.0

& = 5f a=8

| 8.0

10.0 | 12.0 1.0 0,= ||f t * > i

Valores
u

8. 50 9. S. Hay personas desafortunadas que no tienen pes i o piernas); por tanto el nmero promedio de pies es menor aue dos.

48

"2

S4

Calificaciones de matemticas 101

bi Positiva

a 129.5 DI 0

4.0

s.

c No existe' recin neaientre ,vv

812

Respuestas

Respuestas

813

7. 9.

y = 23.75 * 0.5339x. SSE = 1235.535 v = 1.2516 - 2.I647.V. SSE = 72.8b) -2.75

3. al

y 4900

11. ai v = -025.T'

13. y ---0.9850- 0.0100.x 15. v = 305.027 - 1.2553.T. x = 69, y = 218.41 segundos Ejercicios de revisin i 1. a i
l
0

.= 3500 ;

rT

-00

4000

-oOO

5000

5500

6000

Nmero de solicitudes de admisin 20.0;*

bi 675.249.05 el 4362.008

a 0.91 /) 785

di y = 437-008 + 0.785*. SSE = 696,157.1422

If.j

:.h 4= 4200

f, io.i) r

oU,

0.0

2.0

4.0

6.0

Total gastado ten miles de dlares)

bl 9.75 el 12.950 g)
20.0 i

cl 0.93 J) 3900

di = -0.7 + 3.9*, SSE = 23.9

'3SOU

4O0

4500

5000

5500

6000

Nmero de solicitudes de admisin

5. aj 0.85 c) 254.58 7. al
105 i

b) 194,147.94 d) 25.19

4i " 0 :

U.u

2.0

4.0

..

3tal gastado i en miles de dlares)

0.1!

i 5-0

20.0

25.0

30.0

Temperatura ten erados Celsius t

1
814 RespuesUs Respuestas 815

bl 0.98 d) 409.60 9. a) t

c) y = 2.8589 + 5.0753* ei 2.S6

5. al Ser caluroso o llover. b) Ser caluroso y llover. cj No ser caluroso y llover. di No ser caluroso y no llover. 7. a) 9 bl 18 cl 27

19.

11.a) 1 3 / J 8/15 13.a; 0.66 di 0.34 15. a) 0.527


1

2/15 )

cj 2/3

; 22/53

3 21.0

I i

t-

9. al 5={AAA,SSS.SAS.ASS.SSA.SAS.SSA.ASS) bl (SSS, SAS, ASS.AAS)


C

a ) 0.049

1 14.0 i-

4 f) 4 g) 4

gi 42/527

.' 6/7 e) 466/951

c; 1/7 /} 0.042

fl
o

d) AAS, SAA, ASA, SAS, SSA, SSS) ei 6 h) 2


0.05

17. al 5/8 d) 3/32 Grupo de ejercicios 5.i !>.i5


i-if
!i5

bj 1 4 / ej 11/32

c) 4/21

7.0 -

I
g 3
0 L U
1 : : 1 L

11. Hay muchas posibilidades, tales como ={(1.2))yF=((3,4)}. 13.a) (1.2} b) 1) c) (1,2.3.4,5,6) f) 4.6,7,8)

U.
I'.I

:s.i5 :

Salano anual promedio Grupo de ejercicios 5.3 1. a) 12 d) 20 3. 30 b) 10 ej 35 5. 720 11. 20 17. 15 15.311,875,200 Grupo de ejercicios 5.4 cj 120 /) 126 7. 720 13. 362

1. ai No; (0.5)10.6) = 0.1 bl No; P(E o F) * 0 3. a) 0.5 5. S;P(E\F) = P(E) fc) 1/16
C

'6.0 b) 0.67 d) 12.08

7.2

S.4

9.6

10.S

12.0

d) (1,4)

e) (4,6)

bl 0

DAPlen pulgadas i cj y =7.7994 + 0.1708*

15. al No necesanamente.

i>J No necesanamente.

c) S.

Examen de conocimientos 1. aj 13.1 j incremento c) 1.4 i No; elnmerode levantamientos no puede sernegativo. 2. a) 61.33 d) 2.50 f) W 2151.5 e) -22.97 cv 153

17. (SSS, SSN, SNS, SNN, NSS, NSN. NNS, NNN)

7. a) 1/4 1 3/13

) 1/2

J 17/52 = 0.327

Grupo de ejercicios 5.2 r a) 0 d) 0.99 3. aj 0.3 5. a) 7:3 7. a) 3/10


t

9. No, P(En F) = 0.042 * (0.257)(0.049) 10. No; P( n F) = 1/10 * fl)P(F) = (l/3)(13/30) Grupo de ejercicios 5.7 1. aj x P(x) 0.063 0.250 0,375 0.250 0.063

9. 70 bi i

"

/i) .42

y = -22.97 + 2.495* 1.39

k)

i) 1769.77

j j 30.49

j) 139.21

1 0.99 fe! 3:7 b) 1 5 /

1. a) 0.236 3. a; 0.21 d) 0.43 5. 1/24

bj 0.26 bl 0.29

c) 0.47 cl 0.57 0 1

3. aj No. ste es un ejemplo de correlacin espuria. b) Inflacin.

4. Como y =+m*y= y - m * . y = (y - m * ) + m * . Por tanto, v = y + m(* - * ) . Si sustituimos y por y y * por*, obtenemos y = y .Enconsecuencia, el punto I , y ) est en la recta de regresin. 5. 6 CAPTULO 5 Grupo de ejercicios 5.1 1. ai S.A. AS. AA, SS) ci (s. no) b){ IA, 2A. 3A. 4A, 5A. 6A, 1S, 2S. 3S. 4S. 5S. 6S] 6. 46.01

9. Denotemos por S un espacio muestral y supongamos

7. 0.2

9. 2/5, 3/5

que podemos distinguir las canicas. Entonces, 2y = (RI, R2, R3, B l , B2, A l , A2, A3. A4, A5}, La probabilidad P(B) = 1/5, PA) = 1/2.

3 4 )) Discreto. ; P(xi 0.40

Grupo de ejercicios 5.5 1. aJ 0.12:0.3:0.58 bj No 3. a/ 0.5


ei

de cada resultado es 0.1. S, = (R, B, A ) , P(R) = 3/10,

11. 1/50 13. ai 9/19 di 9; 10 b) 10:9 e) 9/19 cl 9/19

/j 0.3 5. a/ 0

i/3

1 0.3 fi 0.5 i) 0.4 i 1 3 /

ci 0.7

d) 0.1 t) 0.4

0.35 OJO o.:5f

15. ai 0.05, 0.48. 0.21. 0.12. 0.05. 0.03. 0.02 bi 1 17.a/ 17/30
U'i i/10

oC

c) 0.05 13/30' e 3/20

di 0.50 c ; i/6

3. Dos e las muchas posibilidades son: 5, = (nia, ruo), 5, = estudiante 1. no estudiante 11

816

Respuestas

Respuestas

817

,a = 1
ci

. a. = U.5

bi t/. = 4/3. a = o v piyi l 0 I 4/9 4/9 1/9

9.

el h) a

fi

6/55 3/55

9/11 S/ ." = '


:

di 0.201

Q.000

bi 0.878

c.) 0.026

a Pixi j.200, i 8

Grupo de ejercicios 6.5 1. ai j = 6. a = 2.4. a = ',.55


:

~. bi 0.26 el 1.84
cJ 0.60

9. a) 0.23

d) 1.28

Examen de conocimientos 1. 720 ai 6/11 bi 14/3 ei 4/7 i No.


i

i L = 17, c = 2.55, c = 1.60 <


:

ci u = 12. a = 8.4, CT= 2.90


:

di u = l, o 2 = 0.8, a = 0.89

11. al .v 0 1 0.044 0.087 0.128 0.234 0.297 0.155 0.030 0.025 c) 1.53 d) 0.945

di 8/11 s No.

/i 3/10

a 8/35

3. ,ii = i.a = 0.99 5. /j = 500.a= 15.81 7. u = 2.7. a - 1.64 9. al Pixj 0.18 i! i i i

I.Ki p

o.08 r 0.06 r 0.04 i0.02 r


L

1
3 4

3. al 5 = { 0 M . 1M.2M) cuenta el orden)

ci 3 (sin tomar en cuenta el ordenj. 6 (tomando en d) 0.3 ei 0.6

5 6 7 6J 3.36
el

4. aj 0.33 d) 0.91 5. (w)=0.37

bl 0.62

ci 0.29

! i
. i7 ix 14 ; c

Binomial/i = 20

= 0.6

6. ^. = 0 . 5 , ^ = 0.61

0., h
o.!2 0.10

3.36 bj 14,000 dlares. CAPTULO 6 Grupo de ejercicios 6 1. a) El nmero de formas en que ocho intentos pueden dar lugar a cuatro xitos. dar lugar al xito. 3. n = 8, p = 0.4,0 < x < 8; intento: mandar un estudiante al campo; xito: que padezca irritacin cutnea. 5. No binomial. 7. n = 30. p - 0.4, 0 < x < 30; intento: el ingreso de un

di Pix) i 0.20 r 1.8 11 0.16 tl.14


ft!

13. aj ..18,000 dlares, 15.2.5 Ejercicios de revisin 1. a) 0.43 3. a) 0.2 5. ai x P(x) bl Plx) 1/6

0.08 0 . o.04 r 0.02 j"

-,

O.lll0. 08 1U6 .I 0.04 [i |- .s lo !" IS * 2 p = 0.5 0.02;

b) El nmero de fetmas en-queseis intentos no pueden b) 0.82 ij 0.91 3 16 / 1/6 16 / 1/6 16 / cl 0.13

0 i 1 .t 4 5 o i M ti II Binomial n = 20 t ) Pl.v)
1

! II

7 * 1 10

0.20'0.18 0. lo jn.]4 p .12 r e) P(xl 0.l4

Binomial n = 2

estudiante a la universidad; xito: que se grade. bi 31,824 el I cl

9. ai 120

di 792

0.20

Grupo de ejercicios 6.2 1. al 0.001 bi 0.209 a 0.595

0.1010.D8 r

d 0.009

ci 3.5

di 1.71

3. ai 0.235 5. ai 0.313

bi 0.154 bi 0.657

ci 0.179 c: 0.234

3.06 r

7. fj = 800 dlares, o = 3429.219 dlares. 9. ai v Plx: | 0 \9 ~9 1 2 4/9~

JJ 0.016 0.296
Binomiai n = 20 3inormai n = 20 p = 0.S

7.

ai 0.107 di 0.000

0.666

818

Respuestas

Respuestas

819

f!

Pix's

5.

al 0.008

fe i 0.385 bi 0.161

c 0.000 c 0.655 3. 5. 9.

cj .75 ai 0.250 1.53 0.111 fe/ fe'

di

1.07 0.994

el 0.995 c; 0.526

ci 5. 8.

u = .25. o = 0.97 0.180 n 6. 0.081 7. 0.27!

7. ai 0.365 9. a) 0.435 11.0.065


0.151-

.:of

fe; 0.00:

1, u-

8.5. o = 1.15

11. a; 0.073 ! i I Grupo de ejercicios 6.6 1. a) 0.168 ai 0.175 ai 0.137 a; 0.168 ai 0.195 bl 0.000 fe; 0.007 fei 0.980 fe; 0.269 fe) 0.351 cl 0.125 c) 0.018 c> 0.020 ci 0.647 cl 0.982 d) 0.003 di 0.960 di 0.995 di 0.577 dj 0.238 3. 13. 0.196 15.a) 0.003

0.195

cj 0.434

d) 0.567

CAPTULO 7 Grupo de ejercicios 7.1

.5 r -

3.

fe; 0.243

cj 0.243

1. 3.

aj 0 al 1/7 a; 1/4

bi 1/3 j 6/7
bi

ci 5/6 cj 6/7 c) 1/2 c) !

di 7/12 di 0

el 1/6

i !

I
5.

Examen de conocimientos 1. al 0.358 bl 0.735 fe) 0.677 c) 0.000 o 1.000 di 0.003

: ; 4 > 6 " s'/1 o 11 ; : >


Binomial n = 20

p = 0.2

7. 9.

5. 2. a; 0.026 di 0.503

I 1/2

Grupo de ejercicios 6.4 1. y 210


fl

7. ai 3/4

fe)

di i/2

a) 2. Si un gran nmero de estudiantes no preparados intenta adivinar las respuestas de las diez preguntas, el promedio de preguntas contestadas acertadamente ser cercano a dos. fe) 1.6. Para ei supuesto anterior, la vananza ser cercana a 1.6. Grupo de ejercicios 7.2 1. 3. aj 0.16 aj 0.5 fe) bl 0.68 0.9270 cj 0.815 a 0.0933 cl 0.9538 ci 0.9938 cl 1.28 di 2.58 ij 0.025 ) 0.0215 rfi 0.0248

bl 3,360 Ejercicios de repaso 1. a) x 0 1 -fet-o.eot -Tt-fteee j 0.023 bl 0.1 fe) 0.184 17. 6,930 19. 0.375 cj 0.019 o 0,200 bl P[x> 0.116 0.312 0.336 --t: 1*10.049 0.005 4. al

5.

a) 0.032 c/i 0.002

bl 0.113

cl 0.016

Ir-ar-Wm 9. al 0.012

Pix) 0 1
^

4 5

0.237 0.396 0.264


fi 088 U.UOO

5. 7. 9.

a) 0.3907 fe) 0.4904 ai 0.0277 a) 1.65 fei 0.9625

11. ai 0.031 13. aj 0.039 15. 0.043

PIV
PlX)

0.015 0.001

J 1.96

0.35 p 0.30 j0.25 r 0.20 0,!5 '.i.ir i

Grupo de ejercicios 7.5 1 U.40I. alO.9544 feiO.1587 CJ0.9861 J)0.6915 el0.3551

Grupo de ejercicios 6 5 1. .v 0 1 Plx) _7_ 44 21 44 1 3. i 0 Pix) 1 14 8 21 I

3. ai 0.0062 fe) 0.9876 cj 0.0013 J) 1" 5. ai 448 7. aj 620 9. 0.1587 I I . "3.33 pulgadas o 6. 1 pies 13. .... o9i5. i 30.85 ;: 50.85 iA fe! 500 ci 552 cl 130 )628 di 100.000

fe)98.760

B i n o m u i = 20

820

I Respuestas

Respuestas

821

Grupo de ejercicios 1. aj 0.6563 3. ai 0.5J38

3. ai 0.52 0.6560 a 0.-U04 0.0069 d: 5. ,;) 16.16 di 6. ai 44.02 7. 0.62 8. fej 0.0317 cj 0.0462 0.8925 fe) 4. <;) 0.0099 fe/

fe) -0.67
0.9082 i ) 2075 38.5

c- -0.25 0.03*6 al 0.0437

11. Dgito

Frecuenci:

bi 0.6578

Secuencia esperada

Errar muestra

3. ai Frmula con tactor de correccin, fe) Frmula sin factor ce correccin. a Frmuia sin factor de correccin.

fe) 0.2148

O 22.31

5.

5. a; 0.9732 fe/ 07397 7. te; O.Of-.i8 9. 0.9901 Grupo de ejercicios' 1. al 0.0025


1

muestrai; u es ia media de ia poblacin de a que proceden las muestras. 0 13. a) Protesores 05 7 013, 044. 193, 112.

Uf es la media de la distribucin muestral de la media

fe; 0.9382

". Ei error estndar de la meUia cambia de 075 a 0.5. ;.se vuelve menor y se aproxima a cero cundo ei tama? de ia muestra crece. 9. ai 6.45
; ;

9. ai 1.000. 1". o 0.9999 fej 0.0025 CAPTULO 8 o 0.002 <i) 0.23 15.

bi 057: prot'esor057.629: profesor 29.013: profesor 13 843: profesor 43. 840: profesor 40. Muestras ordenadas (0.0) (0.2) (0.4} (0.6) (2.0) 2.2! {2.4} (2,6} {4.0} (4.2) (4,4) (4.6) {6.0! {6.2} (6.4) (6.6} 4-3 3- 3 = 0
4-

fe/ 5.

11. u = 3 . 5 . C7 =2.09 Error muestral 13. ,z< =3.5. O; =2.09


;

3. u ~ 0.1563, a = 0.0244 5. al 0.3694 7. 2.56 horas. 11. ai 10 minutos, cj 0.6501 13. 0.6357 15. a) 7.33
IADSL

fej 0.6724

cj 0.113

Grupo de ejercicios 8.1 1. Tuck. 12: James Lum. 17: Rick Quest. 07: Pete Gum. 02: Mary Baker, 10: Helen Jewei, 18: Ban Rat un "guila": AASSS AASSS. 5. Asignemos un nmero de dos dgitos de 00 a 96 a cada uno de los 97 clientes. Luego, desde un punto aleatorio de partida en la tabia, nos movemos horizontalmente a ra-ttereeha-kasfa-eseoger15 clientes. / 3. Denotemos un nmero par por un "sol" y un impar por 13:Robert Moon. 04: EdDoe. 01: Mike Able. 20: Maud

15. La distribucin muestral de a moda solo tiene sentido 3-3 = 0 existe una nica moda; en la prctica esto nunca ocurre.
| 0.16 0.16 0.36 0.16 0.16

9. 63.92 horas. fej 10 minutos. di 0.3829

cuando para cada muestra extrada de la poblacin

17. ai Pfxl

3=1

TL2

15

15

16~5

2 - 3 = -1 4-3

fe) 11.09

cj 5.55

bi 15 dlares.

cl 1.90 dlares.

Grupo de ejercicios 8.3 I. aj 0.0212 di 0.8438 fe) 0.7912 e) 0.9925 5. 0.95 ci 0.2709 7. 0.025

17. 0.6308 Ejercicios de repaso 1. al 3/8 d) 3/8 3. al 1.04 di 0.84 5. ai 44.8 <fj 52.5 7. 80.68 11. al 0.2231 13.0.0325, 0.5 15. 0.999+ o 1-

19.4 meses.

7. Daito cj 3/8

3. 0.005 9. 12 I I . -2.14 13. a) 2.718 15. 0.975 17.a) 0.8531

fe) 3/4 j 51/80 fe) -0.25 ej -0.52 fej 44.2

cj 0.25

Como el promedio de los errores mustrales es cero, x es un estimador insesgado de u. 27 Esperamos que cada dgito aparezca 17. ai No: no es aleatorio escoger nicamente a las personas que usan anteojos, fe) No: este procedimiento slo elige estudiantes de gimnasia o relacionados con la gimnasia,
ci

fe) 1796

cl 44.8

22 9. 161.65 bi 0.3834 9. Dgito

25 veces.

fe) 0.6448

0.9826

Frecuencia esperada

Frecuencia muestral

Error

S.

Grupo de ejercicios 8.4 1. al 6 fe/ 077 fe) 3


f

19. No a menos de que la muestra se obtenga usando un procedimiento aleatorio.

ci Normal. = i.58 6

3. al u = 4. o = 2.24 o 7 l ! 2

u = 4. a, 4 5

Grupo de ejercicios 8.2 1. c. La distribucin muestra! de la mediana es ia de todos sus valores posibles calculados a partir de muestras uei mismo iamao. La distribucin muestrai de la vananza es la ae toos sus \s Dosibies caiculaua en muestrasdei mismo

Examen de conocimientos l. aj. 5/6 .

I?' 5/6

u,

=u-4.o=

normal.

ai '2 - i -58; aproximadamente


v

822

Respuestas

Respuestas 823

794
9.

0.803

c) 0.74::

5.

ai 0.7492

b) 0.5 bt 0.4649

ci 40.5

Grupo de ejercicios 9,4 1. ai 2090 bi 2401

La poblacin es normal. Para muestras de tamao uno. la distribucin muestral de a media es idntica a ia poblacin de la que proceden las muestras.

6. a: 0.1056 7. -3.16 9. ai 4

3. 4096 8. 0.65 9. 606 bl 0.7071 Grupo de ejercicios 9.5 1. ai 5.14; 34.2bi 12.40.39.56

11.ai Muestra {1.11 {1,7} (1.13) {7,7} {7.1} {7,13} {13.13} U3.1) {13.7! bj A/ o a
sima

Suma Suma

f 1 2 3

(Suma-14) Suma /
:

i
8 14 14 8 20 26 14 20

2 8 14 20 26

144 72 0

2 16 42 40 26 126 Mediana i

CAPITULOS Error

/
10
1

muestral -2 -l 0 3

f Error muestral -20 -22 0 30 -i:

Grupo de ejercicios 9.1 1. ai 79.94 %. 99.02 %. 3. 5. ai 1.88 2.145 b) 85.02 %. di 99.42 %. b) 1.65 7. 2.462 a 1.56

" 1
1

7) "

3. ai a' (0.015,0.039); rj:(0.12. 0.20i bi a'' (478.85. 1817.37); CJ:I21.88. 42.63)


c i

144

432

: 3
6

' (0.72. 1.57); cr:(0.85, 1.25) di o'' (480,223.34, 1.172,672); a:(692.98, 1.082.90) bi (1.37, 1.981 9. a : (0.020. 0.11): a:(0.]4. 034)
2

10 64

5. ai 1.61 9. 0.55 7. 6.09

= 126/9 = 14m n\i = <2)(7) = 14 = V432/9 - 4 V 3 = 6.93, 20

11. 6.20. Si se usa I para estimar a. podemos tener un 999!- de confianza de que u dista menos de 6.20 de 7 = 98.2. 13.77.38 %. 15.1239.7

11.0.99 15.(0.0018. 0.00551

13.(1.07.5.14)

Jna = t. V2 )(4.898) = 6.93 13. aj 0.5089 di 0.3300 15. al 0.1190 b) 0.7620 cl 0.1190 bl 238.8 = 239 Valores de la mediana cj -0.1875 fj 1.5297 di 2.8125 el 1.5297 3. 5. 9. aj 0.9554 l l . 0.94I2 13. a) 0.3108 ci 0.6827 15. 1Examen de conocimientos b) 0.0703 c.i 0.5793 bl 0.8187 cl 0.997" 9. 163.20,68.20) 11.(155.41,171.59) g) Los resultados son iguales. 70.75, 84.85) 7. (26.91 dlares. 30.01 dlares) bi 3.8078 cj 0.9120 = 10 u Grupo de ejercicios 9.2 1. al (27.56, 29.04), w = 1.48 bj (27.42, 29.18), w= 1.76 cl (27.14, 29.46), w = 2.32 17. a; u- - 75, a- = 1.58
x

Ejercicios de repaso ! al (0.55, 0.57) 3. 666 bj n = 9,466 5. (0.35, 0.44). E = 0.049

cj 291.39 = 291 Grupo de ejercicios 8.5 1. ai Aproximadamente normal; u, = 0.05. a- - 0.03


p

d) (26.96. 29.64), w = 2.68 a; 1.796 bj 0.30 cj 0.85

7.(0.089.0.50) 11.(3.49,6.29) 15. a) (0.36, 0.46)

9.(57.76,66.24) 13.a) 0.026 bi 1.068 b) (7.99.8.05)

b) 0.8340 aj 0.2877 aj 95.44 aj 0.0245 aj 0.0194 Ejercicios de revisin 1. aj S.

O 0.8506 b) 0.7123 b) 6.68 bi 0.3409 bl

d) 0.6225 cj 0.9875

Examen de conocimientos 1. ai 1.740 2. ai 4.26 bj 42.98 bl -9.62 cl 540

13. (0.98, 1.04) Grupo de ejercicios 9.3 I. al (0.2i; 0.29) ci (0.58, 0.62) ci (0.06. 0.38) 3. al 0.058 bi (0.45.0.57) bl (0.22,0.28) di (0.34, 0.46)

3. (16.47.17.93) 5. (0,97, 2.42) 8. al 0.60 di 0.95

4. (0.12,0.22) 6. 5477. 80 bj 0.85 el 0.98 ci 0.80

(0.73, 0.77 )

;
Asignemos a cada letra un nmero de dos dgitos del cero al 26. Empezamos desde un punto cualquiera de la tabla y extraemos pares hasta escoger tres letras. Si se forma un numero de dos dgitos mayor que 26. se descarta v se escoee otro par. y asi sucesivamente.

bl No; todas las muestras posibles de tamao cinco no pueden obtenerse con este mtodo. 3. No podemos decir: debemos conocer el procedimiento utilizado.

5.

10.63, 0.70), = 0.036. 9. i.47. 079) 13. i0.41. 0.51 17. 0.58, 0.82

CAPITULO

70

7. (0.024. 0.056.1 I I . .0.46. 0.O0) 15. .0.83. 0.91.19. 0.35. j . o i :

Grupo de ejercicios 10.1 1. j ; B bi A

824

Respuestas

Respuestas

825

5. a) H.: La efectividad de la nueva medicina es menor o igual que la de la antigua. H.: La efectividad de a nueva medicina es mayor que la'de !a antigua. Decisin: rechazar H , error Tipo 1. b > Hy La primera escuela es tan efectiva como lasegunda. H,: La pnmera escuela no es tan efectiva como la segunda.
n

Tipo II: dar por hecho que al menc > ..1 95% de ios estadounidenses estn contra la en: cuando son menos de! 95% quienes lo manifiesta:!. IT*, j/ Falsa. bi Falsa.
t

i; 0.0314 9. ai H-.u = U. b) H,: u = 4. ci 0.05. prueba de dos coias. Ji Distribucin de la media. e: 0.70 gi No rechazar H .
0

Ejercicios de repaso 1. ff : fi < 24, H;. u > 2 4 , ; = 3.94. z,


a

= 1.65; decisin:

rechazar H 3. H
y

valor p = 0+
:

c Verdadera.

19. Porque hay posibilidad de que H. sea falsa. 21. al Incorrecta. Tipo 1. bi Incorrecta, Tipo 1!. ci Correcta. di Correcta.

2.565

decisin: rechazar H . vaior p = 0.0329


0 tM

P > 0.62. H. p < 0.62, ; = -1.84. ^ = -1.65.

ni Error Tipo II. probabilidad desconocida. i) Valor p > 0.20 ll.tf ,:u<7,
;

Decisin: no rechazar H.. buena decisin. 7. ai Dos colas. b) Dos colas, a Descolas.

5. //,: = 140. H;. ft * 140.- 1.38. r t rechaza H .


0

= = 2.447;

n o

Grupo de ejercicios 10.2 1. ai 479.38


CJ

H;. u > '. b) Toda .7 < 479.38 di H,\v < 500 f) ni TipoII. 0.05 ; = 0.37. ^ = 1-65 Por tanto, no Como ; = 0.37 < 1,65, no rechazamos

I.

H : a < 0.05. H
n 2

a > 0.05. x = 33.6, - / j


2 2
n

( )

(24i =

9. ai La medicina contine 5 me de codena. bl La medicina puede ser no efectiva en cantidades cl menores o peligrosa en cantidades mayores. Error Tipo I: concluir que la medicina no contiene 5 mg de codena cuando s los contiene. Error Tipo II: concluir que el medicamento contiene 5 mg de codena cuando no es as. Un error Tipo II es ms grave porque lleva a una posible sobredosis.

36.415: no se rechaza H . 9. H . p < 0.6. Hyp>


0

el .7,480

H-. i > 500

tenemos evidencia de que la estancia promedio de los pacientes de ciruga exceda los siete das.

gi No rechazar H.

rechazar H .
n 0

0.6.: = 2.91. ; = 1.65; decisin:


M

3. ai 30,140.25
n

b) Toda I > 30,140.25 ^ > 30.000 0.05 /)

cl /Y: u < 30.000 di ej x , 30,200 gj Rechazar H

13. (13.29,15.311; el intervalo contiene el nmero 14. Esto es consistente con ei resultado del ejercicio nueve, pues no rechazamos H . u = 14.
0

I I . H . fj = 16, H- u = 16. .' = -1.21, t decisin: no se rechaza H .


n

(|MS

= 4.032:

ni Tipo I.

Examen de conocimientos 1. HyP = l\,HyP*l\ a) r = 1.15 bl i =2201 cl No se rechaza H . di Valor > 0.2
+ 0

11. 1 - a es la probabilidad de que la hiptesis nula no sea rechazada siendo cierta, mientras que 1 - j3 es la probabilidad de que la hiptesis nula sea rechazada cuando es falsa. 13. a) Decidir que fumar es daino cuando en realidad no lo es. " bl Decidir qu fumar no es daino cuando de hecho s lo es. c) Las decisiones buenas son decidir que fumar es perjudicial cuando lo es. o que no es nocivo cuando no lo es. Un error Tipo II es ms grave.

Grupo de ejercicios 10.3 1. ai H . u >95.


0

Grupo de ejercicios 10.4 1. a) z = -2.24, -,


m
J0Q}

bl

//,:u <95.

= 2.58: no rechazamos H .
0 a a

c) 0.05. prueba de una cola. di Distribucin de la media. el -1.94


a

bl ; = 2, Zf = 2.58; no rechazamos H . cl z- 2.89, d) z = 0.77, = 2.33; no rechazamos H . = 2.33; no rechazamos Hy


v

fi

-1.65

g) Rechazar H , concluir que 92.25 sea significativamente fnener-que-95- h) Posible error del tipo 1,0.05 es la probabilidad de un error Tipo I. i) 0.0262. 3. ai H .u>
n

3. a ) / =13.5, xfi95 (-7) = 16.151; rechazamos H


2

2. H . p> 0.85, H p<


a y

0.85

a) 2 = -1.08
0

bl x - 30, zl
2

(24) = 42.980; no rechazamos H . (36) = 54.437, -


v 0
975

cl f = 2u' r,
) 2

2s

(361 = 21.336;

no rechazamos H bi H u<\0.
y

10.

di x = no rechazamos H . 5. 7 =3.14, ^
2

cj No se rechaza H dj Valor p = 0.1401 3. a) 23.75


0

c 0.01. prueba de una cola. d) Distribucin de la media. ei -2.15 gi No rechazar H .


r

9 5

(10) = 3.940; rechazamos/f .


c

bj

30.144 no se rechaza H .
B
o w

15. ai ErrordeltipoLdecidirqueelmtododedescubrirruento no es mejor que el expositono cuando en realidad lo opuesto es cieno.

f)

-2.264

7. H- p < 0.20; H- p > 0.20;: = 2.795; ^ 20% ven ei ftbol.

= 2.33; valor

kl Ei error posible es Tipo II, la probabilidad es desconocida. ij 0.01 < valor p < 0.025. 5. al tf u
r

p = 0.0026; rechazamos f, en consecuencia, ms del

4. H . t > 60,000, H;. p < 60,000,; = -3.81. ; = 1.65; decisin: rechazar H Por tanto, los datos indican aue u < 60,000 millas.
v

Error Tipo II: decidir que el mtodo de descubnmiento es mejor que el expositono cuando no es as en la realidad.

9. ; = -.86.-; = -l,65,valorp = 0.0314;rechazar/V ,


0O} 5

= 70.

bi

/,:u = 70. U.H


rP

5. H . o > 1,200. H : a < 1.200. f = 22.12, x;., i34) = 17.789; no se rechaza Hy


0 }

bi

estn defectuosas cuando en realidad a lo ms ei 2% lo estn.

Error Tipol: decidir que ms del 2% de las mquinas

ci 0.05, prueba de dos colas. di Distnbucin de la media. ei 0.67 gi No rechazar H.. ni Error Tipo II. la prooabilidau es desconocida. a 7.
JI

= 0.60, H.: p * 0.60,: = -1.63, = ;


r

M 2 5

= 1.96. CAPTULO 77

fj

2.262

valor p = 0.10312; no rechazar H 13. ti., o < 5. H.:a >


2 2

Error Tipo II: decidir que. cuando mucho el 2% de las mquinas estn defectuosas cuando el porcentaje es mayor. ci Error Tipo l: concluir que menos oei 5vr ae os estadounidenses estn contra a guerra cuando en realidad al menos ei 95% de esa poblacin es a que se pronuncia en contra de la misma.

:.y

= 2.54. ^

iU)=

19.675;

Grupo de ejercicios 11.1 1. Dependiente, porque las parcelas de memo acre fueron de suelos similares. 3. Dependiente, ya que ios cebos fueron asignados \ colocados por parejas en un mismo lugar.

Vaior p > 0.10 H,. u > 84. bi H:.a < 84. O.05. prueoa de una cola. -,.86 ti -.05

no rechazar H.. 15. i0 42. 0.621 No podemos establecer que a = 0.60


2

di Distribucin ce la media. c; Rechazar//,, ni 0.05

17. ai (0.015. 0.047) b. H:a <d.0\.H:.o >O.Ol.r-42.12.


i 1

./

(9) =

30. 44: se rechaza H .

5. No colocar ios cebos por parejas.

826

Respuestas

Respuestas

827

7.

ai Poner impermeable a un zapato de cada par. b) Eleeir al azar cinco pares con impermeable y comparar con otros cinco pares sin impermeable.

9. ai F = 1.65, gl = 30. 24), F <:Q.


m

24) = 2.58; no se

rechaza b> F = 2.64, si = ;2C. 23), F rechaza H ,


r
001

7. ; = L29 : 9. (0.82. 2.4S) 11.; = 3.7. :

= 2.33, no rechazar He. valor p = 0.0985 00 .1

3. ai : - 1.12. r c ^ , , = 1.96; no se recnaza H,. s) r = 1.25. x ( l ) = 3.841; no se rechaza 37..


M

i20. 23) = 2.78; no se

o i . i 2 * 1.25 '
J

9. Dependiente, porque compitieron pares de ratas. 11. ai F = 1.78, gl = 20. 30), F (.20. 30.) = 1.95; no se
C(B

0 0 1

= 2.58: rechazar H,, Esto no significa que

5. y- = 7.449. x ; ( 2 ) = 5.991: se rechaza*/,: podemos


M

Grupo de ejercicios 11.2 1. 0.0793 3. al H


v

rechaza H

u <u.. nicamente que u, s u . 13. j ) : = 1.74.


u a

concluir que ias proporciones difieren. 7. f = 647927. y/


m

bi '0.95, 1.83) 13. a) F = 1.78 gl = 20. 19), F^',20. 19) = 2.15: no se rechaza H
ry

= 2.201. gl = 11; no se rechaza H . 0.10 <


n

(3) = 11.345: se rechaza H;. pode-

u. - u, = 0. H.: p, - p, = 0. c = -1.44. z c , ^ =
n

vaior p 0.20 15. ai : = -0.68. ;


0 O !

b> .-2.21. 19.05) = 3.169, gl = 10; no rechazar H..

mos concluir que ias proporciones son distintas. 9. ;; = 2.12193. "los ' = 7.815; no se rechaza H.
2 1 31 2 0?

2.58; no recnazar H b) 1-0.16. 0.56) 5. a) H :p -p


n i :

bj (0.91. 1.94) O No podemos recomendar a la nueva mquina como


] MS

bi i-3.38. 2.18) 17. (-3.24. -1.16). La prueba de hiptesis del ejercicio 16 fue de una cola con a = 0.05: no es comparable con la construccin de un intervalo de confianza del 95 %. 1 9 . ; = 3.87. i ^ j , = 1.96; rechazar H .
n

= 0.H :p,-fi^0.z=l.%.tz,
:

supenor a a antigua. Grupo de ejercicios 11.5 1. aj s = 6.9602, / = 0.96, r. rechaza H .


a

11. x = 0.80324. x. O) = 7.815; no se rechaza H,, Grupo de ejercicios 12.3 I . y = 1.22, Xo. (4) = 13.277; no se rechaza H
2
ul

2.58; no rechazar H b) (-0,42. 2.22) 7. ;


o w

= 2.50, valor crtico = 2.33. valor p = 0.0062;


0

= 2.101, el = 18; no se

bj

rechazar tf 9.
l

(-3.57, 9.57)

3. ^ = 2 6 . 6 . il (9)=
m

16.919; podemos concluir que las

H u -p,<Q.H.:a,

- p . > 0 , : = 2.67,;
()

0J)

= 1.65valor

3. a) 1-6.73. 073) bl s = 4.1806. f = -1.68. t = 2.086. el = 20; no se


p .025
v

21. F = 4.39. F,J5.

6) = 4.39. F = 1.20; no se rechaza H .


0

frecuencias difieren. 5. x = 32.6, X t t * 5 ^


1
(4

p = 0.0038; rechazar /Y " Grupo de ejercicios 11.3 1. aj 0.2 3. a) H , .


P r P l l

Las vananzas poblacionales pueden ser consideradas iguales, por lo que la prueba de / es apropiada para ei ejercicio 18. Examen de conocimientos 1. ai F = 1.33, F, (30,30) = 1-84; no se rechaza tf
K T

9-488; podemos concluir que las

rechaza H
p

preferencias de color no son iguales. 7. x


1 =

bi

0.061 =

cj -0.66 Q.53,z =l.%.


U2

5. al s = 7.908, i = 1.50, f rechaza H .


a

00Q5

= 2.831, gl = 21: no se

bj

(-14.417. 4.417) = 1.734, gl = 18


E

H-9833, Xoi 3) = 7.815: podemos concluir que


(

no siguen la distnbucin binomial especificada. 9. ^ = 6.8, x i < ^ '


2 ,=

= 0,H .p p^0,z
r

7.

ai s =4.61, t = 3 . 7 1 , /
p ' BO OS .

valnr p = f> 5Q6> nn rprharar bl 1-0.054, 0.094) El intervalo contiene al cero; no rechazar H .
0

bj z 2.83, Cgjj 1.65; se rechaza H^. ci (1.29. 4.91) 2. al


P

pueden no aparecer con la misma frecuencia.


= v

'6-919; no se rechaza//,,; los dgitos

9. al (-0.53. 2.93) bj s = 2.075, i = 1.44, r p


m

5. ai 1-0.145, 0.185) b) H-.p p


r :

= 2.069, al = 25: no se

= 0.56

bi c = 0.32
a

I I . x - 19-7. X O . I H
1

(9)

= O.fl,:p, - - , * 0 , ; = 0 . 2 4 , z = 1-96;
0

00 5 .2
a

cj ;

= 1.65; no se rechaza H

concluir que no aparen con la misma frecuencia.

podemos

no rechazar H , valor 7. a) (-0.1082, 0.1442)

= 0.8104

rechaza H . 11.(1.03, 6.37) Grupo de ejercicios 11.6 1. aj 1.22 3. (=1.20,gl = 9 bj 3

di (-0.16. 0.22) 3. ai (0.72, 2.44) 4. aj 2.83 bj 0.64, 1.18) bj 2.12 Grupo de ejercicios 12.4 1. x = 0-1532. x.os (-) = 5.99!; no se rechaza
2

bj z - 0.37, valores crticos = 2.58; no rechazar H ,


n

valor p = 0.7114 9. ; = 2.09, I c ^ j j = 1-96; rechazar H , el intervalo de


0

cl ; = 2.47; se rechaza H di valor p = 0.0068 el (2.33, i 1.67)

3. x = 16.8107. x (4) = 9.488: se rechazaH podemos


2 M

concluir que el inters y la habilidad estn relacionados. 5. = 19.3322. x"oi 6) = 16.812;serechaza// ;podemos
2 0

confianza es (0.0053, 0.142) Grupo de ejercicios 11.4 1. F - 1.20gi = (19, 4) bi bl 0.392 cj 0.206

5.

a) r=3.04,;

0(is

= 2.015.gl = 5;rechazar// ;elprograma


0

concluir que el estatus social y el programa de 5. aj 4.51 b\ = 1.33, f a i = 1.97. i


0OS

es efectivo.

bj

(0,62, 7.38)
oca

preparatoria son dependientes. U 4 . 14) = 2.48; no se rechaza la = 1.701. gl = 28; rechazar H .


Q

7. a) = 2.5. i , = 2.9807. r = 3.14./ = 1.771, gi = 13; rechazar H


r

bj

(0.78, 4.22)

hiptesis de vananzas iguales.


0 0 5

3. ai 0.500 5. ai 1.09. 5.13)

Ejercicios de repaso 1. ai z = 2.58. c


002!

di (0.42. 5.78) = 1.96; rechazar valorp = 0.0098 CAPTULO 12

e)

(-578. -0.42)

7. x = 30.1484, x o . ^ ' r concluiramos que fumar cigarrillos y la presin sistolica estn relacionados.
J 101 = l 8 3 0 7 ; s e r e c h a z a H

(0.1666, 1.0845)
iM

9. x =-12.3565. xl \2)
2 M

= 5.991: se rechaza

H, en

bl 12.02, 1482) 3. -0.13. 0.20); no hay diferencia entre las proporciones pofclaoonaies porque-el intervalo- contie-ne-al- cero.. 5. ; = 4.82. ; = .96; rechazar f.

conclusin decimos que las respuestas ae ios estudiantes estn relacionadas con su nivel de calificaciones

7. a, F = .""O gl = ,25. 151. F i 2 5 . 15) = 2.53. no se recnaza #


r
v

Grupo de ejercicios 2.2 1. ai gl = 5. j r ^ ) =11.070 bi gi = 20. v-. i20) = 57.5o6


1)1

o F = 2.10, gl = to. 20). f ^ t . 1 0 . 201 = 2.35. no se rechaza H ,

Ejercicios de. revisin. 1. x = 9-5. xioj-4) = 9.488: se rechaza H.: podemos


2

concluir que hay diferencias en las preferencias.

828

K-ipuvstis

Respuestas

829

X = 8.82. x.wU) = 3.341; se rechaza tf ; podemos


1
0

9.

s; =0.0000141. j = 0.000701,F = 49.72.^(3.16} = 3.24: se rechaza H.: hay diferencias entre ios niveles promedio de contaminacin para las cuatro plantas de servicio.

Grupo de ejercicios 3.4 Fuente Bloque 7: .-.lamiente Error Totai GL 3 2 6 11 SS MS F 8.24

Grupo de ejercicios 13.5 1.a) Fuenie GL i 2 2 6 1! SS 533 1138 4 MS 535 569 2 246 F 2.17 2.5 0.008

concluir que ia eficacia del ;nedcamento difiere del 85 por ciento. X - "i.b. Xao'" 11-07; no se rechaza He, no hay evidencia de que ei dado est careado.
2
1 =

Grupo de ejercicios 13.2 1 Fuente Entre muestras Ai interior de las muestras SS 16.9 172 188.9 SS 52.2 1419.8 gl 1 8 9 gl 3 MS 85.5 F MS 21.5 F 6.9 0.79

60.53 20.1! 0.67 0.33 0.14 14.67 2.44 75.67

Factor A Factor B Interaccin Error Total

1475 3150

7. x2 = 2 . XOLIB ^ ' #.y podemos concluir que los porcentajes difieren.


0 9 1 = 3 8 4 , : n 0 s e r e c n a z a

9. y. - 5-33. X,05^) = 5-991; no se rechaza H no


2 v

Total Fuente

Fuente Marca Laboratono Error Totai

GL i 3 6 11

SS

MS

bi

La interaccin y los efectos principales no son significativos con a = 0.05.

podramos decir que los porcentajes han cambiado.


: 0

l l . X = 1.38. Xooi (3)= 11.345; se rechaza / ;no podemos concluir que las proporciones son diferentes.
0

1.620 0.810 3.99 0740 0.247 J 77 1.220 0.203 3.580

aj No hay interaccin. bl No hay interaccin. a) 6 dj 3 bi 2 ei O 2

Entre muestras Al interior de las muestras Total

17.4 0.20

1367.6 16 19

13. x2 = 35.25, xlKa)

= 5.991; se rechaza tf ; diramos

finalmente que la clase social y las suscripciones al peridico estn relacionadas. 15. 2= 157.39. X a ( 2 ) = 5.991; se rechazaH ; los datos
M 0

F = 0.008, gi = 2. 6i

SST = 13,658.38, SSB = 335.54, SSW = 13.322.84. MSB = 167.77, MSW = 360.08, F^Q, 37) = 4.08: no se rechaza H .
g

Fuente Empleo Hora Error Total -p <0.05 F


m

GL 4 2 8 14

SS 3373 62.53 43.47 139.73

MS

fj A: F = 2.17, GL = i l. B:F = 2.31 GL = (2.6) >); Fuente A B AB Error Total al Fuente GL 3 2 6 12 23 GL 13.8 5 3 23 1.2 SS 2 4 30 44 SS 232.7 '563.3 273.0 12858.0 MS 116.4 93.9 22.8 F 5.11 4.12 8 MS 6.9 1.25 0.15 0.1 F 69 12.5 1.5

8.43 i.55 31.27 5.76' 5.43

indican que las categoras no son homogneas.

SST = 3722.65. SSB = 321.85, SSW = 3400.8. MSB = se rechaza W. 80.46. MSW = 56.68, F = 1.42. F (4, 60) = 2.53, no
0OJ

Examen de conocimientos 1. ^ = 3.87 2. a) P^0-9 bj 129.60 cj 6.635

di SerechazaH..

Grupo de ejercicios 13.3

(4.8) = 3.84, F

tM

(2.8) =4.46

1. aj SST= 55.275, SSB = 39.875. SSW


" 4 8 1 . 2 \ 5 7 M S F = T 3 , 2 9 1 7 F = 27.62, F
J B

15.400, M S W = ( 3 , 3 2 ) = 2.92;

CR = 4 . 4 5 . A * N

3. aj 8.63

bj 13.277
v

cj No se rechaza H 4. aj 4 7 4 pendientes.

se rechaza H

las cuatro dietas producen efectos

Fertilizante Fuente Delito Proceso Error Total *p <0.05 ~ > ^ ( 6 . 1 2 1 = 3 . 0 0 . ^ , 2 = 3.89 CD = 4.36, TJury = GP GL 2 12 SS MS F Vanedad Interaccin Error Total

1 789.0 3929.7 172.36

diferentes en las lecturas de glucosa de la sangre.


bj C D = 29.16, A * D . A = C , B * C cj B - A : (-22.49, 3 5 . 8 3 ) ; C - A : (50.84. 109.16); C - B . (44.17, 102.49) D-A:

bj 5.991
0

6 645.24 172.67 103.33

107.54 12.49 86.33 10.33* 8.61

cj No se rechaza H , las variables pueden ser inde-

(25.28,83.6); C-D J-3.6,54.72); D - B ; (18.61,76.93),

dj

T = 0.69

20 921,24 bj F
0{1S

CAPTULO

13
ai SST = 5 4 0 . 2 1 , SSB = 366.55. S S W = 173.66, M S B =

(6,12) = 3.00; la interaccin entre fertilizante y

variedad de maz es significativa; como esta interaccin est presente, no es juicioso poner a prueba los principales efecios del fertilizante o de la variedad de maz. Uno puede poner a prueba, por ejemplo, las diferencias en las tres variedades de maz de cada nivel de! fertilizante, lo que dara lugar a tres pruebas de r para cada uno de los tres niveles de fertilizante, es decir, un total de doce pruebas. 11. ai Fuente GL SS 27.65 96.52 31.93 86.00 242.07 MS F

Grupo de ejercicios 13.1 1. aj t = 0.8866, / = 2.306, gl = 8; no se rechaza H .


a

183.28, M S W = 19.30, F = 9.50, F (2,9)


m

= 4.26; se

rechazaH las medias de las razones de penetracin


v

bj s =21.5, j ; = 16.9. F = 0.786, F ^ l . 8) = 5.32, no se rechaza H .


0

difieren para las tres perforadoras. bi


ci C D = 9.10. D B 3 = D B 2 D B 3 - D B 1 : (-2.85,15.35); D B 3 - D B 2 : (4.42.22.62); DB1-DB2: (-1.81. 6.37)

cj r = (0.8866) = 0.7860
! 2

ai

Fuente

GL 2 ; 6 i

SS 197.6 218.2 71.4 487.2

MS 98.8 17 7 11.9

F 8.30 6.11*

s; =80.6, s; =56.68.2" = 42. f se rechaza #. 5. j ; =85.48.

(4,60) = 2.53; no

di

w- = 0 . 5 9

Bloque Fertilizante Error Totai -p <0.05

ai SST = 4 0 0 . 3 7 . S S B = 2 8 7 . 1 5 . S S W = 113.22. MSB =

= 17.4. f = 0 . 2 0 . f , t 3 . 1 6 ) = 3 . 2 4 ; n o
B

142.57. M S W = 6 . 2 9 . F = 2 2 . 8 3 . F ^ . 2 . S = 5.55; se rechaza He, hay diferencias de produccin pan os tres fertilizantes. bi
C-A: C D = 368. C = . A : C - B : C D 5.43.
:

se rechaza He, no hay evidencia de que difieran as velocidades de mecanografiado de las cuatro secretarias. 7. j ; = 7 7 1 , = 2919.F* 3.78.F \Z, 18) = 6.01:no
m

Diferencial Mezcla
0M

;
4 2 18 2b

15.81 2.89 48.26 10.10 7.98 i.67


' 7 ,
?

= 2.58; B - A . C D =

F ^ 2 . 6 > = 5.14. F 7 . 6 ) = 4.76 bi DC = 8.03, BI = B3.co '= 0.35


i

Interaccin Error Totai

se rechaza/.; no hay mnguna diferencia en la media de ios empos de terminacin de las tres disciplinas.

B =A

c< '1> - 0.6S

c) DC = 0.87; no se detecto diferencia entre ios fertilizantes: ID' = 0.39

830 l Respuestas

Respuestas

831

bj

Como F (4.18) = 2.93. a interaccin de mezcia y diferenciales de engranajes no es significativa: por tanto, podemos poner a prueba los efectos principales de ia mezcla y el diferencial. Efecto principal (aire mezcla de gasolinas): F (2,18) = 3.55. Este efecto principal es siga'".cativo. DC = 4.71. Efecto principal (diferencial de engranaje): no es significativo.
0ttS 0O5

SST = 937.08. SSB - 25 .53 SSW = 685.55.3 1SB = 25.76. MSW = 68.56. F = 1. 32. ^ 2 . 10) = 410. no se rechaza i: Fuente H. GL 4 2 SS 36.40 4.13 9.20 MS 2.07 9.10 .15 r

7. ai 57.5582 di 219.4502

bi ei

4.4970 ci 170.5713 187.9712 /) 251.5714

7. ai BSD = 0.288 T 1.75 FHD -0.183 PSD

bi

0.92

Grupo de ejercicios 14.2 I. ai F - 3.280. F Jl. bi 10.0889. 0.515) apropiado. 3. a) F - 270,692. l.F ( 1.3) = 10.1 ; el modelo lineal es
005

Ejercicios de repaso 5) = 6.61; ei modeio lineal es

Juez Persona Error Totai


M

T.O|
:.S

apropiado; y = 9.0256 7 0.3020.x.

1. r = 1.06,2
0.O2J

= 2.7761 el = 4; n hav evidencia que o

13. a)

Fuenie

GL

SS 0.0242 0.1441 0.1338 0.0217

MS 1.12 6.64 6.17

c 1 = 3.64. 1 = 2.571 gl = 5); el modelo lineal es

indique que p * cero. 3. al F = 58.2175. F .ei (1. 3l = 34. i : ei modeio lineal es -

Presin Catalizador Interaccin Error Total


l05

10.0242 20.2881 20.2676 120.260! 170.8400

-19.73

* F , (4.8) = 3 . 8 4 . ^ 1 1.8) = 4.46


bl No fi3y diferencias significativas entre los tres candidatos. Pero comoF t4.8) = 3.84, s las hay en ios promedios de las calificaciones de ios jueces. DC = 3.35:32 * J4 y Jl *J4.
00?

cl (87373. 895.75) ei 203.76 dlares 1 = 525.82, / apropiado. /)

b) (879.98. 889.50)

apropiado; y = 69.7085 -r 203.758.x. di

5. ai 7.

bl al

apropiado; y =-4.9824 + 3.!985.t (075. 5.65) y =-64.0305 -r 1.4830.x. 84 ci (76,93)

bl (67, 101!

(1.688.43. 1.711.11)

Como F (2,12) = 3.89, est presente una interaccin entre catalizador y presin. No es prudente poner a prueba ios efectos pnnci pales de los catalizadores o de Examen de conocimientos la presin; uno podra poner a prueba, por ejemplo, los bi 7 5 30 efectos de los tres catalizadores en cada uno de os dos 2 6 niveles de presin; esto involucrara un total de seis 3.75 3 75 pruebas. Tambin podramos interesamos en poner a prueba ios dos niveles de presin para cada uno de los tres SS catalizadores: este esfuerzo requerira tres pruebas de t.

= 3.182 (gl = 3); el modeio lineal es

a) d) h)

el n

f) jl
gl 2 6 8

5.75 1

22.5

5. al F = 231,649. F ( l , 10) = 4.96; el modelo lineal es apropiado: v = 96.753 - 2.0027.x. bi (-2.296. -1.71) cj (47.48. 49.90) di (42.34. 51.03)
tJS

F = 134852. ut 4) = 21.2; el modeio lineal es apropiado. bj 128.41 diares. cj 73070 dlares. d) (1,070.90, 1,620.04) ei (1.010.50. 2,450.90)

F (\.

MS 3.75 3.75

r 1

Entre muesiras 15.a) Fuente GL 1 2 2 S S' 24.0 112.0 144.0 MS 24.0 56.0 72.0 18.3 1.31 3.06 3.93 F Al mi. de las muestras Totai 0 Fuente Bloque Tratamiento Error Total ai 2 GL
7

7.5 22.5 30.0

7. a) F = 527.2708. F ( l , 8) = 5.32; el modelo lineal es apropiado; y = -33.539 + 1.7515*. bi (i.58, 1.93) c) (35.85, 37.19) al (43.55. 47.01)
oos

9. al Calificacin = -207.15 ^ 18.39 de edad - 4.934 de estatura - 1.824 de peso. bl 0.638 cj S; f = 4.71. valor p = 0.035 < 0.05 di b y estatura, el 78.13 Examen de conocimientos 1. a) 4.4 c) Rechazar Hn. 2.

b) bl

t 2.10!

Mtodo

Grupo de ejercicios 14.3 1. = 2.137. 2 3. r = 2.177, p > cero. 5. = 2.943. / p > cero. 7. a) -0.6678 bi F8.0372. F
ao t65 0 J a

Periodo Interaccin Error Total b)

=2.228 (gl = 10); no hay evidencia de

que sea diferente de cero. SS 494.000 7.333 2.667 504.000 MS

18 23

330.0 610.0

= 2.896 (gl = 8); no hay evidencia de que = 1.734 (gl = 18); hay evidencia de que 3.

4.24 4.3 /3 = 0 dj El modelo lineal no es apropiado.

a)

diferente de cero.

hay evidencia que apoye que p es

cl

Como F^d. 18) = 3.55, hay interaccin entre el periodo y el mtodo de enseanza. Como consecuencia, no deben realizarse pruebas para los efectos pn nci pales del penodo y el mtodo de enseanza; en su lugar, uno podra querer probar las diferencias de los dos mtodos para cada penodo, lo cual requenra tres pruebas de r. o bien, desearamos probar una diferencia en los conocimientos obtenidos en los tres penodos para cada uno de los mtodos de enseanza. Esto requenra seis pruebas de r, tres para cada uno de los mtodos. 6.

3 6 11

247.000 2.444 5.50 0.444

ej y = 1.5 + !.5x. a) 1.5 bj di 0.90 ai


4.7

0.25

4. (-2.73,8.13) ( l . 10) = 4.96; se rechaza/%,,; existe 5. cj No; F = 0.42. valor p = 0.736 > 0.05 ei Por ejemplo, 2.41 = 8.667/3.59. En general.; = b < Desv.est. Estos estadsticos se usan para determinar su los / son diferentes de cero. ? /)
v

2 4 i 3 /; .4: F=8.47.gi = 2, 12), fi: F = 6 78. zl = i !2) 3.

d)

bi ei

Cl

una relacin. ci 1-2.83. , = 2.228. gl = 10; se rechaza#;/>* 0 di 0.446 Grupo de ejercicios 14.4 1. ai 6807 bj 76.27 ci 59.87

bj

-07

dj 45.8% de ia vananza en x, y .x.

No rechazamos 14

Hr

Ejercicios de repaso

CAPTULO

di 65.42 3. ai v = -60.25 -i-1.0330 1Q ~ 2.438 horas, b 0.605 ci S; F = 5.57 con valorp = 0.039 < 0.05 di Ninguno. el 93.255

s es el error de desviacin estndar. Se define por j = 'SSE/(n- 3) . Su valor es 2.82S

1. SST= 323.87,SSB = 80.27.SSW = 243.6.MSB = 40.14. Grupo de ejercicios 14.1 MSW = 9.02. F = 4.45. F 2.27) = 3.35; se rechaza H.. 1. v =-3 - 4v - e
0CV

ai

h \5 a b>
:>i -S

CAPTULO 75
Grupo de ejercicios 15.1

-5

3. al SST = 782.97.SSB = 554.81.SSW= 228.16.MSB = 184.94. MSW = 28.52. F = .48. f . 3 . 8 ) = 4.07; no se rechaza H. ) DC = 15.17,'Grupo- =- Grupo 2 c =0.58
)(B :

3.

v -

-i

5.

ai

-15.2376 ' i

28.SIS

57.

ai 96.9076

19.8162 ) 6

1. ; = 1 2 9 - = 1.65; no se recnaza H. 5. ai 0.8979 b, 5.41 DOS ci S; F= 7.06. valor p - 0.01 < 0.05 ai Los coeficientes de regresin ADVER y SAles son = -1 96: se rechaza H amos sigmcauvamenie distintos ue cero contr ='>iO:-' 3. ; = 2 26 2; 5. : = . 2 =196. no se rechaza H..

832

M Respuesta;

Respuestas

1 833

Grupo de eiercicios !5.2 I. a j n = 7.7* = 25. r = 3, 7 = 3 ,)3-25 = f7)(7-!V2 cj u= 14. a = 5.91 ; = -1.86 3. )n = 9 , r = 3 2 . I - = 13. 1 = 1 3 bj 32+ 13 = {9X9-r 10V2 cj u = 22.5.7=8.44.; = -!. 13
fl

5. H- 2.79. x o s '
l3

'.815: se rechaza H..

3, ai -0.78

Examen de conocimientos
00

Grupo de ejercicios 15.5 1. 5 = 6.33. x i 2 ) = 5 991; se rechaza H. hay una diferencia entre el nmero promedio de problemas con las impresoras lser.
y

bj : = -2.62. =c = =1.96: se rechaza n

1. ai 7 2/ 4 4

bi 13.48 f. 1.96 bi =2.58 4. 5.5

ci 2.44
No se rechaza H. 0.05"-

5. , ; 0.51 bi z = 1.53. 2 , = =1.96; no se rechaza H..


0

2. ai 1.90 3. O.55, 1)

3. 5 = 7.0. -; (2) = 5.991; se rechaza He. los tres


}l}

5. u = 85.5.0= 22.96.: = -3.07. -z^ = -1.65; se rechaza 7. u= 105,(7 = 26.79.; = 0. = 7 ^ = =1.96; no se rechaza "o9. u= 162.5.o = 37.!7,; = -1.68,-10

diferentes.

vaiuadores obtienen resultados significativamente

7. ai -0.81 bi : = -4.327, =/ consistentes. 9. ai -0.114 = =2.228. los resultados son

5. V = 52.5.; = -1.02. - = = -2.53: no se rechaza H = 1.96; no se rechaza H... 6. //= 04. 7. a) 0.60 (i) 1.2
M J 5

5. S = 4.90. x o 5

, 2 !

i 9 9 1 ;

n 0

s e

recn

= -1.65;serechaza =-

podemos concluir que hay alguna diferencia entre en las medias de produccin por tumo.
31 =

az

n o

bj z = -0.26. =

1 = 3.841; no se rechaza H..


1

Ejercicios de repaso 1. /= 109.; = 2.14. = 3. : = .90. z


aM

bi 0 c; 0.5 e> No se rechaza H.,


c

I I . n = 15, T= 44, u = 60, a = 17.61, : = -0.91. - ; 1.65; no se rechaza tf .


0

00

7. 5 = 5.00, Xoo.^ 7.815; no se rechaza H , no podemos concluir que hay alguna diferencia entre las medias de los anlisis de laboratorio.
n
(3 =

= 1.96; se rechaza H .
0

8. W = 2.18. x0511.) = 6.625: no se rechaza H . APNDICE A 1. ai A', + A', - .V.


> X
A

= 2.58; no se rechaza H .
{)

9. Marcas de gasolina: 5 = 5.80, Xo.o5 ^ 7.815; no se rechaza H ; no podemos concluir que hay alguna diferencia entre las medias de rendimiento de millas 15. n = 15. 7 = 96.5, // = 60. = 17.61,; = 2.07, - ; = por galn para las cuatro marcas de gasolina. Tipos de -2.33; no se rechaza /V. automvil: 5=4.50. x ] 2) = 5.991; no se rechaza tf ; no concluimos que hay alguna diferencia entre ias Grupo de ejercicios 15.3 medias de los millajes para los tres automviles. 1. [/= 79.5, : =-1.81, ~z = -1.65; hay una diferencia entre los empos de vida til - -4L-47^ralotes^=-i4J7.x d5) = .11.07: no se rechaza 13.7i= 15. 7 = 4 9 , u = 6 0 . a = 17.61, ; =-0.624, - ; , = -1.65: no se rechaza
M 1 05 0

5. L ' = 24.5.; = -i.41, - = = -2.53; no se rechaza H., 7. H - 2.54, x 9511= 3.84: no se rechaza H 9. H = 1.56. U.aj 0.60 b) ; = 1.80, ; 13. aj -0.95
0 ( B

xr,.

(2) = 9.210; no se rechaza H .


c

b)lX]

! X\ >',)+ .Y* - r-i-M .Y' ^ X:Y +


t

+ Tj^(X]

^ 2) * 1 .Y- -r 2) .
4

V'.,

x\ K/i

A ' ; n + X* i ; +/ x
4 t 24

ei/ Yt
r

*;;.Y*
:

wu

= 1.65; se rechaza H

/) .Y, Y; +A' K; + '.Y, Y * X Y: ~ X.Y: T X Y ;


:

flj

3. aj L/=79.5,:=-1.81.-c =-1.65;hayunadiferencia. bj = 1.924, / = 2.457, gl = 30; no se rechaza H no


1J5 U1

hay diferencia. cj Resultados eferentes; el resultado de la pane a es mejor pues no sabemos nada sobre los supuestos de la prueba de /. 5. aj U = 29, : = -1.59, ~z = -1,65; no tenemos evidencia de que el mtodo B sea mejor. 1 t- 1.52, gl= 18,.' = 1.734; no tenemos evidencia de que el mtodo B sea mejor.
tM
ls5

r7 ; los operadores no trabajan con la misma rapidez. Mquinas: 5 = 6.80. X005 (3) = 7.815; no se rechaza He, no hay evidencia que sugiera que las mquinas trabajan con diferente rapidez.
0

bj z - 2.85, zt

tK

= 2.228; se rechaza H .
}

15. n = 17, 7 = 10.5. u = 76.5, a = 21.!2,: = -3. i25. -;, = -2.33; se rechaza H .
r

3. a) 25 di 50 /) 25 jl -7

35 ei 15 hi 0

ci 44 /) 28 i, 0
1

Grupo de ejercicios 5.6 1. aj R= 15,n,= 12,n, = 11,u = 12.4783.a,= 2.3381, : = 1.079 bj R = 15, n. = 2. . i . = 12, u = 13, a = 2.3956.; = 0.8349
n
f

cj La prueba de la suma de los rangos es la prefenda si los supuestos de la prueba de t no pueden ser satisfechos. Ninguna prueba produce resultados significativos en este caso.

3. R = 20, n, = 15, n. = 22. p = 18.838, a = 2.888,; = 0.402, == = t i . 9 6 : no se rechaza H .' 02 . 5 B i


g r r

7. a) U = 5 8 . ; = 0.65. tz^ = 2.58: no se rechaza He. valor p = 0.5156 I F=2.O0,f (8,10)=3.07;no tenemos evidencia que sugiera que las vananzas poblacionales son diferentes. o i = -0.79, = =2.878; no se rechaza H.
us i M

5. a] Con base en la mediada de los puntajes, 4.5,/? =26, n, = 25, n = 25, = 26. o = 3.499.; = 0, = c = 1.96; no se rechaza H. b 1 Con base en pares e impares,R = 26, n = 29. n. = 21. u, = 25.36.a, = 3 . 4 . ; = 0.19. =- = =1.96;*no se rechaza H
: R
0015 : 00

7.

7 =37.5,/?= 19.n, = 25 fi.= 2 5 , i i , = 26. c/,= 3.499.


<

Grupo de ejercaos 5.4 1- H = 0.70 xJutl) = 5.841: no se rechaza H., liv


i 3 !

: = -2.00, ^

8 1

= 1.96; se rechaza H..

Grupo de ejercicios 15.7 1. ai 0.0061 b) z = 0.0183. = c = =1.96: no se rechaza H..


00JJ

A H

7 8 1 f ; n o

s e

-chaza

802

Apndice C Base de datos

de!sujeto Sexo m-i

Edad
7"

Fuma

PSS

PSD

Esuiura

Peso

delsu.ieio 5 o

Nmero 064 687 688 689 690 691 692 693 694 695 696 697 698 699 700 701 702 703 704 705 706 707

Edad

Fuma PSS

PSD

Estarun:

Peso

Respuestas a ejercidos con numeracin impar


Esta seccin contiene respuesta- los ejercicios con numeracin impar de los apartados de habilidades bsicas de mas aplicaciones y de revisin del 12 rulo. Adems, aqu pueden encontrarse las respuestas a las presuntas de toaos Sos exmenes de conocimientos de los captulos. Nota: Sus respuestas pueden variar, ligeramente de las aqu anotadas en algunas ocasiones, respecto al nmero de curas decimales usadas en los clculos intermedios. No se preocupe demasiado por las diferencias menores entre sus respuestas y las dadas aqu; muchas de las respuestas numricas fueron obtenidas con una calculadora manual o una computadora. 5. ai Los cambios en ei nmero de clulas auxiliares y de tipo T para todos los individuos sujetos a diierentes niveles de estrs. bf Los cambios en el nmero de clulas auxiliares y de tipo T para las 36 personas sujetas a diferentes niveles de estrs.

Vii-

p M M M M M M M M M M M M M M M M M M M M

N S N N N S N N N N S N N N N N N N S

90 170 120 130 120 170 130 92 120 132 151 140 152 162 130 150 160 150 140 140 110 160 138 150 108 95 160 150 140 140 130 132 130 96 128

58 100 80 74 70 90 82 60
/

164.1 179.0 1804 192.0 159.4 174.5 164.7 168.4 i 76.5 176.0 178.5 182.9 170.9 161.0 172.3 176.8 165.0 160.2 174.0 176.0 166.5 168.0 175.5 182.8 173.0 171.0 178.7 174.5 181.0 168.0 170.4 177.8 177.8 173.0 173.5

65.5 86.5 90.2 100.9 70.5 76.5 713 74.2 74.6 82.0 77.0 87.3 71.7 66.7 67.9 76.5 67.5 64.5 68.8 58.8 56.8 54.0 84.9 79.9 70.5 57.0 75.0 81.5 84.3 72.7 57.5 77.9 60.0 67.9 76.9

F M M M M M M M M M M M M M M M M M M M M

31
7 7T 7 7^ 7

N N N N S N N" N N N N N N N N N S S N

108 180 150 170 158 130 130 124 170 180 134 180 130 110 180 140 154 168 170 140 206

78 00 80 80 90 80 70 82 70 95 80 84 70 70 80 76 84 94 94 80 110 80 86 80 92 90 80 65 70

167.4 175.9 175.2 170.9 174.0 169.0 175.4 167.4 177.5 167,8 175.1 175.0 181.6 170.0 169.0 176.5 157.5 172.6 170.6 172.0 172.4 175.4 185.2 166.0 183.0 184.0 172.3 183.8 166.3 174.8 175.5 175.6 177.5 178,0 158.4

54.2
7

OJO 1
DJT

68 69 69 69 69 69 69 69 70 70 70 70 70 70 70 70 70 70 71 71 71 71 71 71 71 71 72 72 72 72 72 72 72 7

6.9

160 100

79.0 70.3 87.3 57.1 374 64.5 80. 65.0 76.8 84.0 67.4 75.9 58.1 84.9 557 61.2 62.3 73.9 867 76.6 90.1 61.3 76.6 61.7 86.2 67,1 70.5 65.2 76.4 74,5 70.8 627

655 uju 657 658 659 660 661 662 663 664 665 666 667 668 669 670 671 672 673 674 675 677 678 679 680 681 682 683 684 685 686

7?
"* "\

73 73 73 74 7
1

180 120

70 70 82 70 120 70 88 72 70 '75 60 70 90 88 90 68 60 90 72 80 80 80 80 80. 56 76

CAPTULO 7 Grupo de ejercicios 1.1 1. ai La afirmacin de la impresin de que una persona incapacidad, tanto como una de 65 aos.
1

75 75 75 75 75 75 76 76 76 77 77 11 79 79

tpica de 35 aos de edad requiere un seguro de

140 100

b) Estn relacionadas las incapacidades para el trabajo incapacidades relacionadas con la edad aparecieran

Uno esperara que la mayor parte de las 7. Un estadstico. La encuesta es ms confiable para una muestra de las amas de casa de la comunidad Grupo de ejercicios 1.3 1. aj Todas las respuestas de los 1500 votantes registrados. b) 500 respuestas de los votantes de la muestra.

en personas de 55 aos o ms.

M
M M M M M M M M M M M M

s
s s
N N N N N N N S N N

M
M M M

N
N N N S N

3. a) Esta afirmacin da la impresin de que todo el b) Cuanto personal hay all? Son jvenes todos? personal de servicio cuenta con experiencia.

N N N

708 709 710 711 712 713 714 715 716 717 718 719 720

180 120

676 - M

M "79 79 M M M M M M M M M 79 80 80 83 84 86 92 98

W "130 140 N N N N N N N N N 120 180 160 130 135 170

d) El nmero de votos parael seor Jacksonen la poblacin 5. a) Afirmar esto da la impresin de que el calmante de la e) l no intensificar sus esfuerzos en la campaa. marca X es el elegido 3. a) Inferencial. b) Descnptiva. b) Cuntos mdicos' Cul es el calmante? Es mejor o Inferencial. d) Inferencial. que la aspinna?
1

c) El nmero de votos para el seor Jackson en la muestra.

170 104 180 120

7. ai La afirmacin da la impresin de que todos los 5. a) La coleccin de costos de los libros de texto para los 1200 estudiantes. alimentos bajos en grasa son buenos para cualquier b) Los costos de ios textos para los 25 estudiantes corazn, an el de un fumador empedernido con entrevistados. sobrepeso, presin sangunea alta y diabetes. O 1200 es ei tamao de la poblacin y 135 dlares el b) En cules personas Cunto lo reducen? Es promedio del costo de sus libros de texto. significativa la reduccin? d) 25 es el tamao de la muestra y 152.25 dlares el Grupo de ejercicios 1.2 promedio del costo de sus libros de texto. 1. a i La causa de cada accidente en el estado de Maryiand e) Se ha cometido un error: 135 dlares es demasiado
0

b) La causa de cada accidente en as cinco subdivisiones elegidas del estado para junio. c i El porcentaje de accidentes para las cinco subdivisiones donde ei alcohol es un factor que contribuye, puede dentes en Maryiand debidos en pane ai alcohol. >emr como una estimacin del porcentaje de acci-

para el mes de junio.

bajo.olamuestra noes representativa de la poblacin.

CAPTULO 2 Grupo de ejercicios 2.1 1. ai cuantitativa. ci cualitativa. b) cuantitativa, d\.

3. a) discreta. b) discreta, 3. ai Los resultados de todos os pacientes artriticos. curac 'ontinua. ) continua. dos o no. que toman aceite de hgado de bacalao y os Ue todos os pacientes tambin artrticos, curados o 5. ai Coiumna 1: cuantitativa. no. que no toman ese aceite. Coiumna 2. cualitativa. 7 Los resudados del grupo de 50 pacientes artrticos, Coiumna 5: cuantitativa, curados o no. que'.ornan-aceite de hgado, ue bacalao c Coiumna ;: ordinal-.- y ios resultados dei grupo de 50 annticos, curados o Coiumna 2: nominal. no. aue no toman cieno aceite Coiumna 5: de razn.

/" Discreta.

136

Estadstica descriptiva: anlisis de ditos jnivariados

EXAMEN DE CONOCIMIENTOS

DEL CAPTULO 3. Conadere ia sisuiente tabia de m e s e * * poblacin:

1. Usca!ic,cionesi aiesdeunaseccinde!grupo209 de matemticas se iustran en ia grfica de barras adjunta.


1

4
DESCRIPCIN 4.7 Dependencia covarianza 4.2 Correlacin y orediccin lineal y 4.3 Regresin

Anlisis descriptivos de datos bivariados


OBJETIVOS DEL CAPITULO En \:<ie caotuio estudiaremos > > > > > Que es un diagrama de dispersin Covananza. Correlacin. Como determinar ei coeficiente de correlacin E mtodo de > de los mnimos prediccin. ia ecuacin de mnimos cuadrados, que estima r. la ecuacin y corro se usa.

a) Encuentre it. b) Determine (7. 4. Qu puede decir ue x en relacin con ei resto de ios datos si x: a) tiene un puntaje; de o b) posee un puntaje estndar de 2?
0 1

cuadrados para determinar

Calificaciones a) Qu medida de tendencia central deber usarse para describir la calificacin central' Explique a
1

0ene un puntaje d e : de-1 5. En cul de las situaciones siguientes es mayor ei puntaje onginai .v respecto a su conjunto de datos a)x = 3 7 . j c = 2 0 , j = I 0 b U = 500. .r= 200. . = 250 s C) J:=3.0,.V=1.0. = 0.7
0 0

Como determinar cmo

estn relacionadas dos variafa/es. prediccin. de corre/acin y la pendiente de

razn de su respuesta. b) Utilice su respuesta antenor para encontrar lais) calificacinlesi central(es). c) Cuntos estudiantes estn representados en la grfica dj Qu porcentaje de estudiantes recibieron una calificacin de C? ej Qu porcentaje de estudiantes recibieron una cali. fisacin (fc^trrrrejT^ 2. Considere las muestras 3. 8,7,12 y ! 0 para encontrar: a) el rango bl la media c) la mediana d) el rango promedio ei la vananza fi la desviacin estndar g) el puntaje estndar para la medida !0 h! ei IQR.

> >

Cmo usar la ecuacin de regresin con propsitos de Como se relacionan /a recia de el coeficiente

regresin. se calcula.

>

6. Si x = 8 y o" = 4, encuentre el puntaje onginai .r para . _ _i 7. Construya una grfica de caja para los datos del pro_.hlema 7 "

Qu es a suma de cuadrados para el error y cmo

clima parece afectar la ofensiva en bisbol. La tabla adjunta indica una relacin entre la temperatura y la ofensiva de 1987 a 1989.
16

8. Suponga que una muestra consiste en cinco medidas. 30,80, 50.40 y x. Determine el valor de .t tal que la media, la mediana y ia moda sean todas iguales. 9. Tiene la mayor pane de la gente una medida de pie mayor que el promedio Justifique su respuesta.
0

Temperatura 0-59 60-69 70-79 80 -89


a

Porcentaje de bateo 02/41 0.25 3 0.259 0.263 0.263

Carreras por Jonrones por juego si 8.5 8.6 9.1 9.1 juego IAQ 1.65 1.69 1.85 1.83

90 en adelante

Los datos sugieren que cuando la temperatura aumenta, la ofensiva mejora; un estudio sobre la relacin entre la temperatura y la ofensiva utiliza regresin y correlacin, que son los temas que veremos en este captulo. Los anlisis estadsticos utilizan frecuentemente ciatos cuantitativos de Panorama del captulo naturaleza bivariaoa: esto es, a cada elemento de ia muestra le correscionde un par de medidas, .os siguientes son ejempios de datos bivariados:

Вам также может понравиться