Вы находитесь на странице: 1из 7
6 Capitulo 3 Estadisticos para describr, explorar y comparar datos 3-1__Panorama general Este capitulo es sumamente importante porque presenta estadisticos baisicos que sscriben las caracteristicas fundamentales de un conjunto de datos. En el panora- ma general del capitulo 2 (seccién 2-1) sefialamos que al describir, explorar y comparar conjuntos de datos, las siguientes caracteristicas suelen ser de suma im- portancia: 1. el centro, 2. la variaci6n, 3. la distribucién, 4. los valores extremos y 5. las caracteristicas de los datos que cambian con el tiempo. Pensamiento critico e interpretacién: mas alld de las formulas La tecnologia nos permite disfrutar del siguiente principio del uso de la estadistica mo- ddema: no es tan importante memorizar formulas o realizar céleulos ari plejos a mano; en cambio, nos podemos concentrar en obtener resultados con algtin tipo de tecnologia (calculadoras o programas de cémputo), part luego dar un sentido prictico a los resultados a través del pensamiento crtico, Tenga esto en mente mien- tras estudia el presente capitulo, Por ejemplo, cuando estudie la desviacién estindar cn la seccién 3-3, trate de observar eémo funciona la férmula como medida de varia- idn, luego aprenda a calcular valores de desviaciones esténdar, pero realmente haga un esfuerzo por comprender e interpretar los valores de las desviaciones estindar. Este capitulo incluye algunos pasos detallados de procedimientos relevantes, pero no es necesario dominar esos pasos en todos los casos. Sin embargo, le reco- mendamos que realice algunos célculos manuales antes de utilizar su calculadora ‘© computadora, ya que esto mejorar su comprensin y asi podri apreciar mejor los resultados obtenidos a partir de la tecnologi Los métodos de este capitulo y del anterior se conocen cémo métodos de es- tadistica descriptiva, ya que su objetivo es resumir 0 describir las caracterist cas importantes de un conjunto de datos. Mis adelante en este libro emplearemos métodos de estadistica inferencial, cuando utilicemos datos muestrales para ha (0 generalizaciones) acerca de una poblacién. Con la estadistica idos. La estad cca descriptiva y la estadistica inferencial son dos divisiones generales de esta ma tuo, junto con el 2, se ocupa de principios fundamentales 3.2 Medidas de tendencia central Concepto clave Cuando describimos, exploramos y comparamos conjuntos de da- tos, las siguientes caracteristicas suclen ser sumamente importantes: centro, variacién, Aistribucién, valores extremos y cambios a través del tiempo. [Recuerde que las siglas CVDVT (Cuidado con los Virus que Destruyen el Valioso Trabajo) sirven para no ol- vidar esas caracteristicas]. En esta secci6n nos enfocamos en las caracteristicas del centro, Buscamos obtener de alguna manera un niimero que represent el valor central de un conjunto de datos. Los conceptos de media y mediana deben quedar completa- mente claros. En especifico, habri que conocer muy bien los métodos para el célculo de los valores de la media y 1a mediana. Asimismo, es importante saber que el va- lor de la media se puede ver muy afectado por la presencia de un valor extremo, aunque la mediana no es tan sensible a esto, (Un valor extremo es un valor que 2:2 Medidas de tendencia central n cesta muy alejado de la gran mayoria de los datos). La parte I de esta seecién inc! conceptos basicos que deben comprenderse muy bien antes de pasar ala parte 2. Parte 1: Conceptos basicos de las medidas de tendencia central Definicin Una medida de tendencia central es un valor que se encuentra en el centro ala mitad de un conjunto de datos. Hay muchas formas distintas de determinar el centro, por lo que tenemos dif rentes definiciones de las medidas de tendencia central, que incluyen la mei ‘median, la moda y la mitad del rango. Comenzaremos con la media. la Media La media (aritmética), por lo general, es la medida numérica més importante que se utiliza para describir datos; comiinmente se le conoce como promedio. Definicion La media aritmética de un conjunto de valores es la medida de tendencia § central que se calcula al sumar los valores y dividir el total entre el miimero de valores. Esta medida de tendencia central se utilizard con frecuencia a lo 5 largo del libro y nos referiremos a ella simplemente como la media, Esta definicién puede expresarse con la formula 3-1, que utiliza la letra griega (sigma mayiiscula) para indicar que los valores de los datos deben sumarse. Es decir, Sx representa la suma de todos los valores de los datos. El simbolo n denota el tamaiio de la muestra, que es el nimero de valores en el conjunto de datos. Formuta 3-1 Media = 3£ Sta de todos os valores dela musta 7“ atimero de valores muesiales Si cl conjunto de datos es una muestra de una poblacién mas grande, la media se simboliza¥ (y se le “x barra”); cuando se usan todos los valores de Ia poblacin, la ‘media se simboliza por medio de p (la letra griega mu miniscula). (Por Io general, los estadisticos muestrales se representan con letras del abecedario latino como ¥, y los parimetros poblacionales con letras del alfabeto griego como p,) representa la suma de un conjunto de valores. x es la variable que generalmente se usa para representar los datos in- dividuales. n representa el miimero de valores en una muestra. representa el mimero de valores en una poblacién. es la media de un conjunto de valores muestrales. es la media de todos los valores de una poblacién, Per EN LAS NOTICIAS: La revista Health compas las medidas de los maniques. con Jas medidas de las mujeres. Los siguientes resultados se repotron como" promedios, que tal verre= presentan medias. Eatura de os rmaniguies: 6 pies; esttura de as mujeres 5 pies 4 pulgadas. Ta ‘mail de la cintura de Tos mani- aquies: 23 pulgadas;cintura de las ‘mujeres: 29 pulgodas. Tanto de Ja cadera de os maniquies: 34 pulgadas; cadera de las mmjeres: 40 pulgatas. Talla de vestido de Jos maniquies: 6; talla de vestido de las mujeres: 11. Cuando se comparanIas medias, es evidente «que los maniquies y las mujeres reales son muy diferentes " Capitulo Estadisticas para describr, explorar y comparar datos EJEMPLO Verificacién del plomo en el aire Se sabe que el plomo tiene algunos efectos daiinos graves en la salud. A continuacién se presentan ccantidades de plomo (medidas en microgramos por metro cibico o pz /m*)en el La Agencia de Proteccién Ambiental de Estados Unidos establecié un es- lad del aire con respecto al plomo: un nivel maximo de 1.5 g/m’. jones que Se presentan a continuaciGn se registraron en el eificio 5 del World Trade Center en distintos dias, inmediatamente después de la destruccién ‘causada por los ataques terorisas del I] de septiembre de 2001, Calcule la me dia de esta muestra de niveles de plomo en el aire 540 1.10 042 0.73 048 1.10 Poblaciones cambiantes SOLUCION La media se calcula empleando la formula 3-1, Primero se su man las puntuaciones y después se dividen entre el nimero de éstas: Una de las cinco caractestieas ins importantes que se men- cionaron en el capitulo 2 sel ” 6 Patién de cambio de tos datos com el paso de tiempo. Algunas Poblaciones cambian, y sus es- taditicos importantes eambian Yr _ 540 + 110 +042 +073 +048 + 110 _ 9.23 _ | org 6 La media del nivel de plomo es 1.538 g/m’. Ademas del valor de la me- también es notable que el conjunto de datos incluye un valor (5.40) que esti muy distante de los dems, Seria importante investigar un “valor también, Los estindares de los extremo” como éste. En tal caso, el nivel de plomo de 5.40 jiz/m* se midi6 cintrones de seguridad no han después del colapso de las torres del World Trade Center, cuando habia ni- cambiado en 40 ais, aun yeles excesivos de polvo y humo. Asimismo, es probable que parte del plo- ‘cuando el peso de Js estadour mo fuera producto de las emisiones de la gran cantidad de vehiculos que ridenses se ha incrementado de Megaron al lugar. Estos factores ofrecen una explicaci6n razonable para un ‘manera considerable desde en- valor tan extremo. tonces. En 1960 el 12.89% de Jos estadounidenses se conside- tahan obeses, en conparckn | Mediana ‘con el 22.6% en 1994, Segin la Agencia Nacional de Carreteras de Estados Uni- dos (Highway Trafic Safety Administration), los cinturones de seguridad deben ajustarse a tun maniui estindar de choque J (disefado con datos de 1960) Definic tetnibcaclanocenner,| Bl sms Een mS Clea Saal con un espacio ie de pulge implica el valor intermedio, cuando ls valores de ls datos originales se pre- dhs, En feo, el cinta se sentan en orden de magntud creciente(odecreciene). La medianasuele de ajusta al 95% de los hombres y = denotarse con X (y se lee “x con tilde’ 199% de as mujeres, per es ‘tos pareentajes ahora son bajas ane el aumento de peso duane te In segunda mits del siglo Una desventaja de la media es su sensibilidad a cada valor, de tal forma que una puntuacién excepcional puede afectarla de manera drastica. La mediana resuelve. cn gran medida, esa desventaja. La mediana es un ‘valor intermedio”, ya que la mitad de los valores de los datos estin por debajo de Ia mediana y Ia otra mitad por arriba de ella, La siguiente definicién es mas precisa mn Para calcular la mediana, primero se ordenan los valores (se acomodan en ot- den) y luego se sigue uno de los siguientes dos procedimientos: pasado. Algunas empresas de 1. Si el mimero de valores es impar, la mediana es el niimero que se localiza automnvilesoffecencinturones ‘exactamente a la mitad de la lista de seguridad con extensions, 2, Si el niimero de valores es par, la mediana se obtiene calculando la media de Ios dos ntimeros que estin a la mitad, pero otras no.

Вам также может понравиться