Вы находитесь на странице: 1из 13

UNIVERSIDAD TE CNOLOGICA DE MORELIA TECNOLOGIAS DE LA INFORMACION Y COMUNICACIN DESARROLLO DE HABILIDADES DEL PENSAMIENTO LOGICO 2E UNIDAD V CARLOS ALFREDO SANTIBAES

Nombre del profesor UTM111216TIC 08/04/2012 EN MI CASAHAHAHA XD

Estadstica Descriptiva

La estadstica descriptiva es una parte de la estadstica que se dedica a analizar y representar los datos. Este anlisis es muy bsico, pero fundamental en todo estudio. Aunque hay tendencia a generalizar a toda la poblacin las primeras conclusiones obtenidas tras un anlisis descriptivo, su poder inferencial es mnimo y debera evitarse tal proceder. Otras ramas de la estadstica se centran en el contraste de hiptesis y su generalizacin a la poblacin. Clasificacin de la estadstica

La estadstica se puede clasificar en dos grandes ramas: 1. Estadstica descriptiva o deductiva. 2. Estadstica inferencial o inductiva. La primera se emplea simplemente para resumir de forma numrica o grfica un conjunto de datos. Se restringe a describir los datos que se analizan. Si aplicamos las herramientas ofrecidas por la estadstica descriptiva a una muestra, solo nos limitaremos a describir los datos encontrados en dicha muestra, no se podr generalizar la informacin hacia la poblacin. La estadstica inferencial permite realizar conclusiones o inferencias, basndose en los datos simplificados y analizados de una muestra hacia la poblacin o universo. Por ejemplo, a partir de una muestra representativa tomada a los habitantes de una ciudad, se podr inferir la votacin de todos los ciudadanos que cumplan los requisitos con un error de aproximacin. Historia de la Estadstica

Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del pas. De acuerdo al historiador griego Herodoto, dicho registro de riqueza y poblacin se hizo con el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un censo de las tierras con el objeto de verificar un nuevo reparto. En el antiguo Israel la Biblia da referencias, en el libro de los Nmeros, de los datos estadsticos obtenidos en dos recuentos de la poblacin hebrea. El rey David por otra parte, orden a Joab, general del ejrcito hacer un censo de Israel con la finalidad de conocer el nmero de la poblacin. Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos efectuaron censos peridicamente con fines tributarios, sociales (divisin de tierras) y militares (clculo de recursos y hombres disponibles). La investigacin

histrica revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera. Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor supieron emplear los recursos de la estadstica. Cada cinco aos realizaban un censo de la poblacin y sus funcionarios pblicos tenan la obligacin de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos peridicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo suceda uno de estos empadronamientos de la poblacin bajo la autoridad del imperio. Durante los mil aos siguientes a la cada del imperio Romano se realizaron muy pocas operaciones Estadsticas, con la notable excepcin de las relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos. En Inglaterra, Guillermo el Conquistador recopil el Domesday Book o libro del Gran Catastro para el ao 1086, un documento de la propiedad, extensin y valor de las tierras de Inglaterra. Esa obra fue el primer compendio estadstico de Inglaterra. Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la tcnica romana, los mtodos estadsticos permanecieron casi olvidados durante la Edad Media. Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico, Galileo, Neper, William Harvey, Sir Francis Bacon y Ren Descartes, hicieron grandes operaciones al mtodo cientfico, de tal forma que cuando se crearon los Estados Nacionales y surgi como fuerza el comercio internacional exista ya un mtodo capaz de aplicarse a los datos econmicos. Para el ao 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique VII tena por la peste. Ms o menos por la misma poca, en Francia la ley exigi a los clrigos registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que apareci a fines de la dcada de 1500, el gobierno ingls comenz a publicar estadstica semanales de los decesos. Esa costumbre continu muchos aos, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad) contenan los nacimientos y fallecimientos por sexo. En 1662, el capitn John Graunt us documentos que abarcaban treinta aos y efectu predicciones sobre el nmero de personas que moriran de varias enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabra esperar. El trabajo de Graunt, condensado en su obra Natural and Political Observations...Made upon the Bills of Mortality (Observaciones Polticas y Naturales ... Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo innovador en el anlisis estadstico.

Por el ao 1540 el alemn Sebastin Muster realiz una compilacin estadstica de los recursos nacionales, comprensiva de datos sobre organizacin poltica, instrucciones sociales, comercio y podero militar. Durante el siglo XVII aport indicaciones ms concretas de mtodos de observacin y anlisis cuantitativo y ampli los campos de la inferencia y la teora Estadstica. Los eruditos del siglo XVII demostraron especial inters por la Estadstica Demogrfica como resultado de la especulacin sobre si la poblacin aumentaba, decreca o permaneca esttica. En los tiempos modernos tales mtodos fueron resucitados por algunos reyes que necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos pases. El primer empleo de los datos estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemn que viva en Breslau. Este investigador se propuso destruir la antigua creencia popular de que en los aos terminados en siete mora ms gente que en los restantes, y para lograrlo hurg pacientemente en los archivos parroquiales de la ciudad. Despus de revisar miles de partidas de defuncin pudo demostrar que en tales aos no fallecan ms personas que en los dems. Los procedimientos de Neumann fueron conocidos por el astrnomo ingls Halley, descubridor del cometa que lleva su nombre, quien los aplic al estudio de la vida humana. Sus clculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compaas de seguros. Durante el siglo XVII y principios del XVIII, matemticos como Bernoulli, Francis Maseres, Lagrange y Laplace desarrollaron la teora de probabilidades. No obstante durante cierto tiempo, la teora de las probabilidades limit su aplicacin a los juegos de azar y hasta el siglo XVIII no comenz a aplicarse a los grandes problemas cientficos. Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la palabra estadstica, que extrajo del trmino italiano statista (estadista). Crea, y con sobrada razn, que los datos de la nueva ciencia seran el aliado ms eficaz del gobernante consciente. La raz remota de la palabra se halla, por otra parte, en el trmino latino status, que significa estado o situacin; Esta etimologa aumenta el valor intrnseco de la palabra, por cuanto la estadstica revela el sentido cuantitativo de las ms variadas situaciones. Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este interpret la teora de la probabilidad para su uso en las ciencias sociales y resolver la aplicacin del principio de promedios y de la variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la aplicacin prctica de todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la ciencia. Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos matemticos fundamentales para la teora Estadstica; la teora de los errores de observacin, aportada por Laplace y Gauss; y la teora de los mnimos cuadrados

desarrollada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston ide el mtodo conocido por Correlacin, que tena por objeto medir la influencia relativa de los factores sobre las variables. De aqu parti el desarrollo del coeficiente de correlacin creado por Karl Pearson y otros cultivadores de la ciencia biomtrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones. Los progresos ms recientes en el campo de la Estadstica se refieren al ulterior desarrollo del clculo de probabilidades, particularmente en la rama denominada indeterminismo o relatividad, se ha demostrado que el determinismo fue reconocido en la Fsica como resultado de las investigaciones atmicas y que este principio se juzga aplicable tanto a las ciencias sociales como a las fsicas.

Media Aritmtica La media aritmtica de n observaciones de la variable X se denotar por el smbolo

y se define como la suma de ellas dividida por n. Simblicamente:

Ejemplo: La media aritmtica de los nmeros 3, 9, 12, 5 y 6 es:

Si se grafican estos puntos se obtiene:

En la figura es claro que la media aritmtica corresponde geomtricamente al punto de equilibrio de los datos. En una tabla de frecuencias, la media aritmtica se calcula suponiendo que todas las observaciones en una clase son iguales a su valor medio (mi), por lo que la contribucin de la i-sima clase a la suma es fimi. Por lo tanto, se calcula la media por la ecuacin:

Esta ecuacin tambin puede re-escribirse como:

Donde: fi = frecuencia de la clase i-sima mi = Valor medio de la clase i-sima fRi = Frecuencia relativa de la clase i-sima

Ejemplo: Calcular la media de la siguiente tabla de distribucin de frecuencias: intervalos Punto medio de clase (mi) Conteo fi fAi FRi FRAi

(07.7 , 11.7] (11.7 , 15.7] (15.7 , 19.7] (19.7 , 23.7] (23.7 , 27.7] (27.7 , 31.7] (31.7 , 35.7] (35.7 , 39.7]

9.7 13.7 17.7 21.7 25.7 29.7 33.7 37.7 TOTAL

||||| ||||| ||||| ||| ||||| ||||| ||| ||||| ||||| ||||| ||||| |||| ||||| ||||| ||||| || ||||| ||||| ||| |||| |

18 13 24 17 13 0 4 1 90

18 31 55 72 85 85 89 90 90

18/90 18/90 13/90 31/90 24/90 55/90 17/90 13/90 0/90 4/90 1/90 90/90 72/90 85/90 85/90 89/90 90/90 90/90

Se tiene la siguiente formula: Se van a tomar todos los valores de la tabla de la columna f i y mi ; se va a sustituir en la frmula anterior y queda como:

Tambin la media se puede calcular con la formula: Al tomar los datos de la Tabla de Frecuencias para fRi y mi y sustituirlos en la frmula el resultado queda de la siguiente manera:

Note que los resultados soun un poco diferentes por el nmero de decimales utilizados para los calculos.

Mediana La mediana (Me) de un conjunto de n nmeros ordenados de menor a mayor, es el nmero central en el arreglo. Si n es un nmero impar (non), slo hay un valor central en el arreglo. Si n es un nmero par, hay dos valores centrales y la mediana debe tomarse como la media aritmtica de estos dos valores.

Ejemplo: Calcular la mediana de los nmeros 3, 9 , 12, 5 y 6

Primero hay que ordenar los nmeros de menor a mayor: 3, 4, 6, 9, 12

Despus se debe verificar si el valor de n es par o impar (non), en caso de ser par se toman los dos valores que estn en el centro. Como en este caso n = 5 (nmero non), hay un solo valor central, el 6 y ste es el valor de la mediana, es decir: Me = 6

Ntese que la mediana es un valor ms tpico del conjunto anterior que la media aritmtica:

Ejemplo: Se tienen las siguientes edades tomadas de un grupo de 10 estudiantes del grupo del curso de Introduccin a los Diseos Experimentales del Colegio de Postgraduados, se desea conocer cual sera su media y cul sera su mediana. 25, 27, 35, 28, 30, 24, 25, 29, 32, 37 a. Clculo de la media:

b. Clculo de la mediana: Primero se ordenan los datos de menor a mayor: 24, 25, 25, 27, 28, 29, 30, 32, 35, 37 Puesto que n = 10(nmero par), hay dos valores centrales, que son 28 y 29. La mediana es la media aritmtica de estos dos valores. Es decir

Para localizar la mediana en una tabla de frecuencias slo busque los valores que indiquen aproximadamente la mitad de la frecuencia relativa acumulada (aproximadamente el 50%), ya que la mediana es un valor que divide a los datos en mitades.

Como los datos son 90 (nmero par) la mediana esta localizada entre la observacin cuadragsima quinta y cuadragsima sexta (45a y 46a) que corresponde al intervalo entre 15.7 y 19.7 como se muestra en la tabla:

intervalos

Punto medio

Conteo

fi

fAi

FRi

FRAi

de clase (mi) (07.7 , 11.7] 9.7 ||||| ||||| ||||| ||| (11.7 , 15.7] 13.7 ||||| ||||| ||| ||||| ||||| ||||| (15.7 , 19.7] 17.7 ||||| |||| (19.7 , 23.7] 21.7 ||||| ||||| ||||| || (23.7 , 27.7] 25.7 ||||| ||||| ||| (27.7 , 31.7] 29.7 (31.7 , 35.7] 33.7 |||| (35.7 , 39.7] 37.7 | TOTAL

18 13 24 17 13 0 4 1 90

18 31 55 72 85 85 89 90 90

18/90 18/90 13/90 31/90 24/90 55/90 17/90 13/90 0/90 4/90 1/90 90/90 72/90 85/90 85/90 89/90 90/90 90/90

Otra forma de clculo sera utilizando la siguiente frmula:

Donde: Me es mediana. L es Lmite inferior de la clase mediana. n es Tamao de muestra. FA es Frecuencia Acumulada precedente a la clase mediana. f es Frecuencia absoluta de la clase mediana. c es amplitud del intervalo de clase. De la tabla anterior se han tomando los valores necesarios para sustituir en la frmula y obtener el valor de la Mediana: L = 15.7 n = 90 FA = 31 f = 24 c=4 Al sustituir en la formula queda la siguiente expresin:

Moda La moda (Mo) de un conjunto de datos es el valor (si existe) que ocurre con mayor frecuencia. Si es un valor nico decimos que la distribucin de frecuencias es unimodal, si tiene dos o ms valores con la misma frecuencia mxima, decimos que la distribucin es bimodal, trimodal, entre otras.

La moda es una medida de tendencia central que es poco usada por las siguientes razones: a) Puede ocurrir que no exista. b) A menudo no es un valor nico.

Retomando el ejemplo de las edades tomadas de un grupo de 10 estudiantes del grupo del curso de Introduccin a los Diseos Experimentales, el clculo de la moda sera: 25, 27, 35, 28, 30, 24, 25, 29, 32, 37

La moda de este conjunto de datos es 25 puesto que tiene una frecuencia de 2, mientras los dems valores tienen una frecuencia de 1.

Si se comparan los valores obtenidos por este conjunto de datos se tiene:

No siempre los datos obtenidos por la media, la mediana y la moda coinciden, este es un ejemplo en el cual se nota ms este concepto.

En una tabla de frecuencias, la moda se define como el valor medio de la clase cuya frecuencia tiene el valor numrico mayor, la cual recibe el nombre de clase modal.

Punto medio Conteo de clase (mi) (07.7 , 11.7] 9.7 ||||| ||||| ||||| ||| (11.7 , 15.7] 13.7 ||||| ||||| ||| ||||| ||||| ||||| (15.7 , 19.7] 17.7 ||||| |||| (19.7 , 23.7] 21.7 ||||| ||||| ||||| || (23.7 , 27.7] 25.7 ||||| ||||| ||| (27.7 , 31.7] 29.7 (31.7 , 35.7] 33.7 |||| (35.7 , 39.7] 37.7 | TOTAL intervalos

fi 18 13 24 17 13 0 4 1 90

fAi 18 31 55 72 85 85 89 90 90

FRi

FRAi

18/90 18/90 13/90 31/90 24/90 55/90 17/90 13/90 0/90 4/90 1/90 90/90 72/90 85/90 85/90 89/90 90/90 90/90

Los valores obtenidos utilizando la tabla fueron: Mo = 17.7 que es el punto medio del intervalo donde la frecuencia absoluta (24) es mayor que los dems, y es de tipo unimodal.

Medidas de dispersin

Las medidas de tendencia central ttienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersin nos dicen hasta que punto estas medidas de tendencia central son representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los valores de la distribucin respecto al valor central. Distingamos entre medidas de dispersin absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirn comparar varias muestras. MEDIDAS DE DISPERSIN ABSOLUTAS u VARIANZA ( s2 ): es el promedio del cuadrado de las distancias entre cada observacin y la media aritmtica del conjunto de observaciones.

Haciendo operaciones en la frmula anterior obtenemos otra frmula para calcular la varianza:

Si los datos estn agrupados utilizamos las marcas de clase en lugar de Xi. u DESVIACIN TPICA (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersin la desviacin tpica que se define como la raz cuadrada positiva de la varianza

Para estimar la desviacin tpica de una poblacin a partir de los datos de una muestra se utiliza la frmula (cuasi desviacin tpica):

u RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las observaciones mayor y el menor. Re = xmax - xmin

Вам также может понравиться