Вы находитесь на странице: 1из 11

ESTADISTICA Historia de la Estadstica: Como dijera Huntsberger: "La palabra estadstica a menudo nos trae a la mente imgenes de nmeros

apilados en grandes arreglos y tablas, de volmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones, ingresos, crditos y as sucesivamente. La Estadstica es mucho ms que slo nmeros apilados y grficas bonitas. Es una ciencia con tanta antigedad como la escritura, y es por s misma auxiliar de todas las dems ciencias. HISTORIA: Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el ao 3050 antes de Cristo, datos relativos a la Poblacin y la riqueza del pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con el objetivo de preparar la construccin de las Pirmides. Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos efectuaron censos Peridicamente con fines tributarios, sociales (divisin de tierras) y militares. Pero fueron los romanos, maestros de la organizacin Poltica, quienes mejor supieron emplear los recursos de la estadstica. Cada cinco aos realizaban un censo de la poblacin y sus funcionarios pblicos tenan la obligacin de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos peridicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo suceda uno de estos empadronamientos de la poblacin bajo la autoridad del imperio. Durante los siguientes mil aos a la cada del imperio romano se realizaron muy pocas operaciones estadsticas ya En Inglaterra, Guillermo el Conquistador recopil el Domesday Book o libro del Gran Catastro para el ao 1086, un documento de la propiedad, extensin y valor de las tierras de Inglaterra. Esa obra fue el primer compendio estadstico de Inglaterra. Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la tcnica romana, los mtodos estadsticos permanecieron casi olvidados durante la Edad Media. Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico, Galileo, Neper, William Harvey, Sir Francis Bacon y Ren Descartes, hicieron grandes operaciones al mtodo cientfico, de tal forma de aplicarse a los datos econmicos. Con las denominadas pestes que se dieron en Inglaterra, Francia se llevaron los censos de nacimiento y defuncin, El primer empleo de los datos estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemn que viva en Breslau. Este investigador se propuso destruir la antigua creencia popular de que en los aos terminados en siete mora ms gente que en los restantes, y para lograrlo hurg pacientemente en los archivos parroquiales de la ciudad. Despus de revisar miles de partidas de defuncin pudo demostrar que en tales aos no fallecan ms personas que en los dems. Godofredo Achenwall, profesor de la Universidad de Gotinga, acu en 1760 la palabra estadstica, que extrajo del trmino italiano statista (estadista). Crea con razn, que los datos de la nueva ciencia seran el aliado ms eficaz del gobernante consciente.

Entretanto, en el perodo del 1800 al 1820 se desarrollaron dos conceptos matemticos fundamentales para la teora Estadstica;por Laplace y Gauss; y la teora de los mnimos cuadrados desarrollada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston ide el mtodo conocido por Correlacin, que tena por objeto medir la influencia relativa de los factores sobre las variables. De aqu parti el desarrollo del coeficiente de correlacin creado por Karl Pearson. DEFINICION DE ESTADISTICA: La Estadstica es la parte de las Matemticas que se encarga del estudio de una determinada caracterstica en una poblacin, recogiendo los datos, organizndolos en tablas, representndolos grficamente y analizndolos para sacar conclusiones de dicha poblacin. Para que realizamos: Para una deduccin de conclusiones y para una correcta y acertada toma de decisiones. Segn se haga el estudio sobre todos los elementos de la poblacin o sobre un grupo de ella, vamos a diferenciar dos tipos de Estadstica: Estadstica descriptiva. Realiza el estudio sobre la poblacin completa, observando una caracterstica de la misma y calculando unos parmetros que den informacin global de toda la poblacin. Estadstica inferencial. Realiza el estudio descriptivo sobre un subconjunto de la poblacin llamado muestra y, posteriormente, extiende los resultados obtenidos a toda la poblacin. CONCEPTOS BASICOS: Poblacin: Es el conjunto de personas, animales o cosas que tienen 1 o mas caractersticas en comn, tenemos Poblacion Finita y Poblacion Infinita: Es un numero fijo de valores ejem cantidad de alumnos aprobados en la USC. Poblacin infinita: Es una sucesin infinita de valores ejemplo las estrellas en el universo. Muestra: subconjunto de la poblacin que elegimos para hacer un estudio ms reducido. Censo: Es el proceso de observar a la poblacin completa, es decir tomar una muestra igual a la poblacin. Unidad Estadstica: A cada elemento que integra la poblacin se le llama Unidad Estadistica, para seleccionar una muestra se toman unidades estadsticas de la poblacin en estudio. Muestreo: El muestreo es una herramienta de la investigacin cientfica. Su funcin
bsica es determinar que parte de una realidad en estudio (poblacin o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha poblacin.

Marco Muestral:

Es la parte de la poblacin desde donde se selecciona la muestra. (es decir que debes delimitar tu muestreo ejem. Jvenes de 12 a 21 anos la ciudad de Puno).

Observacin

y Experimento:

De hecho, la experimentacin hace uso de la observacin, sin embargo la observacin no necesariamente es parte de la experimentacin, La observacin requiere el uso de la vista acompaado o no de algun instrumento auxiliar que la potencie (microscopios, telescopios, etc.)La experimentacin consiste en reproducir un fenmeno observado previamente o una propuesta terico-matemtica con el fin de corroborar la hiptesis inicial.

CLASIFICACION DE LA ESTADISTICA: Se divide en 2 ramas LA ESTADSTICA DESCRIPTIVA, que se dedica a los mtodos de recoleccin, descripcin, visualizacin y resumen de datos originados a partir de los fenmenos en estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin estndar. Algunos ejemplos grficos son: histograma, pirmide poblacional, clusters, etc. LA INFERENCIA ESTADSTICA, que se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hiptesis), pronsticos (correlacin) estimaciones de o futuras de de caractersticas relaciones entre numricas de variables (estimacin), asociacin (anlisis de observaciones, descripciones

modelamiento

regresin). Otras tcnicas de modelamiento incluyen ANOVA, series de tiempo y minera de datos. VARIABLES: Las variables pueden ser de dos tipos: Variables cualitativas o atributos: no se pueden medir numricamente (por ejemplo: nacionalidad, color de la piel, sexo). Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ingresos anuales). Las variables tambin se pueden clasificar en: Variables unidimensionales: slo recogen informacin sobre una caracterstica (por ejemplo: edad de los alunmos de una clase). Variables bidimensionales: recogen informacin sobre dos caractersticas de la poblacin (por ejemplo: edad y altura de los alumnos de una clase).

Variables pluridimensionales: recogen informacin sobre tres o ms caractersticas (por ejemplo: edad, altura y peso de los alumnos de una clase). Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas: Discretas: slo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: nmero de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podr ser 3,45). Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehculo puede ser 80,3 km/h, 94,57 km/h...etc.
Medicion: La medicin es un proceso en virtud del cual las observaciones se traducen en nmeros, es decir que los investigadores comienzan con variables y despus aplican reglas para determinar como habran de expresarse esas variables en forma numrica. Tipos de Medicion: Escala Nominal:

La escala de medida nominal, puede considerarse la escala de nivel ms bajo, y consiste en la asignacin de nmeros o smbolos a cada una de las diferentes. Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean equivalentes respecto del atributo o propiedad en estudio, despus de lo cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le atribuyan nmeros, puede ser una de las razones por las cuales se le conoce como "medidas nominales". Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR Ncleo San Carlos de acuerdos a la carrera que cursan.
Carrera Educacin Administracin Nmero asignada a la categora 1 2

Se ha de tener presente que los nmeros asignados a cada categora sirven nica y exclusivamente par identificar la categora y no poseen propiedades cuantitativas. Escala Ordinal: En caso de que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de "orden" de los nmeros asignndolo a los objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado de atributo que B. Ejemplo: Al asignar un nmero a los pacientes de una consulta mdica, segn el orden de llegada, estamos llevando una escala ordinal, es decir que al primeo en llegar le asignamos el n 1, al siguiente el n

2 y as sucesivamente, de esta forma, cada nmero representar una categora en general, con un solo elemento y se puede establecer relaciones entre ellas, ya que los nmeros asignados guardan la misma relacin que el orden de llegada a la consulta. Escalas de intervalos iguales: la escala de intervalos iguales, est caracterizada por una unidad de medida comn y constante que asigna un nmero igual al nmero de unidades equivalentes a la de la magnitud que posea el elemento observado. Es importante destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no refleja en ningn momento ausencia de la magnitud que estamos midiendo. Ejemplo: El lapso transcurrido entre 1998-1999 es igual al que transcurri entre 2000-2001. Escala de coeficientes o Razones: El nivel de medida ms elevado es el de cocientes o razones, y se diferencia de las escalas de intervalos iguales nicamente por poseer un punto cero propio como origen; es decir que el valor cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se observa una carencia total de propiedad, se dispone de una unidad de medida para el efecto. A iguales diferencias entre los nmeros asignados corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio. Adems, siendo que cero ya no es arbitrario, sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud de la propiedad presente en B. Ejemplo: En una encuesta realizada en un barrio de esta localidad se observ que hay familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3 hijos
ORGANIZACIN Y PRESENTACION DE DATOS CATEGORICOS FRECUENCIA

Definiremos como frecuencia de un dato el nmero de veces que este aparece en el colectivo; consecuentemente, si una variable estadstica toma r valores, cada uno de los cuales puede repetirse un cierto nmero de veces, podramos decir que el nmero de datos representado por la variable seran N, siendo N la suma de las respectivas frecuencias de cada dato (N=Xi).
Tipos de frecuencia

Frecuencia absoluta:
La frecuencia absoluta es el nmero de veces que aparece un determinado valor

en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de datos, representado por N.

Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.

Frecuencia relativa: La frecuencia r e l a t i v a e s e l c o c i e n t e e n t r e l a f r e c u e n c i a absoluta de un determinado valor y el nmero total de datos. Se puede expresar en % y se representa por ni. La suma d e l a s f r e c u e n c i a s r e l a t i v a s e s i g u a l a 1 . Frecuencia acumulada: La frecuencia a c u m u l a d a e s l a s u m a d e l a s f r e c u e n c i a s a b s o l u t a s d e t o d o s l o s v a l o r e s i n f e r i o r e s o i g u a l e s a l v a l o r considerado. Se representa por Fi. Frecuencia relativa acumulada: La frecuencia relativa a c u m u l a d a e s e l c o c i e n t e e n t r e l a f r e c u e n c i a
acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento.

Ejemplo: Durante e l m e s d e j u l i o , e n siguientes temperaturas mximas:

una

ciudad

se

han

registrado

las

32, 31, 28, 2 9 , 3 3 , 3 2 , 3 1 , 30 , 3 1 , 3 1 , 2 7 , 2 8 , 2 9 , 3 0 , 32 , 3 1 , 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

En la 1ra c o l u m n a d e l a

tabla colocamos la variable ordenada de menor a mayor, en la 2da hacemos el recuento y en la 3ra anotamos la frecuencia absoluta. xi 27 28 29 30 31 32 33 34 III III I Recuento I II fi 1 2 6 7 8 3 3 1 31 Fi 1 3 9 16 24 27 30 31 ni 0.032 0.065 0.194 0.226 0.258 0.097 0.097 0.032 1 Ni 0.032 0.097 0.290 0.516 0.774 0.871 0.968 1

Este tipo de tablas de frecuencia se usa con variables discretas.

1. Que temperatura fue la mas frecuente 2. Cuantos das hubo 29 y 30 grados de temperatura.

3. Cuantos das hubo con 31 grados a menos temperatura 4. De todo el mes que porcentaje esta la temperatura de 32 grados 5. En que porcentaje se encuentran las temperaturas de hasta 33 grados.
Diagrama de sectores Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un crculo, de modo que el ngulo de cada sector es p r o p o rc i o n a l a la f r e c u e n c ia absoluta correspondiente. El diagrama circular se transportador de ngulos. construye con la ay u d a de un

Ejemplo:En una clase de 30 alum, 12juegan a baloncesto, 3practican natacin, 4juegan ftbol y el resto no practica porte.

Alumnos Baloncesto Natacin Ftbol Sin deporte Total

ngulo

12 3 9 6 30

144 36 108 72 360

Diagrama de barras Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto. S e r e p r e s e n t a n s o b r e u n os e j e s d e c o o r d e n a d a s , e n e l e j e d e abscisas se colocan los valores de la variable, y sobre el eje de ordenadas l a s frecuencias absolutas o relativas o acumuladas.

L o s datos s e r e p r e s e n t a n m e d i a n t e barras d e u n a altura proporcional a la frecuencia.

Ejemplo U n e s t u d i o h e c h o a l c o n j un t o d e l o s 2 0 a l u m n o s d e u n a c l a s e p a r a determinar su grupo sanguneo ha dado el siguiente resultado: Grupo sanguneo A B AB 0

fi 6 4 1 9 20 PICTOGRAMAS:

Los pictogramas utilizan smbolos para representar un conjunto de datos. La mayor frecuencia se identifica por la mayor acumulacin de smbolos. Los pictogramas se emplean sobre todo, para hacer ms amigables y entendibles los informes estadsticos.

Ejemplo 2 Los datos son los emisiones de dioxido de 20 estados americanos 0,3 1,5 2,3 0,3 4,2 1,5 fi 3 6 2 2 4 3 20 3,8 2,1 ni 0.15 0.30 0.10 0.10 0.20 0.15 1.00 1,5 3,8 0,3 2,3 Fi 3 9 11 13 17 20 1,5 2,1 Ni 0.15 0.45 0.55 0.65 0.85 1.00 3,8 4,2 1,5 3,8 4,2 1,5

Datos 0,3 1,5 2,1 2,3 3,8 4,2

8 6 4 2 0 0,3 1,5 2,1 2,3 3,8 4,2 Series1

CONSTRUCCION DE TABLAS DE FRECUENCIA EMPLEANDO INTERVALOS DE CLASE Es la organizacin de datos agrupados


Clases o intervalos de clase: Grupo de valores que describen una caracterstica. Deben incluir todas las observaciones y ser excluyentes. Los intervalos contienen los lmites de clase que son los puntos extremos del intervalo. Se denominan intervalos cerrados, cuando contienen ambos lmites e intervalos abiertos si incluyen solo un lmite. Limites Reales: Sirven para mantener la continuidad de las clases Anchura o tamao del intervalo: es la diferencia entre los lmites reales de una clase Nmero de clases: es el nmero total de grupos en que se clasifica informacin, se recomienda que no sea menor que 5 ni mayor que 15 la

Marca de Clase: Es el punto medio del intervalo de clase, se recomienda observar que los puntos medios coincidan con los datos observados para minimizar el error. Frecuencia: es el nmero de veces que aparece un valor Grficos de una Distribucin de Frecuencias Los grficos son tiles porque ponen en relieve y aclaran las tendencias que no se captan fcilmente en la tabla, brinda una verificacin grfica de la veracidad de las soluciones. Histograma: Esta formado por rectngulos cuya base es la amplitud del intervalo y tiene la caracterstica que la superficie que corresponde a las barras es representativa de la cantidad de casos o frecuencia de cada tramo de valores, puede construirse con clases que tienen el mismo tamao o diferente ( intervalo variable). La utilizacin de los intervalos de amplitud variable se recomienda cuando en alguno de los intervalos , de amplitud constante, se presente la frecuencia cero o la frecuencia de alguno o algunos de los intervalos sea mucho mayor que la de los dems, logrando as que las observaciones se hallen mejor repartidas dentro del intervalo. Polgono de Frecuencias (cuando es la grafica con fi) Se puede obtener uniendo cada punto medio (marca de clase) de los rectngulos del histograma con lneas rectas, teniendo cuidado de agregar al inicio y al final marcas de clase adicionales, con el objeto de asegurar la igualdad del reas. Curvas de frecuencia No es ms que la curva suavizada que se traza sobre el polgono y representa la asimetra y la curtosis que tiene la distribucin, permite visualizar un esquema ms claro del patrn de datos. Existen varios tipos de curva de frecuencia: Curvas J, Simtricas o Asimtricas (sesgada a la derecha o a la izquierda), Unimodales, Bimodales y Multimodales.

Ojivas:

(cuando es la grafica con Fi acumulada)

Cuando se trata de relacionar observaciones en un mismo aspecto para dos colectivos diferentes no es posible ejecutar comparaciones sobre la base de la frecuencia, es necesario tener una base estndar, la frecuencia relativa. La ojiva representa grficamente la forma en que se acumulan los datos y permiten ver cuantas observaciones se hallan por arriba o debajo de ciertos valores.

Entonces: Cuando se dispone de gran nmero de datos es til distribuirlos en clases o categoras, y determinar la cantidad perteneciente a cada clase que es la frecuencia de clase. Entonces encontramos: X: gastos mensuales de un estudiante del UPSC. N: numero de estudiantes. Mediante la regla de Sturges : a) Rango: R= N mayor N menor. b) N de intervalos= 1+3.3 log(n) (+/- ) c) Amplitud del intervalo. Rango/ N de intervalo 250, 310, 390, 240, 300, 510, 220, 350, 210, 200, 300, 220, 280, 320, 210, 360, 520, 240, 360, 230, 390, 430, 270, 380, 270, 330, 350, 530, 400, 440, 340, 420, 450, 370, 260, 200, 230, 300, 540, 340, 370, 200, 380, 480, 410, 460, 470, 500, 550, 560.

a) R= 560-200= 360 b) NI = 1+3.3log(50) = 6.61 = 7 (+/- 1) = 8 o 6 c) Ai = 360/7 = 51.43 = 51 Ai= 360/8 = 45 Ai= 360/6=60 Falta histograma y polgono de frecuencia Ejemplo de datos continuos 1) Con el objeto de determinar el nmero de horas diarias que las amas de casa se dedican a ver televisin, se llev a cabo una encuesta en 35 hogares en Lima Metropolitana, obtenindose los siguientes resultados en horas: 2.8 4.2 4.9 6.0 7.1 3.3 4.4 5.2 6.1 7.2 3.4 4.5 5.6 6.5 7.3 3.5 4.8 5.6 6.6 7.4 3.5 4.8 5.7 6.9 7.5 4.1 4.9 5.8 7.1 7.5 4.2 4.9 5.9 7.1 7.5

a) Construya la tabla de distribucin de frecuencias b) Interprete los valores de f2+f3 , F5, Yi y 1- Fr4 f1 + f2 = 10 amas de casa ven televisin entre 2.8 y menos de 4.68 horas al dia F5 es el numero total de amas de casa, Yi 5 amas de casa en promedio ven televion de 3.37 horas al dia

.1 - .68571429 = 0.31428571 es el 35% de amas de casa ven televisin entre 6.56 y 7.5 horas al dia

Intervalos 2.8 - 3.74 3.74 - 4.68 4.68 - 5.62 5.62 - 6.56 6.56 - 7.5

fi 5 5 8 6 11 35

ni 0.14285714 0.14285714 0.22857143 0.17142857 0.31428571

Fi 5 10 18 24 35

Ni 0.14285714 0.28571429 0.51428571 0.68571429 1

Yi 3.27 4.21 5.15 6.09 7.03

15 10 5 0 1 2 3 4 5 Series1

15 10 5 0
2.8 - 3.74 3.74 4.68 4.68 5.62 5.62 6.56 6.56 - 7.5

Вам также может понравиться