Вы находитесь на странице: 1из 16

ESCUELA SUPERIOR POLITCNICA DE CHIMBORAZO

FACULTAD DE CIENCIAS. ESCUELA DE QUMICA

Ctedra: Estadstica
Docente: Yolanda Daz Heredia

Llegar el da en que el pensamiento estadstico ser tan necesario para ejercer la


ciudadana, como el aprender a leer y a escribir H. G. Wells.

Un da, cuando el pollito estaba rascando entre las hojas, una bellota cay del rbol y lo
golpe en la cola. Oh, dijo el pollito, el cielo se est cayendo! Voy a avisarle al rey.
El pollito hizo algo que todos hacemos de cuando en cuando: poner las cosas fuera de
proporcin. Mientras esta es una reaccin normal para un libro de cuentos de animales y
muchos seres humanos, los peritos estadsticos no deben reaccionar demasiado rpido ni
emocionalmente ante dichas situaciones. Un estadstico debe retroceder y observar
desapasionadamente para mantener un sentido claro de equilibrio y proporcin.

El campo de la estadstica es un conjunto de procedimientos para reunir, medir, clasificar,


codificar, computar, analizar y resumir informacin numrica adquirida sistemticamente. Un
curso en estadstica generalmente se percibe como aquel que involucra muchas frmulas y
clculos. De hecho, algunas operaciones matemticas estn involucradas; pero no
constituyen el catalizador de la estadstica. En realidad, la estadstica implica aprender una
nueva manera de ver las cosas, adquirir una visin de la realidad basada en el anlisis
cuidadoso de hechos, en lugar de reacciones emocionales o experiencias aisladas.

1.1RESEA HISTRICA

Histricamente la Estadstica surgi de una preocupacin por ciertos problemas del


comportamiento humano, los que nacen en conexin con los juegos de azar, esquemas de
seguro, reclutamiento y entrenamiento de grandes ejrcitos, y cosas semejantes. Es difcil
precisar con exactitud cual fue el nacimiento de la Estadstica, sin embargo se sabe que ya
en el siglo XIII se empezaron a elaborar censos del sector agrario con la finalidad de
establecer impuestos. En Inglaterra en el ao 1086 este tipo de trabajos tenan como
objetivo establecer un cuadro esttico de la sociedad o del pas y en base al cual no se
extraa ningn tipo de resultados prcticos. En la poca del Feudalismo sencillamente no
exista necesidad de la reflexin estadstica de la manera como lo entendemos en la
actualidad
Independientemente del desarrollo de la Estadstica en el siglo 16 se cre una rama de la
matemtica conocida como Teora de Probabilidades. Los jugadores de dados o cartas
deseosos de saber de que manera se poda alcanzar el premio mayor empezaron a realizar
una gran cantidad de observaciones, entre ellos haban cientficos de renombre como
Girolamo Cardano (1501-1576), fsico, astrnomo y matemtico, se le atribuye la primera
discusin sobre probabilidad en su manual para jugadores; pero fueron Pascal (1623
1662) y Fermat (1601 1665), alrededor de la primera mitad del siglo XVII quienes
desarrollaron la Teora de la Probabilidad.
Jacob Bernoulli (1654 1705) fue tambin uno de los primeros que estudiaron la
probabilidad matemtica; su nombre va asociado a varios conceptos matemticos, como los
Experimentos de Bernoulli en probabilidad.
La curva normal ha sido de mucha importancia en el desarrollo de la Estadstica. La
ecuacin de esta curva fue publicada por primera vez en 1733 por De Moivre, quien no tena
idea de su aplicacin en observaciones experimentales y su publicacin era desconocida
hasta que Karl Pearson la encontr en una biblioteca en 1924. Sin embargo, esta ecuacin
tambin fue descubierta posteriormente por dos astrnomos y matemticos: Laplace (1749
1827) y Gauss (1777 1855) independientemente, hoy en da se conoce tambin como la
curva de Gauss o campana de Gauss.
En el siglo XIX Charles Lyell encontr aplicacin de la Estadstica a un problema de
Geologa. Entre 1830 y 1833 Lyell public tres volmenes sobre Geologa donde establece
la relacin entre las rocas terciarias y sus respectivos nombres. El razonamiento de Lyell fue
esencialmente estadstico. Una vez que se establecieron y aceptaron los nombres, el
mtodo fue casi totalmente olvidado. No ha habido gelogos evolucionistas que investiguen
si fueron usadas medidas discretas, implcitas en los nombres, o si us un proceso continuo
y, si podr ser usado para hacer predicciones.
Charles Darwin (1809 1882), bilogo, recibi el segundo volumen de Lyell y se cree que su
teora fue influenciada por este libro. El trabajo de Darwin fue principalmente de naturaleza
biomtrica o estadstica. Tambin Mendel con su estudio de las plantas hbridas publicado
en 1866 tena un problema de tipo biomtrico o estadstico.
En el siglo XIX la necesidad de una profundizacin en las bases de la Estadstica se hizo
trancendental, Karl Pearson (1857 1936) fsico- matemtico ingls, inspirado en Darwin,
aplic sus matemticas a la evolucin. Pearson, considerado el padre de la Estadstica pas
casi medio siglo haciendo una profunda investigacin en Estadstica, a l se debe el estudio
de la bondad de ajuste con la distribucin X2 y el coeficiente de correlacin entre dos
variables.

-2-
Mientras Karl Pearson trabajaba con muestras de tamao grande, la teora de las muestras
grandes era inadecuada para los investigadores que tenan que trabajar con muestras
pequeas. Entre ellos estaba W.S. Gosset (1876 1937), alumno de K. Pearson y cientfico
de la cervecera Guinness. Los conocimientos matemticos de Gosset mostraron haber
sido insuficientes para el reto de encontrar distribuciones exactas de la desviacin estndar
de la muestra, del cociente de la media y ladesviacin estndar de una muestra y del
coeficiente de correlacin, estadgrafos con los cuales l comnmente trabajaba.
Consecuentemente el recurri a compilar y computar las distribuciones de frecuencias
empricas al tomar cartas de un paquete de cartas barajadas. Los resultados de estos
trabajos aparecieron en la revista Biomtrica en 1908 bajo el seudnimo de student. Hoy
en da la distribucin t de Student la cual es una herramienta bsica para los estadsticos y
experimentadores la misma que est mundialmente difundida.
El Ingls Ronald Alymer Fisher (1890 1962), especialista en Gentica y Estadstica, fue
influenciado por Karl Pearson y Gosset e hizo importantes contribuciones a la Estadstica,
precis mtodos estadsticos para la interpretacin de datos cuantitativos. Desarroll
aplicaciones de la distribucin F, por lo que lleva su nombre. Esta distribucin se utiliza para
probar hiptesis acerca de varianzas de pequeas muestras.
J. Neyman y E.S. Pearson, presentaron una teora de pruebas de hiptesis estadsticas en
1936 y 1938; esta teora promovi considerablemente la investigacin y, muchos de sus
resultados son de gran utilidad prctica.
William Sller, nacido en 1906, contribuy a la teora de la probabilidad con su trabajo sobre
el Teorema Central del Lmite Central , en su libro introdujo muchos ejemplos que explican
nuevas aplicaciones a los fenmenos biolgicos, fsicos y estadsticos.
John von Neumann (1909 1957) llev a cabo la primera demostracin del teorema
mnimax, base fundamental de la teora de juegos, que fue propuesto primeramente por
Emile Borel en 1921. Tambin fue un pionero de la teora de las computadoras, habiendo
diseado y construido el llamado MANIAC (analizador matemtico, integrador numrico y
computador) en el Instituto para Estudios Avanzados en Princeton en 1952
Abraham Wald (1902 1950) en sus dos libros Sequential Anlisis y Statistical Decisin
Fuctions alcanz grandes logros en Estadstica y sus aplicaciones.

1.2 Terminologa

Estadstica.
Es la ciencia pura y aplicada que crea, desarrolla y aplica procedimientos, en tal
forma, que se pueda evaluar la certeza de la inferencia inductiva. (Steel y Torrie)

-3-
Es la ciencia que usa mtodos para reunir, organizar, resumir, y analizar datos, as
como para obtener conclusiones vlidas y tomar decisiones razonables, a base de
tales anlisis ( Spiegel)

Se refiere a la tcnica de recoleccin, representacin, procesamiento y anlisis de un


conjunto de datos. La estadstica cumple dos funciones:
la de anlisis descriptivo en forma de tablas y grficas de las caractersticas observadas por
lo general de la muestra, y la de inferencia estadstica o induccin, logrndose a travs de
sta generalizaciones para un grupo mayor denominado poblacin, partiendo de un grupo
menor llamado muestra.

Estadstica Descriptiva: Nos permite esquematizar o mostrar datos en forma ordenada y


grfica sin sacar conclusiones de ellos. Se aplica para muestras o poblaciones.

Estadstica Inferencial: A ms de mostrar datos en forma ordenada y grfica, nos permite


tomar decisiones y sacar conclusiones o inferencias sobre la poblacin de donde se extrae
la muestra.

Bioestadstica: Es la ciencia de la matemtica aplicada, que nos permite recolectar,


analizar, interpretar y tomar decisiones sobre datos provenientes de las ciencias de la vida.

Poblacin. Es un conjunto de medidas o el recuento de todos los elementos o individuos


que presentan una caracterstica comn. El trmino poblacin se usa para denotar el
conjunto de elementos del cuales se extrae la muestra.

Los elementos que integran la poblacin o la muestra pueden corresponder a personas,


animales, objetos o cosas. Adems, el elemento puede ser una entidad simple (un
estudiante) o una entidad compleja (un curso), y se denomina unidad investigada. Es
importante resaltar el hecho de que a pesar de encontrarse una poblacin constituida por un
grupo de elementos, a la estadstica no le interesa el elemento en s, sino su caracterstica.

Caractersticas (o caracteres). Corresponden a ciertos rasgos, cualidades o propiedades


que poseen los elementos que constituyen la poblacin o la muestra. Algunos caracteres
son mensurables y se describen numricamente denominndose caracteres cuantitativos;
otros se expresan mediante palabras, smbolos (o nmeros) por no ser mensurables y se
denominan caracteres cualitativos o atributos.

-4-
Poblacin Concreta: Una poblacin concreta est delimitada e identificada en el sentido de
conocer quines y cules son sus unidades.

Poblacin Hipottica: Sus unidades se caracterizan a travs de las propiedades que lo


conforman.

Muestra. Se define como un conjunto de medidas o el recuento de una parte de los


elementos pertenecientes a una poblacin. Los elementos se seleccionan aleatoriamente,
es decir, todos los elementos que componen la poblacin tienen la misma posibilidad de ser
seleccionados. Para que una muestra sea representativa de la poblacin se requiere que las
unidades sean seleccionadas al azar, ya sea utilizando el sorteo, las tablas de nmeros
aleatorios, la seleccin sistemtica o cualquier otro mtodo que sea el azar.

Parmetros. Son todas aquellas medidas que describen numricamente la caracterstica de


una poblacin. Tambin se denomina valor verdadero, ya que una caracterstica poblacional
tendr un solo parmetro (media, proporcin, varianza, etc.). Sin embargo una poblacin
puede tener varias caractersticas y, por tanto, varios parmetros.
Generalmente los parmetros que se estiman con mayor frecuencia son: la media (), el
total ( ), la proporcin (p), la razn y la varianza.
Ejemplos en los cuales se desea conocer la media poblacional son:
La calificacin promedio de los egresados de una Facultad
El ingreso promedio por familia de una ciudad, etc.

Estimador (puntual). La descripcin numrica de una caracterstica correspondiente a la


muestra, se denomina estimador puntual o estadgrafo como por ejemplo el promedio o
media muestral, varianza muestral, proporcin muestral, etc.

Observacin. Para estudiar el colectivo se requiere de informacin individualizada (de los


individuos), las conclusiones que se obtienen de la investigacin estadstica no se refiere a
cada elemento individualmente, sino al conjunto de los individuos considerados como grupo.
Pues se debe tener en cuenta siempre que la estadstica estudia el comportamiento de los
fenmenos de grupo, prescindiendo de aquellos fenmenos individuales que pueden ser
considerados como resultados de casos aislados.

Los caracteres (variables) son las caractersticas de los individuos los mismos que son
mensurables cuantitativamente o cualitativamente. Llamamos caracter cuantitativo aquella
modalidad numrica, cuyos valores se toma sobre un conjunto finito o infinito numerable, o

-5-
sobre un subconjunto de nmeros reales. De acuerdo a esta descripcin estos caracteres se
subdividen en discretos (naturales, enteros o racionales) y continuos (la recta real numrica,
un intervalo o un segmento de la recta), por ejemplo son caracteres discretos: el nmero de
estudiantes de un colegio, el nmero de hijos de una familia, el nmero de personas de la
fila frente a una ventanilla, el nmero de estudiantes que asisten normalmente a la ctedra
de Bioestadstica, etc. y son caracteres continuos: el peso o la estatura de los estudiantes,
el salario de un jefe de familia, la resistencia de un determinado tipo de cuerda, el pH de una
solucin, la densidad de una muestra, etc.

Se conoce como caracter cualitativo aquel que toma modalidades no numricas por
ejemplo: sexo, profesin, religin, color de cabello, etc.; a los cuales es posible establecer
un nivel jerrquico o un nivel de satisfaccin asignndoles un valor; por ejemplo al carcter
sexo de un individuo se dan los valores: 1 a hombre y 2 a mujer o viceversa.

Una poblacin (o las caractersticas de una poblacin) puede ser analizada (o pueden ser
analizadas) a travs de una o varias variables aleatorias.

Si un caracter es observado sobre una parte de la poblacin, es decir, sobre una muestra y
los individuos observados son elegidos al azar, entonces el caracter se denomina variable
aleatoria (v.a.) por lo que una v.a. puede ser: cualitativa y cuantitativa discreta o cuantitativa
continua.

1.3 OBJETO Y CAMPO DE APLICACIN

Como mtodo de investigacin el objeto de la estadstica es:


La descripcin de fenmenos masivos eventualmente de procesos y
El descubrimiento de regularidades que existen en estos fenmenos o procesos

Campo de aplicacin:

1.- GENETICA : Ciencia de comunicacin biolgica entre generaciones. Lo que se transmite


de padre a hijo (tercer principio dilucidado por Johan Gregor Mendel, en 1865)
Mendel tena una mente brillante- fsica, matemtica, estadstica-. Su capacidad como
experimentador para seleccionar individuos que diferan en ciertas caractersticas
cualitativas y su meticulosidad para realizar, tabular y analizar contajes de las progenies
resultantes de sus cruzamientos, permiti llegar, ms tarde, a una clara comprensin de la
gentica de poblaciones.

-6-
Algunos atributos de plantas , animales y el hombre, se ubican en escalas continuas de
medida y se expresan mejor como kilogramos, centmetros, cuocientes de inteligencia, etc.
Estas variaciones son de naturaleza cuantitativa y se llaman caracteres cuantitativos. La
descripcin y anlisis de stos, requiere de mtodos especiales, dados por la rama de las
matemticas llamada estadstica.
El conocimiento de las leyes de azar (probabilidad), es bsico para comprender la
transmisin de factores heredables. As podemos preguntar, en familias que tienen dos
hijos, que proporcin de ellas tendrn dos varones?, varn y mujer?; dos mujeres?; ojos
claros y cafs?, etc

2.- NUTRICION: Tanto en nutricin humana como aninmal, el control de calidad de


alimentos es utilizado extensamente para mantener la uniformidad de productos
elaborados. Continuamente se est probando la bondad de nuevas dietas, que se traduzcan
en mayores ganancias de peso en aves, porcinos, etc. Un diseo experimental que permita
evaluar a nuevos balanceados producidos por casas comerciales, frente a un testigo, deja
oportunidad al investigador para seleccionar el mejor y recomendarlo al pblico.

3.- COMERCIALIZACION: A las entidades encargadas de controlar la distribucin de


productos agrcolas, interesa conocer zonas de cultivo, poca de siembra y cosecha, costos
de produccin, canales porlos que se distribuye el producto. Una encuesta bien diseada y
un muestreo adecuado, pueden dar resultados econmicos satisfactorios tanto para el
agricultor como para el consumidor.

4.- MEDICINA: La prensa informa diariamente sobre nuevos productos para controlar o
prevenir tal enfermedad; o sobre el resultado de varios mtodos, para curar el cncer. Para
conseguir esos nuevos productos o mtodos, el investigador mdico puede usar conejos o
ratas, a los que se inocula el organismo causante de la enfermedad, quiz en varias dosis,
frente a un testigo. Despus de tomar cuidadosamente los datos y del anlisis estadstico
respectivo, es posible multiplicar nuevas vacunas, sueros, etc.
En el mismo campo mdico, por medio de un simple muestreo, el profesional obtiene
inferencias sobre la sangre de sus pacientes, a travs de una sla gota.
As mismo, se puede calcular la probabilidad de que el tercer hijo de una familia que padece
de hemofilia, herede este caracter. O se puede establecer quien es el padre de un nio,
cuya madre tiene grupo sanguneo O.

5.- AGRONOMIA: El ensayo ms sencillo sera la prueba de adaptacin de algunas


variedades de trigo, en cierta localidad. Si las condiciones de fertilidad, riego, cuidados

-7-
culturales, etc., se mantienen constantes, el nico factor en estudio estar formado por las
variedades y as se podr establecer cul esla de mayor rendimiento. Si se quiere obtener
mayor informacin, es posible usar dosis de fertilizante y/o sembrar las variedades envarias
localidades, con lo que se ampla el alcance de las inferencias.

6.- INFORMACION GENERAL: Un muestreo bien diseado puede predecir el resultado de


las prximas elecciones, informar sobre las preferencias del consumidor, los gustos
alimenticios, las preferencias de programas de radio y televisin, etc

Actividades de Aprendizaje No. 1

1. Qu significado tiene cada uno de los siguientes trminos: Poblacin, muestra,


parmetro, estimador? Indique un ejemplo de cada uno de los trminos.

2. Cul es el campo de aplicacin de la estadstica?

3. Clasifique cada uno de los siguientes datos segn pertenezcan al tipo: nominales,
ordinales, discretos o continuos.
Temperatura en grados Celsius
Accidentes de trabajo en una fbrica
pH de un lquido conocido
Arboles talados en el ao 2012 en el pas
Pulsaciones del corazn
Edad de un conejo de laboratorio
Tiempo de incubacin de un huevo de gallina

4. Mire la edicin ms reciente del peridico y encuentre ejemplos de cada tipo de datos.
Resuma brevemente sus hallazgos por escrito

5. Con sus propias palabras de un concepto de estadstica.

6.- Explique la diferencia entre: Variable cualitativa y cuantitativa; Variable discreta y


continua. De un ejemplo de cada una

7. Por qu est Ud. aprendiendo estadstica?

-8-
8 Qu le gustara investigar?.

-9-
2.1 ORGANIZACIN Y PRESENTACIN DE DATOS

La Estadstica Descriptiva o deductiva tiene como finalidad colocar en evidencia aspectos


caractersticos (promedios, variabilidad de calificaciones, etc.), que sirven para efectuar
comparaciones sin pretender sacar conclusiones de tipo ms general. Esta descripcin se
realiza a travs de la elaboracin de cuadros, grficos, clculos de promedios, varianzas,
proporciones y mediante el anlisis de regresin.

2.1.1 Variables cualitativas

Las variables cualitativas estn caracterizadas por observaciones no numricas, no obstante


pueden ser codificadas mediante smbolos numricos, observando pero que el orden de
codificacin es del todo arbitrario. Indiquemos con E = 1, 2, ... ,k} una posible codificacin
de las observaciones realizadas y sea mi el nmero de individuos que tiene resultado

mi
i=1,...,k , al mismo que se denomina frecuencia absoluta. Se indica con f i frecuencia
m
relativa del resultado i-simo, m indica el nmero total de individuos. Estas frecuencias
satisfacen las siguientes propiedades:

Ejemplo: Calificaciones de 25 estudiantes en la asignatura Bioestadstica


i ESCALA FRECUENCI FRECUENCIA PORCENTAJE
Codificacin (1) A RELATIVA (3)*100%
ABSOLUTA (3) (4)
(2)
1 S 10 0.40 40%
2 MB 2 0.08 8%
3 B 7 0.28 28%
4 R 3 0.12 12%
5 I 3 0.12 12%
TOTAL 25 1.00 100%

Para este tipo de variables, las representaciones grficas usuales son: grficos de barras y
de pastel.

2.1.2 Variables Cuantitativas

- 10 -
Si los resultados de una investigacin nos lleva a obtener valores numricos se tienen
entonces las variables llamadas cuantitativas, cuyos valores numricos tienen su
importancia, los datos de una variable X se pueden representar con histogramas. En
muchos casos, por ejemplo si las variables asumen valores en un conjunto continuo (en un
intervalo o en la recta de los reales), o sea variables continuas, es til reagrupar los datos en
clases.
Las representaciones grficas utilizadas en este tipo de variables son generalmente:
Histogramas, polgonos de frecuencia y ojivas.

Ejemplo: Los siguientes datos son los tiempos en minutos, para que 50 individuos accedan
a un turno en una clnica particular para realizarse una prueba sangunea:
2.3 0.2 2.9 0.4 2.8 3.1 3.7 7.2 1.6 1.9
2.4 4.4 5.8 2.8 3.3 2.4 4.6 3.8 1.5 2.7
3.3 9.7 2.5 5.6 9.5 0.4 1.3 1.1 5.5 3.4
1.8 4.7 0.7 6.2 1.2 4.2 1.2 0.5 6.8 5.2
7.8 0.8 0.9 0.4 1.3 6.3 7.6 1.4 0.5 1.4

Nota. En la prctica se obtienen buenos resultados si se hace la seleccin del nmero de


clases considerando la raz cuadrada de n.

Cada clase esta definida por dos valores, estos valores constituyen los lmites reales de las
clases. El lmite real superior de una clase es el lmite inferior de la siguiente.
La diferencia entre los lmites reales de una clase constituye el intervalo de la clase. Se
llama marca de clase o punto medio al valor correspondiente al punto central de su intervalo.

Cuando tenemos ya determinado las clases clasificamos y contamos los individuos incluidos
en cada clase. El nmero resultante se denomina frecuencia absoluta de la clase
respectiva. El nmero de individuos de una clase se puede expresar tambin mediante su
frecuencia relativa, bien en forma de proporcin (cociente entre la frecuencia absoluta de
esa clase y el nmero total de individuos de la muestra) o bien en forma de porcentaje
(frecuencia referida a 100 individuos de la muestra).

Del ejemplo se tiene la siguiente tabla.

Clase Asignacin Recuento


0.5 ||||||||| 9
1.5 ||||||||||| 11
2.5 |||||||| 8
3.5 ||||||| 6
4.5 |||| 4

- 11 -
5.5 |||| 4
6.5 ||| 3
7.5 ||| 3
8.5 0
9.5 || 2
Asignacin de los individuos de una muestra utilizando las marcas de clase

Con los datos de este problema realicemos:


a) Tabla de frecuencias
b) Histograma.
c) Polgono de frecuencias
d) Ojiva

Solucin.
a) Reglas generales para construir las distribuciones de frecuencia:
Determinar el mayor y el menor entre los datos registrados para luego calcular el rango
(diferencia entre el mayor y el menor valor de los valores).
rango = 9.7 - 0.2 = 9.5

Dividir el rango en un nmero conveniente de intervalos de clase del mismo tamao (igual
longitud). Si esto no es posible, entonces utilizar intervalos de clase de diferente tamao. El
nmero de clases que se emplea para clasificar los datos depende del total de
observaciones. Como anteriormente se dijo, si el nmero de observaciones es relativamente
pequeo, la experiencia muestra que el nmero de clases a emplear es generalmente mayor
o igual a 5. Si existe una cantidad grande de datos, el nmero de clases debe encontrarse
entre 8 y 12 y generalmente no existirn ms de 15 o 20 clases. Para este problema se
decidi utilizar 10 clases.
Determinar el nmero de observaciones que caen en cada clase (recuento de datos). La
tabla de frecuencias que se obtiene es:

TABLA DE FRECUENCIAS 1 (EJERCICIO TIPO)


No. Clase Lm Lm. Punto Frec. De Frec. Rel. Porcentaje
I Inf. Sup. medio clase fi %
ci ni

- 12 -
1 (0. - 1] 0 1 0.5 9 0.18 18%
2 (1 2] 1 2 1.5 11 0.22 22%
3 (2 3] 2 3 2.5 8 0.16 16%
4 (3 - 4] 3 4 3.5 6 0.12 12%
5 (4 - 5] 4 5 4.5 4 0.08 8%
6 (5 - 6] 5 6 5.5 4 0.08 8%
7 (6 - 7] 6 7 6.5 3 0.06 6%
8 (7 - 8] 7 8 7.5 3 0.06 6%
9 (8 - 9] 8 9 8.5 0 0.00 0%
10 (9- 10] 9 10 9.5 2 0.04 4%
Total n=50 1.00 100%

La columna de las frecuencias relativas se denomina nuevamente distribucin de


frecuencias relativas o simplemente distribucin.

Las tablas estadsticas presentadas son la expresin escrita de la distribucin de


frecuencias de los individuos de una muestra respecto a una variable.

Nota. Las frecuencias relativas fi expresan la asignacin de cada observacin a una


determinada clase y por la primera propiedad de las frecuencias sus valores siempre estn
entre 0 y 1, es decir, son nmeros decimales o fracciones que en lo cotidiano no son
utilizadas, por ejemplo 0.05, 0.5, 0.14, etc.; pero si se escucha a menudo cinco por ciento,
cincuenta por ciento o catorce por ciento, los que se indican por 5%, 50% o 14% que son
nmeros decimales multiplicados por 100% a los que se les denomina porcentajes.

b) Las distribuciones pueden ser representadas grficamente por histogramas.

Un histograma es un conjunto de rectngulos que se determinan representando las


frecuencias relativas en el eje vertical contra los lmites reales inferiores, para cada una de
las clases en el eje horizontal del plano cartesiano.
La importancia radica en la interpretacin de esta representacin grfica. Formalmente,
observando un histograma se pueden contestar varias preguntas. Por ejemplo:
Cules son las mediciones ms comunes?. Para ello hay que observar la barra o el
grupo de barras ms altos.
Hay un comportamiento simtrico? Hay sesgo?Hacia qu lado? Para responder a
estas preguntas basta con observar la forma del histograma.
Cmo es la dispersin? Para contestar hay que observar a partir del grupo de barras
ms alto qu tan rpido disminuye la frecuencia de las dems barras.
Cuntos picos hay? Cuando hay varios picos o agrupaciones de barras en un
histograma, puede deberse a que el material procede de distintas cadenas de

- 13 -
produccin, de diferentes proveedores, han intervenido varios operadores o se han
utilizado distintos instrumentos de medicin sin sincronizar.
Hay datos aislados o raros? Un pequeo grupo de mediciones muy extremas o raras es
fcilmente detectable en un histograma ya que aparece claramente aislado del resto. Un
dato raro refleja una situacin especial que se debe investigar, puede ser un error de
medicin o de dedo, pero tambin puede reflejar un comportamiento especial. En
cualquier caso se debe investigar a qu se debe.

El conjunto de datos tambin se representan por polgonos de frecuencia. Para trazar


un polgono de frecuencias se deben calcular las alturas hi, en nuestro problema
coinciden con las frecuencias relativas, a ms de los puntos medios ci , i=1,2,...,10 de las
clases y luego se une los puntos (ci , hi) con segmentos de rectas.

De los dos diagramas se observa que los datos del tiempo de transaccin bancaria se
agrupan alrededor de la segunda clase representada por el punto medio 2.5 minutos.

d) La frecuencia total de todos los valores menores que el lmite real superior de un intervalo
de clase se conoce como frecuencia absoluta o relativa acumulada, hasta ese valor de clase
inclusive. De esta definicin se obtiene los resultados de las dos ltimas columnas de la
tabla siguiente.
TABLA DE FRECUENCIAS
No. De Clase L L Punto Frec. de Frec. Rel. Porcentaj Frec. Frec.Acu
clase m m medio clase ni fi e Acum. m
i Inf. Su ci % Absoluta Relativa
p. Fi Fi
1 (0. - 1] 0 1 0.5 9 0.18 18% 9 0.18
2 (1 - 2] 1 2 1.5 11 0.22 22% 20 0.40
3 (2 - 3] 2 3 2.5 8 0.16 16% 28 0.56
4 (3 - 4] 3 4 3.5 6 0.12 12% 34 0.68

- 14 -
5 (4 - 5] 4 5 4.5 4 0.08 8% 38 0.76
6 (5 - 6] 5 6 5.5 4 0.08 8% 42 0.84
7 (6 - 7] 6 7 6.5 3 0.06 6% 45 0.90
8 (7 - 8] 7 8 7.5 3 0.06 6% 48 0.96
9 (8 - 9] 8 9 8.5 0 0.00 0% 48 0.96
10 (9- 10] 9 10 9.5 2 0.04 4% 50 1.00
Total n =50 1.00 100%

La columna de las frecuencias acumulativas se denomina distribucin de frecuencias


acumulativas o ms brevemente distribucin acumulativa, la misma que se puede graficar,
en el eje vertical se anotar la frecuencia relativa (o absoluta) acumulada de una clase
contra el lmite inferior de la siguiente sobre el eje horizontal y uniendo con segmentos todos
los puntos consecutivos, dan lugar al polgono de frecuencias acumuladas u ojiva.
OJIVA

POLIGONO DE FRECUENCIAS ACUMULADAS


1
F 0,9
R 0,8
E
0,7
C
U 0,6
E 0,5
N 0,4
C
0,3
I
A 0,2
S 0,1
0
0 1 2 3 4 5 6 7 8 9 10
LIMITES INFERIORES DE CLASE

Observacin. Tanto los diagramas de barras como los histogramas tienen por objeto:

- 15 -
1) Demostrar el perfil de distribucin de los datos. El conocimiento de este perfil es til en
varias situaciones, como sugerirn los anlisis apropiados de la inferencia estadstica:
estimacin de parmetros, prueba de hiptesis, anlisis de la varianza, etc.

2) Dar una idea de la dispersin y la ubicacin de algunas medidas de tendencia central:


moda, mediana y media.

- 16 -

Вам также может понравиться