Академический Документы
Профессиональный Документы
Культура Документы
Ctedra: Estadstica
Docente: Yolanda Daz Heredia
Un da, cuando el pollito estaba rascando entre las hojas, una bellota cay del rbol y lo
golpe en la cola. Oh, dijo el pollito, el cielo se est cayendo! Voy a avisarle al rey.
El pollito hizo algo que todos hacemos de cuando en cuando: poner las cosas fuera de
proporcin. Mientras esta es una reaccin normal para un libro de cuentos de animales y
muchos seres humanos, los peritos estadsticos no deben reaccionar demasiado rpido ni
emocionalmente ante dichas situaciones. Un estadstico debe retroceder y observar
desapasionadamente para mantener un sentido claro de equilibrio y proporcin.
1.1RESEA HISTRICA
-2-
Mientras Karl Pearson trabajaba con muestras de tamao grande, la teora de las muestras
grandes era inadecuada para los investigadores que tenan que trabajar con muestras
pequeas. Entre ellos estaba W.S. Gosset (1876 1937), alumno de K. Pearson y cientfico
de la cervecera Guinness. Los conocimientos matemticos de Gosset mostraron haber
sido insuficientes para el reto de encontrar distribuciones exactas de la desviacin estndar
de la muestra, del cociente de la media y ladesviacin estndar de una muestra y del
coeficiente de correlacin, estadgrafos con los cuales l comnmente trabajaba.
Consecuentemente el recurri a compilar y computar las distribuciones de frecuencias
empricas al tomar cartas de un paquete de cartas barajadas. Los resultados de estos
trabajos aparecieron en la revista Biomtrica en 1908 bajo el seudnimo de student. Hoy
en da la distribucin t de Student la cual es una herramienta bsica para los estadsticos y
experimentadores la misma que est mundialmente difundida.
El Ingls Ronald Alymer Fisher (1890 1962), especialista en Gentica y Estadstica, fue
influenciado por Karl Pearson y Gosset e hizo importantes contribuciones a la Estadstica,
precis mtodos estadsticos para la interpretacin de datos cuantitativos. Desarroll
aplicaciones de la distribucin F, por lo que lleva su nombre. Esta distribucin se utiliza para
probar hiptesis acerca de varianzas de pequeas muestras.
J. Neyman y E.S. Pearson, presentaron una teora de pruebas de hiptesis estadsticas en
1936 y 1938; esta teora promovi considerablemente la investigacin y, muchos de sus
resultados son de gran utilidad prctica.
William Sller, nacido en 1906, contribuy a la teora de la probabilidad con su trabajo sobre
el Teorema Central del Lmite Central , en su libro introdujo muchos ejemplos que explican
nuevas aplicaciones a los fenmenos biolgicos, fsicos y estadsticos.
John von Neumann (1909 1957) llev a cabo la primera demostracin del teorema
mnimax, base fundamental de la teora de juegos, que fue propuesto primeramente por
Emile Borel en 1921. Tambin fue un pionero de la teora de las computadoras, habiendo
diseado y construido el llamado MANIAC (analizador matemtico, integrador numrico y
computador) en el Instituto para Estudios Avanzados en Princeton en 1952
Abraham Wald (1902 1950) en sus dos libros Sequential Anlisis y Statistical Decisin
Fuctions alcanz grandes logros en Estadstica y sus aplicaciones.
1.2 Terminologa
Estadstica.
Es la ciencia pura y aplicada que crea, desarrolla y aplica procedimientos, en tal
forma, que se pueda evaluar la certeza de la inferencia inductiva. (Steel y Torrie)
-3-
Es la ciencia que usa mtodos para reunir, organizar, resumir, y analizar datos, as
como para obtener conclusiones vlidas y tomar decisiones razonables, a base de
tales anlisis ( Spiegel)
-4-
Poblacin Concreta: Una poblacin concreta est delimitada e identificada en el sentido de
conocer quines y cules son sus unidades.
Los caracteres (variables) son las caractersticas de los individuos los mismos que son
mensurables cuantitativamente o cualitativamente. Llamamos caracter cuantitativo aquella
modalidad numrica, cuyos valores se toma sobre un conjunto finito o infinito numerable, o
-5-
sobre un subconjunto de nmeros reales. De acuerdo a esta descripcin estos caracteres se
subdividen en discretos (naturales, enteros o racionales) y continuos (la recta real numrica,
un intervalo o un segmento de la recta), por ejemplo son caracteres discretos: el nmero de
estudiantes de un colegio, el nmero de hijos de una familia, el nmero de personas de la
fila frente a una ventanilla, el nmero de estudiantes que asisten normalmente a la ctedra
de Bioestadstica, etc. y son caracteres continuos: el peso o la estatura de los estudiantes,
el salario de un jefe de familia, la resistencia de un determinado tipo de cuerda, el pH de una
solucin, la densidad de una muestra, etc.
Se conoce como caracter cualitativo aquel que toma modalidades no numricas por
ejemplo: sexo, profesin, religin, color de cabello, etc.; a los cuales es posible establecer
un nivel jerrquico o un nivel de satisfaccin asignndoles un valor; por ejemplo al carcter
sexo de un individuo se dan los valores: 1 a hombre y 2 a mujer o viceversa.
Una poblacin (o las caractersticas de una poblacin) puede ser analizada (o pueden ser
analizadas) a travs de una o varias variables aleatorias.
Si un caracter es observado sobre una parte de la poblacin, es decir, sobre una muestra y
los individuos observados son elegidos al azar, entonces el caracter se denomina variable
aleatoria (v.a.) por lo que una v.a. puede ser: cualitativa y cuantitativa discreta o cuantitativa
continua.
Campo de aplicacin:
-6-
Algunos atributos de plantas , animales y el hombre, se ubican en escalas continuas de
medida y se expresan mejor como kilogramos, centmetros, cuocientes de inteligencia, etc.
Estas variaciones son de naturaleza cuantitativa y se llaman caracteres cuantitativos. La
descripcin y anlisis de stos, requiere de mtodos especiales, dados por la rama de las
matemticas llamada estadstica.
El conocimiento de las leyes de azar (probabilidad), es bsico para comprender la
transmisin de factores heredables. As podemos preguntar, en familias que tienen dos
hijos, que proporcin de ellas tendrn dos varones?, varn y mujer?; dos mujeres?; ojos
claros y cafs?, etc
4.- MEDICINA: La prensa informa diariamente sobre nuevos productos para controlar o
prevenir tal enfermedad; o sobre el resultado de varios mtodos, para curar el cncer. Para
conseguir esos nuevos productos o mtodos, el investigador mdico puede usar conejos o
ratas, a los que se inocula el organismo causante de la enfermedad, quiz en varias dosis,
frente a un testigo. Despus de tomar cuidadosamente los datos y del anlisis estadstico
respectivo, es posible multiplicar nuevas vacunas, sueros, etc.
En el mismo campo mdico, por medio de un simple muestreo, el profesional obtiene
inferencias sobre la sangre de sus pacientes, a travs de una sla gota.
As mismo, se puede calcular la probabilidad de que el tercer hijo de una familia que padece
de hemofilia, herede este caracter. O se puede establecer quien es el padre de un nio,
cuya madre tiene grupo sanguneo O.
-7-
culturales, etc., se mantienen constantes, el nico factor en estudio estar formado por las
variedades y as se podr establecer cul esla de mayor rendimiento. Si se quiere obtener
mayor informacin, es posible usar dosis de fertilizante y/o sembrar las variedades envarias
localidades, con lo que se ampla el alcance de las inferencias.
3. Clasifique cada uno de los siguientes datos segn pertenezcan al tipo: nominales,
ordinales, discretos o continuos.
Temperatura en grados Celsius
Accidentes de trabajo en una fbrica
pH de un lquido conocido
Arboles talados en el ao 2012 en el pas
Pulsaciones del corazn
Edad de un conejo de laboratorio
Tiempo de incubacin de un huevo de gallina
4. Mire la edicin ms reciente del peridico y encuentre ejemplos de cada tipo de datos.
Resuma brevemente sus hallazgos por escrito
-8-
8 Qu le gustara investigar?.
-9-
2.1 ORGANIZACIN Y PRESENTACIN DE DATOS
mi
i=1,...,k , al mismo que se denomina frecuencia absoluta. Se indica con f i frecuencia
m
relativa del resultado i-simo, m indica el nmero total de individuos. Estas frecuencias
satisfacen las siguientes propiedades:
Para este tipo de variables, las representaciones grficas usuales son: grficos de barras y
de pastel.
- 10 -
Si los resultados de una investigacin nos lleva a obtener valores numricos se tienen
entonces las variables llamadas cuantitativas, cuyos valores numricos tienen su
importancia, los datos de una variable X se pueden representar con histogramas. En
muchos casos, por ejemplo si las variables asumen valores en un conjunto continuo (en un
intervalo o en la recta de los reales), o sea variables continuas, es til reagrupar los datos en
clases.
Las representaciones grficas utilizadas en este tipo de variables son generalmente:
Histogramas, polgonos de frecuencia y ojivas.
Ejemplo: Los siguientes datos son los tiempos en minutos, para que 50 individuos accedan
a un turno en una clnica particular para realizarse una prueba sangunea:
2.3 0.2 2.9 0.4 2.8 3.1 3.7 7.2 1.6 1.9
2.4 4.4 5.8 2.8 3.3 2.4 4.6 3.8 1.5 2.7
3.3 9.7 2.5 5.6 9.5 0.4 1.3 1.1 5.5 3.4
1.8 4.7 0.7 6.2 1.2 4.2 1.2 0.5 6.8 5.2
7.8 0.8 0.9 0.4 1.3 6.3 7.6 1.4 0.5 1.4
Cada clase esta definida por dos valores, estos valores constituyen los lmites reales de las
clases. El lmite real superior de una clase es el lmite inferior de la siguiente.
La diferencia entre los lmites reales de una clase constituye el intervalo de la clase. Se
llama marca de clase o punto medio al valor correspondiente al punto central de su intervalo.
Cuando tenemos ya determinado las clases clasificamos y contamos los individuos incluidos
en cada clase. El nmero resultante se denomina frecuencia absoluta de la clase
respectiva. El nmero de individuos de una clase se puede expresar tambin mediante su
frecuencia relativa, bien en forma de proporcin (cociente entre la frecuencia absoluta de
esa clase y el nmero total de individuos de la muestra) o bien en forma de porcentaje
(frecuencia referida a 100 individuos de la muestra).
- 11 -
5.5 |||| 4
6.5 ||| 3
7.5 ||| 3
8.5 0
9.5 || 2
Asignacin de los individuos de una muestra utilizando las marcas de clase
Solucin.
a) Reglas generales para construir las distribuciones de frecuencia:
Determinar el mayor y el menor entre los datos registrados para luego calcular el rango
(diferencia entre el mayor y el menor valor de los valores).
rango = 9.7 - 0.2 = 9.5
Dividir el rango en un nmero conveniente de intervalos de clase del mismo tamao (igual
longitud). Si esto no es posible, entonces utilizar intervalos de clase de diferente tamao. El
nmero de clases que se emplea para clasificar los datos depende del total de
observaciones. Como anteriormente se dijo, si el nmero de observaciones es relativamente
pequeo, la experiencia muestra que el nmero de clases a emplear es generalmente mayor
o igual a 5. Si existe una cantidad grande de datos, el nmero de clases debe encontrarse
entre 8 y 12 y generalmente no existirn ms de 15 o 20 clases. Para este problema se
decidi utilizar 10 clases.
Determinar el nmero de observaciones que caen en cada clase (recuento de datos). La
tabla de frecuencias que se obtiene es:
- 12 -
1 (0. - 1] 0 1 0.5 9 0.18 18%
2 (1 2] 1 2 1.5 11 0.22 22%
3 (2 3] 2 3 2.5 8 0.16 16%
4 (3 - 4] 3 4 3.5 6 0.12 12%
5 (4 - 5] 4 5 4.5 4 0.08 8%
6 (5 - 6] 5 6 5.5 4 0.08 8%
7 (6 - 7] 6 7 6.5 3 0.06 6%
8 (7 - 8] 7 8 7.5 3 0.06 6%
9 (8 - 9] 8 9 8.5 0 0.00 0%
10 (9- 10] 9 10 9.5 2 0.04 4%
Total n=50 1.00 100%
- 13 -
produccin, de diferentes proveedores, han intervenido varios operadores o se han
utilizado distintos instrumentos de medicin sin sincronizar.
Hay datos aislados o raros? Un pequeo grupo de mediciones muy extremas o raras es
fcilmente detectable en un histograma ya que aparece claramente aislado del resto. Un
dato raro refleja una situacin especial que se debe investigar, puede ser un error de
medicin o de dedo, pero tambin puede reflejar un comportamiento especial. En
cualquier caso se debe investigar a qu se debe.
De los dos diagramas se observa que los datos del tiempo de transaccin bancaria se
agrupan alrededor de la segunda clase representada por el punto medio 2.5 minutos.
d) La frecuencia total de todos los valores menores que el lmite real superior de un intervalo
de clase se conoce como frecuencia absoluta o relativa acumulada, hasta ese valor de clase
inclusive. De esta definicin se obtiene los resultados de las dos ltimas columnas de la
tabla siguiente.
TABLA DE FRECUENCIAS
No. De Clase L L Punto Frec. de Frec. Rel. Porcentaj Frec. Frec.Acu
clase m m medio clase ni fi e Acum. m
i Inf. Su ci % Absoluta Relativa
p. Fi Fi
1 (0. - 1] 0 1 0.5 9 0.18 18% 9 0.18
2 (1 - 2] 1 2 1.5 11 0.22 22% 20 0.40
3 (2 - 3] 2 3 2.5 8 0.16 16% 28 0.56
4 (3 - 4] 3 4 3.5 6 0.12 12% 34 0.68
- 14 -
5 (4 - 5] 4 5 4.5 4 0.08 8% 38 0.76
6 (5 - 6] 5 6 5.5 4 0.08 8% 42 0.84
7 (6 - 7] 6 7 6.5 3 0.06 6% 45 0.90
8 (7 - 8] 7 8 7.5 3 0.06 6% 48 0.96
9 (8 - 9] 8 9 8.5 0 0.00 0% 48 0.96
10 (9- 10] 9 10 9.5 2 0.04 4% 50 1.00
Total n =50 1.00 100%
Observacin. Tanto los diagramas de barras como los histogramas tienen por objeto:
- 15 -
1) Demostrar el perfil de distribucin de los datos. El conocimiento de este perfil es til en
varias situaciones, como sugerirn los anlisis apropiados de la inferencia estadstica:
estimacin de parmetros, prueba de hiptesis, anlisis de la varianza, etc.
- 16 -