Академический Документы
Профессиональный Документы
Культура Документы
INTRODUCCIN
ESTADSTICA
NELLY SNCHEZ GMEZ
UNIDADES
1. Estadstica descriptiva.
2. Variables aleatorias discretas y continuas.
3. Estimacin y prueba de hiptesis.
4. Anlisis de la regresin.
5. Diseo de experimentos
CONCEPTOS BSICOS
Estadstica
Descriptiva:
Inferencial:
Concepto
Definicin
Elemento o individuo
Es cualquier objeto o ser que porte informacin sobre el fenmeno que se estudia. Si estudiamos la
altura de los rboles, cada rbol es un individuo
Poblacin
Conjunto de todos los individuos o elementos (personas, objetos, animales, etc.) de una poblacin,
que tienen ciertas caractersticas en comn y que porten informacin sobre el fenmeno que se
estudia, es la totalidad de los elementos o cosas bajo estudio.
Muestra:
Dato:
Parmetro
Estadstico
Variable
Es cierta caracterstica o fenmeno que puede adoptar diversos valores, las variables pueden ser
cuantitativas y cualitativas.
02/03/2016
Variables
Cualitativas: son aquellas que tienen
naturaleza de categora o clase, no se
pueden medir numricamente.
ESTADSTICA DESCRIPTIVA
UNIDAD 1
TEMAS
1.1. Introduccin.
1.2. Datos no agrupados.
1.3. Datos agrupados.
1.4. Representacin grfica.
4. Determinar el tamao de los intervalos, se debe procurar que sea un valor impar. Esto permitir tener como
punto medio un valor con menos fracciones.
El lmite aparente inferior del primer intervalo es el valor mnimo del conjunto de datos.
El lmite aparente superior de dicho intervalo ser el valor que incluya la amplitud considerada.
6. Realizar el conteo o acomodamiento de los datos en su respectivo intervalo. Obtener las frecuencias absolutas.
7. Determinar los lmites reales de cada uno de los intervalos.
Lmite real inferior = lmites aparente inferior menos la mitad del valor de enlace.
Lmite real superior = lmites aparente superior ms la mitad del valor de enlace.
02/03/2016
8. Determinar los puntos medios o marcas de clase, se calculan mediante los siguientes criterios
9. Obtener las frecuencias relativas. Frecuencia relativa = frecuencia absoluta de cada intervalo/ total de
frecuencias.
10. Obtener las frecuencias acumuladas (sumar y acumular las frecuencias de cada uno de los intervalos).
11. Obtener las frecuencias porcentuales acumuladas (sumar y acumular las frecuencias relativas de cada
uno de los intervalos o dividir las frecuencias acumuladas de c/u de los intervalos entre el total de
frecuencias).
.
= .
.
=
= .
MODA
Para calcular la moda en datos no agrupados debe localizarse el valor (o valores) que se repite ms veces y ese ser la
moda, un conjunto de datos puede tener una, dos, tres, o ms modas.
Para calcular la moda en datos agrupados debe calcularse el punto medio del intervalo que contenga la mxima
frecuencia.
En este caso la moda es 6.1 y 7.0, ya que son los puntos medios que tiene la mxima frecuencia (6)
VARIANZA.- Indica la desviacin promedio de los datos respecto a la media aritmtica expresada en
unidades cuadradas. Esta medida eleva al cuadrado las desviaciones de los datos respecto a la media
aritmtica, con lo cual se elimina la posibilidad de que dicha suma sea cero. Elevando al cuadrado la
desviacin tpica se obtiene la varianza.
Para calcular la varianza la frmula a utilizar es:
MEDIDAS DE DISPERSIN
DESVIACIN TPICA O DESVIACIN ESTNDAR.- Indica la desviacin promedio de los datos respecto a la
media aritmtica expresada en unidades originales. Esta medida eleva al cuadrado las desviaciones de los
datos respecto a la media aritmtica, con lo cual se elimina la posibilidad de que dicha suma sea cero.
Obteniendo la raz cuadrada de la varianza se obtiene la desviacin tpica.
Clculo de la desviacin tpica.
Frmula para su clculo:
Datos de una poblacin
2
1
02/03/2016
DISTRIBUCIONES DE PROBABILIDAD
DISTRIBUCIN BINOMIAL
Distribucin normal
Si los valores de una variable se distribuyen normalmente y adems se transforman en calificaciones
estndar Z, entonces dichos datos quedan expresados en unidades de la curva normal estndar, cuyas
propiedades son:
a) Su media aritmtica es cero.
b) La desviacin tpica y la varianza tienen un valor de uno.
Ejemplo: Se tira una moneda 10 veces: cuantas caras salen? Si no ha salido ninguna la variable toma el
valor 0; si han salido dos caras la variable toma el valor 2; si todas han sido cara la variable toma el valor 10
DISTRIBUCIN POISSON
!
! !
Esta distribucin es adecuada para variables discreta, y nos permite calcular probabilidades de eventos que
tienen probabilidades muy pequeas en una unidad de tiempo, distancia, espacio etc., Si un experimento
binomial tiene un nmero de repeticiones grande (n >30) y una probabilidad de xito muy pequea (p
0.10) entonces el clculo de las probabilidades es conveniente hacerlas mediante la distribucin Poisson,
cuya frmula es:
p es la probabilidad de xito, es decir, que salga "cara" al lanzar la moneda. Por lo tanto p = 0,5
q probabilidad de fracaso La frmula quedara:
6 =
10!
0.56(.05)106
10 6 ! 6!
6 = 0.205 20.5%
DISTRIBUCIN HIPERGEOMETRICA
Esta distribucin es adecuada para variables discretas y se utiliza en experimentos que tienen dos posibles
resultados o estos se pueden agrupar en xitos y fracasos, adems las repeticiones del experimento son
dependientes y su probabilidad de xito es variable en cada una de las repeticiones del experimento,
generalmente se presentan en experimentos que se realizan sin reposicin y su frmula es:
donde:
= n p = media aritmtica
2 =
( )2
Al nmero de variables independientes en la suma se llama grados de libertad y resulta ser el parmetro de la
distribucin. x2v = z2 1 z22 z23 ...... z2v La forma de la grfica de x2 depende de los grados de libertad, ya que
a medida que aumenta el tamao el tamao de la muestra, aumentan los grados de libertad y la semejanza con
la distribucin con la normal es mayor.
02/03/2016
DISTRIBUCIN T DE STUDENT
PRUEBAS DE HIPTESIS
En las investigaciones es de gran importancia realizar estudios pilotos o preliminares, con el fin de
obtener informacin relevante que nos permita corregir o afianzar la investigacin, en dichos estudios es
importante trabajar con muestras pequeas, ya que nos proporcionan informacin sobre los posibles
resultados de la investigacin.
Un ejemplo prctico del uso de la estadstica en la vida diaria lo son las pruebas de hiptesis, cuyo objeto
es probar, en base a una muestra, si el valor de un parmetro se ajusta o no a ciertas especificaciones requeridas
atendiendo a un nivel de probabilidad, as podremos probar.
t=
a).- Si la diferencia entre dos estadsticos (promedios, proporciones, varianzas etc.,) se deben al proceso
aleatorio o realmente constituyen una diferencia.
b). Si dos muestras provienen de la misma poblacin
c). Si la diferencia entre dos tratamientos es o no significativa.
Donde:
=
= .
La informacin con la que se trabaja en las pruebas de hiptesis es incompleta, ya que generalmente
proviene de muestras, por lo que las decisiones que se tomen no pueden considerarse seguras en un 100%, es
decir, que existe el riesgo de cometer error al tomar una decisin.
Hiptesis, es una suposicin terica que se acepta provisionalmente para explicar ciertos hechos
El procedimiento para tomar decisiones a partir de una muestra en las pruebas de hiptesis es el siguiente:
a). Asignar una probabilidad pequea (10%, 5%; 3%, 2%, 1.0%, 0.5%, etc.) de cometer un error.
b). Plantear las hiptesis estadsticas: nula (Ho: = o) y alterna (Ha: o Ha: o Ha: o)
c). Obtener el estadstico de prueba Z (si la muestra es mayor o igual de 30) o t (si la muestra es menor de 30)
(Ho: =
Ho:
Hiptesis Alterna no Direccional o Bilateral (Ha: o) Afirma que el parmetro de la poblacin tiene un valor
diferente al hipottico, sin indicar el sentido o direccin de esa diferencia.
H i p t e s i s n u l a (Ho)
Decisin
R e c h a z a r Ho:
No rechazar Ho:
Verdadera
Error tipo I ()
No hay error
En las pruebas de hiptesis estadsticas hay cuatro posibilidades de tomar una decisin:
1. Aceptar una hiptesis cierta, no implica error
2. Rechazar una hiptesis cierta, es un error tipo I ()
3. Aceptar una hiptesis falsa, un error tipo II ()
4. Rechazar una hiptesis falsa, no implica error
VALOR P
Falsa
No hay error
Error tipo II( )
El valor p es el nivel de significancia () mnimo que permite rechazar Ho, es decir que si () toma un valor
menor que el de p (el nivel de confianza aumentara) Ho no se rechazara y si adopta un valor mayor que p (el
nivel de confianza disminuir) entonces Ho se rechazara
Ejemplo: supongamos que
a) El valor de Z calculada es de 3.12, y n = 40
b) Las hiptesis son: (Ho: = 75) y (Ha: 75)
c) Si buscamos el valor de - 3.12 en tablas de Z obtendremos 0.4991, por lo que 0.5000-0.4991=0.0009, este valor
es de ()/2=0.0009, es decir que el valor total de () ser 2(0.0009) = 0.0018, y en consecuencia el nivel de
confianza es del 99.82%.( ya que 1.0000-.0018=0.9982) y el valor de p=0.0018.
02/03/2016
MUESTREO
Justificaciones del muestreo.
El muestreo es un conjunto de tcnicas que nos permiten seleccionar elementos de una poblacin
en forma conveniente para estimar de manera eficiente los valores de los parmetros.
Tipos de muestreo
El muestreo aleatorio simple es el ms simple ya que no tiene restricciones y consiste en seleccionar a los elementos
de la poblacin en forma aleatoria ya sea mediante sorteo o por el uso de tablas de nmeros aleatorios.
El muestreo estratificado consiste en dividir a la poblacin en subgrupos llamados estratos (grupo de elementos que
tienen caractersticas semejantes respecto a la variable considerada), para posteriormente obtener aleatoriamente de
cada estrato una submuestra y estas conformaran la muestra.
El muestreo por conglomerados consiste en seleccionar aleatoriamente grupos de elementos de la poblacin para
posteriormente tomar todos o parte de los elementos para conformar la muestra
El muestreo sistemtico consiste en seleccionar un elemento de la poblacin cada K esima unidad mediante el siguiente
criterio.
a).- Enumerar cada uno de los elementos de poblacin.
b).- Determinar la razn de muestreo.(K) donde K = No. de elementos de la poblacin / No. de elementos de la muestra.
c).- Elegir aleatoriamente un valor entre uno y el valor resultante de K, el cual denotaremos por R
d).- Obtener los elementos de la poblacin a partir de R y cada K
Un coeficiente de correlacin nos determina el grado de relacin o de asociacin entre variables. Hay varios
tipos de coeficientes de correlacin y su utilizacin depende de ciertos factores tales como:
a) .- Tipo de variable (discreta, continua o cualitativa).
Cuando estamos interesados en determinar si hay relacin lineal entre variables tales como la
temperatura y la precipitacin, entre la altura y el follaje de un rbol o el numero de das lluviosos y la
produccin de mangos, etc. entonces es necesario recurrir a los mtodos estadsticos de correlacin lineal,
es decir hay que calcular un coeficiente de correlacin, que nos indique el grado de asociacin entre
variables, o basarse en una grfica que nos permita visualizar la posible asociacin
La correlacin lineal simple permite determinar la posible asociacin lineal entre dos variables y la
correlacin lineal mltiple permite determinar la posible asociacin lineal entre dos ms variables.
02/03/2016
Experimento: es un cambio en las condiciones de operacin de un sistema o proceso, que se hace con el
objetivo de medir el efecto del cambio en una o varias propiedades de un producto.
El parmetro "a" es el valor que toma la variable dependiente "y", cuando la variable independiente "x"
vale 0, y es el punto donde la recta cruza el eje vertical.
Variable de respuesta: caracterstica del producto cuyo valor interesa mejorar mediante el diseo de
experimentos
Factores controlables: son variables del proceso que se pueden fijar en un punto.
La regresin lineal nos permite calcular el valor de estos dos parmetros, definiendo la recta que mejor se
ajusta a esta nube de puntos.
Factores no controlables (de ruido): variables que no se pueden controlar durante el proceso
Niveles y tratamientos: Los diferentes valores que se asignan a cada factor estudiado en un diseo
experimental se llaman niveles. Una combinacin de niveles de todos los factores se llaman tratamiento.
Ejemplo
Nivel de velocidad
Nivel de temperatura
tratamientos
Error aleatorio: es la variabilidad observada que no se puede explicar por los factores estudiados
PRINCIPIOS BSICOS
Factores estudiados: son las variables que se investigan en el experimento para observar como afectan o
influyen en la variable de respuesta
Error experimental: componente del error aleatorio que refleja los errores del experimentador en la
planeacin y ejecucin.
Planeacin: son actividades encaminadas a entender el problema, disear y realizar las pruebas
experimentales adecuadas.
Anlisis: se debe determinar el modelo de anlisis de varianza Anova.
Interpretacin: analizar con detalle el experimento desde su inicio hasta los nuevos aprendizajes que se
obtuvieron en el proceso.
REFERENCIAS
MENDENHALL, W., SCHEAFFER, R.L., WACKERLY, D. D., Estadstica Matemtica con aplicaciones, tercera
edicin, editorial Iberoamrica, estados unidos
WEBSTER, A. L.. Estadstica aplicada a los negocios y economa, tercera edicin, editorial McGraw Hill,
Colombia, 2000.
Bloqueo: Es nulificar o tomar en cuenta en forma adecuada todos los factores que pueden afectar la
respuesta la respuesta observada.
GUTIERREZ, H., DE LA VARA, R., anlisis y diseo de experimentos, McGraw Hill, Mexico, 2003
MILLER, I., FREUND, JOHN., Probabilidad y estadstica para ingenieros, editorial Revert, Mxico.