Вы находитесь на странице: 1из 54

ESTADSTICA BSICA II

IDT John Harvey vargas


Matemtico Universidad de Antioquia

ESTADSTICA BSICA II

Qu es la estadstica?
Mtodos y procedimientos destinados a recoger, clasificar, resumir, hallar regularidades, analizar los datos y realizar inferencias con el fin de ayudar a la toma de decisiones y en su caso formular predicciones.

ESTADSTICA BSICA II

CLASIFICACIN
ESTADSTICA DESCRIPTIVA ESTADSTICA INFERENCIAL

Describe, analiza y representa un grupo de datos utilizando mtodos numricos y grficos que resumen y presentan la informacin contenida en ellos.

A partir del clculo de probabilidades y datos muestrales, efecta estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.

ESTADSTICA BSICA II

DEFINICIONES Y CONCEPTOS BSICOS


Individuos o elementos: Personas u objetos que contienen cierta informacin que se desea estudiar. Poblacin: Conjunto de individuos o elementos que cumplen ciertas propiedades comunes. Muestra: Subconjunto representativo de una poblacin. Muestreo: Mtodos para la recoleccin de la muestra.

Datos: Conjunto de valores de una variable para cada uno de los elementos de la muestra.

ESTADSTICA BSICA II

DEFINICIONES Y CONCEPTOS BSICOS


Variable: Caracterstica que toma diferentes valores en diferentes personas, lugares o cosas. Ordinales Variables cualitativas Nominales Discretas Variables cuantitativas Continuas Parmetro: Medicin numrica que describe algunas caractersticas de una poblacin.

Estadstico: Medicin numrica que describe algunas caractersticas de la muestra.

ESTADSTICA BSICA II

Qu incluye un problema estadstico?


Definicin clara del objetivo del experimento y de la poblacin pertinente. Diseo del experimento o procedimiento del muestreo. Recoleccin y anlisis de los datos. El procedimiento para hacer inferencias acerca de la poblacin, basado en la informacin muestral.

La provisin de una medida de bondad (confiabilidad) para la inferencia.

ESTADSTICA BSICA II

ESTADSTICA DESCRIPTIVA

ESTADSTICA BSICA II

ESTADSTICA DESCRIPTIVA
DATOS CUALITATIVOS

Se miden en escala

Nominal

Ordinal

Se representan en

Grficos Diagramas de Barras Diagramas de Sectores

Tablas Frecuencia Contingencia

ESTADSTICA BSICA II ESTADSTICA DESCRIPTIVA


DATOS CUANTITATIVOS

Se dividen en

Discretos

Continuos

Se miden en escalas

Razn

Intervalos

Se representan en

Se resumen en medidas de

Grficos

Tablas

Centralidad

Variabilidad

Histogramas Boxplot Diagramas de Dispersin

Frecuencia Agrupada Frecuencia no Agrupada

Media Mediana Moda

Varianza Rango Coeficiente de Variacin

ESTADSTICA BSICA II

REGRESIN LINEAL SIMPLE


Relaciones entre variables estadsticas Con frecuencia encontramos variables estadsticas que presentan algn tipo de asociacin o dependencia unas de otras.

Ejemplos:
El consumo de cigarrillo con el cncer pulmonar. El aumento de peso de un animal con la racin diaria de alimentos.

El consumo de una droga con la publicidad que se le hace.


El entrenamiento en la realizacin de una actividad con el tiempo gastado en realizarla. En los ejemplos anteriores podemos ver que las variables tienen algn grado de correlacin

ESTADSTICA BSICA II

REGRESIN LINEAL SIMPLE


si al aumentar o disminuir una de Correlacin Positiva ellas, la otra vara en la misma forma.

Correlacin Negativa

cuando varan en sentido inverso.

Si no existe ninguna relacin o dependencia entre las variables se dice que ellas estn incorrelacionadas.

ESTADSTICA BSICA II

REGRESIN LINEAL SIMPLE


Observacin: La dependencia estadstica no implica relacin causa-efecto.

Ejemplos:
La dependencia estadstica no permite concluir que el consumo

de cigarrillo es causa de cncer pulmonar. El consumo de licor y el nmero de automviles de un pas presentan una correlacin positiva muy alta. No por ello podemos concluir que el poseer automvil hace que las personas se vuelvan bebedoras. La alta correlacin se debe a que ambas variables crecen al aumentar el nmero de habitantes del pas.

ESTADSTICA BSICA II

REGRESIN LINEAL SIMPLE


Consideraciones Importantes
Vamos a considerar una relacin funcional entre las variables X yY

Suponiendo que X toma valores asignados o controlados por el investigador y Y depende de X a travs de la relacin Y= f(X)

Decimos que X es la variable independiente y Y la variable dependiente.

ESTADSTICA BSICA II

Ejemplo:
Se desea conocer la relacin entre la presin arterial y la edad en personas adultas.
EDAD (Aos) X 19 PRESIN (mmHg) Y 122

Se han obtenido los siguientes datos de 10 hombres a los cuales se les pregunto su edad y se les midi su presin sistlica.

25
30 42 46 49 52 57 62 70

125
126 129 130 132 135 138 142 145

ESTADSTICA BSICA II

DIAGRAMA DE DISPERSIN
PRESIN vs EDAD
150 145 140 135 130 125 120 0 20 40 60 80

los valores de Y aumentan a medida que aumenta la edad y los diferentes puntos tienden a colocarse en una lnea recta. Esta informacin nos permite pensar que las dos variables estn relacionadas linealmente.

ESTADSTICA BSICA II

forma

Si la relacin entre X y Y es aproximadamente de la entonces se trata de una regresin lineal. interesa )

(Nos

Debemos asumir que la relacin entre X y Y no es una relacin lineal perfecta ya que Y es una variable aleatoria cuyos valores exactos son impredecibles.

Para una persona dada, el valor de Y puede expresarse como:

En donde y son parmetros desconocidos y i es el error que cometemos al querer expresar el valor de Y mediante una relacin lineal con X.

ESTADSTICA BSICA II

ESTIMACIN DE LA RECTA DE REGRESIN

La recta de regresin estimada es obtenida por el mtodo de los mnimos cuadrados y est dada por:

Donde:

ESTADSTICA BSICA II

GRFICO DE REGRESIN AJUSTADA


RECTA DE REGRESIN AJUSTADA
160 140 120 100 80 60 40 20

0
0 20 40 60 80

Y= 112.26 + 0.446X

ESTADSTICA BSICA II

A) Error de Estimacin Mediante la Recta Ajustada Ejemplo:


El sujeto nmero 5 que tiene una de edad de 46 aos. Su presin sistlica fue de 130 mmHg. Supongamos ahora que no se le midi la presin queremos estimarla mediante la ecuacin de regresin. Entonces su presin ser: Y5= 112.26 + 0.446X5 Y5 = 112.26 + (0.446) (46) Y5 = 132.8 mmHg

Error: 130mmHg 132.8 mmHg = - 2.8 mmHg

ESTADSTICA BSICA II

B) Predicciones a Partir de la Recta


Mediante la ecuacin de regresin podemos predecir o pronosticar valores de la variable Y.

Ejemplo:
Si se sabe que la edad de un sujeto es 50 aos, su presin sistlica puede pronosticarse mediante la recta de regresin ajustada como:
Y= 112.26 + (0.446) (50) Y= 134.5 mmHg.

Observacin:
La interpretacin o cualquier otra inferencia basada en la regresin, es vlida fundamentalmente dentro del rango de variacin de X.
Para nuestro ejemplo la variacin de Y puede ser vlida slo para edades entre 19 y 70 aos.

ESTADSTICA BSICA II

C) Interpretacin de la Pendiente
El coeficiente de regresin , representa la pendiente de la recta. Este coeficiente indica la cantidad de variacin (creciente o decreciente) de la variable Y por unidad de cambio de la variable X.

Para nuestro ejemplo, la pendiente es 0.446, lo que indica que la presin sistlica aumenta 0.446 mmHg por cada ao.

ESTADSTICA BSICA II

D) Coeficiente de Correlacin de Pearson (Muestral) r


Es un ndice estadstico que mide la relacin lineal entre dos variables cuantitativas y esta dado por

Para nuestro ejemplo, r = 0.97

ESTADSTICA BSICA II

Propiedades del Coeficiente de Correlacin de Pearson:


1. El valor de r es independiente de las unidades en que X y Y se midan. 2. Valores de r cercanos a 1 indican que la relacin de X y Y es lineal y que estn relacionadas directamente. 3. Valores de r cercanos a -1 indican que la relacin de X y Y es lineal y que la relacin es inversa. 4. Si r es cercano a cero no existe relacin lineal. Pero esto no implica una independencia total entre las dos variables, es decir, puede existir relaciones no lineales entre las dos variables.

ESTADSTICA BSICA II

E) Coeficiente de Determinacin
Es el cuadrado del coeficiente de correlacin

Este coeficiente nos indica la proporcin de la variacin de Y que es explicada o que puede atribuirse a su relacin lineal con X.
Para nuestro ejemplo, el coeficiente de determinacin es indicndonos que: Un 94% de la variacin de la presin sistlica se debe a su relacin con la edad o, Que la edad explica el 94% de la variacin de la presin sistlica en sujetos varones con edades entre los 19 y 70 aos.

ESTADSTICA BSICA II

INFERENCIA ESTADSTICA

ESTADSTICA BSICA II

INFERENCIA ESTADSTICA
Las poblaciones se caracterizan mediante medidas descriptivas numricas llamadas parmetros.

La inferencia estadstica tiene como objetivo el hacer inferencias acerca de los parmetros de una poblacin.
Parmetros tpicos de una poblacin: media, varianza, proporcin, etc. La inferencia estadstica es un proceso que permite emitir juicios probabilsticos sobre una poblacin cuando solo disponemos de la informacin parcial contenida en una muestra.

ESTADSTICA BSICA II

Qu tamao debe tener la muestra y cmo debe ser seleccionada para que la informacin extrada de ella sea representativa de la poblacin objeto de estudio?

MUESTREO

ESTADSTICA BSICA I

GENERALIDADES DEL MUESTREO


Poblacin pequea Poblacin grande Censo Muestreo

Sin reposicin

TIPOS DE MUESTREO
Con reposicin

Muestreo Aleatorio Simple ALGUNOS MTODOS DE MUESTREO Muestreo Estratificado Muestreo por Conglomerados

ESTADSTICA BSICA II

TIPOS DE MUESTREO
MUESTREO CON REPOSICIN MUESTREO SIN REPOSICIN

Las unidades se seleccionan por lo menos una vez

Las unidades se seleccionan slo una vez

Cuando se desea saber cunto tiempo gasta una persona haciendo cola en un banco, sta puede ser observada una o ms veces, cada vez que vuelve al banco.

En una encuesta electoral, poco antes de una eleccin de voto de las personas entrevistadas, stas deben ser escuchadas apenas una sola vez, pues, en una eleccin, el voto es individual.

ESTADSTICA BSICA II

MUESTREO ALEATORIO SIMPLE

La forma ms comn de obtener una muestra es la seleccin al azar, es decir, cada uno de los individuos de una poblacin tiene la misma posibilidad de ser elegido. Tiene poca o nula utilidad prctica cuando la poblacin es muy grande.

ESTADSTICA BSICA II

MUESTREO ALEATORIO SIMPLE


Ejemplo:
Supongamos que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de estadstica de 20 alumnos.
1. Escribir los 20 nombres en pedazos separados de papel, colocarlos en un recipiente, revolverlos y luego extraer cinco papeles al mismo tiempo. 2. Listar los estudiantes y utilizar una tabla de nmeros aleatorios, para escoger los 5 alumnos de acuerdo al orden de lista. 3. Excel tiene una opcin para extraer una muestra aleatoria de una lista.

ESTADSTICA BSICA II

MUESTREO ESTRATIFICADO
Se utiliza cuando la poblacin consiste de grupos heterogneos. Se forman grupos disjuntos, llamados estratos, con los elementos ms parecidos entre s, y dentro de cada estrato se hace una seleccin aleatoria simple.

Se llama afijacin a la manera como se puede repartir la muestra en los diferentes estratos.
Afijacin Uniforme

La muestra se reparte por igual en cada uno de los estratos.

Afijacin Proporcional

La muestra se reparte proporcional al tamao de cada estrato

ESTADSTICA BSICA II

MUESTREO ESTRATIFICADO

Ejemplo:
En un estudio sobre salarios en una empresa, se tuvieron en cuenta tres estratos: directivas, empleados y obreros. Suponiendo que la empresa cuenta con 25 directivas, 130 empleados y 913 obreros, y el tamao de la muestra que vamos a seleccionar es n = 120. Si la afijacin es proporcional debemos repartir la muestra de la siguiente manera:

Las 3 directivas, los 15 empleados y los 102 obreros los seleccionamos utilizando el muestreo aleatorio simple.

ESTADSTICA BSICA II

MUESTREO POR CONGLOMERADOS


Se obtiene seleccionando aleatoriamente un conjunto de m colecciones de elementos muestrales, llamados conglomerados de la poblacin y posteriormente, llevando a cabo un censo completo en cada uno de los conglomerados. El muestreo por conglomerados proporciona una cantidad especfica de informacin a un costo mnimo cuando: No existe una lista de todos los elementos de la poblacin o sera muy costoso obtenerla. La poblacin es grande y est dispersa en una regin muy extensa.

ESTADSTICA BSICA II

MUESTREO POR CONGLOMERADOS Ejemplo:


supongamos que un economista desea estimar la cantidad promedio empleada en comida por vivienda en cierto barrio de la ciudad. Como es un barrio grande y no se cuenta con los recursos suficientes para hacer la encuesta en todo el barrio, el economista divide el barrio por manzanas (conglomerados) y extrae una muestra aleatoria de las mismas. Posteriormente procede a hacer la encuesta en cada una de las viviendas de las manzanas seleccionadas.

ESTADSTICA BSICA II

Diferencias entre el Muestreo Estratificado y el Muestro por Conglomerados


En el de conglomerados slo se elige una muestra de subpoblaciones, en el estratificado todas las subpoblaciones (estratos) se seleccionan para muestreo posterior. En relacin a la homogeneidad y la heterogeneidad, el criterio para formar conglomerados es el opuesto al de formar estratos. Los elementos dentro de un conglomerado deben ser tan heterogneos como sea posible, pero los conglomerados mismos deben ser tan homogneos como sea posible. Cada conglomerado debe ser una representacin en pequea escala de la poblacin.

ESTADSTICA BSICA II

MUESTREO SISTEMATICO
En este caso se elige el primer individuo al azar y el resto viene condicionado por aqul. Este mtodo es muy simple de aplicar en la prctica y tiene la ventaja de que no hace falta disponer de un marco de encuesta elaborado. Puede aplicarse en la mayora de las situaciones, la nica precaucin que debe tenerse en cuenta es comprobar que la caracterstica que estudiamos no tenga una periodicidad que coincida con la del muestreo

ESTADSTICA BSICA II

MUESTREO NO PROBABILISTICO.
Es aquel utilizado en forma emprica, es decir, no se efecta bajo normas probabilsticas de seleccin, por lo que sus procesos intervienen opiniones y criterios personales del investigador o no existe norma bien definida o validada. TIPOS: Muestreo por cuotas Muestreo Intencional Muestreo Casual o Incidental. Bola de nieve.

ESTADSTICA BSICA II

Muestreo por cuotas


Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la poblacin y/o de los individuos ms "representativos" o "adecuados" para los fines de la investigacin. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de aleatoriedad de aqul. En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de individuos que renen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 aos, de sexo femenino y residentes en Trujillo. Una vez determinada la cuota, se eligen los primeros que se encuentren que cumplan esas caractersticas. Este mtodo se utiliza mucho en las encuestas de opinin.

ESTADSTICA BSICA II

Muestreo Intencional

Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusin en la muestra de grupos supuestamente tpicos. Es muy frecuente su utilizacin en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto.

ESTADSTICA BSICA II

Muestreo Casual o Incidental.

Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los individuos de la poblacin. El caso ms frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fcil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos). Un caso particular es el de los voluntarios.

ESTADSTICA BSICA II

Bola de nieve.
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.

ESTADSTICA BSICA II

ERROR DE ESTIMACIN
Cuando la muestra se obtiene por mtodos probabilsticos es posible hacer inferencias acerca de ciertas caractersticas numricas de la poblacin con base en las caractersticas numricas de la muestra. MUESTRA POBLACIN

La media, la proporcin y la varianza muestral, son respectivamente estimadores de la media, la proporcin y la varianza poblacional

ESTADSTICA BSICA II

ERROR DE ESTIMACIN

Ejemplo:
Supongamos que queremos estimar la edad promedio de los estudiantes de un colegio nocturno de 635 estudiantes y que para ello escogimos aleatoriamente 84 estudiantes. Si aos, entonces podemos estimar en 21.7 aos la edad promedio de los estudiantes del colegio nocturno.

Qu tan precisas son estas estimaciones?


En general, si queremos estimar el parmetro por medio del estimador , el error de estimacin estar dado por

Un estimador es ms preciso entre menor sea su error de estimacin.

ESTADSTICA BSICA II

A) Error de Estimacin para la Media


Para un error aleatorio simple sin remplazo est dado por:

En esta frmula aparece la varianza poblacional que generalmente es desconocida. Esta varianza se estima usualmente con la varianza muestral , de modo que una estimacin del error de muestreo para la media sera:

ESTADSTICA BSICA II

A) Error de Estimacin para la Media

Se puede mostrar que si la poblacin es normal o aproximadamente normal el 95% de las estimaciones del parmetro caen el intervalo . Diremos entonces que el intervalo es un intervalo de confianza del 95% para estimar a .

ESTADSTICA BSICA II

A) Error de Estimacin para la Media


Ejemplo:
El gobierno de cierta localidad desea estimar el consumo promedio de agua por vivienda con el fin de racionalizar dicho recurso. Selecciona al azar y sin reemplazo n = 180 viviendas y observa el medidor de agua durante un da. Se obtiene de esta muestra un consumo promedio 19.6 galones con una desviacin estndar de 2.4 galones. El ltimo censo en dicha localidad report 2350 viviendas.

Esto significa que podemos estimar un consumo promedio de agua por vivienda
entre 19.26 y 19.94 galones con una confiabilidad

95%.

ESTADSTICA BSICA II

TAMAO DE LA MUESTRA
Llamemos B el error mximo que podemos admitir al estimar la media tomando una muestra de tamao n. El error mximo se encuentra en los extremos del intervalo en otras palabras, con una probabilidad de 0.95 si la poblacin tiene una distribucin normal o aproximadamente normal.

Despejamos n

En la prctica, generalmente se desconoce . A veces es posible conocer la varianza mediante alguna investigacin anterior o estimarla mediante una muestra piloto. En este caso, reemplazamos por .

ESTADSTICA BSICA II

TAMAO DE LA MUESTRA Ejemplo:


Un investigador est interesado en estimar el peso promedio ganado por pollo entre 0 y 4 semanas, alimentados con una racin nueva. Se tienen 1000 pollos y se desea establecer el tamao de la muestra para estimar con un error no mayor que 1 gramo. Usando estudios similares sobre nutricin de pollos, el investigador encontr que era aproximadamente 36.

Segn la frmula el nmero de pollos que debe pesar es 126

ESTADSTICA BSICA II

GRACIAS

Вам также может понравиться