Вы находитесь на странице: 1из 31

ESTG1005 - Estadística

Francisco Moreira – famoreir@espol.edu.ec


Clase 1
2017 Primer Semestre
Contenido

 Estadística: Generalidades

 Definiciones

 Estadística Descriptiva

 Organización de datos

 Cálculo e interpretación de estadísticos

 Datos Bivariantes
Contenido

 Estadística: Generalidades

 Definiciones

 Estadística Descriptiva

 Organización de datos

 Cálculo e interpretación de estadísticos

 Datos Bivariantes
Estadística: Generalidades

Definición de Sheldon M. Ross en su libro Introducción a la Estadística.


La Estadística es el arte de aprender a partir de los datos. Está relacionada con
la recopilación de datos, su descripción subsiguiente y su análisis, lo que nos
lleva a extraer conclusiones.

¿Dónde se originó?

Objetivo de la Estadística:
• Analizar datos y transformarlos en información útil para la toma de
decisiones.

Podemos considerar entonces:


• Descripción y clasificación de datos -> Estadística Descriptiva
• Extracción de conclusiones -> Estadística Inferencial
Contenido

 Estadística: Generalidades

 Definiciones

 Estadística Descriptiva

 Organización de datos

 Cálculo e interpretación de estadísticos

 Datos Bivariantes
Definiciones

• Población: Una población es un gran conjunto de objetos de


naturaleza similar que es de interés en su conjunto.
• Muestra: Una muestra es una parte de los elementos de una
población. Se elige una muestra para hacer inferencias sobre la
población examinando o midiendo los elementos de la muestra.
• Parámetro: Un parámetro es un valor numérico que describe una de
las características de una distribución de probabilidad o población.
• Estimador: Un estadístico, medida o modelo aplicado a una muestra,
destinado a estimar algún parámetro de la población de la que
proviene la muestra.
• Individuo: Cada uno de los elementos de la población.
• Variable estadística: Característica propia del individuo objeto del
estudio estadístico.
Fuente: http://www.statistics.com/resources/glossary
Definiciones

Ejemplo:
Definiciones

Ejemplo:
Muestra

Individuo

Población
Contenido

 Estadística: Generalidades

 Definiciones

 Estadística Descriptiva

 Organización de datos

 Cálculo e interpretación de estadísticos

 Datos Bivariantes
Estadística descriptiva

- Censos
Recopilación
- Muestreos
Organización de
datos
- Rango
Clasificación
- Intervalo
Estadística
descriptiva - Diagramas
Presentación
- Histogramas
Cálculo e
interpretación Características:
- De posición
Descripción
- De dispersión
- De forma
Contenido

 Estadística: Generalidades

 Definiciones

 Estadística Descriptiva

 Organización de datos

 Cálculo e interpretación de estadísticos

 Datos Bivariantes
Organización de datos

Recopilación
Tipos de Variables
• Población estadísticas
• Muestra

Cualitativas Cuantitativas

Discretas Continuas

Numéricas Numéricas no
numerables. numerables.
Ej.: número de hijos Ej.: estatura
Organización de datos

Clasificación
• Ej.: Edades de un grupo de estudiantes.

• Tamaño de muestra (n)


• Alcance (A)
• Rango (R)
• Número de intervalos de clase (K) K=1+3,32Log(n) “Regla de Sturges”
• Intervalo de clase (𝐼𝑖 )
• Ancho de clase (w) w=R/K 𝐼𝑖
[… , …)
[… , …)
[… , …)
[… , …)
Contenido

 Estadística: Generalidades

 Definiciones

 Estadística Descriptiva

 Organización de datos

 Cálculo e interpretación de estadísticos

 Datos Bivariantes
Cálculo e interpretación

Presentación
• Tablas de frecuencia.
𝐿𝑖𝑛𝑓 +𝐿𝑠𝑢𝑝
Marca de clase (𝑥𝑖 ) 𝑥𝑖 = 2

Frecuencia absoluta (𝑓𝑖 )


Frecuencia absoluta acumulada (𝐹𝑖 )
Frecuencia relativa (ℎ𝑖 ) ℎ𝑖 =𝑓𝑖 /n
Frecuencia relativa acumulada (𝐻𝑖 ) 𝐻𝑖 =𝐹𝑖 /n

𝐼𝑖 𝑥𝑖 𝑓𝑖 𝐹𝑖 ℎ𝑖 𝐻𝑖

Tabla. Formato de tabla de frecuencia


Cálculo e interpretación

• Presentación gráfica
• Diagrama de barras
• Polígono de frecuencias
𝑓
• Diagrama de sectores ( 𝑛𝑖 ∗360°)
• Histogramas
• De frecuencia, al unir los puntos medios se hace un polígono de frecuencias.
• De frecuencia acumulada (diagrama escalonado), al unir las barras se
obtiene una ojiva.

Figura. Ejemplo de Histograma


Cálculo e interpretación

Descripción
• Característica de posición
• Medidas de tendencia central: Media, mediana y moda

Media Promedio aritmético

Datos no
Mediana Posición central
agrupados

Moda Más repetido


Cálculo e interpretación

𝑘
Media 𝑖=1 𝑓𝑖 𝑥𝑖
𝑥=
𝑛
𝑛
Datos 2 − 𝐹𝑚𝑒−1
Mediana 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 𝐿𝑖𝑛𝑓 + 𝑤
agrupados 𝑓𝑚𝑒

∆1
Moda 𝑀𝑜𝑑𝑎 = 𝐿𝑖𝑛𝑓 + 𝑤
∆1 + ∆2

• Frecuencia de la clase mediana 𝑓𝑚𝑒


• Frecuencia de la clase modal 𝑓𝑚𝑜
• ∆1 = 𝑓𝑚𝑜 − 𝑓𝑚𝑜−1
• ∆2 = 𝑓𝑚𝑜 − 𝑓𝑚𝑜+1
Cálculo e interpretación

• Percentiles Ejemplo de percentiles v.e. discreta:


Definición: 𝑃𝑘 , 𝑘: 1,2, … , 99,
“percentil k”, valor de la variable 𝑓𝑖 𝐹𝑖

que deja por debajo, el k% de los


valores de la variable (ordenados).

𝑃25 = 𝑄1 -> 1er Cuartil


𝑃50 = 𝑄2 -> 2do Cuartil = Mediana
𝑃75 = 𝑄3 -> 3er Cuartil

Cálculo para v.e. discretas:

𝑛∗𝑘
𝑃𝑘 =
100
¿DIAGRAMA
DE CAJAS?
Cálculo e interpretación

Cálculo para v.e. continuas: Ejemplo de percentiles v.e. continua:

𝑛∗𝑘
− 𝐹𝑖−1 𝑓𝑖 𝐹𝑖 ℎ𝑖 𝐻𝑖

𝑃𝑘 = 𝐿𝑖𝑛𝑓 + 𝑤 100
𝑓𝑖

𝑘
− 𝐻𝑖−1
𝑃𝑘 = 𝐿𝑖𝑛𝑓 + 𝑤 100
ℎ𝑖
𝑛∗𝑘 𝑘
− 𝐹𝑖−1 − 𝐻𝑖−1
𝑃𝑘 = 𝐿𝑖𝑛𝑓 + 𝑤 100 = 𝐿𝑖𝑛𝑓 + 𝑤 100
𝑓𝑖 ℎ𝑖
Cálculo e interpretación

• Característica de dispersión
• Miden la homogeneidad de las observaciones.
• Rango o recorrido = Valor máximo – Valor mínimo de la variable
• Recorrido o rango intercuartil RI = 𝑄3 − 𝑄1
• Desviación media
𝑘 ¿Por qué no utilizar
𝑖=1 |𝑥𝑖 −𝑥|
• Datos no agrupados 𝐷𝑥 = como medida la suma
𝑛
𝑘
• Datos agrupados 𝐷𝑥 = 𝑖=1 |𝑥𝑖 −𝑥|𝑓𝑖 (𝑥𝑖 −𝑥)?
𝑛
• Varianza (poblacional)
Porque la suma de
𝑘 2 todos estos valores da 0
𝑖=1(𝑥𝑖 −𝑥)
• Datos no agrupados 𝜎2 = 𝑛
𝑘 2
𝑖=1(𝑥𝑖 −𝑥) 𝑓𝑖
• Datos agrupados 𝜎 2= Si hablamos de
𝑛
• Desviación típica 𝜎 = 𝜎2 muestras la varianza
𝜎
• Coeficiente de variación 𝑐𝑣 = es:
𝑥
𝑘 2
2 𝑖=1(𝑥𝑖 −𝑥)
𝑠 = 𝑛−1
Cálculo e interpretación

• Ejemplo:
𝑘
𝑖=1( 𝑥𝑖− 𝑥)2 𝑓𝑖
𝒙𝒊 𝒇𝒊 𝜎 2=
4 20
𝑛
6 40

8 44 𝒇𝒊 𝒙𝒊 𝟐
10 36

12 22

162
Cálculo e interpretación

• Ejemplo:
𝑘
𝑖=1( 𝑥𝑖 − 𝑥)2 𝑓𝑖
𝒙𝒊 𝒇𝒊 𝒇𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊 𝟐 𝜎 2=
4 20 80 320
𝑛
6 40 240 1440

8 44 352 2816 𝒇𝒊 𝒙𝒊 𝟐
10 36 360 3600

12 22 264 3168

162 1296 11344


• Supongamos que dada una muestra X de tamaño n en la que se
investiga una característica X, se define 𝑌𝑖 = 𝛼𝑋𝑖 + 𝛽 donde 𝛼 y 𝛽
son constantes reales y el subíndice i varía de 1 hasta n. Encontrar la
media y varianza de Y = 𝛼𝑋 + 𝛽
Cálculo e interpretación

• Momentos centrales y no centrales


• Momentos centrados • Momentos no centrados

𝑘 𝑟
𝑖=1 𝑓𝑖 (𝑥𝑖 −𝑥)
𝜇𝑟 =
𝑛
𝑘 𝑟
𝑖=1 𝑓𝑖 𝑥𝑖
𝑀𝑟 =
𝑛
Cálculo e interpretación

• Característica de forma
• Coeficiente de sesgo (coeficiente de asimetría de Fisher)

Si la distribución es simétrica, entonces sabemos que 𝛾1 = 0. El recíproco no es cierto: es un


error común asegurar que si 𝛾1 = 0 entonces la distribución es simétrica (lo cual es falso).

• Coeficiente de curtosis (apalancamiento)


𝜇
𝛾2 = 44 − 3
𝜎
Leptocúrtica. Si 𝛾2 > 0, más apuntada y con colas menos anchas que la normal.
Platocúrtica. Si 𝛾2 < 0, menos apuntada y con colas más anchas que la normal.
Mesocúrtica . Si 𝛾2 = 0, la distribución normal.
• Valores atípicos
Contenido

 Estadística: Generalidades

 Definiciones

 Estadística Descriptiva

 Organización de datos

 Cálculo e interpretación de estadísticos

 Datos Bivariantes
Datos Bivariantes

• Distribuciones Marginales y Condicionadas


Ejemplo:
X = Peso, Y = Estatura
Frecuencias Marginales
• Frecuencias Marginales de X
• Frecuencias Marginales de Y
Frecuencias Condicionadas
• Frecuencias Condicionadas de X
• Frecuencias Condicionadas de Y

Con las distribuciones marginales se puede trabajar como si fueran


univariantes, así mismo con las condicionadas y se pueden encontrar
los estadísticos estudiados.

Ejercicio 1: Encontrar las características de posición y dispersión con las frecuencias Marginales y Condicionadas
Datos Bivariantes

• Covarianza
𝑖 𝑗 𝑓𝑖𝑗 (𝑥𝑖 − 𝑥)(𝑦𝑗 − 𝑦) 𝑖 𝑗 𝑓𝑖𝑗 𝑥𝑖 𝑦𝑗
𝐶𝑜𝑣 𝑋, 𝑌 = 𝜎𝑥𝑦 = = − 𝑥𝑦
𝑛 𝑛
• Dependencia e independencia estadística
• Independencia estadística
𝑓𝑖. 𝑓.𝑗
Si 𝑓𝑖𝑗 = 𝑛 ∀ 𝑖, 𝑗
• Dependencia estadística, es cuando hay relación entre las variables.

El grado de relación se mide mediante un coeficiente de asociación. (pág. 43 a 45)

Ejercicio 2: Verificar dependencia o independencia estadística


Recomendaciones

Leer el libro Probabilidad y Estadística: Fundamentos y Aplicaciones de


Gaudencio Zurita Herrera (2da Edición), Capítulo 1 pág. 2 a 45.

Вам также может понравиться