Академический Документы
Профессиональный Документы
Культура Документы
Definiciones
Estadística:
Definiciones
Estadística
"Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de
propiciar la toma de decisiones más eficaz".
Definiciones
Tipos de Estadística
Descriptiva Inferencial
A B
Definiciones
Tipos de Estadística
Descriptiva Inferencial
Dato FN FNA
x2 Mecanismos de
x1
x1
selección x3
x3
x5
x2
x4
. . . xN
Muestra Aleatoria
Población
Estimador
Parámetro
Población
El conjunto de todos los elementos de interés, esta definición no es exclusiva de
seres humanos. Una población debe definirse claramente en el tiempo y en el
espacio.
Muestra
Porción o parte de la población de interés. Un subconjunto de
la población.
Ejemplo: Cuando se prepara sopa para 100 personas, la olla es mucho más grande
que la utilizada para preparar sopa para 5 personas, sin embargo si deseamos
estimar si la sopa tiene sal, con una sola cucharada es suficiente para darse
cuenta si tiene sal o no. Observe que el tamaño de la población no influyo en el
tamaño de la muestra.
x2 Mecanismos de
x1
x1
selección x3
x3
x5
x2
x4
. . . xN
Muestra Aleatoria
Población
Estimador
Parámetro
Variable
1. La edad
2. Color de ojos
4. Sexo
5. Ingresos
Variable
Tipo de variables
Cualitativa Cuantitativa
Discreta Continua
Variables
168.4 168.8
168 169
Variables
Escalas de medición
de variables
Por ejemplo el ingreso por ventas: Una medida de cero indica que no se ha vendido
nada, ayer vendí el doble que hoy, el ingreso por ventas se divide entre el personal.
Ejercicio
¿Cuál es la población bajo estudio?
Coca Cola desea analizar la rapidez con que sus maquinas etiquetan las
botellas de jugos del Valle. Para esto deciden hacer el seguimiento al número
de botellas etiquetadas por día, tomando aleatoriamente 100 días durante un
año de producción de las maquinas.
Ejercicio
Ordenar
¿Para qué se
construyen las Agrupar
tablas de
frecuencias ?
Resumir
Ejemplo
Las estaturas (en centímetros) de los socios de un club juvenil
son las siguientes
• K=?
20
En nuestro ejemplo a 3.333
6
Ejemplo
3. Calculo del límite inferior :
(k )(a ) Rango
Li Valormínim o
2
Nuestro ejemplo será:
(6)(4) 20
Li 128 128 2 126
2
Tabla de frecuencia
Histograma
Representación gráfica de los datos
Ojiva
Concepto de distribución
Fuente: DICCIONARIO DE LA LENGUA ESPAÑOLA - Vigésima segunda edición – Real Academia Española
Función empírica de distribución
acumulativa
0.25 0.23
0.20
0.17
0.10
0.07
0.05
0.00
[126 -130) [130 -134) [134 -138) [138 -142) [142 -146) [146 -150)
Función empírica de distribución
acumulativa
Función empírica de distribución acumulativa
0 para x Lo
*
F ( x) F( Li1 ) f i ( x Li ) para Li x Li i 1, 2...k
1 para x Lk
Ejercicio en clase del uso de la función
empírica de distribución acumulativa
Tabla de frecuencia de las estaturas (en centímetros) de los socios de un club
juvenil.
Marca de
Intervalo (k=6) clase fi Fi fri Fri
[126 -130) 128 8 8 0,27 0,27
[130 -134) 132 2 10 0,07 0,33
[134 -138) 136 5 15 0,17 0,50
[138 -142) 140 4 19 0,13 0,63
[142 -146) 144 7 26 0,23 0,87
[146 -150) 148 4 30 0,13 1,00
Total 30 1,00
Ejercicio en calse del uso de la función
empírica de distribución acumulativa
1. ¿Qué porcentaje de jóvenes tienen estaturas menores a 141 cm?
4. ¿ A partir de qué valor el 70% de los jóvenes tienen estaturas menor a él?
5. ¿ A partir de qué valor el 35% de los jóvenes tienen estaturas mayores a él?
Otras representaciones gráficas de
los datos
Los gráficos permiten visualizar en forma global y rápida
el comportamiento de los datos.
39%
40%
140 Medios de Comunicación
120 20%
120
102 6%
100
0%
80 A B C
62
60
40
Barras
22
20
5 6
0
Volantes Perifoneo Cajeros Amigos Radio Otro
Otras representaciones gráficas de
los datos
3,200,000 430,000
410,000
2,960,423
3,000,000
2,870,585 2,874,762 390,000
Clientes
350,000
2,600,000
330,000
2,400,000 310,000
290,000
2,200,000
270,000
302,446 346,306 392,571 408,288
2,000,000 250,000
2006 2007 2008 2009
Años
CLIENTES ventas
Otras representaciones gráficas de
los datos
Sectores, torta o circular PAC,
100,
11%
POS,
823,
89%
Medidas de tendencia central
Corresponden a valores que generalmente se ubican en la parte
central de un conjunto de datos.
x
i 1
i
X
n
• Para datos agrupados:
k
m f
i 1
i i
X
n
Si tenemos que:
A = Valor de referencia
Xi = Cualquier dato
di = (Xi – A) la desviación
Introducción a las propiedades
de la Media Aritmética
Ejemplo:
Sobre la edades de un grupo particular.
Xi A = 50 Xi A = Media
Valor de Valor de la Valor de Valor de la
Diferencia Datos referencia diferencia Diferencia Datos referencia diferencia
d1 64 50 14 d1 64 54 10
d2 65 50 15 d2 65 54 11
d3 53 50 3 d3 53 54 -1
d4 49 50 -1 d4 49 54 -5
d5 46 50 -4 d5 46 54 -8
d6 52 50 2 d6 52 54 -2
d7 43 50 -7 d7 43 54 -11
d8 55 50 5 d8 55 54 1
d9 20 50 -30 d9 20 54 -34
d10 93 50 43 d10 93 54 39
Suma 40 Suma 0
Propiedades de la Media
Aritmética
Propiedades:
• Propiedad 5
• Propiedad 6
Trabajo en clase 1
Una compañía constructora resuelve estudiar en un concreto su resistencia a la
comprensión, con el objeto de hacer un control de calidad. Para ello se tomaron
10 cilindros de prueba de acuerdo con las normas establecidas. Los resultados en
kg/cm2 de presión obtenidos al cabo de 28 días de curado fueron: 295, 282,
221, 240, 328, 191, 275, 253, 259, 206
Ventajas:
• Emplea en su cálculo toda la información disponible.
• Es un valor único.
Ventajas y desventajas de la media
Ventajas:
Desventajas:
• Se ve adversamente afectada por valores extremos,
perdiendo representatividad.
25 38 29 42 39 54 23
33 45 45 26 34 30 31
Localizar la mediana.
Mediana – Ejemplo (cont.)
Dato 23 25 26 29 30 31 33
Posición 1 2 3 4 5 6 7
7.5
Dato 34 38 39 42 45 45 54
Posición 8 9 10 11 12 13 14
Mediana
Mediana – Ejemplo (cont.)
Mediana
Paso 1: Ordenar los valores del mínimo valor al máximo
Dato 23 25 26 29 30 31 33
Posición 1 2 3 4 5 6 7
Dato 34 38 39 42 45 45
Posición 8 9 10 11 12 13
Cálculo de la mediana
0 para x Lo
F ( x) F( Li1 ) f i* ( x Li 1 ) para Li 1 x Li i 1, 2...m
1 para x Lm
Ventajas:
• Fácil de calcular si el número de observaciones no es muy
grande.
• No se ve influenciada por valores extremos, ya que solo influyen
los valores centrales.
• Fácil de entender.
• Se puede calcular para cualquier tipos de datos cuantitativos.
• Es la medida de tendencia central más representativa en el caso
de variables que solo admiten la escala ordinal.
Ventajas y desventajas de la mediana
Desventajas:
Ventajas:
• No requiere cálculos.
• Fácil de interpretar.
Desventajas: