Академический Документы
Профессиональный Документы
Культура Документы
ESTADSTICA
OBJETIVO GENERAL:
Proporcionar al alumno elementos formativos en la teora
de la probabilidad y estadstica que le permitan analizar y
asignar valores reales a fenmenos aleatorios relacionados
con la ingeniera.
Cul es la diferencia?
La diferencia consiste en el propsito para el cual se produce u ofrece la
informacin. En el primer caso slo da a conocer resultados; en el
segundo caso estos mismos resultados son ofrecidos con el fin de que los
interesados puedan sacar conclusiones (realizar inferencias) y
eventualmente tomar decisiones.
Estadstica
La Estadstica trata del recuento, ordenacin y clasificacin de los datos
obtenidos por las observaciones, para poder hacer comparaciones y sacar
conclusiones.
La Estadstica Descriptiva es la rama de las Matemticas que recolecta,
presenta y caracteriza un conjunto de datos (por ejemplo, edad de una
poblacin, altura de los estudiantes de una escuela, temperatura en los
meses de verano, etc.) con el fin de describir apropiadamente las
diversas caractersticas de ese conjunto. Registra los datos en tablas y
los representa en grficos. Calcula los parmetros estadsticos (medidas
de centralizacin y de dispersin), que describen el conjunto estudiado.
3
1.
2.
3.
4.
VARIABLES
ESTADSTICAS
Variable cualitativa
Las variables cualitativas se refieren
a caractersticas o cualidades que no
pueden ser medidas con nmeros.
Podemos distinguir dos tipos:
1.Variable cualitativa nominal
Una variable cualitativa nominal
presenta modalidades no numricas
que no admiten un criterio de orden.
Por ejemplo: mujer, hombre.
2.Variable cualitativa ordinal o
variable cuasicuantitativa
Una variable cualitativa ordinal
presenta modalidades no numricas,
en las que existe un orden. Por
ejemplo: pequeo, mediano y grande. 7
Variable cuantitativa
Una variable cuantitativa es la que
se expresa mediante un nmero, por
tanto
se
pueden
realizar
operaciones aritmticas con ella.
Podemos distinguir dos tipos:
1.Variable discreta
Una variable discreta es aquella que
toma valores aislados, es decir no
admite valores intermedios entre
dos valores especficos.
2.Variable continua
Una variable continua es aquella que
puede tomar valores comprendidos
entre dos nmeros.
V a r ia b le s
C u a l it a t i v a o A t r i b u t o
E s c a la d e m e d ic i n
C u a n t i t a t iv a o N m e r i c a
E s c a la d e m e d ic i n
T ip o
N o m in a l
I n t e r v a lo
D is c r e t a
O r d in a l
R azn
C o n t in u a
TIPOS DE VARIABLES
Variable: corresponde a la caracterstica de la Unidad de Anlisis
Variables Cualitativas
Variables Cuantitativas
CONTINUA
DISCRETA
NOMINAL
ORDINAL
Intervalo
Caracterstica o cualidad
cuyas categoras no tienen
un orden preestablecido.
Ejemplos: Sexo, Deporte
Favorito, etc.
Caracterstica o cualidad cuyas
categoras
tienen
un
orden
preestablecido.
Ejemplos: Calificacin (S, N, A);
Grado de Inters por un tema, etc.
DISTRIBUCIN DE
FRECUENCIAS
La distribucin de frecuencias o tabla de frecuencias es una
ordenacin en forma de tabla de los datos estadsticos, asignando a
cada dato su frecuencia correspondiente.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias
absolutas de todos los valores inferiores o iguales al valor
considerado.
Se representa por Fi.
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia
absoluta de un determinado valor y el nmero total de datos.
Se puede expresar en tantos por ciento y se representa por ni.
La suma de las frecuencias relativas es igual a 1.
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la
frecuencia acumulada de un determinado valor y el nmero
total de datos. Se puede expresar
en tantos por ciento.
10
TIPOS DE GRFICOS
Un grfico estadstico es una representacin visual de una serie
de datos estadsticos. Es una herramienta muy eficaz, ya que un
buen grfico:
Capta la atencin del lector.
Presenta la informacin de forma sencilla, clara y precisa.
No induce a error.
Facilita la comparacin de datos y destaca las tendencias y las
diferencias.
Ilustra el mensaje, tema o trama del texto al que acompaa.
11
GRFICO CIRCULAR O DE
SECTORES
Un grfico de sectores es una representacin circular de las
frecuencias relativas de una variable cualitativa o discreta
que permite, de una manera sencilla y rpida, su comparacin.
Ideal para variables nominales
Se
hace
un
crculo
que
representa al 100% de los casos.
Se divide el crculo en sectores:
cada sector representa un valor
de la variable.
El tamao de cada sector
depende del porcentaje de
ocurrencia de cada valor.
Slo grafica un grupo por vez
No permite usar muchas categora
(por congestin visual).
ECONOMIA
18%
PSICOLOGIA
30%
INGENIERIA
10%
DERECHO
4%
ARQUITECTURA
10%
12
MEDICINA
28%
GRFICO DE
BARRAS
Un grfico de barras es una representacin grfica en un eje
cartesiano de las frecuencias de una variable cualitativa o
discreta.
Se manejan dos ejes.
El eje horizontal indica las
distintas categoras o valores
de la variable.
El eje vertical representa al
ndice estadstico o frecuencia
de cada categora.
Permite la comparacin de varios
grupos.
Las barras pueden juntarse o
separarse
para
denotar
la
continuidad de los valores de la
variable.
13
La orientacin
del grfico puede
ser:
Las
categoras
pueden
ordenarse
alfabticamente
facilitando su bsqueda o por sus frecuencias facilitando la
comparacin de los datos.
14
HISTOGRAMA
Se usa para representar las frecuencias de una variable
cuantitativa continua.
En uno de los ejes se posicionan las clases de la variable
continua (los intervalos o las marcas de clase que son los
puntos medios de cada intervalo) y en el otro eje las
frecuencias. No existe separacin entre las barras.
15
POLGONO DE
FRECUENCIAS
Otra forma de representacin de uso menos comn, y muy
parecida a las grficas de lneas, es el polgono de frecuencias.
La diferencia fundamental entre ambas es que en el polgono
de frecuencias se aaden dos clases con frecuencias cero: una
antes de la primera clase con datos y otra despus de la
ltima. El resultado es que se "sujeta" la lnea por ambos
extremos al eje horizontal y lo que podra ser una lnea
separada del eje se convierte, junto con ste, en un polgono.
16
17
DIAGRAMA DE TALLO Y
HOJAS
18
GRFICO DE
DISPERSIN
Un grfico de dispersin muestra en un eje cartesiano la
relacin que existe entre dos variables.
Este grfico nos informa del grado de correlacin entre las dos
variables.
Dentro de la correlacin lineal, en algunos grficos se dibuja la
recta de regresin obtenida gracias a un mtodo matemtico:
el ajuste lineal. Esta recta nos muestra ms clara y rpidamente
la tendencia de los puntos y, por tanto, la relacin.
19
ARREGLO DE
DATOS
Propuesta estadstica para el arreglo de datos
Datos
Agrupar en
clases
Distribucion
es de
frecuencias
Conjunto de
clases
estadsticas
Grficos
20
NMERO DE
CLASES
Clculo del nmero de
clases
Norma emprica
Frmula exponencial
Frmula logartmica
Norma emprica
Frmula
exponencial
Frmula logartmica
21
Parmetros Estadsticos
Medidas de tendencia
central
Mediana
Moda
Media
Media
Medidas de variabilidad y
dispersin
Medidas de
Posicin
Cuartiles
Deciles
Percentiles
22
Aritmtica
Media
Geomtrica
Media Armnica
Rango
Desviacin media
Varianza
Desviacin Estndar
Coeficiente de
variacin
Para datos no
agrupados
La media aritmtica es el valor obtenido al
sumar todos los datos y dividir el resultado
entre el nmero total de datos.
es el smbolo de la media aritmtica y
se calcula con la siguiente expresin.
Media
Aritmtica
Para datos
agrupados
Si los datos vienen agrupados en una tabla
de frecuencias, la expresin de la media es:
Media
Geomtrica
inflacin
razones
valores
que
muestren
una
24
progresin geomtrica (efecto multiplicativo
sobre el de los aos
25
Mediana
Para datos no
Es agrupados
el valor que ocupa el lugar central de
todos los datos cuando stos estn
ordenados de menor a mayor.
1 Si la serie tiene un nmero impar de
medidas la mediana es la puntuacin
central de la misma.
2 Si la serie tiene un nmero par de
puntuaciones la mediana es la media entre
las dos puntuaciones centrales.
Para datos agrupados
La mediana se encuentra en el intervalo
donde la frecuencia acumulada llega hasta
la mitad de la suma de las frecuencias
absolutas.
26
Para datos no
La agrupados
moda es el valor que tiene mayor
frecuencia absoluta.
Se representa por Mo.
Moda
27
No hay moda
Promedio
Promedio
Mediana
Mediana
Moda
Moda
moda
moda
moda
moda
Promedio
Mediana
28
Promedio
Promedio
Promedio
mediana
mediana
mediana
Frecuencia
Frecuencia
moda
promedio
promedio
mediana
moda
mediana
29
con
Medidas de variabilidad y
dispersin
Rango
Desviacin media
Varianza
Desviacin Estndar
Coeficiente de
variacin
30
31
Varianz
a
Donde:
xi : Marca de clase
fi: Frecuencia absoluta
k: Numero de clase
32
Propiedades de la varianza
1 La varianza ser siempre un valor positivo o
cero, en el caso de que las puntuaciones sean
iguales.
2 Si a todos los valores de la variable se les suma
Varianz
a
Desviaci
n
Estndar
Donde:
xi : Marca de clase
fi: Frecuencia absoluta
k: Numero de clase
34
un
nmero
la
desviacin
tpica
queda
36
Cuartiles
Si A es entero, entonces el Cuartil corresponde al
Qk
valor medio de las observaciones ubicadas en las
posiciones A y A+1.
Si A no es un entero, el Cuartil Q corresponde a
la observacin ubicada en la posicin entera
siguiente, es decir, A+1.
Para datos agrupados:
Deciles
Dk
Percentil
es
Pk
Forma de la Distribucin
Simetra
Asimetra Positiva
Asimetra Negativa
(Q3 - Q2 ) <
40
( Q2 - Q1)
El Coeficiente de
Variacin
Es otra medida de variabilidad que tiene la ventaja de ser
sin unidades.
Para una muestra de datos con media
y desviacin
estndar s, se define el coeficiente de variacin como
Si el 5% Cv 20%
----> datos con homogeneidad
aceptable. La media aritmtica es representativa.
42
-Asimetra
Otras medidas o
Coeficientes
-Kurtosis o Apuntamiento
Coeficiente de AsimetraCA
(x
i 1
x)3
n s3
(x x)
i 1
n s4
43
48
Los 5 elementos de un
problema de estadstica
La poblacin
de inters
inferencial
1.
2. Una o ms variables (caractersticas de
inters) a ser investigadas
3. La muestra estadsticamente
significativa
4. La inferencia que se hace sobre la
poblacin basados en la muestra
5. La medida de confianza de la inferencia
49
50
51
52
Medidas de forma
Coeficiente de curtosis
En algunos caso unos datos pueden estyar concentrados alrededor de la media, de manera que la distribucin tiene un
pico grande . En otro casos, la distribucin puede ser relativamente plana. Las medidas que determinan que tan
empinada se encuentra una distribucin se denominan coeficientes de curtosis, o simplemente curtosis. Una medida
que se usa con frecuencia est dada por
Cuando el valor de
Si
entonces la distribucin es ms empinada que la curva normal y se dice que es leptocrtica. Si
entonces la distribucin es ms aplanada que la curva normal y se llama platicrtica.
Observaciones:
Cuando se desea calcular el coeficiente de segso o de curtosis en una muestra slo se necesita reemplazar en la
expresin anterior el valor de la media poblacional por la media muestral y el tamao de poblacin por el tamao de la
muestra.
Si los datos estn agrupados o ponderados por
se multiplicara la expresin del parntesis en el numerador y el
denominador por
53
54
55
56
2) La Desviacin tpica
agrupados esta dada por:
Centro
de clase Amplitud
f1
f2
I1
c1
a1
I2
.
.
c2
a2
n1
n2
Ik
ck
ak
nk
fk
Total
FAA fra
sc
(c
j 1
para
datos
xc ) 2 f j
CAc
(c
j 1
xc ) 3 f j
s c3
Media c x c c j f j
CApc
j 1
57
(c
j 1
xc ) 4 f j
s c4
58
59