Академический Документы
Профессиональный Документы
Культура Документы
VARIABLES ALEATORIAS
Tabla 2.1 Variable aleatoria definida como la suma de puntos al tirar dos dados
r d1 d2 sud r d1 d2 sud r d1 d2 sud
1 1 1 1 2 13 13 3 1 4 25 25 5 1 6
2 2 1 2 3 14 14 3 2 5 26 26 5 2 7
3 3 1 3 4 15 15 3 3 6 27 27 5 3 8
4 4 1 4 5 16 16 3 4 7 28 28 5 4 9
5 5 1 5 6 17 17 3 5 8 29 29 5 5 10
6 6 1 6 7 18 18 3 6 9 30 30 5 6 11
7 7 2 1 3 19 19 4 1 5 31 31 6 1 7
8 8 2 2 4 20 20 4 2 6 32 32 6 2 8
9 9 2 3 5 21 21 4 3 7 33 33 6 3 9
10 # 2 4 6 22 22 4 4 8 34 34 6 4 10
11 # 2 5 7 23 23 4 5 9 35 35 6 5 11
12 # 2 6 8 24 24 4 6 10 36 36 6 6 12
Esta VA así definida toma 11 valores enteros posibles de 2 a 12, y posibilita representar
cada punto muestral con los valores de la VA. La anterior se puede graficar como la
Figura 2.1
19
Decir X(ri) = R, implica que a cada evento del S le corresponde un único número en el
campo de los Reales (R). Ejemplo, para la familia de los 3 hijos sea la VA, definida como
el número de niñas en la familia estudiada, Figura 2.2:
1 2 3 4 5 6 7
Resultados
Figura 2.3 Representación de la VA número de niñas (N) en una familia de 3 hijos.
NOTA: A cada evento del S le corresponde un único número en R, pero lo que no puede
suceder es que un evento se vaya en dos números diferentes como X (r 3) = 2 y X (r3) = 0.
Puede representarse funcionalmente como X(ri). Muchas VA, pueden definirse para un
mismo S, por ejemplo: con los 2 dados sean:
Y1 = el número salido al tirar el primer dado,
Y2 = el número al tirar el segundo dado,
X el promedio de tirar ambos dados,
X = (Y1 + Y2)/2 ;
X2 = (Y1 + Y2)2/Y1 ,y
X3 = Y1, etc.
20
secuenciales en que el primer valor indica si es N ó V en el primer nacimiento, etc.
Consiste de 23 puntos (con los cuales se pueden definir múltiples VA).
La división más gruesa habla de VA discretas y continuas. Una Variable Aleatoria Discreta
(VAD) surge generalmente del acto de contar, así sean contables finitos como en los
ejemplos mostrados o contables infinitos. El S que involucra un número contable de
puntos (finito o ) se dice discreto, o dicho de otra forma X(r i) se va solo en RE (enteros,
incluido el 0), por ejemplo, número de llamadas recibidas en una hora, número de
carambolas en un juego de billar, el número de fallas en un proceso de fabricación, el
número de árboles quemados en un incendio, el número de semillas germinadas en un
vaso de Petri.
Una Variable Aleatoria Continua (VAC), surge principalmente del acto de medir, puede
tomar cualquier valor en uno o más intervalos X(r i) R (menores, mayores o iguales a
cero), como el tiempo para que crezca un árbol, la altura de una planta, los kgm. de fruta
de un cultivo.
2.3 Función de probabilidad: Es otra función que le asigna a cada VA. DISCRETA, su
respectiva probabilidad, Figura 2.5. Se expresa como P(xi) = P (X = xi), o sea la
probabilidad de que la variable X tome el valor particular xi, por ejemplo si X = Número de
Niñas P(X=xi) = P(X=3) = 8/27.
21
La función de la suma de los dados podría también escribirse así:
xi 1
36 xi 2...6
p( xi )
13 xi xi 7...12
36
Una función de probabilidades debe cumplir:
X
1) pr ( x) 0, xi X ; 2) pr ( x) 1 100%
i 1
22
2) Tiene su F ( X xi ) F ( xi ) p( X xi ) que coincide con un área:
xi
F ( X xi )
f ( x)dx (2.4)
Por ejemplo, considérese que el tiempo de extinción de una partícula radiactiva sea t. Por
trabajos prácticos se sabe que la probabilidad de supervivencia de tal partícula, más allá
de un tiempo t1 ,es et , constante (se conoce o se averigua), p(t ti ) 1 F (ti ) et , en
i i
2) El término distribución se puede usar como genérico para denotar las funciones de
probabilidad o de densidad. En el último ejemplo se puede decir que el tiempo de
extinción sigue una distribución exponencial, o que es una variable exponencialmente
distribuida.
23
2.6.2 Resúmenes de los datos. El investigador antes de proceder a calcular debe
obtener una visión simplificada de sus datos. R le facilita esta labor. Para ver lo que
involucra el resumen estadístico de una prueba simple usaremos un archivo:
y
2.51 2.58 2.92 2.82 2.82 2.37 2.22 2.37 2.43 2.73
2.56 2.40 2.60 2.11 2.31 2.18 2.14 2.25 2.00 2.20
2.46 2.29 2.42 2.72 1.94 2.54 2.35 2.59 2.22 2.34
2.70 2.32 2.95 2.19 2.51 2.57 2.44 2.28 2.38 2.55
2.57 2.10 2.76 2.62 2.14 2.25 2.60 2.56 2.33 2.74
2.41 2.39 2.40 2.18 2.89 2.15 2.28 2.41 2.64 2.42
2.45 2.47 2.48 2.08 2.29 2.06 2.45 2.50 2.55 2.83
2.24 2.16 2.64 2.22 2.45 2.08 2.60 2.38 1.99 2.54
2.54 2.42 2.08 2.65 2.24 1.91 2.57 2.98 2.77 2.40
2.85 1.90 2.24 2.49 2.18 2.61 2.54 2.34 2.34 2.33
que se guardó como una sola columna en la dirección que se muestra, llamado das.txt:
data<-read.table("c:\\estadistica\\das.txt",header=T)
attach(data)
names(data)
[1] "y"
Usualmente deberíamos empezar con gráficos simples como, una gráfica indexada (index
plot): gráfico de dispersión con un argumento simple, en el cual los datos son graficados
en el orden en el cual fueron tomados o aparecen en el dataframe; una gráfica de cajas y
bigotes (box-and-whisker plot) y una gráfica de frecuencias (un histograma con
paralelogramos o cajuelas: bins) cuyos anchos los elige R). Se empezará con 3 de los
cuatro gráficos por salida con la siguiente orden:
24
21.75 en lugar del correcto 2.175: el error se vuelve evidente en la gráfica indexada (abajo
a la derecha). Este cuarto gráfico se hará alterando la base de datos, cambiando la
observación 52 por 21.75 en otro vector (y2) y graficamos
y2<-y
y2[52]<-21.75
plot(y2, main="Grafico con dato alterado",col="red")#Gráficos página anterior. Estos
resúmenes gráficos no podrían ser más simples. Existe otra orden; de muchas más
posibles, en R para histogramas, en la library(MASS)
truehist(y,main="Histograma de Y",col="gray")
Histograma de Y
1.5
1.0
0.5
0.0
2.7.1 Medidas de tendencia central (TC). Uno de los descriptores simples más
importantes, es el punto alrededor del cual se centra la distribución, conocidas como
medidas de TC. Las más importantes son la media, la mediana y la moda.
2.7.1.1 Valor esperado o media. El valor esperado, llamado media aritmética, promedio,
media, coincide con la esperanza matemática E(X), la cual se calcula como:
xi p( xi ) VAD
E ( X ) i (2.6)
x f ( x)dx VAC
Acá se puede pensar que el efecto de las funciones de probabilidad o de densidad es
asignar pesos relativos a los valores de la VA, por lo cual el valor esperado puede ser
mirado como el centro de gravedad de la distribución, esto es el punto alrededor del cual
la suma de las probabilidades a la izquierda balancea exactamente las de la derecha. Por
ejemplo encontrar el valor esperado al lanzar un solo dado libre de sesgos. Su espacio
muestral será:
Tabla 2.4. Probabilidades al arrojar un dado
25
6
E x xi p( xi ) 11 6 2 1/ 6 ... 6 1 6 3.5 * En este caso la variable aleatoria
i 1
Otro ejemplo: Sea Y una variable aleatoria que representa la vida en segundos de un
alevino en un estanque con adultos, de acuerdo con su peso en grm/100 (X), cuya función
de densidad se encontró experimentalmente como f (x ) 2.85 x 2 . Encontrar la vida media
30 30
1 2.85
para valores de 1 x 30, x: E ( x) x 2
dx x(2.85 x 2 )dx dx 9.6434 .
3 x 1 1
x
Dada una muestra de datos x1 , x2 , , xn se define la media aritmética muestral como:
n
x i n n
a) X i 1
; b) X xi fr ( x j ); c) X m j fr (mi ) (2.7)
n i 1 i 1
a) para datos sin agrupar, b) para datos discretos agrupados y c) para datos agrupados
en clases suponiendo que todos los datos de cada clase son idénticos a su marca de
clase, en que fr (x j ) son frecuencias relativas y fr (m j ) frecuencia relativa de la clase j. Se
prefiere esta media que usa todos los datos si ellos son muy homogéneos, pues es muy
sensible a las observaciones atípicas y un error en los datos puede distorsionarla
grandemente.
mean(y2)
[1] 2.615205
2.7.1.1.2 Cálculo de una media ponderada en R. Sea el valor de una variable aleatoria:
vec1<-c(1,2,3,4)#va,x en la tabla
fre<-c(3,4,6,2)#frecuencia, número de veces que se encontró el 1, el 2, etc.
sum(fre)#orden para sumar los datos en la variable fre
[1] 15
26
sum(vec1*fre)/sum(fre)
[1] 2.466667
2.7.1.2 Media geométrica. Cuando por intuición se aprecie que una distribución o una
población tiene comportamientos de progresiones geométricas o exponenciales, el valor
de equilibrio se puede estimar como
n
a) X g n
x
i 1
i ; b) X g Exp( LN ( x)) (2.8)
2.7.1.4 Media Harmonica: Para distribuir poblaciones que siguen una progresión
aritmética inversamente proporcional, como los tiempos promedios de rendimientos en
una tarea se acostumbra esta media:
n
XH n
(2.9) .
1
i 1 x
Para calcular por ejemplo el tiempo promedio de apeo o derribada de un árbol entre 3
hacheros que muestran los siguientes promedios/árbol tipo:
1. hachero tumba el árbol en 10’ en 1’ hace 1/10 de la tarea
27
2. hachero tumba el árbol en 15’ en 1’ hace 1/15 de la tarea
3. hachero tumba el árbol en 18’ en 1’ hace 1/18 de la tarea
3 3
Xh 13.5' 14.33' X o sea diferente a la media aritmética.
1 10 1 15 1 18 0.222
Otro contexto. Una hormiga, tiene un territorio cuadrado de 2 metros de lado. Inicia un
recorrido pausado a una velocidad de 1 m/min, acelera en el lado 2 y lo recorre a 2 m/min,
el tercer lado lo recorre aun mas rápido a 4 m/min, pero cansada decide recorrer el último
tramo a 1m/minuto.
espacio
Pero es correcta esta respuesta? Veámoslo con la Física. Recuerde que V m
min
.
tiempo
No queda duda que la hormiga recorrió 8 metros. Tiempos: primer recorrido: 2 min.,
segundo recorrido: 1min., tercer recorrido: 0.5 min., cuarto recorrido: 2 min. Por tanto, el
tiempo gastado total fue de 5.5 minutos. Entonces su velocidad promedio según la
8 m
fórmula debió ser V 1.4545 min
m
, que coincide con el cálculo de la media harmonica:
5.5 min
4
XH 1.4545 min
m
( 14 11 )
1
1
1
2
media.har<-function (x) 1/mean(1/x) #acá se declara que este objeto ahora es una función
media.har(vec1)
[1] 1.92
2.7.1.4 Mediana. Se define como el medio punto de la distribución. Para una función de
z
densidad f(x) la mediana es el punto tal que: f ( x)dx 0.50 , o sea el valor de la variable
aleatoria que tiene exactamente la mitad del área bajo la función de densidad. Se define
igual para VAD, como el valor de la VA por debajo o por encima del cual se sitúa el 50%
de los datos de una muestra. Si x1, x2 ... xn representan en orden creciente la colocación
de los datos de una población, entonces su mediana se obtiene como a) como el dato que
ocupa el lugar (n+1)/2; b) promedio de dos datos centrales:
Xn Xn
1
X me a) X n 1 ; si n es impar; b) 2 2
; si n es par (2.10)
2 2
28
Por ejemplo, la mediana ( X me ) de 3, 12, 4, 8, 5, 16, 24 3, 4, 5, 8, 12, 16, 24.
n 1 7 1 8 12
cuarto número, para la serie: 3, 4, 5, 8, 12, 16, 24 y 27 X me
10 .
2 2 2
Para datos agrupados, se calcula como el centro del intervalo central (xa , xb ) que
verifique:
F ( X xa ) 0.5 y F ( X xb ) 0.5 (2.11)
Es muy apropiada para variables aleatorias no distribuidas simétricamente ya que usa
menos información que la media pues solo tiene en cuenta el orden y no su magnitud por
lo cual no se altera mucho con algunos errores en los datos, por ejemplo útil en la
distribución de ingresos personales por grupos de familias, que queda quizás mejor
representada con su mediana que con X ya que no es sensitiva a los pequeños números
de las observaciones extremas. El índice de letalidad media de insecticidas es otro
ejemplo. Por otra parte puede variar más de muestra a muestra que la media por lo cual
X está más cerca de que la Mediana muestral de la Mediana poblacional.
Este estadístico es más elástico a las observaciones remotas que la desviación estándar
puesto que las distancias de la media vienen de sus cuadrados por lo cual las medidas
remotas podrían influenciarlas más drásticamente cuando en la MAD, las desviaciones de
un pequeño número de remotas, sería irrelevante. Por lo tanto, es una mejor medida de
dispersión para distribuciones sin media como la distribución de Cauchy, por ejemplo.
29
en que k es un factor de escala constante y depende de la distribución de probabilidades
1
elegida. Para datos distribuidos normalmente k 1.4826 en que 1 es la
1
(3 / 4)
inversa de la distribución acumulativa de una normal estandarizada. Por ello para la MAD se
tiene:
1 x MAD MAD
p x MAD p p z 2.11b
2
2.7.1.5 Moda. Para variables discretas es el valor de la VA con la más alta probabilidad.
En VAC es el valor de VA asociado con el máximo de la función de densidad. También se
define como el valor que más se repite. No es buena pues es altamente influenciable por
la muestra. Su principal uso es descubrir subpoblaciones S’ dentro de S o poblaciones,
pero su gran virtud sobre todo para muestreos es conducir al concepto de estratificación,
división en subpoblaciones como lo muestra la Figura 2.10.
En R no hay una función estándar para la moda, para ello hay que bajar la biblioteca
“modeest” y usar la función mfv(vector). Ejemplo sea un conjunto de datos:
y3=c(74,40,56,72,40,82,76,72,87,81,50, 65, 62)
30
Figura 2.11 Posición relativa de las 3 medidas de TC. Sesgos de una distribución. a)
Asimétrica positiva, b) negativa
Para simplificar la notación k será usado para designar E ( X k ) . Entonces 1 denota
E ( X 1 ) E ( X ) de la VA(X). k es conocido como el k-ésimo momento crudo de la
distribución o alrededor de cero, o quizás del origen.
31
sd(x)
[1] 7.631389
Un signo negativo muestra una larga cola a la izquierda del histograma con mediana >
media. La convención puede adoptar estos nombres por la posición de la mediana con
respecto a X . Cuando la mediana se localiza a la izquierda de la media se dice sesgo a la
3 3
izquierda o asimétrica positiva. La cantidad 1 = 3 = 33 mide el sesgo
2 2
3/ 2 3/ 2
r1<-mom3/(sd^3)
r1
sd 0.3145346
cp<-3*(mu-median(dicru$d))/sd
> cp
mean 0.6790207
data: y
32
skew = 0.11437, z = 0.49566, p-value = 0.6201
alternative hypothesis: data have a skewness
bonett.test(y)
data: y
tau = 0.19240, z = -0.22066, p-value = 0.8254
alternative hypothesis: kurtosis is not equal to sqrt(2/pi)
bonett.test(y)
33
2.7.3.6 Propiedades de la esperanza. Es interesante conocer, manejar y racionalizar los
siguientes conceptos, pues ayudan a entender otros; si k = constante:
1) E(k ) k p( x) k p( x) k (2.18)
2) E(kx) k x p( x) k x p( x) kE( x) (2.19)
3) E(k X ) E (k ) E ( X ) k E ( X ) (2.20)
4) E(k bX ) k bE ( x) (2.21)
5) E( X x ) E( X ) E ( X ) 0 (2.22) .
o sea, siempre la de desviaciones con respecto a la media = 0
2.7.4.1 Rango: Diferencia entre el mayor y el menor valor de una V.A. si X=x1, x2... xn,
entonces el rango muestral = xn x1 , se considera una medida de dispersión cruda, al no
considerar sino los valores extremos. También es muy improbable que una muestra
contenga los verdaderos X máximo y mínimo, por lo cual generalmente subestima el
poblacional, por lo cual será un estimador sesgado e ineficiente. Sin embargo es
considerado útil por algunos. Si se entrega como parte de una información, es importante
que vaya acompañado de otras medidas de dispersión.
En R, existe la función range que le entrega los valores mínimo y máximo del vector y la
función diff(range(X)) que le entrega el valor del rango definido. Ejemplo:
range(x)
[1] 3 24
diff(range(x))
[1] 21
2.7.4.2 Percentil: Se llamará percentil al valor de la VA por debajo del cual se encuentra
el p% de los datos, por ejemplo, en un número de datos impar, la mediana es el percentil
50. Estas fracciones también se llaman en general fractiles, deciles, etc. Por ejemplo se
llama cuartiles a aquellos valores que dividen la distribución en cuatro partes iguales, así
Q1 es por definición igual al percentil 25, el Q 2 coincide con la mediana y Q3 es el percentil
75. Son usados para dar dispersión de datos ordenados como el Rango intercuartilítico o
rango intercuartil (RI) que es la diferencia entre los percentiles 75 y 25. En R, existe la
función quantile(x,porcentaje). Ejemplo:
34
quantile(y,0.25)#Entrega el percentile 25 de y
25%
2.241465
quantile(x,0.25)
25%
4.5
Considérese por ejemplo que un ave, sea encontrada anidando en otras localidades
diferentes como enredaderas, aleros de las casas, ramas de los árboles o en cavidades
en las paredes. Si de 20 nidos observados, se encontraran de a 5/localidad, entonces se
podría hablar de una gran diversidad en sitios de anidamiento, pero si 17 nidos estuvieran
ubicados en las ramas de los árboles y 1 en los otros sitios, se hablaría de baja
diversidad. En otras palabras, observaciones distribuidas regularmente (similarmente)
entre las diversas categorías dan idea de alta diversidad, pero si el grueso de las
observaciones ocurre en sólo algunas de ellas se habla de baja diversidad.
35
También se conoce como Shannon Wiener, k = número de categorías, pi igual a la
proporción de observaciones encontradas en la categoría i cuando se tiene n = tamaño
muestral y fi = número de observaciones en la categoría i, con p i = fi/n, con lo cual (1) se
puede reescribir como:
k
n log n fi log fi
H i 1
(2.31)
n
Tabla 2.6 Sitios de anidamiento de las aves, en una ciudad y otros cálculos
Frecuencias observadas productos fre LOG fre
Localización
Muestra1 Muestra2 Muestra3 fi Log fi1 fi Log fi2 fi Log fi3
(i)
Enredaderas 5 1 2 3.495 0 0.602
Aleros 5 1 2 3.495 0 0.602
Ramas 5 1 2 3.495 0 0.602
Cavidades 5 17 34 3.495 20.918 52.07
n 20 20 40
Sumas 13.979 20.918 53.876
Shannon 0.602 0.255 0.255
H´max 0.602 0.602 0.602
J´ 1 0.424 0.424
El muestreo de sitios de anidamiento de las aves, en la ciudad dado por la Tabla 2.6,
presenta las soluciones. Cualquier base logarítmica puede usarse para ello, siendo muy
usadas las de 10, e, 2. Puede transitarse de una a otra así, Tabla 2.7. Por ejemplo si
H’=0.255 usando Base e, entonces H’=(0.255)x(3.3219) = 0.847 usando la base 2.
Tabla 2.7 Factor de multiplicación para convertir (H, H’, Hmax, H’max) calculadas
con bases diferentes
Este ha sido denominado como: índice de uniformidad por Pielow, pero sería preferible
asumirse como de homogeneidad o diversidad relativas. El complemento 1-J’ se muestra
también como un índice de heterogeneidad o de dominancia. Por lo expresado acerca de
36
k como subestimador del número de categorías de una población, la uniformidad muestral
J’ sobreestimará la de la población, siendo J’ un estimador sesgado.
p( x ,
j i
i yj ) 1 (2.38);
F ( xi , y j ) Pr( x xi y y y j ) (2.39)
y su covarianza, es una medida de la variación conjunta de dos variables aleatorias y se
define como: Cov( X , Y ) xy y es también:
E ( X x )(Y y ) ( x )( y
j i
i x j y ) p( xi , y j ) E ( XY ) E ( X ) E (Y ) (2.40) .
Ejemplo Al medir la estatura y peso de unas personas se obtuvieron los siguientes datos
Tabla 2.7.1, en la cual se dan diversas formas de calcular la covarianza
37
y volúmenes de pulpa, en una industria, los daños pudieran ser eléctricos y mecánicos,
etc.
Tabla 2.7.1 Datos para calcular covarianza entre estatura y peso de una muestra de
personas
Estatura Peso Estat -Estpr Peso - Pespr (Estat -Estpr)(Peso-Pespr) Estat*Peso
0.55 8 -0.65 -32.64 21.22 4.4
0.65 12 -0.55 -28.64 15.75 7.8
0.75 17 -0.45 -23.64 10.64 12.75
0.85 22 -0.35 -18.64 6.53 18.7
0.95 26 -0.25 -14.64 3.66 24.7
1.05 32 -0.15 -8.64 1.3 33.6
1.15 38 -0.05 -2.64 0.13 43.7
1.25 42 0.05 1.36 0.07 52.5
1.35 42 0.15 1.36 0.2 56.7
1.45 54 0.25 13.36 3.34 78.3
1.55 60 0.35 19.36 6.78 93
1.65 66 0.45 25.36 11.41 108.9
1.75 72 0.55 31.36 17.25 126
1.85 78 0.65 37.36 24.28 144.3
medias 1.2 40.64 0 0 8.75 57.53
Covarianza 8.75
En la tabla 2.8, Figura 2.12 se estudia el caso de tirar 2 dados con las definiciones dadas
para las VA X = puntos al tirar el primer dado, Y valor alcanzado por el segundo dado con
respecto al primero
0, si el valor del segundo dado es menor que el del primero.
Y = ,
1, en caso contrario.
38
La distribución acumulativa correspondiente a esta distribución conjunta se da en la Tabla
2.9 Por ejemplo el cálculo de F(3, 1) = 0 + 6/36 + 1/36 + 5/36 +2 /36 + 4/36; así mismo:
F(4, 1) = 0 + (6 + 1 + 5 + 2 + 4 + 3 + 3) = 24/36...etc.
39
attach(dap)
names(dap)
[1] "d"
frec <- cut(d, breaks = 7,dig.lab = 4, right = FALSE)#Solicitud de 7 clases
tab.fr <- table(frec)#coloca los datos en las respectivas clases. Archivo muy largo
tadefr<-as.data.frame(tab.fr)#Construye como dataframe la table de frecuencas
tadefr
frec Freq
1 [10.27,12.81) 8
2 [12.81,15.32) 8
3 [15.32,17.84) 5
4 [17.84,20.36) 6
Etc…
2.8.2 Histogramas. Son tipos de cartas de barras que despliegan la información en tablas
en frecuencias relativas generalmente o a veces la absoluta, cuyo objetivo es causar un
buen impacto visual para resaltar ciertos elementos de la distribución, Figura 2.13,
construido con R, con los datos anteriores mediante:
10 15 20 25 30
d
Figura 2.13 Histograma de los d para la parcela de roble
Esto puede graficarse de diferentes maneras: primero haremos una tabla resumen,
entonces vemos las siguientes opciones:
table(pref)
pref
1 2 3 4
10 4 8 3
par(mfrow=c(1,3))
barplot(pref,main="1a opcion, muchas clases")
barplot(table(pref),main="Agrupado en categorías")
barplot(table(pref)/length(pref),main="Agrupado pero por proporciones")
40
1a opcion, muchas clases Agrupado en categorías Agrupado pero por proporciones
0.4
10
4
0.3
3
0.2
2
0.1
1
2
simple pastel con nombres otros colores
0.0
0
0
1 2 3 4 1 2 3 4
Una gráfica alternativa a la anterior es del tipo pastel que se obtiene en R así:
6 Casero Casero
7 5
43 vas vas
8
9 2
10 Embot Embot
1
11 25 botella botella
12
13 24 Importado Importado
14
15 23
16 22
17 18 19221
0 Callejero Callejero
2.8.3 Cinco números resumen. Son un conjunto de estadísticos que sumarizan una
distribución en forma general: El mínimo, el máximo, los cuartiles y la mediana, pues
generan el rango intercuartil, la distancia entre el primero y el tercero como una medida
burda de dispersión o variabilidad. En R se logran mediante
summary(d)
Min. 1st Qu. Median Mean 3rd Qu. Max.
10.29 14.90 19.60 19.34 24.70 27.91
41
Con R, para el conjunto de daps de roble se calcula el rango intercuartil como:
IQR(d)
[1] 9.7925
2.8.3.2 Observaciones extremas o ouliers extremos, son los que se desvían más del
doble de los ordinarios. Los outliers extremos se desvían del cuartil más cercano por lo
menos tres veces el rango intecuartil. Por ejemplo dap mayores a 0.45 m
(0.225+3.0*0.075) o menores que (0.15-3.00*0.075) se clasifican como observaciones
remotas extremas.
Aparte de los conceptos vistos existen otros métodos gráficos simples de construir que
buscan mostrar patrones de distribución y corrigen ciertos errores cuando se hacen
agrupamientos de clase poco exitosos. De estos son particularmente interesantes los de
tallo y ramas y cajas de Tukey y el de bigotes de Box y Cox, y el de Pareto para variables
cualitativas.
2.8.4 Diagrama de Caja, Muesca y Bigotes (Box and Wishkers Plots). Se basan en
representación semigráficas para mostrar las características principales y datos atípicos
de una distribución de frecuencias, enfocándose en las colas de ella, con indicaciones de
la localización de la mediana y el rango intercuartilítico, que al depender del orden de los
datos y no de su magnitud, son poco influenciables por valores atípicos. En resumen
grafican los cinco números de resumen de los datos, con información acerca de la
localización, dispersión, sesgo y colas de unos datos.
La localización queda representada por la línea (la mediana) que corta la caja dentro de
ella, la dispersión por la altura de la caja (distancia entre los extremos de los bigotes), el
sesgo se muestra en la desviación dada entre la mediana y el centro de la caja o, por la
relación entre las longitudes de los bigotes. Las colas se aprecian por la longitud de los
bigotes relativa a la altura de la caja, y por observaciones alejadas que se dibujan
exprofeso. Los de caja se construyen así:
1- Se ordenan los datos de la muestra y se obtiene los valores mínimo, máximo y los tres
cuartiles principales Q1 , Q2 y Q3 .
2- Se dibuja un rectángulo con extremos en Q1 y Q3 y se indica la posición mediana en Q2
3- Se calculan los límites posibles para los valores atípicos, ecuación (2.41), por fuera de
los cuales se consideran los valores atípicos.
42
145 152 158 158 164 168 174 178
148 153 158 159 165 170 175 179
148 155 158 160 165 170 175 180
150 155 158 161 165 170 175 180
150 157 158 162 167 172 175 183
Figura 2.14 a) Diagrama de caja para los datos de la Tabla 2.11, b) de bigotes y
muesca (wishker notch)
En R, existe en la library(car) una función más elaborada para esos gráficos. Ejemplo la
base d datos ya usada data<-read.table("c:\\estadistica\\das.txt",header=T), Hagamos
y[101]<- -3.8
y[102]<- 7.6
Boxplot(~y, id.n=Inf,main="Boxplot con iden de remotos") # identify all outliers
[1] "101" "102"
Boxplot con iden de remotos
8
102
6
4
2
y
0
-2
101
-4
2.8.5 Diagrama de Tallos y hojas (Steam and Leafs). Es otro procedimiento, debido a
Tukey, para usar especialmente ante un número bajo de datos Figura 2.15. Consistente
en:
1- Redondear los datos a dos o tres cifras significativas expresados en unidades
convenientes
2- Generar una tabla con dos columnas separadas por una línea que: a) para números
con dos dígitos se escriben a la izquierda las cifras de las decenas que forman el tallo y a
43
la derecha las unidades. Por ejemplo 63 se escribe 6|3. Para tres cifras el tallo se
compondrá de decenas y centenas, así por ejemplo, 145 se escribe como 14|5, etc.
3_ Cada tallo define una clase y es escrito una sola vez, el número de hojas representa la
frecuencia de la clase.
3 14|588
7 15|0023
17 15|5578888889
(4) 16|0124
19 16|55578
14 17|00024
9 17|555589
3 18|003
Figura 2.15 Diagrama de tallo y hojas para los datos de la Tabla 2.9
ala<-read.table("clipboard")
> attach(ala)
> names(ala)
[1] "loala" "esp"
library(aplpack)
a<-loala[1:27]
b<-loala[28:47]
stem.leaf.backback(a,b)
_________________________________
1 | 2: represents 1.2, leaf unit: 0.1
a b
_________________________________
| 5* |
1 9| 5. |8 1
44
3 43| 6* |1 2
6 885| 6. |6 3
11 43200| 7* |0124 7
(6) 988776| 7. |88 9
10 21| 8* |133 (3)
8 7| 8. |59 8
7 0| 9* |2 6
6 77| 9. |78 5
| 10* |
4 7| 10. |
3 3| 11* |2 3
2 86| 11. |
| 12* |
_________________________________
HI: 12.6
14.2
n: 27 20
_________________________________
45
Distribucion de la edad a una linea base
85+
80-44
75-79
70-74
65-69
60-64
55-59
50-54
45-49
40-44
35-39
30-34
25-29
20-24
15-19
10-14
5-9
0-4
4 2 0 0 2 4
Hombres Mujeres
Alv aro/2018-02-11
46
D 10
R 8
C 6
A 2
freda
T I S D R C A
72 48 18 10 8 6 2
pareto.chart(freda)
Los datos permiten ver que dos de los defectos tipifican en alto grado, quedando el resto
como incidentes menores. que produce, además, cuando le agregamos una línea con el
porcentaje de explicación acumulado deseado (por ejemplo, del 75%). Al hacer esto se
puede ver en el eje y cuanto corresponde al 75% de las frecuencias, para lo cual
adicionamos las frecuencias usando la función sum(freda) que multiplicamos por 0.75.
Luego se coloca la línea horizontal con la función de R (h=…) en este caso h= para
sum(frecuencias)*0.75. con color rojo, ancho de línea, ejemplo de 4, con la función lwd=4,
asi:
abline(h=(sum(fre)*0.75),col="red",lwd=4)
Diagrama de Pareto
100%
150
75%
Cumulative Percentage
100
Frecuencia
50%
50
25%
0%
0
T I S D R C A
Daños
Figura 2.16 Diagrama mejorado de Pareto para los datos de la Tabla 2.12
47
cex.names=0.5 reduce las Fuentes de las etiquetas(0.5-0.8 muy usados)
las=1: orientación de las etiquetas en los ejes (1=todos horizontalmente, 2= todos
verticalmente, 3=perpendicular a los ejes)
pareto.chart(freda,main="Diagrama de Pareto",xlab="Daños",ylab="Frecuencia",
cex.names=0.6,las=1,col=terrain.colors(6))
abline(h=(sum(freda)*0.75),col="red",lwd=4), etc.
Cuando el número de eventos que componen ciertos conjuntos se vuelve muy grande es
importante conocer número y propiedades de los grupos que se pueden formar con los
diversos elementos de un S o de varios S, al distinguirlos por el número de elementos que
entran en cada grupo, por las clases de elementos y/o por el orden de colocación de ellos
dentro del grupo. De ello se ocupa el AC.
2.9.1.1 Formación de las variaciones de grado n. Por sus diversos grados se forman
así: Las monarias o de 1er grado son los m elementos tomados aisladamente: a, b,
c…….., m, las binarias o de 2 grado se obtiene colocando uno a uno a la derecha de
cada elemento, los elementos restantes, las terciarias o de 3er grado se obtienen al
colocar a la derecha de cada binaria los m - 2 elementos restantes y, las n-arias o de
grado n se forman a partir de las de grado (n - 1) colocando todos los m - n + 1 elementos
restantes. Por ejemplo, sean a, b, c, ch, ... l, m elementos o m grupos distintos. Entonces:
48
ba, bc ... bl
Ternarias: abc, abd, ... abl ... acb, acd ... acl. etc.
2.9.2 Permutaciones. Se llaman así a los grupos que pueden formarse con todos los
elementos de modo que se diferencien por el orden de colocación; o dicho de otra forma
una permutación es una V mm .Se designan como:
m! m!
Pm Vmm m! (2.49)
(m m)! 0!
Similar al concepto anterior existen las permutaciones circulares, en las cuales por
tratarse de un contorno cerrado no habrá ni primero ni último elemento. Entonces
tomando fija la posición de cualquiera de los elementos solo quedan (m 1)! formas
distintas de organización. Se expresa entonces como:
Pc( m ) (m 1)! (2.50)
En R, en la librería DescTools, encuentra como formar esas permutaciones, ejemplo:
x<-letters[1:3]
> Permn(x)
[,1] [,2] [,3]
[1,] "a" "b" "c"
[2,] "b" "a" "c"
[3,] "b" "c" "a"
[4,] "a" "c" "b"
[5,] "c" "a" "b"
[6,] "c" "b" "a"
49
2.9.3 Combinaciones. Se llaman combinaciones de m elementos de grado n, a los
diferentes grupos que puedan formarse con n elementos de los m dados, de modo que
uno difiera de otro no en el orden de colocación, sino en un elemento por lo menos.
Las ternarias escribiendo a la derecha de cada binaria cada uno de los elementos que
siguen en su orden dado:
50
4) Aplicando reiteradamente la anterior:
m m 1 m 2 m 3 m n m n
...
n n n 1 n 2 1 0
n n 1
5) Aplicando reiteradamente la 3): que al sumar y simplificar conduce a la
n n 1
importante fórmula:
m m 1 m 2 m 3 n n 1
...
n n 1 n 1 n 1 n 1 n 1
6) Aplicando algunas de las anteriores se puede encontrar el número de grupos entre los
m tomando los p primeros. Los sumandos de la derecha son grupos donde no entra
ninguno de los p primeros pero si uno, dos, tres, o p primeros:
m p m p p m p p m p p m p
...
n 0 n 1 n 1 2 n 2 p n p
2.9.4 Variaciones con repetición. Aquellas cuyos elementos pueden repetirse una o
varias veces se representan como VRmn , por ejemplo: las variaciones binarias de m
elementos a, b, ...k, l se formarán así:
Ejemplo formar las variaciones con repetición de orden 3 de las cuatro primeras letras del
alfabeto:
x <- letters[1:4]; n <- length(x)
x
[1] "a" "b" "c" "d"
n
[1] 4
51
[5,] "a" "b" "b"
[6,] "a" "b" "c"
2.9.5 Permutaciones con repetición. Implica suponer que entre los m elementos hay
iguales al elemento a, iguales al b, etc, de forma que m Suponiendo que
todos los elementos fueran distintos Pm m ! , pero hay ! permutaciones iguales:
m! m!
Pm ; si hay ! permutaciones iguales entonces Pm , , si hay ! permutaciones
! ! !
iguales entonces:
m!
Pm , , ... (2.54)
! ! !... !
pero ... m .
o sea que el elemento escrito en primer lugar puede repetirse, lo que equivale a un
elemento más, entonces:
m 1 m n 1
VRm2 CRm2 P2 Cm2 1 ; CRmn n 1 (2.55)
2 n
Ejemplos: 1) De Medellín a Cali hay 15 municipios de parada de un transporte. ¿Cuántos
tiquetes distintos deberían imprimirse de modo que cada uno lleve los nombres de los
municipios de origen y de llegada? b) Si cada tiquete se usa indistintamente para dos
municipios, es decir de AZ, sirve como de ZA.
15 14
a) V152 15 14 210 tiquetes b) 105 tiquetes
2
2) Cuántos números de 3 cifras pueden formarse a) sin que haya ninguna repetida en
cada número, b) si se pueden repetir las cifras
a) V103 10 9 8 720 ; pero hay que restar los números que empiezan por cero o sea:
720-72=648. b) VR103 VR102 103 102 900
52
Casos favorables
P . Casos posibles:V62 62 36 Casos favorables:
Casos posibles
6 y 4, 4 y 6, 5 y 5
; para 10: 3, para 11: 2, entonces:
6 y 5, 5 y 6
3 2 3 2 5
P10 ; P11 ; P .
36 36 36 36 36
6) Una bolsa con 12 cartulinas del 1-12, qué probabilidad tendrá de que al extraer dos
cartulinas sumen el número 10.
Casos posibles: V122 122 12 11
Casos favorables 1+ 9 = 2 + 8 = 3 + 7 = 4 + 6 = 6 + 4 = 7 + 3 = 8 + 2 = 9 + 1 4 casos
favorables, al solo importar la suma:
4
P 0.03
12 11
7) El naipe español tiene 40 cartas (rey, caballo, sota, 7, 6, ..., 2, as) y 4 pintas, oro, copa,
espada y bastos. ¿Cuál será la probabilidad de que a un jugador le lleguen 3 reyes en un
manojo de 6 cartas?. Casos posibles:
40 40 39 38 37 36 35 ´
3 838.380
6 6!
Casos favorables:
4 36 4 3 2 36 35 34 28.560
28.560 , entonces P 0.00744
3 3 3 2 1 2 3 ´
3 838.380
8) En un estante de una biblioteca con espacio para 25 libros hay 7 de estadística, 8 de
física y 10 de química. De cuántas maneras diferentes pueden colocarse según la
temática tratada? Son unas permutaciones con repetición:
25!
P257,8,10 21.034´470.600
7! 8! 10!
Es posible demostrar que la suma de todas las combinaciones sin repetición de n
elementos desde los de orden 1 hasta los de orden n es Sc = 2n – 1.
Dos VAC X y Y se dice que tienen una función bivariada o conjunta de densidad de
probabilidades, f(x, y), si para dos pares de valores (x1, x2) y (y1, y2),
y2 x2
p( x1 X x2 y y1 Y y2 ) f ( x, y) dx dy (2.56)
y1 x1
53
x1 y1
F ( x1 , y1 ) p1 ( x x1 , y y1 ) f ( x, y ) dx dy (2.57) .
La proporción del volumen generado con respecto al volumen del cilindro total total da la
probabilidad, Figura 2.17, que equivale al área gris claro contra el área total gris. El
volumen del cilindro equivale al 100% de probabilidades
Por ejemplo para un embarque de mercancía, se garantiza que llegará a unas horas
dadas en un día escogido. Un comerciante específico encargará dicha mercancía durante
el mismo día. Sea: X = tiempo de recibo de la mercancía en fracciones de día, tales que:
0 X 1 y Y = tiempo de encargo de la mercancía en fracciones de día, tal que 0 Y 1.
Los recibos muestran que es muy probable que la mercancía sea recibida durante cortos
intervalos de tiempo por día, incluso antes de ser pedidos, y lo mismo para los intervalos
de solicitud y casi de igual longitud, o sea que los intervalos llegada–solicitud, son también
igualmente probables, por lo cual la función conjunta f(x, y) = 1. Cuando se cumpla lo
anterior este problema gráficamente debe ser como lo presenta la figura 2.18 a),
Problema (1). Cuál será la probabilidad de que tanto el encargo como la entrega de las
mercancías ocurran hasta el mediodía (12 m). Se plantea como:
54
1 1 1 1 1 1 1 1
Pr 0 X y 0 Y 2 2 1dxdy ; o XY 0
12
2 2 0 0 4 2 2 4
Sin hacerlo matemáticamente la 1 4 , como lo muestra la figura 2.18 b).
Problema (3). Cuál será la probabilidad de que el encargo ocurra durante el medio día
siguiente a su llegada, importante para artículos perecibles. Entonces se puede hacer en
1
dos partes: p 0 X 1 y X Y X 1 , Figura 2.18 d), o sea:
2
1 1 1 1 x 1 1 1 1 1 3
p0 X y x Y x p x 1 y x Y 1 2 2 1dydx 1 1dydx
2 2 2 0 x
2
x 4 8 8
que muestra como se distribuye X para cada valor yj. Figura 2.18. Similarmente, para X y
Y funciones continuas con función de densidad conjunta f(x, y):
f1 ( x) f ( x, y ) dy; f 2 ( y) f ( x, y ) dx (2.51)
En el problema de la mercancía:
1 1
f1 ( x) 1dy 1 0 X 1; f 2 ( x) 1dx 1 0 Y 1
0 0
55
p xi , y j p1 xi p2 y j xi y j en VAD
(2.52)
f ( X , Y ) f1 ( X ) f 2 (Y ) XY en VAC
concepto fundamental en el estudio de variables aleatorias. Se puede decir de muchas
formas, dos variables aleatorias X 1 y X 2 son independientes si el conocimiento que se tiene
de una de ellas no aporta información respecto de los valores que alcanzará la otra, o
como se expresó: si f (X1 X2 ) f (X1 ) o sea que la función condicionada es idéntica a la
función marginal, por ello también se puede decir que
f ( X1 , X 2 ) f ( X1 ) f ( X 2 ) (2.53)
ya vista. Es una condición tan fuerte la independencia que si varias VA x1 , x2 , , xn , aún
como datos son independientes también lo será cualquier subconjunto de ellas como:
x1 , x2 , , xh con h n . Igual cosa sucede para cualquier conjunto de funciones de las
variables individuales g ( x1 ), g ( x2 ), , g ( xn ) o de conjuntos disjuntos de ellas
g1 ( x1 , x2 , , xi ), g2 ( x1 , x2 , , xk ), , gn ( x1 , x2 , , xn )
Por ejemplo, si al medir las alturas, diámetro y posición sociológica (PS) de unos árboles,
o sea la ubicación de sus copas en el dosel, la distribución de las alturas con una PS=3 es
la misma que con PS=2, altura y PS resultan independientes.
56
Para muchas operaciones o demostraciones con variables aleatorias es importante
recordar que:
1) E ( X Y ) x y (2.58)
2) E( X ) x (2.59)
3) E ( XY ) E ( X ) E (Y ) x y si X y Y son VA independientes (2.60)
4) VAR( X Y ) VAR( X ) VAR(Y ) 2COV ( X , Y ) si X y Y no son VAI (2.61)
5) VAR( X Y ) VAR( X ) VAR(Y ) si VA independiente (2.62)
6) VAR( X Y ) VAR( X ) VAR(Y ) 2COV ( X , Y ) si no son VA indep. (2.63)
7) VAR( X Y ) VAR( X ) VAR(Y ) si VA independiente (2.64)
3
11 Ε ( X 1 1 )2 ( x1i 2.15) 2 pi ( X 1 )
i 1
2
22 Ε ( X 2 2 )2 ( x2 j 1.30)2 p j ( X 2 ) (1 1.30)2 *0.70 (2 1.30) 2 *0.30 0.21
j 1
3 2
12 Ε ( X1 1 )( X 2 2 ) ( x1ij x1 )( x2ij x2 ) pij ( X1 , X 2 )
i 1 j 1
57
X
Y 1 2 yp(y) (y-pr)^2 cálculos covar
1 0.21 0.05 0.26 0.26 0.344 0.072 -0.040
2 0.18 0.15 0.33 0.66 0.007 0.008 -0.016
3 0.31 0.1 0.41 1.23 0.296 -0.079 0.060
0.7 0.3 1 2.15 0.648 VAR(y) 0.001 0.004 0.005
x*p(x) 0.7 0.6 1.3 covarianza
p(x-
0.063 0.147 0.21 VAR(x)
pr)^2
corr 0.009
sik
(x 1
ij xi )( xkj xk )
ik
j
(2.67)
n n
sii skk
(x
j 1
ij xi ) 2
(x
j 1
kj xk ) 2
58
coeficientes de correlación se encontraron los valores de la Tabla 2.15. Resulta claro que
las observaciones remotas o atípicas tienen un efecto considerable en 12 .
Ejemplo R:
Sean unos datos da campo
asnm temp pH nuesp
1 300 26 3.5 78
2 750 24 6.33 86
3 1200 23 3.28 103
4 1500 22 6.01 105
5 1800 20 5.25 103
6 2100 18 6.13 120
7 2500 16 4.01 124
8 3200 13 5.81 132
9 3600 12 4.96 145
10 4000 8 4.45 170
eco<-read.table("clipboard")
attach(eco)
names(eco)
[1] "asnm" "temp" "pH" "nuesp"
> summary(eco)
asnm temp pH nuesp
Min. : 300 Min. : 8.00 Min. :3.280 Min. : 78.0
1st Qu.:1275 1st Qu.:13.75 1st Qu.:4.120 1st Qu.:103.0
Median :1950 Median :19.00 Median :5.105 Median :112.5
Mean :2095 Mean :18.20 Mean :4.973 Mean :116.6
3rd Qu.:3025 3rd Qu.:22.75 3rd Qu.:5.960 3rd Qu.:130.0
Max. :4000 Max. :26.00 Max. :6.330 Max. :170.0
var(eco)#Matriz de covarianzas
asnm temp pH nuesp
asnm 1505805.5556 -7143.3333 128.9055556 33114.4444444
59
temp -7143.3333 34.4000 -0.4840000 -158.9111111
pH 128.9056 -0.4840 1.2522011 0.4402222
nuesp 33114.4444 -158.9111 0.4402222 765.8222222
cor(eco)#Matriz de correlaciones
asnm temp pH nuesp
asnm 1.00000000 -0.99251538 0.09387504 0.97514465
temp -0.99251538 1.00000000 -0.07374441 -0.97906395
pH 0.09387504 -0.07374441 1.00000000 0.01421579
nuesp 0.97514465 -0.97906395 0.01421579 1.00000000
Plot(eco)
10 15 20 25 80 120 160
3000
asnm
1000
25
20
temp
15
10
5.5
pH
4.5
3.5
160
nuesp
120
80
Son las que se forman de modo que una variable nueva aparezca como el resultado de
aplicar una operación a otras. De ellas las más conocidas son las famosas combinaciones
lineales. Sea X1, X2 ... Xn, una serie de variables aleatorias que pudieran reunirse en una
sola variable así:
k
Yi a1 X 1 a2 X 2 ak X k ... a j X j ; a j constante (2.68)
j 1
por ejemplo:
Ye a1 X 1 a2 X 2 2 (Ye ) 2 (a1 X 1 a 2 X 2 ) a1a1 2 ( X 1 ) a1a2 ( X 1 , X 2 )
a2 a1 ( X 1 , X 2 ) a2 a2 2 ( X 2 ) a12 2 ( X 1 ) 2a1a2 ( X 1 , X 2 ) a22 2 ( X 2 )
60
en que ( X 1 , X 1 ) 2 ( X 1 )
k k k
(Y1 , Y2 ) ai X i , b X
a j b j ( X j )
i i
2
(2.73)
j 1 j 1 j 1
Ejemplo. Y1 a1 X1 a2 X 2 ; Y2 b1 X1 b2 X 2 (Y1 , Y2 ) a1b1 2 ( X 1 ) a2b2 2 ( X 2 )
61