Вы находитесь на странице: 1из 33

ELEMENTOS DE PROBABILIDAD Y ESTADÍSTICA

ESTADÍSTICA  DESCRIPTIVA

1.­  TERMINOLOGÍA. TABLAS Y GRÁFICOS ESTADÍSTICOS

La población es el conjunto de de todos los elementos, que cumpliendo una 
condición, deseamos estudiar.
Por ejemplo: los habitantes de una ciudad, los alumnos de un colegio, las 
gallinas de una granja, etc.

Un individuo es cada uno de los elementos de la población.

Una  muestra  es  cualquier  subconjunto  de la población  (por ejemplo: 100 


alumnos del colegio, 1.000 habitantes de una ciudad, 300 gallinas de una granja, 
etc).

Cada   una   de   las   propiedades   que   se   pueden   estudiar   se   llama  carácter 


estadístico (por ejemplo: talla, peso, sexo, estado civil, etc).

Pueden ser cuantitativos si se pueden medir numéricamente (por ejemplo: 
la talla, el peso, etc) o  cualitativo  si no se puede medir numéricamente (ej: sexo, 
estado civil, etc).

Al conjunto de valores que toma un carácter se le llama variable estadística 
que podrá ser cualitativa o cuantitativa, dependiendo de si el carácter es cualitativo 
o cuantitativo, respectivamente.
Una variable  será  discreta  si  sólo  puede  tomar determinados  valores  (ej: 
número de hermanos, número de aprobados, etc).
Una variable será continua si puede tomar todos los valores posibles de un 
intervalo (ej: altura de una persona, peso, etc).

A veces (sobre todo en las v.continuas) es necesario agrupar en intervalos 
los valores. A esos intervalos se les llama intervalos de clase. Al punto medio de 
cada intervalo de clase se le llama marca de clase (xi). Por ejemplo, si estudiamos 
las alturas de 1.000 personas, es lógico agrupar dichas alturas en intervalos de, por 
ejemplo, 10 cm. 
Es decir:    [1’40 , 1’50) , [1’50 , 1’60) ........ [2’40 , 2’50). Las marcas de clase 
serán: 1’45 , 1’55 , 1’65 ,..........., 2’45

1
La frecuencia absoluta (  fi ) es el número de veces que se repite un valor (si 
están agrupados en intervalos de clase, la frecuencia absoluta del intervalo será el 
número de veces que aparece un valor cualquiera de ese intervalo).

La  frecuencia  relativa  (  fri ) de  un  valor es  el  cociente  entre  la frecuencia 
f
absoluta del valor y el número total de datos  ⇒ fri = i
   N

La frecuencia absoluta acumulada (  Fi ) de un valor es la suma de todas las 
frecuencias absolutas de los valores menores o iguales al valor.

La frecuencia relativa acumulada (  Fri ) de un valor es la suma de todas las 
frecuencias relativas de los valores menores o iguales al valor.

Propiedades de la frecuencia relativa:

1. −      0 ≤ fri ≤ 1
n
2. −       ∑ fri = 1
   i=1

Tablas de frecuencias:
Son tablas donde se reflejan los datos obtenidos y las diferentes frecuencias:

Intervalos  Marcas  de  fi fri Fi Fri °


de clase clase (xi)
150­160 155 1 1/15=0’066 1 0’066 24
160­170 165 3 3/15=0’2 4 0’266 72
170­180 175 4 4/15=0’266 8 0’532 96
180­190 185 7 7/15=0’466 15 1 168
Totales 15 360

GRÁFICOS ESTADISTICOS

Diagramas de barras
Asocia a cada valor una barra, generalmente vertical, de altura igual a la frecuencia 
(absoluta o relativa)

2
7

0
[150,160) [160-170) [170-180) [180,190)

Las frecuencias representadas pueden ser las relativas (diagrama de barras 
de   frecuencias   relativas),   las   absolutas   (diagrama   de   barras   de   frecuencias 
absolutas) o las acumuladas.

Histogramas
Se utilizan para variables agrupadas en intervalos. El gráfico asocia a cada 
intervalo un rectángulo, de manera que su área sea igual a la frecuencia absoluta 
del intervalo.
A i = fi  fi
⇒h =
  A i = (xi +1 − xi ) ⋅h  x i+1 − x i
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
   [150,160) [160-170) [170-180) [180,190)

Polígonos de frecuencias
Es la línea (polígono) que une los puntos correspondientes a las frecuencias 
(que pueden ser relativas ­polígono de frecuencias relativas­, o absolutas ­polígono 
de  frecuencias  absolutas­)  o  los  extremos   superiores   de  las  barras   (si  se  realiza 
sobre el diagrama de barras).
7 ● ●

4 ●

3 ●

1 ●

0
              [150,160) [160-170) [170-180) [180,190)

3
Diagrama de Sectores
Cada   valor   viene   representado   por   un   sector   circular   de   amplitud 
proporcional a su frecuencia.
Normalmente se utilizan tantos por ciento para reflejar las frecuencias.
La amplitud se calcula mediante una simple regla de tres: por ejemplo,  15 
­­­­­­> 360
1   ­­­­­­>  x             ­> x = 24°
[150,160) [150,160)
[160-170)

[160-170) [170-180)
[180,190)

[180,190)

                  [170-180)

ELEMENTOS DE PROBABILIDAD Y ESTADÍSTICA

ESTADÍSTICA  DESCRIPTIVA

2.­ PARÁMETROS ESTADÍSTICOS

Describen el comportamiento y características de un conjunto de datos.
Son de dos tipos: medidas de centralización y de dispersión.

• Medidas de centralización

Moda
Es el valor con mayor frecuencia.
Es la medida central más sencilla y es la medida más adecuada cuando se 
trabaja con datos cualitativos.
Puede ocurrir que existan dos valores con mayor e igual frecuencia. En esa 
caso se dice que es bimodal.
Es poco representativa si el rango es muy amplio. En el ejemplo estudiado 
de las alturas la moda sería 185.

Mediana
La   mediana   deja   tantos   valores   por   debajo   de   ella   como   por   encima.   Es 
decir,  es  el  valor que acumula un 0’5 de frecuencia relativa. Por tanto, para  su 
cálculo los datos deben estar ordenados de menor a mayor. Si el número de datos 

4
es impar, la mediana es el valor que se encuentra en la mitad de la serie de datos. 
Si el número de datos es par, la medina se calcula como la media de los dos valores 
centrales.   Presenta   el   mismo   problema   que   la   moda,   pero   tiene   la   ventaja   de 
poderse   calcular   fácilmente   usando   la     gráfica   del   diagrama   de   frecuencias 
relativas acumuladas. 

Ej: Si tenemos las siguientes estaturas de un conjunto de alumnos:             178, 180, 
168, 183, 168, 181, 174, 176, 171
para calcular la mediana los ordenamos:
168, 168, 171, 174, 176, 178, 180, 181, 183
como hay 9 datos, la mediana será el quinto, es decir, 176 (que deja cuatro datos 
por debajo de él y cuatro por encima).

Si los datos fuesen los siguientes:
168, 168, 171, 174, 175, 176, 178, 180, 181, 183
la mediana (al ser un número par de datos) sería la media de los datos centrales, es 
decir, (175+176)/2 = 175’5

(Nota:Si la mediana se encuentra en un intervalo de clase [a,b), se puede interpolar 
el valor de la mediana mediante la fórmula:
M, posición de la mediana
(M − p)⋅ (b − a) 
Mediana = a + , siendo p,  número de valores anteriores a a
q−p q,  número de valores anteriores a b
   

Media  ( )

Es la mejor medida para describir el promedio. Se calcula con la siguiente 
fórmula: 
n

si los datos no están agrupados en intervalos de clase:          
∑ xi
i =1
Media = X =
   N

si los datos están agrupados en intervalos de clase:             
∑ fix i n
X = i=1
N
= ∑ fri x i
   i= 1

Siendo:
xi = valor i (si los datos están agripados en intervalos de clase, 
 xi será la marca de clase del intervalo i)
fi = frecuencia absoluta del valor  i 

5
fri= frecuencia relativa del valor i
n= numero de valores diferentes
N = número total de valores

En el ejemplo de las alturas la media seria:

 
• Medidas de dispersión
Dan   una   idea   del   alejamiento   de   los   datos   respecto   de   las   medidas   de 
centralización.

Rango, amplitud o recorrido
Es la diferencia entre el mayor y el menor valor de los datos. Al considerar 
sólo   el   menor   y   el   mayor   de   los   datos,   no   proporciona   buena   información   del 
conjunto.
En el ejemplo, el rango seria: 190­150=40

Este   problema   se   puede   intentar   solucionar   mediante   los  cuantiles 


(cuartiles, deciles y percentiles). Resultan cómodos de calcular sobre el polígono de 
frecuencias relativas acumuladas. Los cuartiles se obtienen ordenando los datos y 
dividiéndolos en cuatro partes con igual número de datos. A cada uno de los tres 
valores que establecen la división en cuatro partes se le llama cuartil. A la primera 
división (que acumula el 0’25 de frecuencia relativa o el 25% de los datos) se le 
llama   primer   cuartil   (C1).   Al   segundo,   segundo   cuartil   (C2)   y   al   tercero   tercer 
cuartil (C3). 
De esa forma el segundo cuartil (que acumulará el 25% + 25% = 50% de los 
datos) coincidirá con la mediana.
Si   en   vez   de   cuatro   partes,   dividimos   los   datos   en   10   partes   con   igual 
número   de   datos   cada   uno,   se   obtienen   9   valores   que   se   llaman  deciles  y   se 
representan  como decil  primero  ó D1 (que tendrá  un  0’1 de frecuencia  relativa 
acumulada o acumula un 10% de los datos), decil segundo ó D2, etc.
Los  percentiles  (o centiles) son los 99 valores que dividen el conjunto de 
datos en 100 partes iguales. Los percentiles 20, 40, 60 y 80 se llaman quintiles (pues 
dividen el conjunto en 5 partes).

Varianza   (  σ 2  )
Sirve   para   estudiar   la   variación   que   existe   entre   varias   muestras   o 
poblaciones. Su fórmula es: 

6
n n

si los datos no están agrupados: 
∑ (x i − x )2 =
∑ xi 2
σ2 = i =1 i =1
− X 2
   N    N
n

si los datos  están agrupados: 
∑ fi ⋅ (x i − x )2
σ2 = i =1
   N

En el ejemplo:
(155 − 176' 333)2 ⋅1+ (165− 176' 333)2 ⋅ 3 + (175− 176' 333)2 ⋅ 4 + (185 − 176' 333)2 ⋅ 7
σ2 = =
15
(−21' 333)2 + (−11' 333) 2 + (−1' 333)2 + (8' 667)2
= = 44' 028
   15

Desviación típica  (  σ = σ 2  )
De uso más frecuente que la varianza, se obtiene a partir de ésta:
n

si los datos no están agrupados:  ∑ (x i − x )2
σ = σ2 = i= 1
   N

si los datos están agrupados: 
 

La media es el valor equitativo que se obtendría al repartir todos los datos 
entre cada uno de ellos, mientras que la desviación típica mide lo equitativo o justo 
del reparto. A mayor desviación típica, menor equidad en el reparto.

E nuestro ejemplo, la desviación típica seria:  

Coeficiente de variación de Pearson (C.V)

Sirve para comparar dos poblaciones o muestras.
El C.V nos da la variación relativa de cada población o muestra. A mayor 
C.V mayor variación entre los datos. Se escogerá entonces la población o muestra 
con menor C.V, pues es la que presenta mayor homogeneidad entre los datos y, 

7
por tanto, una mayor representatividad de la media (se considera que la media es 
representativa a partir de un valor del C.V menor de 0’4=40%).

En el ejemplo:   
 

Nota:

Cuando   se  construye   la  tabla  de   frecuencias   y  se   pretende   calcular  parámetros 
estadísticos,   es   normal   incluir,   además   de   las   ya   indicadas,   columnas 
correspondientes a   ,   (fundamentalmente) y a   y a  . Con ello se facilita el cálculo 
       
de los parámetros y  la comprobación de los resultados:

Intervalos  Marcas  de  fi fri


     
de clase clase (xi)
150­160 155 1 1/15=0’066 155 ­21’333 455’096
160­170 165 3 3/15=0’2 495 ­11’333 128’436
170­180 175 4 4/15=0’266 700 ­1’333 1’776
180­190 185 7 7/15=0’466 1295 8’667 75’116

ELEMENTOS DE PROBABILIDAD Y ESTADÍSTICA

ESTADÍSTICA  DESCRIPTIVA

8
2.­  DISTRIBUCIONES   BIDIMENSIONALES.   CORRELACIÓN   Y   REGRESIÓN 
LINEAL

El   problema   a   estudiar   consiste   en   averiguar   si   existe   relación   entre   dos 


fenómenos, representados por las variables X e Y.
Por ejemplo como varía el peso con la altura.

Es   decir,   se   estudian   dos   variables,   intentando   ver   y   medir   el   grado   de 


dependencia o correlación que existe (si existe) entre ambas.

Como   estudiamos   dos   variables,   el   estudio   se   referirá   a  variables 


bidimensionales.

Al estudiar dos variables, las tablas de frecuencias seran del tipo:

x y xy    
   
5 15 75 0’2 0’8 0’04 0’64
7 18 126 2’2 3’8 4’84 14’44
2 10 20 ­2’8 ­4’2 7’84 17’64
1 8 8 ­3’8 ­6’2 14’44 38’44
9 20 180 4’2 5’8 17’64 33’64
Σ=24 Σ=71 Σ=409 Σ=44’8 Σ=104’8

La existencia de correlación  se puede  observar graficamente.  Para ello  se 


representan los datos x e y como puntos (x,y) en el plano, obteniendo N puntos del 
plano. A dicha representación en el plano se le llama diagrama de dispersión. Al 
conjunto de puntos (x,y) se le llama nube de puntos.

La forma  de  la nube   de  puntos   dá información  de  la  existencia  o  no  de 
correlación entre las dos variables. 

Existe correlación        Existe correlación             No existe correlación


       (Lineal) (Cuadrática)

9
Los parámetros estadísticos nos van a permitir saber exactamente el grado 
de correlación existente  y calcular la recta de regresión:

Medias o medias marginales ( )

Son las medias de cada una de las variables:

 
En nuestro ejemplo:

 
Desviaciones típicas ( )
 
Seran las desviaciones típicas de X e Y

 
 
Las varianzas seran 
 
(Si se utiliza la tercera expresión, en la tabla en vez de las columnas  
xi­  e  yi­ ,   se escribirán dos columnas correspondientes a  )
     

En el ejemplo:

Covarianza (
 
Tambien se le llama covarianza conjunta. Se obtiene mediante el cálculo:

 
En el ejemplo: 
 

10
Si bien la covarianza permite obtener conclusiones sobre la existencias y tipo 
de   correlación,   se   utiliza   un   parámetro   que   permite   más   seguridad   en   las 
conclusiones. Se trata del coeficiente de correlación lineal de Pearson.

c. de correlación= 
 
En el ejemplo: 
 
El coeficiente de correlación mide la correlación lineal entre las dos varibles.
Su valor oscila entre ­1 y +1. 
• Si se aproxima a +1, existe correlación lineal, y es directa..Si aumenta la variable 
X,   aumenta   la   variable   Y.   Cuanto   más   se   aproxime   a   +1,   mayor   correlación 
existe.
• Si se aproxima a ­1, existe correlación lineal, y es inversa. Si aumenta la variable 
X, disminuye la variable Y, y viceversa. Cuanto más se aproxime a ­1, mayor 
correlación existe.
• Si se aproxima a 0, no existe correlación alguna. La nube de puntos tiene forma 
redondeada.

r próximo a +1                              r próximoa ­1 r próximo a 0

En el ejemplo , existiria correlación directa. (r=+0’995)

Recta de regresión

Si   el   coeficiente   de   correlación   es   próximo   a   +1   o   ­1,   se   puede   intentar 


calcular la recta que se ajusta a la nube de puntos. Dicha recta recibe el nombre de 
recta de regresión y permite estimar el valor (desconocido) de una de las variables, 
conociendo el valor de la otra variable.
La ecuación de la recta de regresión  será:

11
 
En nuestro ejemplo:
 

 
A veces sólo tiene sentido estudiar una recta de regresión. Por ejemplo, si 
X=¨kg de fertilizantes¨ e Y=¨Rendimientos obtenidos¨, es lógico ver como depende 
Y frente a X. Es decir ver como varian  los rendimientos al variar la cantidad de kg 
de fertilizantes usados. Calcularíamos por tanto la recta  .
 
La   otra     no   llegaría   a   estudiarse   ya   que     la   cantidad   de   fertilizantes 
utilizados no dependen (en la práctica) de los rendimientos obtenidos.

ELEMENTOS DE PROBABILIDAD Y ESTADÍSTICA

PROBABiLIDAD

1.­   SUCESOS ALEATORIOS. PROBABILIDAD

12
• Experimento aleatorio. Espacio muestral

Llamaremos  experimentos deterministas  a aquellos que al repetirlos bajo 


análogas condiciones se obtienen siempre los mismos resultados. Por ejemplo: 
arrojar una piedra al vacio  y medir la aceleración;  medir  la longitud de una 
circunferencia de radio 5; quitar el freno de mano de un coche en una cuesta 
muy pronunciada, etc.

Llamaremos  experimentos aleatorios  a los que se caracterizan por que al 


repetirlos en análogas condiciones, jamás se puede predecir el resultado que se 
va a obtener. Por ejemplo: tirar una moneda al aire; extraer una carta de una 
baraja; abrir un libro al azar y anotar la página, etc.
La  probabilidad  se encarga del estudio de los fenómenos aleatorios o de 
azar. Estudia que es lo más probable que ocurra, asignando a cada posibilidad 
un número que cuantifica las posibilidades de que ocurra.

Se llama suceso aleatorio de un experimento aleatorio a cada uno de los 
posibles resultados del experimento. Se representa de la letra A en adelante.

Al conjunto de todos los resultados posibles de un experimento aleatorio lo 
llamaremos espacio muestral asociado al experimento, y se designará por E.

Ejemplos:

1.­ El espacio muestral asociado al experimento: lanzar una moneda es:  
E={C,X}

2.­ El espacio muestral asociado al lanzamiento de dos monedas es:
E={ CC,CX,XC,XX}

13
Utilic e W ord 6.0c para adjuntar

una im agen de Macintos h

3.­Espacio muestral asociado al experimento: Lanzar un dado.
E={ 1 , 2 , 3 , 4 , 5 , 6 }

4.­ Espacio muestral asociado a al exper. : Lanzar dos dados:
E={ (1,1,),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6)
         (3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,2),(4,3),(4,5),(4,6)
    (5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)}

• Tipos de sucesos:

Sucesos elementales: Es cada uno de los elementos del espacio muestral.

Suceso cierto o seguro: Es el que siempre se realiza. Es evidente que tendrá 
que estar formado por por todos los resultados posibles del experimento, es decir, 
coincide con E.

Suceso imposible: Es el suceso que no se realiza nunca. Lo designaremos 
por  .

Suceso contrario  del suceso A: Es un suceso que se realiza cuando no se 
realiza A. Se representa por   o  . 

• Operaciones con sucesos

Union de sucesos:

Dados dos sucesos A y B de un mismo experimento aleatorio, llamaremos 
suceso unión de A y B al suceso que se realiza cuando se realiza A o B.

14
Por tanto  
Ejemplo:      "Lanzar un dado"     E={1,2,3,,4,5,6}    
A="Salir un número par"={2,4,6,} ; B="Salir un número primo={1,2,3,5}
 ={1,2,3,4,5,6}
Intersección de sucesos.

Llamaremos   suceso   intersección   de   A   y   B   al   suceso   que   se   realiza   si   se 


realizan  A y B
(En el ejemplo anterior.  ={ 2 } )

Si  =  ,entonces se dice que A y B son incompatibles.
Si    ,entonces se dice que A y B son compatibles.

Propiedades

Utilice Word 6.0c para adjuntar

una imagen de Macintosh

Leyes de Morgan:

 
(Todas   estas   propiedades   garantizan   que   el   conjunto   de   sucesos   tienen 
estructura de álgebra de Boole, y por eso se habla a menudo del álgebra de sucesos)

15
• Probabilidad

Idea intuitiva de probabilidad.

Supongamos que lanzamos una moneda y anotamos las veces que sale cara. 
Después de 10,20,30,......,200 lanzamientos obtenemos los resultados:   
                                                                                                                     
N de lanza. 10    20       30        40       50      60      70       80 .................200
N de caras 6    11       16        20       27      31      37       43  ................101
fre.relativa0´6    0´55    0´53    0´5    0´54   0´51 0´52 0´53  ............0´50

Si repitieramos el experimento obtendriamos resultados muy parecidos.

Podemos sacar en conclusión que las frecuencias relativas del suceso cara 
tienden a estabilizarse hacia el valor 0´5.
Este número al que la frecuencia relativa se acerca más cuanto mayor es el 
numero   de   pruebas   realizadas,   lo   llamaremos  probabilidad  del   suceso.   La 
probabilidad de un suceso A, se representará p(A).  
Por tanto se puede interpretar la probabilidad de un suceso como límite de 
frecuencias relativas.

Regla de LAPLACE.

"La probabilidad de un suceso A es el cociente entre el número de casos 
favorables y el número dee casos posibles."

 
Hay   que   tener   en   cuenta   que   los   sucesos   elementales   tienen   que   ser 
igualmente probables (equiprobables).

Ejemplo.      "Lanzar un dado"

a)  Probabilidad de que el número sea par     
A="número par"={2,4,6}        p(A)=3/6=1/2

16
b) B="Obtener primo" ={2,3,5}  p(B)=3/6=1/2

c) C="obtener multiplos de 3"={3,6} p(C)=2/6=1/3

d) D=Obtener múltiplo de 5"={5} p(D)=1/6

Ejemplo. "Lanzar dos monedas" E={CC,CX,CX,XC}

a) A= ¨Obtener dos caras¨ p(A)=1/4
b) B=     "        "    cruces¨ p(B)=1/4
c) C=      "     una cara y una cruz¨     p(C)=2/4
d) D=      "    al menos una cruz¨       p(D)=3/4

Ejemplo. "Extracción de una carta de una baraja española"

a) A=¨Obtener un oro¨ p(A)=10/40=1/4
b) B=¨Obtener un as¨ p(B)=4/40=1/10
c) C=¨Obtener una sota de espadas¨     p(C)=1/40
d) D=¨ Obtener un as o una sota¨ p(D)=8/40=1/5
e) E=¨Obtener bastos o espadas¨             p(E)=20/40=1/2
f) F=¨Obtener una figura¨ p(F)=12/40=3/10

Definición axiomática de probabilidad

Se llama probabilidad a una ley que asocia a cada suceso A un número real 
entre   0   y   1,   que   llamaremos   probabilidad   de   A   y   representaremos   p(A).   La 
probabilidad debe cumplir los siguientes axiomas:

 Propiedades:

17
Ejemplo:

"Extraer una carta de una baraja"

Sucesos:    A="Obtener un oro"     ,      B="Obtener un rey"
        C="Obtener un as de espadas"    ,   D="Obtener figuras"

i) A y B son compatibles, pues  ="Obtener rey de oros"
U
t
i
l
ic
eW
o
r
d
6.
0
cpa
r
a
ad
u
jn
a
tr

u
n
a
i
ma
ge
n
d
eM
a
c
in
t
o
sh

ii) A y C son incompatibles, pues no se puede obtener un oro y el as de 
espadas a la vez.

 
iii)    P(B)=4/40=1/10<p(A)=12/40=3/10
iv)  ="obtener figura de oros"
U
t
i
l
ic
eW
o
r
d
6.
0
cp
ar
a
ad
j
u
nt
a
r

u
n
a
i
ma
ge
n
d
eM
a
c
in
t
o
sh

18
ELEMENTOS DE PROBABILIDAD Y ESTADÍSTICA

PROBABiLIDAD

2.­  PROBABILIDAD CONDICIONADA

Probabilidad condicionada

Vamos   a   estudiar   como   queda   modificada   la   probabilidad   de   un   suceso 


cuando disponemos de información adicional de que se ha presentado otro.

Por ejemplo."Lanzar dos monedas", cuyo espacio muestral es:

E={CC,XX,CX,XC}

la probabilidad de {CC} es 1/4.

Supongamos que salió una cara, entonces la p(CC)=1/2 puesto que el nuevo 
espacio muestral queda reducido a E´={CC,CX}.

Cuando   el   experimento   se   considera   resultado   de   varios   experimentos 


(como en el caso anterior), se habla de experimentos compuestos.

19
Se llama probabilidad condicionada del suceso B respecto del suceso A, y lo 
denotaremos por p(B/A), a la probabilidad de que ocurra B, habiendo ocurrido A. 
Se calcula según la fórmula:
U
t
i
li
ceW
o
rd
6.
0cp
a
ra
ad
j
unt
ar

u
n
ai
m a
g
en
de
Ma
ci
nto
sh

Usando la formula de la probabilidad concicionada, obtenemos:

      REGLA 
 
DEL PRODUCTO

Ejemplo:

"Lanzar un dado al aire". Calcula la probabilidad de obtener un múltiplo de 
3, sabiendo que ha salido puntuación par.
Sea A="Salir n° par"={2,4,6}       p(A)=3/6=1/2
       B="Salir múltiplo de 3"={3,6} p(B)=2/6=1/3
U
t
i
li
ceW
o
r
d6
.0
cp
a
r
aa
dj
unt
ar

u
n
ai
mag
e
nd
eM
a
ci
nt
osh

   
Pues   ="Salir un n° par múltiplo de 3"={6}
Sucesos independientes

Diremos que dos sucesos son  independientes  si la realización de uno no 


modifica   la   probabilidad   de   realización   del   otro.   Por   tanto   A   y   B   son 
independientes si:
p(A/B)=p(A)
p(B/A)=p(B)

Y entonces, por la regla del producto:  p( )=p(A) p(B)

En caso contrario se dirá que los sucesos son dependientes.

Formula de las probabilidades totales:

.  Entonces:
 

20
ELEMENTOS DE PROBABILIDAD Y ESTADÍSTICA

DISTRIBUCIONES DISCRETAS Y CONTINUAS

1.­ VARIABLE ALEATORIA DISCRETA. FUNCIONES ASOCIADAS

Para   poder   hacer   un   estudio   numérico,   los   sucesos   deben   ser   valores 
numéricos xi. Una  variable aleatoria  (que se escribirá  X,Y,Z, etc) asigna a cada 
suceso de un experimento un valor numérico.

21
X(variable aleatoria):  E­­­­­­­­­­­­­­­­­­­­­> R
    Ai­­­­­­­­­­­­­­­­­­­­>xi

Ejemplo:

Experimento: ´lanzar una moneda dos veces¨
E={ (c,c),(c,+),(+,c),(+,+) }
X=¨número de caras obtenidas¨

                                        X: E­­­­­­­­­­­­­­­­­­­­>R
       (c,c)­­­­­­­­­­­­­­­­­­>2
      (c,+)­­­­­­­­­­­­­­­­­­>1
      (+,c)­­­­­­­­­­­­­­­­­­>1
      (+,+)­­­­­­­­­­­­­­­­­>0

Dependiendo de los resultados obtenidos en un experimento, las variables 
aleatorias se pueden clasificar en v.a discretas (si toma sólo algunos valores) y v.a 
continuas (si toma todos los valores de un intervalo).
El ejemplo seria una variable aleatoria discreta  pues sólo toma los valores 0, 
1, 2.

Además será necesario conocer la probabilidad de cada valor xi de la 
variable aleatoria. Las probabilidades de cada valor xi se pueden interpretar como 
las imagenes de una función.
En el caso de una variable aleatoria discreta a dicha función se le llama 
función de probabilidad (f) o función de masa de probabilidad de la variable 
aleatoria. Se define:

f(xi)=P(X=xi)=pi

siendo X la variable aleatoria, xi un valor que toma la v.a y pi la 
probabilidad de xi

Ejemplo:

 X=¨número de caras obtenidas al lanzar una moneda dos veces¨

P(X=0)=1/4

22
P(X=1)=2/4=1/2
P(X=2)=1/4

Notese que la función de probabilidad asigna probabilidades y por tanto:

 
A   partir   de   las   probabilidades   de   la   v.a,   se   puede   generar   otra   funcion, 
llamada función de distribución (F) de la variable y que se calcula:

Es decir, a cada xi la función F(x) le asigna la probabilidad de que X tome valores 
menores o iguales que xi

En el caso de una v.a discreta:

 
Propiedades de la función de distribución:

 
Además la función de distribución permite calcular la probabilidad de un valor xi 
pues:
P(X=  )= f( )=
     
Así:

 Ejemplo:

X=¨número de caras obtenidas al lanzar una moneda dos veces¨

23
Cálculo de la media:

Designaremos la media o esperanza matemática de una v.a por la letra  µ o E(X). 
En el caso discreto se calcula:

 
Ejemplo:  X=¨número de caras obtenidas al lanzar una moneda dos veces¨

 
Cálculo de la varianza y la desviación típica

La  varianza  de una v.a X, se representara  V(X). La  desviación típica  por  σ. La 


desviación típica se calcula como la raíz cuadrada de la varianza:  

En el caso discreto:

Ejemplo:   X=¨número de caras obtenidas al lanzar una moneda dos veces¨
 

  ELEMENTOS DE PROBABILIDAD Y ESTADÍSTICA

DISTRIBUCIONES DISCRETAS Y CONTINUAS

2.­ DISTRIBUCIÓN BINOMIAL

Dentro   de   las   v.a   discretas,   hay   un   tipo   de   variable   especialmente 


interesante.   Se   trata   de   la  distribución   binomial.   Se   corresponden   con 
experimentos donde sólo se distinguen dos posibles resultados: éxito o fracaso.

Ejemplo:

24
Experimento= Lanzamiento de una moneda
Exito=E= ¨Sale cara¨
Fracaso=F= ¨no sala cara=sale cruz¨

Experimento= Lanzamiento de un dardo a una diana
E=¨acertar en el blanco¨
F=¨no acertar en el blanco¨

Las distribuciones bidimensionales se caracterizan, fundamentalmente, por 
las siguientes caracteristicas:
a) Se realizan n pruebas del experimento , independientes unas de otras (con 
reemplazamiento).
b) En el resultado de cada prueba sólo es distinguen dos posibilidades: éxito 
y fracaso.
c) La probabilidad de éxito es constante en cada prueba y suele denotarse 
por p. Por tanto la probabilidad de fracaso es tambien constante. Se denota por q 
(=1­p) .
d) La variable aleatoria trata de contar el número de éxitos en n pruebas.

Una variable que corresponda con esas caracteristicas se denomina binomial 
B(n,p), siendo n el número de pruebas realizadas y p la probabilidad  de exito.
La probabilidad de r exitos se calculará:

 
La media, varianza y desviación típica se calcula:
 

Nota: Uso de las tablas de una B(n,p)

Los resultados del cálculo de la P(X=r) está tabulada. La tabla dispone el 
número de pruebas (n) y el número de exitos ( r ), en la columna vertical, y la 
probabilidad de exito (p), en la columna horizontal.
 
El número de pruebas  es como máximo 10. Si el número de pruebas del 
problema es superior a 10, habrá que realizar los cálculos a mano, con la fórmula 
citada anteriormente, o bien intentar aproximar la binomial mediante una normal 
(Ver último tema).

25
La   probabilidad   de   exito   es   como   máximo   0’5.   Si   en   el   problema   la 
probabilidad de exito  es  superior a 0’5 (por ejemplo  0’7), habrá que considerar 
como éxito el fracaso y viceversa (q=1­0’7=0’3). 

Por ejemplo:
  si queremos averiguar la probabilidad de 5 exitos en 7 pruebas ( P(X=5) ), y la 
probabilidad de éxito es 0’7, deberemos buscar en la tabla la probabilidad de 2 
exitos en 7 pruebas ( P(Y=2) ), siendo la probabilidad de exito 0’3 (=1­0’7)

en 7 pruebas 5 exitos equivalen a 2 fracasos  P(5 exitos)=P(2 fracasos)

ELEMENTOS DE PROBABILIDAD Y ESTADÍSTICA

DISTRIBUCIONES DISCRETAS Y CONTINUAS

26
3.­ VARIABLE ALEATORIA CONTINUA. FUNCIONES ASOCIADAS

Se trata de variables que toman sus valores en todo un intervalo.
La   probabilidad   de   cada   valor   de   una   variable   X,   se   determina   mediante   una 
función llamada función de densidad ( f(x) ), de la siguiente forma:

Una función  f(x) será una función de densidad, si cumple las siguientes 
 
condiciones:
si a y  b son los extremos del intervalo donde toma los valores la variable 
aleatoria)
 

Es decir, el cálculo de la probabilidad se reduce al cálculo del área encerrada 
por una curva:

   
  

a m n b

Por tanto la P(X=m)=0 ( ). Es decir, la probabilidad de que la v.a tome un valor 
determinado es 0. Así:  

                      

Como en las v.a discretas, el valor de la función de distribución ( F ) en un punto 
x, será la probabilidad de que la v.a tome valores menores o iguales que x. 
Por tanto:       
Además:   
 
Basta observar lo anterior para deducir que, para calcular la función de densidad, 
habrá que derivar la f. de distribución :  F’(x)=f(x)

Propiedades:

27
• Cálculo de la media
 
La media de una v.a continua X, se calcula:

 
• Cálculo de la varianza y la desviación típica

La varianza se calcula mediante la fórmula:

 
La desviación típica será:

ELEMENTOS DE PROBABILIDAD Y ESTADÍSTICA

28
DISTRIBUCIONES DISCRETAS Y CONTINUAS

4.­DISTRIBUCIÓN NORMAL

Es el tipo de varible más presente en la naturaleza. Su función de densidad es :   . 
Su   representación   gráfica   tiene   la     forma   de   una   campana   (conocida   como 
 
campana de Gauss)
U
tiliceW
ord6
.0cp
araa
dju
nta
r

u
naim
age
ndeMa
cin
tosh

Como se observa es simétrica respecto a x=µ. 
El área que encierra la curva (probabilidad) en el intervalo (µ­σ,µ+σ) es de 
0’6826 y entre  (µ­2σ,µ+2σ) es de 0’9974 (≈ 1).

La función de densidad de una normal, queda  totalmente determinada si se 
conoce el valor de µ y de σ (µ es el máximo y µ­σ y µ+σ los puntos de inflexión). Por 
ello las normales se denotan de la forma N(µ,σ)

Para simplificar los cálculos se sigue un proceso que consiste en obtener a partir de 
una N(µ,σ) una N(0,1) (normal estandar o tipificada) de media 0 y desviación típica 
1. De ese modo la probabilidad desde ­∞ hasta 0 es de 0’5.
La forma de hacerlo es la siguiente:

Si tenemos una v.a X, N(µ,σ), la variable   será una N(0,1). Y así:
, siendo Z una N(0,1).  
 

29
Por tanto el proceso que se sigue en un problema con una N(µ,σ), es primero 
tipificar   la   variable  (

30
31
será una N(0,1) y después calcular el valor con la ayuda de la tabla:

Ejemplo:
X, N(3,5) 
 
• Uso de las tablas de una N(0,1).

Existen varios tipos de tablas, pero en todas, como la normal es simétrica respecto 
al 0:

 
 
Las dos tablas fundamentales de una N(0,1) se diferencian en que mientras 
que una nos dá la P(Z≤ k), la otra nos dá sólo la P(0≤ Z≤ k) (por tanto habrá que 
añadir   a la probabilidad  observada  en  la tabla 0’5:  P(Z≤ k)=0’5+resultado  de   la 
tabla). 

En ambos casos, la tabla representa las unidades y décimas del valor en la 
columna vertical, y las centésimas en la fila horizontal.

32
ELEMENTOS DE PROBABILIDAD Y ESTADÍSTICA

DISTRIBUCIONES DISCRETAS Y CONTINUAS

5.­ APROXIMACIÓN DE LA BINOMIAL POR LA NORMAL.

A veces los cálculos con una binomial no se pueden hacer con la ayuda de 
las tablas (por ejemplo si el número de pruebas  es mayor de 10), y realizar los 
cálculos a mano resulta demasiado largo. 

Si una B(n,p) cumple que np ≥  5  y  nq ≥  5, entonces los resultados de la 


B(n,p)   se   aproximan   a   los   resultados   de   una   .   Por   tanto   se   pueden   hacer   los 
 
cálculos con una   (tipificandola y usando la tabla de la N(0,1) ) en vez de la B(n,p).
 

33