Академический Документы
Профессиональный Документы
Культура Документы
Esercizi di: Statistica e Calcolo delle Probabilit LISTA DEI SIMBOLI S, , A, B, {}: rispettivamente spazio campione evento impossibile ed . eventi generici. AB: A unione B.
A
k =i
AB: A intersezione B.
A : evento complementare di A (negazione di A). AB, AB: rispettivamente A incluso in B, A incluso strettamente in B. P(A): probabilit dell'evento A. P(): probabilit dell'evento definito dall'asserzione logica in (). P(AH): probabilit dell'evento A condizionata al verificarsi di H. : qualsiasi. v.a.: variabile aleatoria. v.c.: variabile casuale ( sinonimo di variabile aleatoria). X: generica v.a. x: generica determinazione della v.a. X. p(): funzione massa di probabilit. f(): funzione densit di probabilit. s-indipendenza: indipendenza stocastica. iid: v.a. indipendentemente ed identicamente distribuite. X~N(,2): v.a. X distribuita secondo una Normale di parametri e . X: valore atteso della v.a. X.
E(X): valore atteso di X. Var(X): varianza di X. X: deviazione standard o scarto quadratico medio della v.a. X. Cov(,): covarianza.
n n! r = r! n r ! ( )
: circa eguale (FELLER): es. di riferimento principale relativo all'esercizio
1.
Statistica descrittiva
1.1 Dato il seguente insieme di misure, valutare la media, la mediana, la varianza, la deviazione standard, il primo quartile, il terzo quartile e la differenza interquartile. 109, 113, 111, 112, 111, 110, 106, 105, 108, 115 Soluzione Media
10
x
i =1
10 = 110
10
109+113+111+112+111+110+106+105+108+115 = 10
Varianza
2 =
( x )
i =1 i
10 10 1092 +1132 +1112 +1122 +1112 +1102 +1062 +1052 +1082 +1152 = 1102 = 10 = 8.6
x
i =1
10
2 i
2 =
Deviazione standard
= 2 = 8.6 = 2.9
Mediana Una volta ordinati i dati, 105, 106, 108, 109, 110, 111, 111, 112, 113, 115 essendo il campione di dimensione pari (n=10) la mediana si calcola come segue:
x n + x n Me =
2
+1 2
x 10 + x 10 =
2
+1 2
x(5) + x( 6) 2
Primo quartile Considero solo i valori minori della mediana 105, 106, 108, 109, 110 e riutilizzo, limitatamente a questa sotto-popolazione, la formula valida per la ricerca della mediana Q1 = x n+1 = x(3) = 108
2
Si osservi che in questo caso la dimensione della sotto-popolazione dispari (n=5). Terzo quartile Considero solo i valori maggiori della mediana 111, 111, 112, 113, 115, e ricavo: Q3 = x n+1 = x(3) = 112
2
Esercizi di: Statistica e Calcolo delle Probabilit 1.2 Un certo carattere distribuito in una popolazione nel modo seguente in funzione dellet degli intervistati: i 1 2 3 4 5 Classe [20-30] (30-40] (40-50] (50-60] (60-70] ni 5 7 10 7 1 [20-30] una classe chiusa a sinistra e chiusa a destra (30-40] una classe aperta a sinistra e chiusa a destra
Valutare let media alla quale si presenta il carattere, let mediana, il primo ed il terzo quartile, individuare la classe modale; valutare varianza, deviazione standard e differenza interquartile. Diagrammare frequenza relativa e cumulata. Valutare la frequenza relativa della classe (30-50] anni. Soluzione Simbologia: ni=frequenza assoluta, fi=frequenza relativa, Fi=frequenza relativa cumulata, ci=centro della i-esima classe i 1 2 3 4 5 Media Classe [20-30] (30-40] (40-50] (50-60] (60-70] ni 5 7 10 7 1 fi 5/30 7/30 10/30 7/30 1/30 Fi 5/300.17 12/30=0.4 22/300.73 29/300.97 30/30=1 ci 25 35 45 55 65
c n
i =1 k
i i
n
i =1
= ci fi = 25
i =1
5 7 10 7 1 + 35 + 45 + 55 + 65 = 30 30 30 30 30
= 42.3
Mediana Riconosciuto che la classe numero 3, (40-50], la classe mediana (3 infatti il pi piccolo valore di i per cui risulta Fi0.5) si pu scrivere: 0.50 F31 0.50 0.40 M e = LI 3 + ( LS3 LI 3 ) = 40 + ( 50 40 ) = F3 F31 0.73 0.40
= 43.0
Esercizi di statistica e calcolo delle probabilit Prof. M. GIORGIO
Esercizi di: Statistica e Calcolo delle Probabilit Primo quartile La classe che contiene il primo quartile la numero 2, (30-40] (2 il pi piccolo valore di i per il quale risulta Fi0.25) si pu scrivere: 0.25 F1 0.25 0.17 Q1 = LI 2 + ( LS 2 LI 2 ) = 30 + ( 40 30 ) = F2 F1 0.40 0.17
= 33.5
Terzo quartile La classe che contiene il terzo quartile la n 4, (50-60] (4 il pi piccolo valore di i per il quale risulta Fi0.75) si pu scrivere: 0.25 F3 0.75 0.73 Q1 = LI 4 + ( LS 4 LI 4 ) = 50 + ( 60 50 ) = F4 F3 0.97 0.73
= 50.8
Classe modale La classe modale (classe per la quale si osserva la massima frequenza (assoluta o relativa)] la classe n 3 (40-50]. Varianza
k k k k 2 2 = ( ci ) ni ni = ( ci ) fi = ci2 fi 2 = i =1 i =1 i =1 i =1 5 7 10 7 1 = 252 + 352 + 452 + 552 + 652 42.32 = 30 30 30 30 30 = 119.6 2
Deviazione standard
= 2 = 120 = 10.9
Diagramma della frequenza relativa 0.35 0.30 0.25 0.20 0.15 0.01 0.05 0.00 20-30 30-40 40-50 50-60 60-70
Frequenza relativa
Esercizi di: Statistica e Calcolo delle Probabilit Diagramma della frequenza relativa cumulata Frequenza relativa cumulata
1 0.8 0.6 0.4 0.2 0.0 20-30 30-40 40-50 50-60 60-70
Frequenza relativa della classe (30-50] La frequenza relativa della classe (30-50] si ottiene sommando le frequenze relative delle classi (30-40] e (40-50]: 7 10 17 f 2 + f3 = + = 30 30 30
2.
2.1 Rappresentare mediante un diagramma di Venn gli eventi: (i) AB; (ii) AB=S con AB=; (iii) A ; (iv) AB con AB; (v) ABS. Soluzione (i) B A (ii) B A (iii) A
A
(iv) B A
(v) B A
AB
AB
Esercizi di: Statistica e Calcolo delle Probabilit 2.2 Si consideri lo spazio campione S{0,1,2,3,4,5,6,7,8,9} e gli eventi A{1,2,3}, B{3,4,5}, C{4,5,6}; si scrivano i numeri che sono elementi di ciascuno degli eventi composti di seguito definiti: ( i) Non si verifica n A n B n C. (ii) Si verifica almeno uno dei tre eventi. (iii) Si verifica (esattamente o esclusivamente) uno dei tre eventi. (iv) Si verifica al pi uno dei tre eventi. (v) Si verificano al pi tre eventi. Si rappresenti, inoltre, su di un diagramma di Venn ciascuno degli eventi composti che stato appena definito. Soluzione (i) (ii) (iii) (iv) (v) {0,7,8,9}; {1,2,3,4,5,6}; {1,2,6}; {0,1,2,6,7,8,9}; S.
dedurre quando valgono rispettivamente le eguaglianze (i) AB=A, (ii) AB=A Soluzione Risposta (i) B A Infatti, in generale risulta:
A B = A ( A B)
AB
Risposta (ii) A B
10
Esercizi di: Statistica e Calcolo delle Probabilit 2.4 Un obiettivo consiste di 10 cerchi concentrici di raggio rk (k=1,2,...,10), con rk<rk+1.. Si indichi con Ak levento che si verifica se si colpisce l'interno di un cerchio di raggio rk (k=1,2,...,10). Dedurre cosa indicano i seguenti eventi:
(i) (ii)
B = Ak ,
k =1 10
C = Ak
k =5
Soluzione Premessa Considerato che rk<rk+1 e che i cerchi sono concentrici si deduce che tra gli eventi A1 , A2 , A3 , A4 , A5 , A6 , A7 , A8 , A9 , A10 sussiste la relazione:
A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 .
Risposta (i) Rappresentati come segue gli aventi A1 , A2 , A3 , A4 , A5 , A6 sul diagramma di Venn:
A3 A4
A2
A5 A6
A1
B = A k = A1 A2 A3 A4 A5 A6
k =1
B = A6
11
Esercizi di: Statistica e Calcolo delle Probabilit Nota Si osservi che per rispettare la relazione logica che sussiste tra gli eventi A1 , A2 , A3 , A4 , A5 , A6 ( Aj Ai per ogni i>j) gli eventi sul diagramma di venne sono stati disegnati in maniera tale da garantire che per ogni i>j il verificarsi di Aj implica il verificarsi di Ai . In altri termini, il diagramma di Venn deve esser disegnato in maniera da evidenziare che: se si verifica, ad esempio, levento A1 (ovvero se abbiamo colpito linterno del cerchio di raggio r1) allora sicuramente si verificano anche gli eventi A2 , A3 , A4 , A5 , A6 (ovvero ci troviamo sicuramente anche allinterno di tutte le circonferenze di raggio r2 , r3 , r4 , r5 , r6 ). Risposta (ii)
10
C = Ak = A5 A6 A7 A8 A9 A10 = A5
k =5
A7 A6 A5
A8 A9 A10
12
Esercizi di: Statistica e Calcolo delle Probabilit 2.5 (FELLER 15 PG. 25)
Elaborare mediante le regole dell'algebra degli eventi le seguenti espressioni: (i) (AB)(A B ); (AB)(BC); (ii) (AB)( A B)(A B ). (iii) Soluzione
(i) (ii) (iii) A B A C; A B
13
3.
3.1 Un test sull'inquinamento dell'aria atmosferica richiede che almeno due rilevamenti consecutivi su una serie di tre diano risultato positivo per far scattare misure urgenti antinquinamento. I tecnici hanno a disposizione due dispositivi A e B ed noto dalle caratteristiche di targa che la probabilit di rilevamento dell'inquinamento del dispositivo A maggiore di quella di B. I tecnici decidono di scegliere la migliore sequenza di test in base alla maggiore probabilit di rilevamento dell'inquinamento. Ci sono due possibili sequenze di test: I test A B II test B A III test A B
serie 1 serie 2
I risultati dei test sono indipendenti l'uno dall'altro. Usare il calcolo delle probabilit per decidere quale sequenza di test i tecnici debbano preferire. Soluzione La serie da preferire la serie 2 (N.B. Il risultato non intuitivo). Posto pA=P(rilevamento dispositivo A), pB=P(rilevamento dispositivo B) p1=P(rilevamento sequenza 1), p2=P(rilevamento sequenza 2), i valori di p1 (analogo ragionamento per p2) si ottengono come probabilit dell'unione di eventi favorevoli: P[(ABA)( A BA)(AB A )], poich gli eventi considerati sono tra loro mutuamente incompatibili, la probabilit dell'unione di eventi diventa: P(ABA)+P( A BA)+P(AB A )=pApBpA+(1-pA)pApB+pApB(1-pA)=
=pApB[pA+(1-pA)+(1-pA)]=pApB(2-pA)
14
Esercizi di: Statistica e Calcolo delle Probabilit In definitiva, si ha: p1=P(rilevamento sequenza 1)= pApB(2-pA). Ragionando in maniera analoga per la sequenza 2 si ottiene: p2=P(rilevamento sequenza 2)= pApB(2-pB). si vede che dal momento che pA>pB (2-pA)<(2-pB) risulta p1<p2.
15
Esercizi di: Statistica e Calcolo delle Probabilit 3.2 Qual la probabilit che si realizzi la sequenza di tre sei consecutivamente in tre lanci di un dado "corretto"?. Si indichi con E6i l'evento esce 6 all'i-esimo lancio. Soluzione
16
Esercizi di: Statistica e Calcolo delle Probabilit 3.3 Qual la probabilit che esca almeno un sei in una sequenza di tre lanci di un dado "corretto"? Soluzione
3 3 5 5 5 216 125 91 P E6i = 1 P E6i = 1 = = 6 6 6 216 216 i =1 i =1
Nota
La
ricava
a
3
partire
da
E
i =1
6i
= E6i (legge di De
i =1
17
Soluzione
Si procede mediante enumerazione degli eventi elementari che realizzano l'evento composto sopra specificato. Essi sono: 1 5 5 25 = 1. E61 E62 E63 P ( E61 E62 E63 ) = 6 6 6 216 2. E61 E62 E63 P ( E61 E62 E63 ) = 3. E61 E62 E63 P ( E61 E62 E63 ) =
5 1 5 25 = 6 6 6 216 5 5 1 25 = 6 6 6 216
A noi interessa la probabilit dellunione di tali eventi. Tali eventi sono incompatibili pertanto la loro unione si pu ottenere sommando le probabilit calcolate ai punti 1), 2) e 3): 25 25 25 75 + + = 216 216 216 216
18
Soluzione
p=
nf
6 5 4 3 2 1 6! = = 6 n 6 6 6 6 6 6 6
Nota la valutazione della probabilit richiesta pu essere effettuata in 2 maniere Prima maniera Considerato che lanciando 6 volte un dado si possono ottenere 66 differenti sequenze di risultati e considerato che tali sequenze (ordinate) sono equiprobabili (N.B. in virt 1 della correttezza del dado ogni sequenza pu essere ottenuta con probabilit 6 ), si 6 pu calcolare la probabilit richiesta come rapporto tra i casi favorevoli (numero di sequenze ordinate che prevedono tutti esiti diversi) e il numero totale di sequenze ordinate che possibile ottenere. Come precedentemente osservato, totale di sequenze ordinate che possibile ottenere pari a nT = 66 . I casi favorevoli sono invece n f =6!=654321. Pari al numero di sequenze (costituite dai 6 differenti esiti possibili) che differiscono per lordine con cui tali esiti sono stati ottenuti. Essendo il numero di lanci pari al numero di facce del dado si dovranno infatti ottenere necessariamente sequenze del tipo: 1,2,3,4,5,6; 1,2,3,4,6,5; 1,2,36,4,5 etc. Ovvero sequenze (ordinate) che differiscono non nei risultati ottenuti ma solo per lordine con cui essi si sono presentati. n 6! Rapportando n f ad nT si ottiene p = f = 6 . n 6 Seconda maniera Definiti i seguenti eventi: A1 ={Il primo lancio pu dare luogo ad un esito qualsiasi} Aj ={il j-esimo lancio da luogo ad un esito diverso da quello ottenuto nei j-1 lanci precedenti} Si pu calcolata la probabilit richiesta come: P ( A1 A2 A3 A4 A5 A6 ) =
= P ( A1 ) P ( A2 A1 ) P ( A3 A1 , A2 ) P ( A4 A1 , A2 , A3 ) P ( A5 A1 , A2 , A3 , A4 ) P ( A6 A1 , A2 , A3 , A4 , A5 ) = 6 5 4 3 2 1 = 6 6 6 6 6 6
Esercizi di statistica e calcolo delle probabilit Prof. M. GIORGIO
19
p=
nf n
365 364 363 362 361 1 365! = 365 365 365 365 365 3655 360!
20
B 13 7 20
90 10 100
Soluzione: Risposta (i) L'evento a cui siamo interessati "la squadra svolge un lavoro soddisfacente per il cliente" si realizza nei seguenti casi: o solo l'operaio A svolge un lavoro soddisfacente ( A B ) o solo l'operaio B svolge un lavoro soddisfacente ( B A) o entrambi gli operai svolgono un lavoro soddisfacente. ( A B ) . In termini di eventi siamo interessati ad ( A B ) . La probabilit dell'unione di due eventi A e B : P ( A B) = P( A) + P( B ) P ( A B) , (1)
che per l'ipotesi di indipendenza stocastica diventa: P ( A B) = P( A) + P( B) P( A) P( B) = 0.98 in questa ipotesi la ditta non incorre nella penale.
Risposta (ii) Dai rilievi effettuati possibile ricavare direttamente la probabilit associata all'evento A B , per cui risulta: P ( A B) = P( A) + P( B ) P( A B) = 0.90 + 0.80 0.77 = 0.93
in questo caso la ditta incorrerebbe nella penale.
21
22
Soluzione
P (G D ) = =
P ( D G ) P (G ) + P D G P (G )
P ( D G ) P (G )
Nota Si osservi che la probabilit che la donna sia in gravidanza passa dal valore 0.01 a circa 0.16 dopo il test, che pur essendo una probabilit ancora non soddisfacente per un test ben 16 volte pi grande di quella relativa allo stato di conoscenze prima del test. In questo caso la sola applicazione reiterata del test pu portare ad un valore soddisfacentemente elevato della probabilit di nostro interesse.
23
Soluzione
0.999 =
ossia:
x P (G ) , x P ( G ) + (1 x ) P ( G )
0.999 =
24
= 0.2
Risposta (b) Bisogna calcolare P ( A B ) . Partendo da:
P ( A) = P ( A B ) ( A B ) = P( A B ) + P( A B)
si ricava:
P ( A B ) ( A B ) = P( A B ) + P( A B) .
Partendo da:
P( A B) = P ( A B ) ( A B ) ( A B ) = = P( A B ) + P( A B) + P( A B)
si ricava:
25
P ( A B ) = P A B .
Partendo da:
P ( A B ) A B = P ( A B ) + P A B = 1 si ricava:
P ( A B ) = P A B = 1 P ( A B ) = 1 0.5 = 0.5
26
Soluzione
Indicati rispettivamente con Bi e Di (con i=1,2,3) gli eventi: alla i-esima estrazione stato estratto un articolo buono e alla i-esima estrazione stato estratto un articolo difettoso, si pu osservare che levento esattamente 2 fra i 3 articoli selezionati siano buoni si realizza se si ottiene una delle seguenti sequenze di risultati: 1. D1 B2 B3 , 2. B1 D2 B3 , 3. B1 B2 D3 . Pertanto si pu scrivere: P ( esattamente 2 fra i 3 articoli selezionati siano buoni ) =
= P ( D1 B2 B3 ) ( B1 D2 B3 ) ( B1 B2 D3 )
relazione che (per la incompatibilit degli eventi 1-3) si pu riscrivere come: P ( esattamente 2 fra i 3 articoli selezionati siano buoni ) =
= P ( D1 B2 B3 ) + P ( B1 D2 B3 ) + P ( B1 B2 D3 ) .
Calcolate le probabilit: 4 10 9 4 9 10 P ( D1 B2 B3 ) = = 14 13 12 12 13 14 10 4 9 4 9 10 P ( B1 D2 B3 ) = = 14 13 12 12 13 14 10 9 4 4 9 10 P ( B1 B2 D3 ) = = 14 13 12 12 13 14 sostituendo, si ottiene: P ( esattamente 2 fra i 3 articoli selezionati siano buoni ) =
4 9 10 4 9 10 4 9 10 4 9 10 + + = 3 = 12 13 14 12 13 14 12 13 14 12 13 14 90 = = 0.49 182 =
27
P ( esattamente 2 fra i 3 articoli selezionati siano buoni ) = 4 10 4! 10! 1 2 1! 4 1 ! 2! 10 2 ! ( ) ( ) = = = 14! 14 3 3!(14 3)! = 90 = 0.49 182
Nota Indicato con: nF il numero di eventi favorevoli (pari al numero di modi diversi in cui possibile formare con i 14 articoli disponibili gruppi da 3 articoli di cui 2 buoni ed 1 difettoso), e con N il numero di eventi possibili (numero di modi diversi in cui possibile formare con i 14 articoli disponibili gruppi da 3, comunque costituiti) la formula usata si ottiene dividendo nF per N. importante osservare che i differenti N gruppi di 3 articoli considerati sono incompatibili ed hanno tutti la stessa probabilit di essere selezionati (tali condizioni devono essere necessariamente soddisfatte se si vuole calcolare la probabilit come nF N ). Il numero di eventi favorevoli, nF , si ottiene moltiplicando il numero di modi in cui (a prescindere dallordine di estrazione) possibile selezionare 1 articolo difettoso da 4 un gruppo di 4 articoli difettosi, pari a (combinazioni di classe 1 di 4 elementi), 1 per il numero di modi in cui possibile estrarre i rimanenti 2 articoli (buoni) da un 10 gruppo di 10 articoli (buoni) : 2 4 10 nF = . 1 2 N (numero di casi possibili) si ottiene considerando indistinguibili gli articoli e conteggiando (come prima) il numero, totale, di gruppi di dimensione 3 che 14 possibile formare con 14 articoli: N = . 3
28
Dove con A si indicato levento {lautomobile pi vecchia di fabbricazione italiana} e con B levento {lautomobile pi nuova di fabbricazione italiana}.
Soluzione
P ( B A) = P( A B) = P( A B) =
= =
P A B P(B)
) = 1 P( A B) =
1 P( B) = 1 ( 0.7 + 0.5 0.4 ) = 0.5
29
( A B) ( A B) =
( A B ) ( A B ) ( A B ) ( A B ) = ( A B ) ( A B ) = = ( A B) = = ( A B) = ( A B ) ( A B ) ( A B ) ( A B) =
30
Soluzione
Indicati con: I levento il conducente dellauto commette uninfrazione durante il prossimo mese e con M levento il conducente dellauto ha pi di 25 anni. dal testo si ricavano le seguenti informazioni:
( )
) ( )
P(M I ) = =
P(I M ) P(M )
) ( )
Nota Gli eventi M e M rappresentano una partizione dello spazio campione (tale condizione deve necessariamente essere verificata sia se si vuole utilizzare il teorema delle probabilit totali che se si vuole utilizzare il teorema di Bayes).
31
Soluzione
Indicati con: A levento la biglia viene estratta dallurna A B levento la biglia viene estratta dallurna B N levento la biglia estratta nera Utilizzando il teorema delle probabilit totali (quasi sempre utile quando si devono trattare esperimenti che, come in questo caso, sono realizzati in pi stadi),si pu scrivere: P ( N ) = P ( N A) P ( A) + P ( N B ) P ( B ) con:
32
Soluzione
Indichiamo con: D levento la carta estratta il dieci di denari. Supponiamo di estrarre la carta dal mazzetto in A. Non sapendo, con certezza, se il dieci di denari in A o in B, per calcolare P ( D ) dobbiamo procedere come segue:
P( D) = P D il 10 in A P (10 in A ) +
1 10 1 = 10 40 40 dove naturalmente P D il 10 non in A = 0 perch non si pu estrarre il 10 dal mazzetto in A se il 10 non in A. Analogamente, se ipotizziamo di estrarre la carta dal mazzetto in B otteniamo: P( D) = P D il 10 in B P ( il 10 in B ) + = + P D il 10 non in B P [il 10 non in B ] = = P D il 10 in B P ( il 10 in B ) =
1 30 1 = 30 40 40 Si vede che la probabilit di successo non dipende dalla scelta che dobbiamo effettuare.
Nota La probabilit ottenuta esattamente pari a quella di pescare il 10 di denari estraendo a caso una carta da un mazzo di 40 carte napoletane!
33
Soluzione Simbologia
A indica levento la carta viene estratta dal mazzetto in A B indica levento la carta viene estratta dal mazzetto in B D indica levento viene estratto il 10 di denari) Si vuole calcolare P ( D ) Utilizzando il teorema delle probabilit totali si pu scrivere: P ( D ) = P ( D A) P ( A) + P ( D B ) P ( B ) pertanto, dedotto dal testo che:
13 , 52
13 39 = . 52 52 Per ricavare il risultato richiesto non resta che calcolare le probabilit condizionate P ( D A) e P ( D B ) . Analogamente a quanto fatto nellesercizio 3.15 calcoliamo: 1 20 1 20 P ( D A) = , P ( D B ) = 20 40 20 40 quindi, sostituendo, otteniamo: 1 13 1 39 1 13 39 1 P( D) = + = + = : 40 52 40 52 40 52 52 40
nota nella espressione 1 20 P ( D A) = 20 40 Esercizi di statistica e calcolo delle probabilit Prof. M. GIORGIO
34
1 la probabilit che si verifichi levento D estraendo da A dato che il 10 di denari 20 20 in A, mentre la probabilit che il 10 di denari sia effettivamente in A. 40
35
Soluzione Risposta 1 P ( A B ) = 0.35 0.70 = 0.24 Risposta 2 P ( A B ) = P ( A ) + P ( B ) P ( A B ) = 0.35 + 0.70 0.24 = 0.80
o, in alternativa:
Risposta 3
P ( A B ) ( A B ) ( A B ) = = P ( A B ) ( A B ) P( A B) =
P ( A B ) ( A B ) ( A B) = P( A B) P( A B) =
0.56 = 0.69 0.8
P( A B) + P( A B )
36
4.
Variabili aleatorie
4.1
(PARZEN)
Siano assegnate le seguenti probabilit: P(X=0)=0.10, P(X=1)=P(X=-1)=0.15, P(X=2)=P(X=-2)=0.30. (i) Verificare se si tratta di una funzione massa di probabilit ed, eventualmente, calcolare: (ii) P(X1); (iii) P(X>1); (iv) P(-1<X1); (v) P( X 1).
Soluzione
(i) Avendo definito S = { x1 , x2 ,..., xk } = {2, 1,0,1,2} , si tratta di verificare che risulti:
P ( X = xi ) 0 i = 1,.., k , P ( S ) = P ( X = xi ) = 1 :
i =1 k
Per la prima condizione la verifica immediata. Per la seconda si calcola: P(X=-2)+P(X=-1)+P(X=0)+ P(X=1)+P(X=2)=0.30+0.15+0.10+0.15+0.30=1 (i) 0.70. (ii) 0.30. (iii) 0.25. (iv) 0.40.
37
Data la funzione F ( x ) = x 2 4 per 0<x2, verificare se si tratta di una funzione ripartizione e ricavare la funzione densit di probabilit corrispondente.
Soluzione
Occorre verificare che la funzione assegnata soddisfi le propriet della funzione ripartizione nell'estremo inferiore e nell'estremo superiore dell'intervallo in cui assume valori la v.a. (supporto).
02 22 F ( 0) = = 0 ; F ( 2) = = 1 . 4 4 Bisogna inoltre verificare che F ( x ) per 0<x2 sia non decrescente derivata non negativa per 0<x2. Anche questa condizione verificata, infatti risulta: dF ( x ) x f ( x) = = >0 0< x2 dx 2
38
Questi valori possono essere ottenuti sfruttando la formula generale (N.B. X una v.a. discreta):
F ( x) = P( X x) =
i:xi x
P( X = x )
i
39
F ( 0) = P ( X = 0) , F (1) = P ( X = 0 ) + P ( X = 1) = F ( 0 ) + P ( X = 1) , F ( 2 ) = P ( X = 0 ) + P ( X = 1) + P ( X = 2 ) = F (1) + P ( X = 2 ) , F ( 3) = P ( X = 0 ) + P ( X = 1) + P ( X = 2 ) + P ( X = 3) = = F ( 2 ) + P ( X = 3) , F ( 4 ) = P ( X = 0 ) + P ( X = 1) + P ( X = 2 ) + P ( X = 3) + P ( X = 4 ) = = F ( 3) + P ( X = 4 ) ,
Infine, ricordando che nel caso di v.a. discrete, la funzione ripartizione una funzione a gradini si conclude che F ( x ) assume valore 0 nellintervallo ( ,0 ) , aperto a sinistra e 0.25 nellintervallo [1,2 ) , valore 0.55 nellintervallo [ 2,3) , valore 0.80 nellintervallo aperto a destra, valore 0.1 nellintervallo [ 0,1) , chiuso a sinistra e aperto a destra, valore
F(x)
-1
Risposta 5
40
41
F(x) 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1
0
Assunto convenzionalmente F ( x0 ) = 0 , per calcolare la funzione massa di probabilit si pu utilizzare la seguente relazione: p ( xi ) = P ( X = xi ) = F ( xi ) F ( xi 1 ) . Utilizzando i dati assegnati si ottiene:
42
i 1 2 3 4 5
xi
1 3 4 6 12
Risposta 2 P(3 X 6) = P ( x2 X x4 ) = F ( x4 ) F ( x1 ) =
p( x ) = p( x ) + p( x ) + p( x ) + p( x ) + p( x ) =1
i =1 i
1 2 3 4 5
F ( x2 ) = p ( x1 ) + p ( x2 ) = p ( x3 ) + p ( x4 ) + p ( x5 )
4
1 F ( x2 ) = p ( x1 ) + p ( x2 ) + p ( x3 ) + p ( x4 ) + p ( x5 ) p ( x1 ) + p ( x2 ) =
Nota 2
F ( 6 ) = F ( x4 ) = p ( xi ) = p ( x1 ) + p ( x2 ) + p ( x3 ) + p ( x4 ) = = p (1) + p ( 3) + p ( 4 ) + p ( 6 ) F ( 3) = F ( x2 ) = p ( xi ) = p ( x1 ) + p ( x2 ) = = p (1) + p ( 3)
i =1
2
i =1
43
F ( 6 ) F ( 3) = p ( xi ) p ( xi ) =
i =1 i =1
= p ( x1 ) + p ( x2 ) + p ( x3 ) + p ( x4 ) p (1) + p ( 3) = = p ( 4 ) + p ( 6 ) = p ( xi ) = = P ( x3 X x4 ) = P ( 4 X 6 )
Nota 3 La v.a, X, numero di mesi fra i pagamenti successivi una v.a. discreta, risulta pertanto: P ( 3 < X 6 ) = P ( 4 X 6 ) = P ( 3 < X < 12 ) = P ( 4 X < 12 ) =
i =3
4
= F ( 6 ) F ( 3)
44
5.
5.1
Le prove desame per entrare in un college americano sono svolte da migliaia di studenti ogni anno e misurano due indici: SAT ed ACT. Le due variabile punteggio conseguito agli esami sono ben approssimate da v.c. Normali. Negli ultimi anni, per il punteggio SAT stata stimata una media di 480 con una deviazione standard di 100; per il punteggio ACT stata stimata una media di 18 con una deviazione standard di 6. 1. Una scuola di economia fissa pari 550 il punteggio SAT minimo per lammissione dei nuovi studenti. Quale percentuale di studenti avr un punteggio maggiore di 550? 2. Quale punteggio minimo deve essere fissato per il test ACT per avere una pari percentuale di ammessi? 3. Qual la probabilit che uno studente ammesso sulla base del test SAT abbia ottenuto pi di 700?
2 X N ( X , X ) = N ( 480,1002 )
2 Y N ( Y , T ) = N (18,62 ) :
Risposta (I)
X x 550 x 550 x 550 480 P ( X > 550 ) = P > = P Z > = P Z > = 100 x x x = P ( Z > 0.7 ) = 1 FZ ( 0.7 ) = 1 0.758 = = 0.242 Si pu prevedere una percentuale di promossi pari al 24.5%. Esercizi di statistica e calcolo delle probabilit Prof. M. GIORGIO
45
Esercizi di: Statistica e Calcolo delle Probabilit Risposta (II) Vogliamo individuare il valore di y tale che: P (Y > y ) = 0.242 P (Y y ) = 1 0.242 = 0.758
Quello che cerchiamo quindi il percentile di ordine 75.8 della v.a. Y. Partendo dalla relazione:
che note: z0.758 = 0.7, Y = 18, Y = 6 Permette di calcolare: y0.758 = 18 + 0.7 6 = 22.2
Effettuando i passaggi si ottiene: P ( X > 700 X > 550 ) P ( X > 700 ) = P ( X > 700 X > 550 ) = P ( X > 550 ) P ( X > 550 ) Da cui essendo:
X X 700 X 700 X > P ( X > 700 ) = P = P Z > = X X X 700 X 700 480 = 1 FZ = 1 FZ = 1 FZ ( 2.2 ) = 100 X = 0.014 e P ( X > 550 ) = 0.242 (risposta I)
Si ottiene:
Esercizi di: Statistica e Calcolo delle Probabilit Nota Detto A levento { X > 700} e B levento { X > 550} si ha:
A implica B A B A B = A :
S B
47
Soluzione Premessa Ipotizzeremo che i segni nella colonna vengano scelti: 1. in maniera casuale 2. indipendentemente dai pronostici effettuati per le altre partite presenti in schedina. Ne consegue che la probabilit di indovinare il risultato della generica partita presente in 1 schedina pari ad (ipotesi 1). 3 In relazione alla i-esima partita possiamo pertanto definire la v.a. Bernoulliana 1 X i B 1, che assume valore 1 nel caso di pronostico corretto e valore 0 nel caso di 3 pronostico errato. 1 1 2 In altri termini la v.a. X i tale che P ( X i = 1) = , P ( X i = 0 ) = 1 = (qualunque sia 3 3 3 i=1,2,,13, ovvero per ognuna delle 13 partite).
Possiamo definire inoltre la v.a. Y = X i che stante le ipotesi 1 e 2 risulta essere la
i =1
13
somma di v.a. bernoulliane indipendenti ed identicamente distribuite (le bernoulliane hanno lo stesso parametro). 1 Si deduce pertanto che Y B 13, . 3 Si osservi che per come sono state definite le X i la v.a. Y conta i punti fatti nella colonna (numero di pronostici esatti)
Nota 1
n n y P (Y = y ) = p y (1 p ) y
Risposta (i)
13 1 1 P (Y = 12 ) = 1 12 3 3
12 1312
13! 2 1 2 = = 13 13 12!(13 12 )! 3 3 3
12
48
Esercizi di: Statistica e Calcolo delle Probabilit Risposta (ii) Levento fare almeno 12 punti si verifica se si fanno 12 o 13 punti. Si tratta pertanto di calcolare:
1 1 3
13 y
13 1 1 1 = 13 , P (Y = 13) = 1 3 13 3 3 vista anche la risposta i, si ricava che: 2 1 27 P (Y = 12 ) (Y = 13) = 13 313 + 313 = 313
13
1313
49
Soluzione Premessa Sotto ipotesi non eccessivamente restrittive (si veda la nota), si pu assumere che la v.a., X, che conta il numero di persone (tra le 15 selezionate) che riesce a dormire nella notte si distribuisce come una Binomiale, X B ( n, p ) , di parametri n=15, p=0.7: n 15 n x 15 x P ( X = x ) = p x (1 p ) = 0.7 x (1 0.7 ) x x Risposta 1
Risposta 2
7 15 15 x P ( 3 X 7 ) = 0.7 x (1 0.7 ) = 0.05 x =3 x
Risposta 3
50
Esercizi di: Statistica e Calcolo delle Probabilit Nota Ad ognuna delle 15 persone selezionate si pu associare una v.a., (Yi , i = 1,2,...,15 ) , che assume valore 1 se lindividuo in questione riesce a dormire nella notte e valore 0 in caso contrario. Poich le 15 persone considerate sono scelte a caso da una popolazione in cui vi una percentuale pari al 70% di individui che riesce a dormire nella notte (N.B. il testo dice che il 30% non riesce), le Yi possono essere
considerate v.a. bernoulliane B (1, p ) di uguale parametro, p=0.7. Supposto inoltre che i 15 individui siano stati estratti da una popolazione di dimensione estremamente grande (rispetto alla dimensione del campione, n=15) le Yi possono essere considerate anche (approssimativamente) s-indipendenti. Ne risulta che:
X = Yi ,
i =0
15
In quanto somma di v.a. bernoulliane indipendenti ed identicamente distribuite, una binomlale B ( n, p ) di parametri n=15 e p=0.7.
51
Soluzione Risposta 1 La variabile aleatoria X, sotto ipotesi non eccessivamente restrittive (si veda lesercizio precedente), pu essere considerata distribuirsi come una Binomiale, X B ( n, p ) , di parametri n=500, p=0.001: n 500 n x 500 x P ( X = x ) = p x (1 p ) = 0.001x (1 0.001) . x x Una buona approssimazione di tale v.a. per n grande e p piccolo si ottiene considerando la seguente v.a. di Poisson, X P ( n p ) :
P( X = x)
(n p) =
x!
exp ( n p )
( 500 0.001) =
x!
( 0.5) =
x!
Risposta 2
exp ( 0.5 ) .
P ( X = 2)
( 0.5) =
2!
Risposta 3
P ( X 2) =
x=2
( 0.5)
x!
exp ( 0.5 ) = 1
x =0
( 0.5)
x!
52
Soluzione
Indicati con X i guasti registrarti in 10 ore Possiamo calcolare:
P ( X = 2)
( t ) =
x t
e x! = 4.9 105
( 0.001 10 ) =
2!
0.00110
0.012 0.01 = e = 2
53
Soluzione Premessa Se il dispositivo sorvegliato periodicamente (un controllo ogni due ore) in ogni singolo intervallo di due ore si pu registrare al pi un guasto. Infatti leventuale guasto sarebbe rilevato solo in occasione della operazione periodica di controllo. Risposta (i) Indicati con X i i guasti registrarti nella i-esima missione di 2 ore (i=1,2,..,5) Possiamo calcolare: 0 t ) t 0.0012 0.002 ( P ( X i = 0) = e =e =e = 0! = 0.998 P ( X i = 1) = 1 P ( X i = 0 ) =
= 3.976 105
Risposta (ii) In questo caso gli intervalli sono solo 3 (6 ore divise in 3 intervalli da 2). La variabile Y che conta i guasti sar pertanto ancora Binomiale di parametri n = 3 e p = 0.002 . Esercizi di statistica e calcolo delle probabilit Prof. M. GIORGIO
54
P ( 2 Y 4 ) = P ( 2 Y 3) = (Y = 2 ) + P (Y = 3) = P (Y = y ) =
y =2 3 3 y 3 3 y 3 y = p (1 p ) = 0.002 y (1 0.998 ) = y =2 y y =2 y 3! 3! 3 2 33 0.0022 (1 0.002 ) + 0.0023 (1 0.002 ) = = 2!( 3 2 )! 3!( 3 3)! 3
55
Soluzione Risposta 1
Bisogna calcolare la probabilit che il numero, X, di aragoste richieste sia superiore a 9:
P ( X > 9) = P ( X = x ) = 1 P ( X = x )
x =10 x =0
P ( X > 9) =
x
x!
x =10
exp ( ) = 1
x =0
7x exp ( ) =1 exp ( 7 ) = x! x =0 x !
9
70 71 79 = 1 exp ( 7 ) + exp ( 7 ) + ... + exp ( 7 ) = 1! 9! 0! = 1 0.0009 + 0.0064 + ... + 0.1015 = 1 0.830 = = 0.170
Risposta 2 Vogliamo determinate il pi piccolo valore di x (indichiamolo con x ) che soddisfa la relazione: P ( X x ) 0.95 (il valore cercato costituisce, per definizione, il 95-esimo percentile, x0.95 , della v.a. X). La ricerca viene fatta per tentativi. Osservato che calcolando la probabilit P ( X x ) con x=9,10,11 e 12, rispettivamente, risulta: 9 7x P ( X 9 ) = FX ( 9 ) = exp ( 7 ) = x =0 x ! = 0.830 < 0.95 Esercizi di statistica e calcolo delle probabilit Prof. M. GIORGIO 56
57
Soluzione
Bisogna calcolare la probabilit che il numero, Z=X+Y, di aragoste complessivamente richieste in una giornata sia superiore a 15. La variabile Z come somma di v.a. Poisson s-indipendenti ancora una v.a. di Poisson di media pari alla somma delle medie di X e Y. Possiamo pertanto scrivere:
E ( Z ) E ( X ) + E (Y ) e E( Z ) = E ( X ) + E (Y ) e P(Z = z) = = z! z!
z z
e z! e quindi calcolare:
P ( Z > 15 ) =
( 7 + 5) =
z
( 7 + 5 )
12 z 12 = e z!
15
z! = 1 0.844 =
x =16
exp ( ) = 1
z =0
z
z!
exp ( ) =1
12 z exp ( 12 ) = ! z x =0
15
= 0.156.
Nota Se in entrambi i ristoranti il numero medio di aragoste richieste fosse stato pari a 7 mettendo da parte 9+9=18 aragoste si sarebbe ottenuto: z 7 + 7 ) ( 7+7 ) 14 z 14 ( P(Z = z) = e e , = z! z! 18 14 z 14 P ( Z > 18 ) = 1 e = 1 0.883 = 0.117 . z! 0 Da tale risultato si evince che lutilizzo di un magazzino centralizzato (a meno degli ovvi costi/problemi logistici) offre rilevanti vantaggi. Infatti, sempre nellipotesi di s-indipendenza delle v.a. X ed Y, la probabilit di riuscire a soddisfare tutte le richieste nel caso in cui le scorte siano gestite separatamente (9 aragoste nel primo ristorante e 9 nel secondo, per un totale di 18 aragoste), risulta pari a:
58
P ( X 9 ) ( Y 9 ) =
9 7x 7y P ( X 9 ) P (Y 9 ) = exp ( 7 ) exp ( 7 ) = x =0 x ! y =0 y ! 9
= ( 0.830 ) = 0.689 laddove la probabilit di soddisfare tutte le richieste (con le stesse 18 aragoste) nel caso di magazzino centralizzato pari a: P ( Z 18 ) = 1 P ( Z > 18 ) = 1 0.117 = 0.883 .
2
59
FT ( t ) = 1 e
t 5
t > 0.
Avendo appena inoltrato una richiesta di intervento siamo interessati a calcolare: 1. la probabilit che la nostra richiesta venga evasa nelle prossime 3 ore? 2. la probabilit che la nostra richiesta venga evasa nelle prossime in un tempo compreso tra 3 e 5 ore. 3. Verificare infine che la media di T pari a 5 e calcolare la sua varianza
1 t e 5 dt 5
60
V ar (T ) = t E (T ) fT ( t ) dt = 0 0
2 t 2 2
1 ( t 5) e 5 dt = 5
2
t t t 2 5 5 5 t e dt = t e + 2t e dt = 2 t e dt = 0 0 0 2 t 5
= 2 5 E (T ) = 2 52.
Da cui sostituendo si ricava:
1 V ar (T ) = t e 5 dt 52 = 2 52 52 = 0 5 2 = 5 = 25.
2
Var (T ) = E (T )
t t 1 5 2 1 5 t e dt t e dt = 2 52 52 = 25 0 5 5
61
6.
Stima puntuale
6.1
Una prova di tenuta effettuata su 915 radiatori d'auto selezionati casualmente da una certa popolazione ha evidenziato la presenza di perdite di liquido refrigerante attraverso le guarnizioni in 127 casi. Effettuare una stima puntuale della proporzione, p, di radiatori che presentano lo i) stesso difetto nell'intera popolazione. Valutare il livello d'incertezza associato a detta stima. ii) iii) Richiamare le eventuali ipotesi su cui basato il calcolo.
Soluzione: Risposta (i) Metodo dei momenti Strategia 1 Possiamo pensare ai risultati dellesperimento come ad un campione bernoulliano di dimensione n=915. In questo caso indicata con X i la v.c. Bernoulliana: X i ~ B (1, p ) che assume (per li-esimo radiatore) valore 1 quando li-esimo radiatore perde e valore 0 quando non perde. Risultando: E ( X i ) = p, i = 1,2,...,915 possiamo scrivere: 1 n 1 n 1 = x = xi ; 3) p = x = xi . 1) 1 = p; 2 ) n i =1 n i =1 si ricava pertanto:
n 915 Strategia 2 Possiamo pensare ai risultati dellesperimento come ad un campione casuale di dimensione k=1 estratto da una v.a. Binomiale (per ottenere il valore della v.a. Binomiale
Esercizi di statistica e calcolo delle probabilit Prof. M. GIORGIO
= p
x x
i =1 i
915 i =1
62
Nota
Y = Xi
i =1
915
Metodo della massima verosimiglianza Strategia 1 Campione Bernoulliano: Ricordando che X i B (1, p ) una particolare Binomiale B ( m, p ) con m=1. Ricaviamo la espressione della funzione massa di probabilit della Bernoulliana partendo dalla formula della Binomiale: m =1 m m 1 m x x p1 (1 p )1 x . x p (1 p ) Espressione da cui osservato che le xi possono assumere solo i valori 1 e 0 (le xi sono 1 1 Bernoulliane) e che = = 1 si ottiene: 0 1 1 x P ( X = xi ) = p x (1 p ) . Utilizzando tale espressione della funzione massa di probabilit delle X i ricaviamo:
L ( p; x ) = p (1 p )
x i =1
1 x
=p
xi
i =1
(1 p )
xi ,
i =1
63
dl l ( p; x )
x
i =1
n xi
i =1
0 e (1 p ) 0 Supposto p
k ) xi p n xi = 0 (1 p i =1 i =1 k
x np +p x x p
i =1 i i =1 i i =1
=0 = 0 xi np
i =1
= p
x
i =1
Strategia 2 Campione Binomiale: Y una v.a. Binomiale B ( n, p ) con n=915. La funzione massa di probabilit di Y la seguente: n y n y y p (1 p ) . Ricaviamo pertanto:
L ( p; y ) = p yi (1 p )
y =1 k n yi
che essendo k=1 si riduce a: n n n y n y L ( p; y ) = p y1 (1 p ) 1 = p y (1 p ) y y1 ovvero n l ( p; x ) = ln + y ln ( p ) ( n y ) ln (1 p ) , y da cui derivando rispetto a p si ottiene: dl l ( p; y ) = y n y, dp p 1 p espressione che posta uguale a zero e risolta rispetto a p fornisce lo stimatore cercato:
Esercizi di statistica e calcolo delle probabilit Prof. M. GIORGIO
64
) y p [n y] y n y (1 p = =0 (1 p ) (1 p ) p p 0 e 1 p 0 permette di scrivere: che supposto p ) y p [n y] = 0 (1 p y n p +p y = 0 y n p =0 y p y 127 = = p = 0.139 . n 915 Che ovviamente coincide con il risultato ottenuto utilizzando la strategia 1.
Nota Gli stimatori e le stime fornite dal metodo dei momenti (come spesso capita) coincidono con quelle fornite dal metodi della massima verosimiglianza. Risposta (ii) Lincertezza di stima pu essere valutata calcolando lerrore quadratico medio dello stimatore. = p pertanto lerrore quadratico Lo stimatore ottenuto uno stimatori corretto E P medio coincide con la sua varianza: = p (1 p ) Var P n ottenuta Una stima della varianza dello stimatore si pu ottenere sostituendo la stima p al valore incognito p. 127 127 1 (1 p ) 915 p 915 Var P = = = 1.31 104 n 915
( )
( )
( )
Risposta (iii) Nel fare i calcoli si supposto: 1) X i ~ B (1, p ) i = 1,2,...,915 2) le X i sono s-indipendenti (la loro funzione massa di probabilit congiunta pari al prodotto delle marginali).
65
Per ognuno dei k=200 giorni di monitoraggio ambientale sono stati selezionati (casualmente) e sottoposti ad analisi n=10 provini di aria. I risultati ottenuti sono riportati nella seguente tabella: Numero di provini inquinati su dieci (xi) Frequenze osservate (ki) 0 133 1 52 2 12 3 3 4 0 totale 200
Assunto che il numero di provini inquinati su n=10 ha una distribuzione Binomiale di parametro p, si formuli la stima tale parametro utilizzando: Il metodo dei momenti; (i) (ii) Il metodo della massima verosimiglianza.
Soluzione Risposta (i) Detta X la v.c. Binomiale: X ~ B ( n, p ) risulta: E ( X ) = n p = 10 p . Calcolata: 1 k 1 200 1 3 x = xi = i ki = xi = 200 k i =1 200 i =1 i =0 0 133 + 1 52 + 2 12 + 3 3 85 = = = 0.425 200 200 e posto: x = 0.425 = 10 p = n p si ricava: x 0.425 =X ) = = p = 0.0425 (N.B. P n 10 n Risposta (ii)
k k n n x L ( p ) = P ( X = xi ) = p x (1 p ) i =1 i =1 x k n xi n xi = ln l ( p ) = ln L p ( ) p (1 p ) = i =1 xi
n = ln + xi ln p + ( n xi ) ln (1 p ) i =1 xi da cui derivando rispetto a p si ottiene: dl ( p ) k xi n xi = dp 1 p i =1 p espressione che posta uguale a zero e risolta rispetto a p fornisce lo stimatore cercato: Esercizi di statistica e calcolo delle probabilit Prof. M. GIORGIO 66
k
=0 p 1 p
i =1
xi
k
n xi
k
xi
i =1
( n xi ) xi ( n xi )
i =1
1 p
k k i =1
i =1
i =1
1 p
) xi p ( n xi ) = = (1 p
i =1
xi p nk + p xi = = xi p
i =1 k i =1 i =1
nk = 0 = xi p
i =1
= p
k
x nk n si ottiene pertanto:
i =1
= p
x
i =1
nk
x 0.425 = 10 n
=X ) (N.B. P n
Nota si vede che nel caso in esame gli stimatori ottenuti ai punti (i) e (ii) coincidono.
67
I giovani cetacei appartenenti ad una certa colonia sono colpiti da una malattia cronica. Tenendo sotto controllo un campione di 4 esemplari ammalati alcuni ricercatori registrano la loro morte nei seguenti giorni, conteggiati a partire dal giorno in cui la malattia si era manifestata: 10, 30, 40 58. ipotizzato che la v.c., T, tempo intercorrente tra il manifestarsi della malattia e la morte del generico cetaceo si distribuisca esponenzialmente: ricavare una stima del tempo medio intercorrente tra listante in cui i cetacei (i) manifestano la malattia e la loro successiva morte; stimare la probabilit che per un generico cetaceo ammalato risulti T>50. (ii)
Soluzione
Premessa x = { x1 , x2 , , xn } .
x exp = E(X ). fX ( x) = 1
Risposta (i) Metodo dei momenti:
n 1 = xi n ; 1){1 = g1 ( ) = ; 2 ) i =1 4 n 3) = xi n = xi 4 = 34.5 i =1 i =1
Massima verosimiglianza:
l ( ; x ) = ln L ( ; x ) = n ln ( )
n xi xi 1 L ( ; x ) = f ( xi ; ) = exp = n exp i =1 i =1 i =1
n n
la stima si ottiene risolvendo rispetto a si ottiene: n l ( ; x ) n i =1 xi = + 2 da cui uguagliando a zero si ricava lequazione: n n i =1 xi + =0 2 che (ipotizzato 0 )
Esercizi di statistica e calcolo delle probabilit Prof. M. GIORGIO
i =1 i
68
si pu riscrivere come: n xi n + i =1 = 0 . Da tale equazione si ottiene la stima: n xi = i =1 . n Nel fare i calcoli si supposto che fosse diversa da zero, pertanto una eventuale soluzione = 0 dovr essere considerata non accettabile). Si osservi che anche in questo caso metodo dei momenti e massima verosimiglianza forniscono la medesima soluzione.
69
stato sottoposto a controllo un campione di 10 individui appartenenti ad una certa comunit che lavora in un ambiente a rischio. Lesame dei rispettivi livelli di azotemia (X) ha rilevato i seguenti valori: 41, 23, 39, 48, 21, 28, 20, 24, 40, 46. Noto che la v.c. X~N(,2), si effettui la stima di , 2 e utilizzando: il metodo dei momenti; (i) il metodo della massima verosimiglianza. (ii)
Soluzione Risposta (i) Metodo dei momenti Detta X la v.c. Normale: X ~ N ( , 2 ) risulta:
E ( X ) = 1 = ,
= x = xi n = xi 10 = 33
i =1
10
2 =
( x x )
i =1 i
i =1 10
( x x )
i =1 i
10
= 106.2
70
L ( , ; x ) = f X ( xi ) =
i =1 i =1
1 xi 2 1 exp = 2 2
n 1 n xi 2 1 = exp 2 2 i =1
( xi ) 2 n xi 1 i =1 l ( , ; x ) = = 2 i =1 2 1 2 1 n n 1 n 2 2 l ( , ; x ) = n 3 ( xi ) = + 3 ( xi ) 2 i =1 i =1 Uguagliando a zero le espressioni ottenute e mettendo a sistema si ottiene (quando si uguaglia a zero si introducono i per indicare che le soluzioni del sistema sono le stime ricercate):
) ( x
i =1 i n
=0
)=0 ( x
i =1
n +
n
) ( x
i =1 i
= 0.
n
)=0 = xi n . ( xi
i =1 i =1
Sostituendo nella seconda si ricava: 1 n 1 n 2 2 ) = 0 2 = ( xi x ) n + 2 ( xi i =1 n i =1 Si vede che gli stimatori, e quindi le stime ottenute, coincidono con quelli fornite dal metodo dei momenti.
71
Nota 1
( x x )
i =1 i
1 n 2 1 n 2 1 n 1 n 2 2 = ( xi 2 xi x + x ) = xi 2 xi x + x = n i =1 n i =1 n i =1 n i =1 1 n 2 1 n n = xi 2 x xi + x 2 = n i =1 n i =1 n = 1 n 2 xi x 2 n i =1
Nota 2 Sia il metodo dei momenti che quello della massima verosimiglianza forniscono per 2 lo stimatore non corretto:
2 =
( X
i =1
X)
( X
i =1
X)
per il
n : n 1
S2 =
n n 2 = n 1 n 1
( X
i =1
X)
( X
i =1
X)
n 1
72
8 esemplari di un certo modello di autovettura messi in prova su una tratta di 100 km hanno fatto registrare i seguenti consumi di carburante: 8.0 8.2 8.5 7.6 8.2 7.7 8.0 7.5
Supposto che la v.c. consumo si distribuisca normalmente si stimino la media e varianza della popolazione.
Soluzione:
Per stimare i parametri usiamo per la media lo stimatore media campionaria (coincidete sia con lo stimatore ottenuto utilizzando il metodo dei momenti che con quello ottenuto utilizzando il metodo della massima verosimiglianza). Per la varianza utilizziamo invece la varianza campionaria corretta. n 63.7 1 2 2 2 =x= =S = = 8.0; ( xi x ) = 0.117 . 8 n 1 i =1 Nota Per i passaggi si veda lesercizio 6.4.
73
Assegnato un campione casuale di dimensione n estratto da una v.a. Poisson effettuare una stima puntuale del parametro . P( X = x) =
x
x!
Soluzione
x = { x1 , x2 , , xn } .
Metodo dei momenti: Ricordando che E ( X ) = scriviamo:
n 1 = xi n ; 1){1 = g1 ( ) = ; 2 ) i =1 da cui si ricava: n = xi n 3) i =1
xi
xi !
e = ( e ) i =1
n n i =1
xi
1 xi !
l ( ; x ) = n + xi ln + ln
i =1 i =1
1 xi !
d l ( ; x ) = n + xi d i =1 =0 = n + xi
i =1 n
x
i =1
Nota Si vede che anche in questo caso la soluzione ottenuta, coincide con quella fornita dal metodo dei momenti.
74
Esercizi di: Statistica e Calcolo delle Probabilit 6.7 Assegnato un campione casuale di dimensione n estratto da una v.a. Weibull impostare il calcolo delle stime di massima verosimiglianza dei parametri del modello (il problema non pu essere completamente risolto per via analitica).
Soluzione
x = { x1 , x2 , , xn } .
x f ( xi ; , ) = xi 1 exp i
n n
n = n
= n ln n ln + ( 1) i =1
n
ln ( x )
i
i =1 i
x ln ( xi ) l ( , ; x ) n n i =1 i = n ln + i =1 ln ( xi )
n
si e Uguagliando a zero e risolvendo il sistema di equazioni risultante rispetto ad ricavano le stime desiderate. n n n n 1 i =1 xi = + + +1 i =1 xi = 0 ) x ln ( xi n n i =1 i + i =1 ln ( xi ) n ln =0 0) , da cui (ipotizzato si ottiene :
n
75
n +
i =1 i
=0
n
) x ln ( xi n n i =1 i + i =1 ln ( xi ) n ln =0
ovvero:
i =1 i
xi = i =1 n
n
) x ln ( xi n n i =1 i + i =1 ln ( xi ) n ln =0
n
restituita dalla I equazione nella II, si ottiene la da qui, sostituendo la espressione di seguente equazione in forma implicita: n n ln ln x x x ( ) ( ) n n i i i i =1 + i =1 ln ( xi ) n i =1 n n ln +n = n x x
i =1 i
i =1 i
x ln ( xi ) n n i =1 i = + i =1 ln ( xi ) n =0 n x i=1 i
n
Questa equazione, deve essere risolta per via numerica. Una volta trovato il valore utilizzando la I equazione: che la soddisfa sar possibile calcolare
n xi = i =1 n
Nota 1 fossero diversi da zero, pertanto eventuali e Facendo i calcoli si supposto che = 0 dovranno essere considerate non accettabili). =0 o soluzioni Nota 2 n i =1 xi
1
(
n n
i =1 i
x =
n xi ) = ( = 1 i
= i =1
= i =1 ( xi ) ln ( xi )
76
7.
Stima intervallare
7.1 Sulla base di un campione di 9 elementi estratti casualmente da una popolazione con varianza pari a 3 stata calcolata una media (campionaria) x =10.2. Si calcoli l'intervallo di confidenza della media della popolazione al livello di fiducia 0.95
Soluzione
Un intervallo di confidenza per la media al livello 0.95 dato da:
, x + z10.025 x z10.025 . n n
Da tale espressione. essendo z1-0.025=z0.975=1.96 si ricava lintervallo: (9.07, 11.33).
Nota Tale intervallo risulter esatto se la X Gaussiana approssimato (teorema del limite centrale) se la X non Gaussiana.
77
Esercizi di: Statistica e Calcolo delle Probabilit 7.2 Sono state eseguite con un'opportuna strumentazione 10 rilevazioni di un indice di inquinamento dell'aria x1,x2,...,x10. Utilizzando tale campione si sono calcolati per il livello (concentrazione) d'inquinante la media e la deviazione standard:
xi = i =1 = 10.48 , = 1.36 . 9 i =1 10 Supposto che la X abbia una distribuzione Normale, di parametri e 2, si calcoli un intervallo di confidenza per (livello di confidenza 1-=0.90). x =
Soluzione
noto che un intervallo di confidenza al livello 0.90 dato da: , x + t10.05 x t10.05 . n n Da tale espressione. essendo t1-0.05=t0.95=1.83 (t di Student con n-1=9 gradi di libert) si ricava lintervallo: (9.69, 11.27).
10
( x x )
i
10
78
Esercizi di: Statistica e Calcolo delle Probabilit 7.3 Nelle misurazioni del livello di inquinamento di un motore a combustine interna si vuole essere sufficientemente certi che la differenza tra il valore medio stimato il valore medio vero del carico inquinante non sia maggiore di una certa quantit prefissata. Qual la dimensione n del campione che si deve utilizzare perch risulti al livello di confidenza 0.99 che l'errore di stima x non sia superiore a 0.1? Si supponga che la deviazione standard sia pari a 0.5.
Soluzione
Un intervallo di confidenza per la media al livello 0.99 dato da:
n = 0.99
z10.005
0.1
con z0.995=2.576 e =0.5, che risolta rispetto ad n fornisce la soluzione al problema: 2.576 0.5 n 0.1 n 2.576 0.5 0.1
n ( 2.576 5 ) n = 166
2
79
Esercizi di: Statistica e Calcolo delle Probabilit 7.4 8 esemplari di un certo modello di autovettura messi in prova su una tratta di 100 km hanno fatto registrare i seguenti consumi di carburante: 8.0 8.2 8.5 7.6 8.2 7.7 8.0 7.5
La media e la deviazione standard campionaria risultano (esercizio 6.5): n 63.7 1 2 = x= = 8.0; ( xi x ) = 0.34 n 1 i =1 8 Si calcoli l'intervallo di confidenza per il consumo medio, , di tale modello di autovettura (livello di confidenza 0.95). Si supponga che la v.c. consumo si distribuisca normalmente.
Soluzione
Un intervallo di confidenza al livello 0.95 dato da: , x + t10.025 x t10.025 . n n Da tale espressione. essendo t1-0.025=t0.975=2.365 (t di Student con n-1=7 gradi di libert) si ricava lintervallo: (7.71. 8.28).
80
Esercizi di: Statistica e Calcolo delle Probabilit 7.5 8 esemplari di un certo modello di autovettura messi in prova su una tratta di 100 km hanno fatto registrare i seguenti consumi di carburante: 8.0 8.2 8.5 7.6 8.2 7.7 8.0 7.5
Osservato che (da tale campione) risulta un consumo medio (campionario) pari a x = 8.0 , si calcoli l'intervallo di confidenza al livello 0.95 per il consumo medio, , di tale modello di autovettura. Si supponga che la v.c. consumo si distribuisca normalmente e che la sua varianza sia pari a 2 = 0.118 .
Soluzione
Un intervallo di confidenza al livello 0.95 nel caso di varianza, 2 , nota dato da:
+ x z , x z 1 0.025 1 0.025 . n n
Da tale espressione. essendo z1-0.025=1.96 (Normale Standard). si ricava lintervallo: (7.76. 8.24). Si noti che in questo esercizio pur avendo usato per x e gli stessi valori, 0.8 e 0.34 nellesercizio (7.4) si ottiene per un intervallo meno ampio di quello utilizzati per x e calcolato in quellesercizio. Questo risultato non casuale, ma dipende dal fatto che nellesercizio (7.4), non essendo nota la deviazione standard della popolazione, si dovuta . Ci ha determinato un maggiore stato di incertezza che ci ha utilizzare la sua stima costretti ad effettuare una valutazione pi cautelativa [la maggiore cautela si concretizza nelluso, nellesercizio (7.4), della t di Student invece della Normale Standard usata in questo esercizio].
81
Esercizi di: Statistica e Calcolo delle Probabilit 7.6 La misura della capacit di 25 condensatori ceramici dello stesso tipo ha fornito un campione casuale di osservazioni sulla base del quale sono stati ottenuti i seguenti valori di media e deviazione standard campionaria: n 1 2 = x = 10953, ( xi x ) =845. n 1 i =1 Calcolare (i) una stima intervallare della capacit media (ii) una stima intervallare della varianza della popolazione specificando le eventuali ipotesi su cui basato il calcolo.
Soluzione
Ipotesi: I campione casuale estratto da popolazione Normale. II Assumo livello di confidenza pari a 0.95
Risposta (i) Un intervallo di confidenza per la media al livello 0.95 dato da: , x + t10.025 x t10.025 . n n
Da tale espressione. essendo t1-0.025=t0.975=2.064 (t di Student con n-1=24 gradi di libert) si ricava lintervallo: (10597, 11309).
2 2 P 2 ( n 1) 2 12 2 = 1
2 2 P ( n 1) 2 2 ( n 1) 2 = 1 1 2 2
82
Esercizi di: Statistica e Calcolo delle Probabilit 7.7 Per valutare la preparazione di uno studente gli somministriamo un questionario costituito da 40 domande, ognuna delle quali prevede tre possibili risposte (chiuse). Avendo lo studente risposto esattamente a 28 domande si calcoli l'intervallo di confidenza al livello 0.95 della probabilit p di rispondere esattamente alla generica domanda (parametro che pu essere interpretato come il livello di preparazione dello studente).
Soluzione
Un intervallo di confidenza approssimato per il parametro p al livello 0.95 dato da:
z10.025 p
(1 p ) p + z10.025 ,p n
(1 p ) p n
da tale relazione, essendo: 28 = z10.025 = z0.975 = 1.96 e p = 0.7 40 si ricava per p lintervallo: (0.56, 0.84).
83
Esercizi di: Statistica e Calcolo delle Probabilit 7.8 Una prova di tenuta effettuata su 915 radiatori d'auto selezionati casualmente da una certa popolazione ha evidenziato la presenza di perdite di liquido refrigerante attraverso le guarnizioni in 127 casi. Effettuare una stima intervallare della proporzione (p) di radiatori che presentano lo stesso difetto nell'intera popolazione al livello di confidenza 0.95.
Soluzione
z10.025 p
(1 p ) p + z10.025 ,p n
(1 p ) p n
127 = 0.139 915 lintervallo richiesto il seguente: (0.116, 0.161). = z10.025 = z0.975 = 1.96 e p
84
Esercizi di: Statistica e Calcolo delle Probabilit 7.9 Su 150 lanci di una moneta si ottenuto 35 volte testa. Si formuli un intervallo di confidenza, al livello 0.95, del parametro p=P(testa).
Soluzione
z10.025 p
(1 p ) p + z10.025 ,p n
(1 p ) p n
35 = 0.23 150 lintervallo richiesto il seguente: (0.16, 0.30). = z10.025 = z0.975 = 1.96 e p
85
8.
Test di ipotesi
8.1 Una societ di consulenza promette ad un pastificio che con il proprio intervento pu far crescere la produzione giornaliera di pi di 20kg. Per dimostrare la efficacia del proprio approccio tale societ mostra i risultati (certificati) ottenuti in 60 casi aziendali seguiti in precedenza. nei quali l'incremento di produzione era risultato in media pari a 22kg. Il proprietario del pastificio vuole sapere se possibile ritenere che le promesse fatte dai consulenti saranno mantenute. Noto che la deviazione standard pari ad 8kg e posto =0.05, quale test gli consigliereste di effettuare? (i) Si specifichino ipotesi nulla e ipotesi alternativa (ii) si definisca la regione critica (iii) Si calcoli il rischio di seconda specie nellipotesi che lintervento produca un incremento della produzione media di 23 kg. (iv) si specifichi la decisione che bisogna prendere sulla base dei dati disponibili.
Soluzione Risposta (i) H0: 0=20 contro H1: 1>20. Risposta (ii) La statistica test : H0 82 82 X N , X N 20, . 60 n
Dato che l'ipotesi alternativa unidirezionale a destra (H1: del tipo: R.C.: x >c. Con c tale che: P ( X c) = 1 P( X > c) = . Osservato che: Esercizi di statistica e calcolo delle probabilit Prof. M. GIORGIO
1>20)
la regione critica
86
c 20 = z10.05 = 1.645 8 60
da cui si ricava:
c = 20 + 1.645 8
Risposta (iii)
60 = 21.70 .
( 1 ) = P ( X c = 1 ) = P
X 1 c 1 = 1 = n n
( 1 = 23) =
Risposta (iv) Decisione: x = 22 > c = 21.70 x cade nella regione critica R.C. Il test significativo (ovvero lipotesi nulla pu essere rigettata) al livello di significativa =0.05. In altre parole, si pu ritenere al livello di significativa =0.05 che la societ di consulenza sia capace di mantenere le promesse fatte.
87
Esercizi di: Statistica e Calcolo delle Probabilit 8.2 8 esemplari di un certo modello di autovettura messi in prova su una tratta di 100 km hanno fatto registrare i seguenti consumi di carburante: 8.0 8.2 8.5 7.6 8.2 7.7 8.0 7.5
x=
63.7 8.0; 8
n 1 2 ( xi x ) = 0.34 . n 1 i =1
Si effettui un test relativo a: H0: 0=7.7 contro H1: 17.7 con =0.05. Si supponga che la v.a. consumi si distribuisca normalmente.
Soluzione
H0: 0=7.7.; H1: 17.7; =0.05. X X 7.7 H 0 tn1 tn1 8 8 Essendo la ipotesi alternativa non direzionale la regione di accettazione pu essere cos definita: R.A.: c1 x c2 Partendo da: X 7.7 t1 2 = 1 P t1 2 n si ottiene: n X 7.7 + t1 2 n =1 P 7.7 t1 2
8 = 7.42
c2 = 7.7 + t10.025
8 = 7.98
Decisione Il valore osservato di X ( x = 8.0 ) esterno alla regione di accettazione: l'ipotesi nulla deve essere rigettata.
Nota Per giungere a questo risultato si pu anche ragionare come segue: Si calcola un intervallo di confidenza al livello 0.95 per il parametro (si veda lesercizio 7.4):
Esercizi di statistica e calcolo delle probabilit Prof. M. GIORGIO 88
Esercizi di: Statistica e Calcolo delle Probabilit (7.71. 8.28). si osserva che esso non contiene il valore 7.7 assegnato sotto H0 e si conclude che lipotesi H0 pu essere rigettata.
89
Esercizi di: Statistica e Calcolo delle Probabilit 8.3 La resistenza elettrica di un certo tipo di resistori prodotti in serie una v.a., X, Gaussiana. La deviazione standard di X costituisce una misura dello qualit del processo produttivo. Sulla base di 20 resistori scelti a caso tra quelli realizzati da tale processo si calcola una varianza campionaria pari a:
= 0.25 n 1 19 1. Si valuti se possibile accettare lipotesi che la varianza della popolazione sia maggiore di 0.20. 2. Si valuti la probabilit di accettare lipotesi nulla nellipotesi che il vero valore di 2 sia pari a 0.23. Si ponga =0.05
i =1 i =1
S2 =
( x x )
i
( x x )
i
20
Soluzione
2 H0: 2 = 0 =0.20.; H1: 2 > 0.20;.
c=
( n 1)
02
12 ,n1 =
) (
90
Esercizi di: Statistica e Calcolo delle Probabilit 8.4 Negli Stati Uniti molti ristoratori, in seguito agli interventi effettuati per migliorare la qualit del servizio, effettuano dei test sui clienti per valutare i risultati ottenuti. Nel questionari utilizzati allo scopo (usato per valutare lincremento di qualit del servizio) sono proposte risposte raggruppate in due macro categorie: valutazioni positive e valutazioni non positive circa le modifiche apportate. Si supponga di avere somministrato il questionario ad 80 clienti abituali e che di questi 51 abbiano apprezzano le modifiche. possibile concludere che possibile accettare l'ipotesi che una percentuale superiore al 50% esprime apprezzamento per le modifiche apportate al servizio al livello di significativit =0.01?
Soluzione
H0: p=0.5 contro H1: p>0.5;
Z=
p0 (1 p0 ) n
p0 P
N ( 0,1)
(la dimensione campionaria relativamente elevata, n=80, garantisce la bont dellapprossimazione). Test ad una coda. La zona di rigetto del tipo: >c. R.C.: p Dalla relazione:
p0 P p0 + z1 p0 (1 p0 ) n = P z1 = P P p0 (1 p0 ) n si ricava :
c = p0 + z1 p0 (1 p0 ) n
da cui, essendo =0.01 ( z0.99 = 2.33) , si calcola:
80 = 0.63 .
51 = 0.6375 . ricade nella zona di rigetto possiamo 80 concludere che c evidenza per rigettare H0 (accettare H1) al livello di significativit =0.01.
91
Esercizi di: Statistica e Calcolo delle Probabilit 8.5 I ritardi registrati in partenza dai voli di una compagnia aerea sono classificati come accettabili (A) o non accettabili (cA) a secondo che siano state registrati ritardi dell'orario effettivo di imbarco, rispetto all'orario ufficiale, inferiori a 5 minuti. Sulla base dei dati storici, relativi ad un numero molto elevato di controlli effettuati dalla compagnia prima di una importante ristrutturazione, stata stimata una probabilit di incorrere in un ritardo non accettabile p=0.05. Dopo la ristrutturazione, per verificare lefficacia del nuovo assetto organizzativo, si sono monitorati i primi 10 imbarchi registrando 2 ritardi non accettabili. Si pu ritenere che il valore di p sia ancora pari a 0.05 (=0.01).
Soluzione
H0: p=0.05 contro H1: p0.05; Sotto H0:
Z=
p0 (1 p0 ) n
p0 P
N ( 0,1)
c2 = p0 + z10.005 c1 = p0 z10.005
p0 (1 p0 ) 0.05 (1 0.05 ) = 0.05 + 2.57 = 0.227 n n p0 (1 p0 ) 0.05 (1 0.05 ) = 0.05 2.57 = 0.127 n n
si formula la seguente regione di accettazione pertanto, dovendo necessariamente p 0.227 R.A.: 0 p Decisione: appartiene alla regione di accettazione pertanto non si pu rigettare lipotesi nulla. p
Nota Le formule utilizzate forniscono soluzioni esatte solo per n . Per n piccolo a causa della scarsa qualit dellapprossimazione adottata pu capitare che pur essendo una v.a. non negativa, si ottenga per c1 un valore negativo. In tali casi si deve P porre c1 = 0 :
c1 = Max 0, p0 z1 2
p0 (1 p0 ) n
92
Esercizi di: Statistica e Calcolo delle Probabilit 8.6 Per verificare l'efficacia di un nuovo tipo di farmaco si ricorre allo studio delle reazioni di 15 volontari cui viene somministrato. Non essendoci altri riferimenti si ipotizza che un'evidenza statistica di efficacia in pi del 50% dei casi sia un buon risultato. (i) Si determini la regione di rigetto che assicuri un livello di significativit =0.01. (ii) Si calcoli la probabilit di accettare lipotesi nulla nel caso in cui p = p1 = 0.6 (rischio di II specie).
Soluzione
H0: p=0.5 contro H1: p>0.5;
Risposta (i)
c = p0 + z10.01
p1 P c p1 p = p1 =P p1 (1 p1 ) n p1 (1 p1 ) n c p1 c p1 P Z = p1 (1 p1 ) n p1 (1 p1 ) n Da questa relazione, posto p1=0.6 ed n=15, si ricava: 0.8 0.6 = (1.58 ) = ( p1 = 0.6 ) = 0.6 (1 0.6 ) 15 = 0.94
93
Esercizi di: Statistica e Calcolo delle Probabilit 8.7 Un produttore di palline da tennis afferma di realizzare una percentuale di prodotti difettosi minore del 3%. Il generico acquirente considera tollerabile tale livello di difettosit, ma sospettando che il produttore che possa aver dichiarato il falso decide di effettuare un test per verificare la veridicit di tale affermazione. A tale scopo estrae a caso un campione di 100 unit di prodotto (direttamente dalla linea di produzione) conta il numero di palline. Le palline difettose risultano essere 10. possibile affermare, al livello di significativit prossimo a 0.10, che il produttore abbia detto il falso?
Soluzione
H0: p=0.03 contro H1: p>0.03. >c R.C.: p
c = p0 + z10.1
Risultando: 10 = p = 0.1 > c = 0.052 100 possibile affermare al livello di significativit 0.10 che il produttore ha mentito.
94
Un dado viene lanciato ripetutamente per vedere se equilibrato. In 600 lanci le facce con X=1,2,,6 puntini si sono presentate rispettivamente 120, 100, 90, 60, 110, 120 volte. Si vuole verificare al livello di significativit =0.05 se il dado equilibrato
Soluzione
Dal testo si evince che lipotesi nulla H o : P ( X = i ) = ricaviamo le frequenze teoriche in tabella. Utilizziamo la statistica test: 6 (ni n Pi ) 2 2 2 ~ 6 0 = 1 ( n Pi ) i =1
2 con laiuto della seguente tabella: Calcoliamo o
1 i = 1,2, ,6 , da cui 6
Frequenza Osservate 120 100 90 60 110 120 600 Teoriche 100 100 100 100 100 100 600
(ni n Pi ) 2 ( n Pi ) 4 0 1 16 1 4 2 o =26
2 Essendo 12 = 0.95 (6-1 gradi di libert) pari a: 2 2 =26>11.1= 0.95 si pu rigettare lipotesi nulla che il dado sia corretto. Risultando o
95
Esercizi di: Statistica e Calcolo delle Probabilit 8.9 X una v.a. di distribuzione incognita che pu assumere i valori 0,1,2,3,4,5. Si sospetta si tratti di una v.a. Binomiale, X B ( k , p ) , di parametri k=5 e p=0.6. Si verifichi lipotesi considerata utilizzando i dati raccolti nella seguente tabella (tali dati sono stati ottenuti osservando un campione casuale estratto dalla v.a. X):
i
1 2 3 4 5 6
xi
0 1 2 3 4 5
ni
4 13 25 21 28 9
ci
1.02 7.68 23.04 34.56 25.92 7.78
( ni ci )
ci
n = ni = 100 ci = n P ( X = xi )
i =1
Si calcola: 2 6 ni ci ) ( 2 0 = = 18.18 ci i =1 Entrando nella tabella della 2 con 5 gradi di libert ed =0.05 si ricava: c2 = 11.1 Decisione: 2 02 > C al livello di significativit = 0.05 non si pu accettare lipotesi che X B ( 5,0.6 ) .
96
Esercizi di: Statistica e Calcolo delle Probabilit 8.10 X una v.a. di distribuzione incognita che pu assumere i valori 0,1,2,3,4,5. Si sospetta si tratti di una v.a. Binomiale, X B ( k , p ) . Si verifichi lipotesi considerata utilizzando i dati raccolti nella seguente tabella (tali dati sono stati ottenuti osservando un campione casuale estratto dalla v.a. X):
xi ni
0 3
1 12
2 26
3 25
4 25
5 9
Si ponga =0.05.
Soluzione
Per valutare la bont delladattamento utilizziamo il test del 2. Si stima il parametro p:
= P
n x
i =1 i
nk
Si calcolano quindi i valori della funzione massa di probabilit Binomiale con k=5 e p=0.556. P(0) = P(1) = P(2) = P(3) = P(4) = P(5) = 0.0150 0.0989 0.2601 0.3420 0.2248 0.0591
i
1 2 3 4 5 6
xi
0 1 2 3 4 5
ni
3 12 26 25 25 9
ci
1.50 9.89 26.01 34.20 22.48 5.91
( ni ci )
ci
n = ni = 100 ci = n P ( X = xi )
i =1
Si calcola: 2 6 ni ci ) ( 2 = 6.30 0 = ci i =1 Entrando nella tabella della 2 con 4 gradi di libert (si perde un grado di libert perch si stimato il parametro p) ed =0.05 si ricava: Esercizi di statistica e calcolo delle probabilit Prof. M. GIORGIO 97
c2 = 9.49
Decisione: 2 02 C al livello di significativit = 0.05 si pu accettare lipotesi H0 che X sia Binomiale.
98
Esercizi di: Statistica e Calcolo delle Probabilit 8.11 Assegnato il seguente campione casuale: 2.849, 5.879, 2.498, 4.092, 7.240, 4.219, 7.145, 3.967, 5.011, 2.532, 5.984 verificare se possibile accettare lipotesi che sia stato estratto da una popolazione Gaussiana (si ponga =0.05).
Soluzione
Per testare lipotesi di gaussianit utilizziamo il test di Kolmogorov. I parametri della distribuzione non sono assegnati pertanto come primo passo si effettua una stima di media e varianza: X = 4.67
S2 =
( x x )
i
F empirica: Fi =
Z(i ) =
x(i )
i n x(i ) x S
( )
( )
z (i )
-1.263 -1.244 -1.060 -0.411 -0.338 -0.264 0.196 0.699 0.760 1.434 1.490
x (i ) Fi i 1 2.498 0.091 2 2.532 0.182 3 2.849 0.273 4 3.967 0.364 5 4.092 0.455 6 4.219 0.545 7 5.011 0.636 8 5.879 0.727 9 5.984 0.818 10 7.145 0.909 11 7.240 1.000 Si calcola la statistica test:
z(i )
( )
Fi ( zi ) 0.012 0.075 0.128 0.023 0.087 0.150 0.059 0.031 0.042 0.015 0.068
0.103 0.107 0.145 0.341 0.368 0.396 0.578 0.758 0.776 0.924 0.932
( )
99
k0 kc Accetto H0: al livello di significativit = 0.05 si pu ritenere che il campione sia stato estratto da una popolazione Gaussiana.
100
Esercizi di: Statistica e Calcolo delle Probabilit 8.12 Un nostro fornitore fa parte dei pochi privilegiati che partecipano ad un programma di miglioramento della qualit finanziato dalla nostra azienda. Verificare sulla base delle seguenti osservazioni se il numero di prodotti difettosi sul totale dei prodotti consegnati indipendente dallattuazione del programma di miglioramento: difettosi non difettosi prima 20 80 100 dopo 25 175 200 45 255 300
Soluzione
Per provare la s-indipendenza si pu applicare il test 2. Si definisce la regione di rigetto: 2 2 R.C.: 0 >3.84 ( 0.95 =3.84, si entra in tabella 1-=0.95 ed 1 g.l.) n n Si calcola Statistica test ci j = i j : n
02 =
i =1 j =1
(
2
ni j ci j ci j
=
2
( 20 15) =
15 = 2.941
(80 85) +
85
( 25 30 ) +
30
(175 170 ) +
170
Osservato che 2.941<3.84 si decide che non possibile rigettare l'ipotesi nulla.
101
Esercizi di: Statistica e Calcolo delle Probabilit 8.13 Una compagnia aerea ha raccolto le seguenti informazioni su due suoi piloti (A e B): 1. Numero di voli in anticipo 2. Numero di voli in orario (al max 5 minuti di differenza dall'orario ufficiale) 3. Numero di voli in ritardo Sfruttando la tabella di contingenza di seguito riportata. verificare che la puntualit o meno dei voli sia indipendente dal pilota (si fissi =0.10). Voli in anticipo 15 21 36 Voli in orario 65 73 138 Voli in ritardo 20 6 26
A B
Soluzione
Il test d'indipendenza da impostare un test 2. Regione di rigetto: R.C.: 2>4.61 ( 120.10 =4.61, per =2 gradi di libert). n n Tabella dei valori attesi tabella che contiene i valori: ci j = i j : n Voli in anticipo attesi 18 18 36 Voli in orario attesi 69 69 138
2
A B
Statistica test:
=
2 0 i =1 j =1
(n
ij
ci j ci j
(15 18) =
18
( 65 69 ) +
69
( 20 13) +
13
( 21 18) +
= 9.00
= 18 69 13 = 0.5+0.231+3.77+0.5+0.231+3.77=
2 02 =9.00>4.61= 0.90 al livello di significativit =0.10, si pu rigettare l'ipotesi di s-
( 73 69 ) +
( 6 13) +
indipendenza della puntualit dei voli dai piloti (in altre parole si pu ritenere che il ritardo dipende dal pilota) Esercizi di statistica e calcolo delle probabilit Prof. M. GIORGIO
102
Esercizi di: Statistica e Calcolo delle Probabilit RIFERIMENTI BIBLIOGRAFICI Billingsley P. (1986), Probability and Measure, John Wiley & Sons. Bury K. V. (1986), Statistical Models in Applied Science, Krieger. Caroti Ghelli (1978), Statistica bayesiana, Franco Angeli. Daboni L. (1980), Calcolo delle Probabilit ed Elementi di Statistica, UTET. De Finetti B. (1990), Paradossi sulle medie, Induzioni, 0. Erto P. (1992), Fondamenti di calcolo delle probabilit, Edizione Dip. di Ingegneria dei Materiali e della Produzione. Feller W.(1968), An introduction to probability theory and its applications, vol. I, A Wiley International Edition. Johnson R.A., Bhattacharyya G.K. (1992), Statistics, John Wiley & Sons. Meyer P. L.(1970), Introductory probability and statistical applications, Addison Wesley. Mood A. M., Graybill F. A., Boes D. C. (1991), Introduzione alla statistica, Mc GrawHill. Parzen E. (1976), La moderna teoria delle probabilit e le sue applicazioni, Franco Angeli. Rossi C., Scozzafava R. (1993), Sull'uso distorto dei dati statistici nei media, Induzioni, 6, gennaio-giugno 1993, Giardini. Scozzafava R. (1989), La probabilit soggettiva e le sue applicazioni, editoriale Veschi. Sveshnikov A.A. (1968), Problems in probability theory, mathematical statistics and theory of random functions, W.B. Saunders Company. Trivedi K. S. (1982), Probability & Statistics with reliability, queuing, and computer science applications, Prentice Hall. Piccolo D, Vitale C. (1984), Metodi statistici per lanalisi economica, Il Mulino.
103