Un ensayo clnico pone de relieve que 50 pacientes que reciben el tratamiento A para cierta enfermedad se encuentran mejor, en promedio, que 50 pacientes similares que reciben el tratamiento B. Es correcto suponer que el tratamiento A es realmente mejor que el B para esta enfermedad concreta? Para futuros pacientes debera el investigador preferir A frente a B? stas son preguntas tpicas que se plantean en cualquier investigacin estadstica. La primera atae a la inferencia: que conclusiones pueden extraerse razonablemente de esta investigacin? La segunda es una cuestin de decisin: cul es la eleccin racional para el tratamiento futuro, considerando la informacin proporcionada por el ensayo y las consecuencias conocidas o desconocidas de utilizar un tratamiento inferior? Se debe destacar que las respuestas a ambas preguntas, como casi todas las correspondientes a preguntas planteadas sobre datos estadsticos, estn hasta cierto punto teidas de incertidumbre. Pueden existir firmes indicios de que el tratamiento A es mejor que B. pero podemos estar completamente seguros de que los pacientes que recibieron el tratamiento B no estaban ms gravemente afectados que los que recibieron el A. y que esta variabilidad entre los pacientes no era una razn suficiente para explicar las distintas respuestas al tratamiento? Esta posibilidad puede parecer poco probable en determinada situacin especfica, pero raras veces es posible descartarla completamente. Por lo tanto, las preguntas formuladas deben recibir su respuesta expresada en trminos de incertidumbre. Si esta es baja, la conclusin ser firme y la decisin segura. Si la incertidumbre es elevada, la investigacin no permite extraer conclusiones. Por lo tanto es importante considerar la medida de dicha incertidumbre, y el instrumento adecuado para este propsito es la teora de la probabilidad. Al principio la abordaremos de forma bastante terica, mientras que en los captulos posteriores se analizar su aplicacin a distintos tipos de problemas estadsticos. Si se lanza una moneda muchas veces y se anota el resultado de cada tirada, podemos obtener una secuencia como la siguiente (C significa cara y X cruz): XXCXCCXCXXXCXCCXCCCCXXC... Esta secuencia se denomina secuencia aleatoria o serie aleatoria, a cada posicin de la se- cuencia se la llama prueba, y cada resultado a menudo se denomina suceso. Una secuencia aleatoria de sucesos binarios, como C y X en este ejemplo, a menudo recibe el nombre de secuencia de Bernoulli (James Bernoulli, 1654-1705). La secuencia aleatoria se caracteriza por la falta absoluta de un patrn de prediccin. Al lanzar una moneda, la posibilidad de ob- tener C en cualquier momento es la misma que en cualquier otro, y no est influida por el resultado de los lanzamientos anteriores. (Al contrario de lo que algunos creen, la posibili ta PROBABILIDAD 39
0,2 - o.i L o __________ ___________ i _________ _j_ 1 2 5 1 0 2 0 5 0 1 0 0 4 0 0 Nmero de lanzamientos Flg. 2.1. Proporcin de caras en una secuencia de lanzamientos de una moneda, con una escala logartmica para el nmero de lanzamientos. (Cramer, 1946. reproducida con autorizacin del autor y de los editores.) dad de obtener una cara nunca aumentar ni disminuir, aunque ya haya ocurrido una serie de, por ejemplo, seis caras.) En este tipo de secuencia se descubrir que. al aumentar la secuencia, la proporcin de pruebas con un resultado particular va variando cada ve/, menos y tiende a un valor lmite. Esta proporcin se denomina probabilidad de un suceso en particular. La figura 2.1 muestra la proporcin de caras despus de realizar diversos nmeros de lanzamientos, en un experi- mento real. Dado que la proporcin tiende claramente a 1/2, sera razonable decir que la pro- babilidad del suceso cara es aproximadamente 1/2. Considerando la simetra seguramente hu- bisemos llegado a esta misma conclusin antes de ver los resultados del experimento. Las ligeras diferencias en el grabado de cada uno de los lados de la moneda, posibles variaciones de densidad, e incluso algn sesgo en el mtodo de lanzamiento, pueden hacer que la pro- babilidad se desve ligeramente de 1/2, pero es poco probable que podamos realizar un ex- perimento suficientemente prolongado para diferenciar entre una probabilidad de 0,5 y una de 0,5001. El lector puede apreciar que esta definicin de la probabilidad es bastante heurstica. No podemos observar una secuencia de pruebas y decir sin ambigedad Esta secuencia es aleatoria, puesto que observamos slo una porcin finita de la secuencia y pueden existir patrones subyacentes, en los resultados que no son fcilmente distinguibles. Tampoco pode- mos observar una secuencia y establecer con precisin la probabilidad de un suceso espec- fico; la probabilidad es una propiedad asinttica y slo observamos una porcin insuficiente de la secuencia. Sin embargo, existen muchos fenmenos que aparentemente se comportan de ese modo, y el concepto de secuencia aleatoria debe considerarse como un concepto ideal METODOLOGA DE I.A INVESTIGACIN CIENTFICA 234
Consideremos, por ejemplo, que en los ltimos 12 meses en el pas han nacido 200.000 nios, y que al cabo de un ao de edad han sobrevivido 198.248 nios, si definimos como A la condicin que un nio sobreviva su primer ao de vida, entonces su probabilidad es: P( A) = 198248 =0,991 200.000 Complementariamente, la probabilidad de que un nio no sobreviva a su primer ao de vida es: 1 75^ P(A C ) = =0,009 200.000 Observe que el segundo suceso (A) es complemento del primero, cumplindose que: P(A) + P(A C ) = i o P(A) = \-P{A C ) (3) Es decir, si el evento A se define como la condicin que un nio sobrevida su primer ao de vida, entonces se tiene que: P(A w A c ) = P( A o A o ambos) = 1 (4) P(un nio sobreviva su primer ao de vida o no sobreviva su primer ao de vida) =1 En esta condicin es cierto el hecho que el nio sobrevivir o morir, en general la unin de dos eventos cualesquiera implica que ocurre al menos uno de los dos O que ocurren ambos. Cuando un evento en particular sucede efectivamente, como ya hemos dicho, lo definimos como suceso seguro, es decir ocurre en cada uno de los n intentos del experimento, mostrando as una probabilidad de n/n=l. Siguiendo nuestro razonamiento, note que es imposible que A y A 1 ocurran de manera simultnea, es decir que el nio sobreviva su primer ao de vida y a su vez no sobreviva su primer ao de vida. Si un evento jams sucede, posee una probabilidad 0/n=0, lo cual hemos definido como suceso imposible o evento nulo, como se ilustra en la siguiente expresin. P( Ar xA' ) = P{ AyA' ) = Q (5) P(un nio sobreviva su primer ao de vida y no sobreviva su primer ao de vida) =0 De esta forma, como ya sabemos, el suceso puede o no que ocurra y el valor nu- mrico de la probabilidad de ocurrencia del suceso ser un valor cuyo recorrido vara entre 0 y l, incluidos ambos valores, aunque tpicamente se obtienen probabilidades distintas a los valores exactos 0 y 1. TEMA a I PROBABILIDAD
Sucesos mutuamente excluyentes Cuando dos eventos A y B no pueden ocurrir simultneamente, independientes de las razones de ello, se dice que son sucesos mutuamente excluyentes. Analizados desde la teora de conjuntos los podemos definir como sucesos disjuntos, cuya interseccin es vaca, pudiendo ocurrir uno y slo uno de ellos. Como por ejemplo el lanzamiento de una moneda donde el resultado posible de tal experimento es obtener cara o sello, la ocurrencia de uno de esos dos resultados excluye la ocurrencia del otro. No sern sucesos mutuamente excluyentes si para un experimento cualquiera puede ocurrir dos o ms de sus posibles resultados al mismo tiempo. Cuando dos eventos (A y B) son mutuamente excluyentes, se tiene que la proba- bilidad de que cualquiera de los dos eventos ocurra |P(A o B)1 est dada por la suma de probabilidades de los eventos individuales, de esta forma la propiedad aditiva de la probabilidad establece que: P{AKJB) = I\A) + 1\B) (6) Esta propiedad puede extenderse a tres o ms sucesos mutuamente excluyentes. Si A,, A,,..., y A n son n eventos tales que A, r\A f =0 , con i=l, 2,...n y j=l,2,...n, entonces: P(A o A 2 v... u A) = P(A,) + P(A: ) +... + P(A) { 7) Por ejemplo, asumamos que en una sala de espera de una consulta mdico pedi- trica hay cuatro nios que deben recibir sus vacunas recomendadas para nios de 12 meses de edad, y nominemos convenientemente a los nios como Benjamn, Laura, Roco y Joaqun. Si el pediatra posee un bono que otorga gratuidad en el cosro de las vacunas y est dispuesto a otorgarlo mediante una eleccin aleatoria, cul es la probabilidad de que Laura o Joaqun sean elegidos?, podemos usar la ecuacin 6 para obtener esta respuesta: P(Laura o Joaqun) = P(Laura) + P( Joaqun) \_ 4 + 4 = 0,5 Cuando los eventos A v B de la ecuacin 6 no son mutuamente excluyentes, existe la posibilidad que se presenten simultneamente, en cuyo caso la regla de adicin se modifica como: P(A ^ B) = P(A) + P(B) - P(A ^ B) (8) U .5 METODOLOGA DE I.A INVESTIGACIN CIENTFICA 236
Por ejemplo, si cuatro personas estn realizando su ingreso para ser hospitalizadas, y el hospital dispone de cuatro habitaciones, tres de ellas con luz natural y la cuarta sin luz natural, asumiendo los datos proporcionados ms abajo, cul es la probabilidad que la habitacin sin luz natural sea asignada a un hombre o a una persona mayor de 30 aos? Datos: Carla (38 aos), Fernando (36 aos), Pamela (25 aos) y Alejandro (32 aos). P(Hombre o mayor de 30 aos) = P(Hombre) + P(Mayor de 30) - P(Hombre y mayor de 30) = 2 + 3 _ 2 4 + 4 4 = 0,75 2.2.. SUCESOS DEPENDIENTES Y SUCESOS INDEPENDIENTES En el contexto en que se presenten dos o ms eventos, nos encontramos con la situacin que el resultado de uno de ellos puede o no afectar el resultado de un se- gundo evento. En el caso de los eventos estadsticamente independientes, la presencia u ocurrencia de uno de ellos no tiene efecto sobre la probabilidad de ocurrencia de cualquier otro evento. Si E,, E,, E,,....E n son sucesos independientes, con probabilidad P, P^, P,, ....P, entonces la probabilidad conjunta de que ocurra E, y E, y y ................... E n es igual a P * ? *?* ...,P . 1 2 3 n Es decir: P(E,nE 2 nE 3 n ...... E n >= P,*P 2 *P 3 * ....p n , (9) Por ejemplo, un centro mdico posee dos salas de espera de consultas psiquitrica, en la primera sala se encuentran 4 pacientes que requieren evaluacin psiquitrica y 2 pacientes que requieren tratamiento; en la segunda sala se encuentran 3 pacientes para evaluacin y 5 para tratamiento, tales datos pueden organizarse como sigue: Primera Segunda T. . sala ___________________________ sala Tote " Pac. Evaluacin 4 3 7 Pac Tratamiento 2 5 7 Tbtai 6 8 14 a) Si se extrae al azar un paciente de cada sala, cul es la probabilidad de que ambos sean pacientes para tratamiento: Sean E : paciente para evaluacin. T: paciente para tratamiento. Con i= 1 o 2, segn pertenezca a la primera o segunda sala. TEMA a I PROBABILIDAD 237
P{T x nT,) = P{TyP(T 2 ) /i(Q) /?(Q) = 1*1 = 1- ~ 6 8 24 Es decir, la probabilidad que ambos pacientes extrados sean para tratamiento es de 0,208. b) Si se extrae ni azar un paciente de cada sala, cul es la probabilidad de que el primero sea para tratamiento y el segundo para evaluacin, si se comienza la ex- traccin en la primera sala? Sean E: paciente para evaluacin. T : paciente para tratamiento. Con i = 1 o 2, segn pertenezca a la primera o segunda sala. P(TnE) = P(T l )*P(E 2 ) _(7) *n(E 2 ) ~n{Q) n(Q) = 1*= ] - 6 8 8 Es decir, la probabilidad de que se extraiga el primer paciente para tratamiento y el segundo para evaluacin es de 1/8. Consideremos un segundo ejemplo ficticio. Se poseen tres jaulas con ratas de labo- ratorio, la primera de ellas posee 2 ratas grises y 1 blanca, la segunda posee 4 ratas pintadas y 7 blancas, y la tercera jaula posee 6 ratas beige y 4 blancas, cul es la probabilidad de extraer una rata blanca, una rata pintada y una rata beige al extraer una de ellas de cada caja comenzando la extraccin secuencialmente en la primera jaula? Sea B: que la rata sea blanca. P: que la rata sea pintada. G: que la rata sea beige. p(BnpnG)= P(B)*P(P)*P(G)= ^ * yy * * 073
Luego, la probabilidad que se extraiga una rara blanca, una pintada y una beige, al extraer slo tres ratas comenzando secuencialmente por la primera caja es de 0,073. Consideremos, por ltimo, el experimento de hacer el lanzamiento de una moneda diez veces, cul es la probabilidad de obtener cara en el cuarto y sexto lanzamiento? Sea: C,: Que la moneda muestre cara en el cuarto lanzamiento. C,: Que la moneda muestre cara en el sexto lanzamiento. Luego, /((', nC3) = /'((',) * P(C2) = = * = b v 1 2 y \ //(1) //(}) 2 2 4
Es decir, la probabilidad de que ocurra el fenmeno de obtener cara tanto en el METODOLOGA DE I.A INVESTIGACIN CIENTFICA 238
cuarto como en el sexto lanzamiento es de 0,25. Supongamos ahora que no se cumple la independencia estadstica de los eventos, es decir, la probabilidad de un evento afecta la ocurrencia de un segundo evento o de los eventos sucesivos, los eventos as presentados son dependientes, en cuyo caso si E, y E, son sucesos dependientes, se tiene que: P(E l r,E 2 ) = P(E ] )*P(E 2 \E i ) (10) y P(E X o , o E 3 ) = />(,) * P(E 2 | ,) * P{E y \ , yE 2 ) (11) Y as sucesivamente para los E n sucesos dependientes. En el caso de la expresin 10, tenemos que la probabilidad de ocurrencia del evento E [ y E. se calcula como el producto de la probabilidad de , por la probabilidad de E, dado que ocurri ,. Es decir, la probabilidad del segundo evento, est condicionada por la ocurrencia del primer evento, obviamente ello se puede extender a tres o ms eventos. La barra vertical | I | que separa un evento de otro se interpreta habitualmente como dado, otorgando un smbolo conveniente para anunciar la condicin bajo la cual se obtiene la probabilidad precedente. Consideremos un ejemplo bsico: una caja que posee 5 bolitas azules, 7 bolitas blancas y 8 bolitas verdes, cul es la probabilidad, al extraer las bolitas sin reposicin, que la primera salga blanca, la segunda verde y la tercera azul? Definamos como: Suceso A: extraer una bolita azul. Suceso B: extraer una bolita blanca. Suceso V: extraer una bolita verde. P( BnVn A) = P(B) * P(V | B) * P(A | ByV) = * * = = o,041 20 19 18 6840 Es decir, la probabilidad que en la extraccin ocurra esa combinacin preestablecida es de 0,041, siendo bastante baja.