Вы находитесь на странице: 1из 21

DIPLOMADO MODULO I

Les invitamos a participar activamente en el Foro No 1, que abordar el tema de


Caracterizacin Probabilstica de Variables Aleatorias.
A travs de este Foro podremos compartir comentarios y dudas relacionadas al tema, con la
finalidad de cumplir con los objetivos y expectativas de la capacitacin.
Bienvenidos....
Determinar las funciones de distribucin de probabilidad que describen el comportamiento de
las variables de incertidumbre es una de las funciones ms delicada del Analista de Riesgo. De
all surge la gran pregunta: Cul es la distribucin probabilstica que con mayor precisin
pudiera representar los datos?.
Es importante destacar que las mencionadas distribuciones o modelos probabilsticos se
seleccionarn para cada variable a partir de la informacin disponible y accesible. La
informacin disponible puede ser, en el mejor de los casos, evidencia recolectada en el mismo
activo; pero en otros casos puede ser informacin anloga recolectada en otros activos o
procesos similares o puede ser opinin de expertos.
La caracterizacin de variables con incertidumbre es un proceso riguroso que depende del tipo
de informacin disponible. Estaremos estudiando las siguientes tcnicas:
1. Tcnicas estadsticas para tratar datos histricos o muestras recolectadas.
- Grandes muestras: que se tratan con procedimientos de ajuste basados en los
llamados test de bondad (Chi Cuadrado, Kolmogorov-Smirnov y Anderson-Darling)
- Pequeas muestras: que requieren tcnicas altamente diferenciadas tales como
Intervalos de Confianza en los Parmetros y Estadstica Bayesiana.
2. Tcnicas estadsticas para tratar Opinin de Expertos Conocimiento Emprico.
3. Tcnicas estadsticas para tratar Informacin Anloga Conocimiento Genrico.
Karina Semeco
La distribucin probabilstica con mayor precisin va a depender del nmero de datos (grandes
o pequeas muestras), as como las condiciones necesarias para su aplicacin.
Ivn Vela
En general, el tamao de la muestra queda determinado por el grado de precisin requerido en
la estimacin de la media poblacional a partir de la muestra.
En lo que se refiere al grado de precisin requerido deben considerarse dos aspectos:
1. La magnitud del mximo error permisible
2. El grado de confianza de que el error en la estimacin no exceda del mximo error
permisible.
Buenos Das Ivan, espero este muy bien.

http://r2menlinea.com/w3/file.php/12/moddata/forum/16/45/Tamano_de_la_
Muestra_Representativa.pdf

En lnea con su comentario anterior, sobre la representatividad de la muestra. La muestra en


sentido genrico, es una parte del universo, que rene todas las condiciones o caractersticas
de la poblacin, de manera que sea lo ms pequea posible, pero sin perder exactitud.
Existen ecuaciones estadsticas que nos permiten definir el tamao de muestra representativa
en funcin del error permisible y el grado de confianza. En el archivo adjunto una de ellas,
como complemento a su comentario.
Karina Semeco

Karina,
Entonces a su criterio cual sera la distribucin probabilstica que con mayor
precisin pudiera representar los datos.
Ivn

Ivan, buenas noches, espero este muy bien.


Segn mi criterio, la correcta seleccin de la Distribucin de Probabilidad, que
represente el comportamiento de los datos, depender fundamentalmente de dos
aspectos: la naturaleza de la variable y la cantidad de datos disponibles.
Naturaleza de la Variable
En cuanto a la naturaleza de la variable, es clave definir inicialmente si se trata de una
variable continua o discreta, y posteriormente definir el tipo de la misma. En la prctica
existen algunas guas, que menciono a continuacin:
.- Para Variables Fsicas (Ejemplo: porosidad, permeabilidad, presin, temperatura,
longitud, etc.) se recomiendan los siguientes modelos matemticos: Normal,
Lognormal, Exponencial, Weibull, Gamma, Beta.
.-Para Variables relacionadas con tiempo se recomiendan: Exponencial, Weibull,
Gamma, Beta, Lognormal.
.- Para Variables por Opinin de Experto se recomiendan: BetaPert, Uniforme,
Triangular, Lognormal.
.- Para Variables xito o Fracaso, por ejemplo Binomial.
.- Para Variables relacionadas con desviacin o error se recomiendan: normal, mn
extremo, mx extremo.
Cantidad de datos disponibles
Por otro lado, en funcin del tamao de la muestra disponible, existen diferentes
tcnicas estadsticas para el tratamiento y seleccin de la mejor distribucin de
probabilidad:
.- Muestra > 15 datos: se tratan con procedimientos de ajuste basados en los llamados
test de bondad (Chi Cuadrado, Kolmogorov-Smirnov y Anderson-Darling). En este caso
estaramos hablando de hacer un ajuste o fit automtico a travs del Crystal Ball.
.- Muestra entre 6 y 15 datos: se proponen dos opciones para este caso.
Opcin 1: estimar un valor ms probable a partir de un histograma de frecuencia,
calcular el mnimo y el mximo de la muestra, y a partir de estos tres valores asumir una
Distribucin de Probabilidad Beta Pert.
Opcin 2: estimar el Percentil 5 (P5) y Percentil 95 (P95) a partir de los datos de la
muestra, y asumir una Distribucin Lognormal.

.- Muestra menor a 6 datos se recomienda apoyarse en el Teorema de Bayes para


combinar informacin propia con conocimiento anlogo.
.- Opinin de Expertos, asumir alguna de las distribuciones de probabilidad disponibles:
BetaPert, Uniforme, Triangular, Lognormal.
Karina Semeco
Un Saludo
Si dentro de la naturaleza de los datos uno puede decidir al seleccionar el tipo de grfico
por ejemplo Variables Fsicas uno puede seleccionar Normal, Lognormal,
Exponencial, Weibull, Gamma, Beta. Como se identifica cual es la que agrupa al
conjunto de datos de la variable aleatoria Fsica cuando esta depende de otras por
ejemplo en leyes fsicas (ejemplo Ley de Boyle ) que estas variables interactan en un
sistema , se debe hacer distribuciones independientes? Por cada variable se debe realizar
el test de Bondad de ajustes
Jorge Antonio Navarrete
Buenos Das Jos Antonio, espero se encuentre muy bien.
En relacin a su inquietud, es correcto, si tiene un modelo matemtico que depende de
varias variables de entrada, deber caracterizar probabilsticamente cada una de ellas,
asignando una distribucin de probabilidad. La salida del modelo ser por lo tanto una
variable tambin distribuida, y este proceso se conoce como propagacin de la
incertidumbre, y puede hacerse a travs de la Simulacin de Montecarlo.
Si para cada una de las variables de entrada Usted cuenta con un conjunto de datos
(muestra > 15 datos), podr realizar una Prueba de Bondad de Ajuste apoyado en el
programa Crystal Ball. El programa le indicar cul de las hiptesis plantadas cumplen
con los requerimientos de la prueba, en otras palabras, cual hiptesis es aceptada.
Solo se considerar como gua que las hiptesis Normal, Lognormal, Exponencial,
Weibull, Gamma, Beta, pueden ser validas cuando se tratan de variables fsicas.
Karina Semeco
Un saludo
No me queda clara la ltima parte a que se refiere con "conocimiento anlogo", se
refiere al conocimiento previo y la evidencia para mejorar la informacin
Gracias
Buenos Das Jos Antonio, un saludo nuevamente para ti.
Para ampliar un poco el termino de Conocimiento Anlogo, te comento que un
problema tpico de nuestros das es la necesidad de hacer estimaciones sobre procesos o
situaciones "nuevas" sobre las que no se tienen experiencia propia o historia; o si se
cuenta con sta, no es suficiente para considerarla representativa. Pero seguramente
existan experiencias similares de "otros" que pueden servir como referencia, a este

ltimo punto es lo que se conoce como conocimiento anlogo, es decir, historia de


otro que puede ser representativa a nuestro proceso. Cuando nos referimos a "Otros",
podemos estar hablando de yacimientos, pozos, tecnologas o procesos equivalentes.
El Teorema de Bayes es el mtodo matemtico para combinar evidencia escasa o poco
robusta (conocimiento propio) con datos anlogos (conocimiento de otro) y obtener una
informacin mejorada.
Karina Semeco
Karina:
La inquietud es, para el caso de pequenas muestras, con que criterio se debe determinar
el mnimo de confiabilidad que debe tener una prueba para que se pueda considerar
como til para la investigacin.
Gustavo Ponce
Karina buena das,
Si el tamao de la muestra queda determinado por el grado de precisin requerido en la
estimacin, si tengo una poblacin grande cual seria el mtodo mas ptimo o en base a
que se determina el tamao de la muesta unicamente por la formula indicada por
Ud. ?
Carlos Obregn
En cuanto al tamano de las muestras, es importante, pero dentro del conjunto total de la
investigacin; y si hay errores, por ejemplo de recoleccin, una muestra grande puede
ser mala, mientras que otra que sea la mitad de la anterior, pero con buena recoleccin y
seleccin, puede ser excelente. Es decir, un tamao grande no es suficiente para
garantizar precisin en los resultados.
Saludos
Gustavo Ponce
Buenos Das Gustavo, espero se encuentre muy bien.
De acuerdo completamente con su observacin, un tamao de muestra grande no
asegura la validez y precisin de los resultados. Sea la muestra de datos grande o
pequea, lo importante es su calidad y representatividad, para su posterior tratamiento
estadstico, usando la tcnica adecuada.
El analista de riesgo, conocedor de su variable y del proceso, ser la persona encargada
de validar la calidad de la informacin a utilizar en sus estudios.
Karina Semeco
Estimada Katina

Para muestras y ajuste hechos para la opinin de expertos, Cul es el grado de error
admisible para que este tipo de informacin sea confiable.
Buenos Das Hector, saludos.
En relacin a la confiabilidad y validez de los estimados hechos por un Experto o grupo
de ellos, mi opinin es que depender fundamentalmente de la experiencia y el
conocimiento que estos posean de las variables y el proceso que se desee modelar, es
decir, que sean realmente conocedores y que ofrezcan informacin clara y sin sesgo. Es
difcil medir el grado de error admisible.
Existen tcnicas o mtodos para la obtencin de juicios u opinin de expertos, uno de
los ms conocidos es el llamado Mtodo Delphi. Este mtodo forma parte de la
investigacin a desarrollar como Asignacin No 2 para el presente Mdulo del
Diplomado.
Por otro lado, y no menos importante, una vez que se tiene la informacin del Experto
(mnimo, ms probable y mximo), es clave considerar la distribucin de probabilidad
correcta (Beta Pert, Triangular, Uniforme y Lognormal) a utilizar.
Karina Semeco
Gracias Karina
El motivo de mi pregunta se debe a que muchas veces es la nica fuente informacin
disponible, por ende se debe buscar un mnimo de calidad para garantizar confiabilidad
al momento de presentar un proyecto o cualquier recomendacin requerida.
Cordiales saludos, estimada Karina y compaeros del diplomado.
Ms que realizar una pregunta, quisiera agregar un comentario.
Dependiendo del tipo, cantidad y calidad de datos de una variable o fenmeno
analizado, corresponder elegir el modelo ms apropiado. Herramientas informticas o
programas como el CRISTAL BALL, RARE y el mismo EXCEL, han simplificado
totalmente nuestra labor de clculo, porque se encuentran insertadas todas esas
expresiones matemticas. Estas herramientas ayudan a minimizar la incertidumbre,
probabilidad de fracaso con un alto nivel de confiabilidad, ya que incluso presentan
alternativas jerarquizadas para su correcta eleccin.
Sin embargo, considero muy importante recalcar que todos estos programas deben ser
alimentados con una base de datos reales, confiables, aceptables, que representen
fidedignamente una muestra. Adems, el resultado obtenido debe ser revisado,
analizado e interpretado antes de tomar la decisin final. Habrn ocasiones en las cuales
se presenten casos de modelos similares, en donde el buen criterio, experiencia y
capacidad de interpretacin que tenga el analista, ser fundamental para elegir la mejor
alternativa.
Por lo tanto es nuestra responsabilidad dominar estos temas, puesto que la decisin final
ser tomada por cada uno de nosotros.

Eduardo Posso
Considerando que una poblacin debe tener caractersticas medibles o
contables, de naturaleza cualitativa o cuantitativa. A esa caracterstica
medible se le denominara variable estadstica y a los valores que toma se
los llama observaciones. En cambio la muestra es un grupo de unidades
seleccionadas de un grupo mayor (es decir la poblacin) y del cual se
espera obtener conclusiones. El parmetro es un valor usualmente
desconocido, y que por tanto tiene que ser estimado, se lo usa para
representar cierta caracterstica de la poblacin. AFIRMACIN: Parmetro es
un valor fijo: es decir no vara; pero es posible obtener ms de una muestra
de la misma poblacin con lo cual los valores estadsticos (media muestral o
promedio, total muestral, varianza muestral, desviacin estndar muestral,
proporcin muestral) variaran de muestra a muestra. Esto se debe a que el
estadstico es una variable aleatoria que sigue la ley de probabilidad o que
tendr una ley de probabilidad asociada. Lo expuesto es correcto?

TAMAO DE LA MUESTRA Para determinar el tamao de una muestra es necesario


que la persona que realice la investigacin: a. Conozca estudios similares b. Determine
adecuadamente los objetivos del estudio c. Debe conocer especficamente los recursos
econmico disponibles para la investigacin Adems el encargado del estudio debe
analizar adecuadamente las variables a analizar, el diseo muestral a utilizar y considero
que debe determinar el error aceptable de sus estimaciones o decisiones de los
resultados. Pregunta: Existen formulas para determinar el tamao de una muestra y
cuales son?
Buenos Das Milton, gusto en saludarte nuevamente.
En el archivo adjunto te envo una ecuacin para definir el tamao de la muestra
representativa, en funcin de un nivel de confianza y el error muestral permitido.
Karina Semeco
Buenos Das Milton, gusto en saludarte.
De acuerdo completamente con tu afirmacin.
Adicionalmente, para complementar tu comentario, en lnea con lo visto en clases,
tambin podemos dar incertidumbre a los parmetros de una muestra en funcin de su
tamao. Esto lo aborda un rea de la estadstica llamada Intervalos de Confianza en el
clculo de Parmetros.
En el Diplomado estudiaremos dos casos de aplicacin, que son:
. Influencia del Tamao de la muestra en la estimacin del parmetro p probabilidad
de xito o fracaso Distribucin Binomial.
. Influencia del Tamao de la muestra en la estimacin de la medio o el promedio
Distribucin Normal.
Karina Semeco
Estimada Karina,
Con respecto a la pregunta Cal es la distribucin probabilistica que con mayor
precisin pudiera representar los datos?

La distribucin probabilistica que mejor representara los datos depender de la variable


en estudio (por ejemplo fsicas - el espesor de un yacimiento o relacionadas al tiempoel tiempo de perforacin de un pozo o el tiempo de operacin de una bomba BES) y
adems depender del tamao de la muestra. Es importante mencionar que la toma de
decisiones en condiciones de incertidumbre depender de la seleccin de los modelos de
probabilidad.
Tengo una inquietud:
Cuando no sera confiafle en test de bondad de ajuste?
Buenos Das Alexander, espero este muy bien.
Coincido en su afirmacin sobre la importancia de la correcta caracterizacin
probabilstica de las variables, que permitan tener modelos probabilsticos que
realmente apoyen el proceso de toma de decisin.
En cuanto a las Pruebas de Bondad de Ajustes, no puedo decir que alguno de los
mtodos sea o no confiable (Chi-cuadrado, Kolmogorov - Smirnov, Anderson Darling),
ms bien considero que depender del tamao y caractersticas de los datos disponibles.
Estas pruebas contemplan las siguientes etapas:
Etapa 1: Graficar cada una de las curvas de las Distribuciones Hiptesis tericas
obtenidas con los parmetros estimados en el paso anterior, con el histograma de los
datos de la muestra.
Etapa 2: Calcular para cada Distribucin Hiptesis el valor llamado valor del test y
compararlo contra el valor llamado valor crtico.
Etapa 3: Si el valor del test es menor que el valor crtico entonces la Distribucin
Hipottica se considera un buen ajuste y la hiptesis no es rechazada. Si por el
contrario, el valor del test es mayor que el valor crtico, la hiptesis se rechaza.
La prueba de Chi-cuadrado arroja sus mejores resultados cuando las muestras son
grandes, ya que realiza la comparacin sobre el histograma en su formato de frecuencia
de densidad, y depende del nmero de los intervalos de clases definidos.
A diferencia de la prueba Chi Cuadrado, las prueba de Komogorov Smirnov y
Anderson Darling no agrupan los datos en intervalos o clases. En su lugar, para la
prueba se utiliza la funcin de probabilidad acumulada hipottica seleccionada, la cual
es comparada con la funcin de probabilidad acumulada emprica proveniente de los
datos. Esto resulta til, cuando el tamao de la muestra es menor, solo que pudiera
presentar alguna discrepancia con las probabilidades de las colas. Siendo este aspecto
mejorado con Anderson-Darling.
Adjunto un archivo con un Extracto del Libro de R2M sobre las Pruebas de Bondad de
Ajuste.
Karina Semeco
Buenos das Karina:
Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos disponibles
se ajustan a una determinada distribucin. Entre las pruebas de bondad de ajuste se
mencionan: Prueba del Chi Cuadrado, Prueba de Kolmorogorov Smirnov, Prueba de
Anderson Darling, en que casos es recomendable cada una?
Gustavo Ponce

Karina
Acerca de Intervalos de confianza:
En intervalo de confianza es un rango de nmeros, elaborado alrededor de la estimacin
puntual, el que se construye de manera que la probabilidad del parmetro de la
poblacin se localice en algn lugar dentro del intervalo conocido. Por lo tanto, el nivel
de confianza mide la probabilidad de buen funcionamiento de un intervalo, y por este
motivo, el nivel de confianza siempre se elige prximo a 1.
Cules son los mtodos ms utilizados para determinar los intervalos de confianza?.
Gustavo
Buenos Das Gustavo,
Cuando se hacen pronsticos de variables aleatorias, dicho pronstico bsicamente
consiste en determinar la distribucin de probabilidades que representa a la variable de
inters. En estos casos, la estimacin no debe expresarse como un slo valor estimado
(media); sino tambin la precisin de esa estimacin. Una forma de expresar la
precisin consiste en especificar unos lmites que, con una probabilidad dada, incluyan
el valor verdadero de la variable. A dichos lmites se les denominan "lmites de
confianza".
Para definir o determinar un intervalo de confianza puede hacerse a travs de sus
percentiles, a continuacin un ejemplo:
. Supongamos que hemos caracterizado probabilsticamente a la Variable Porosidad
de un yacimiento, que tiene como valor esperado o media un 10%, y adicionalmente
conocemos que su Percentil 5 (P5)= 8% y su Percentil 95 (P95)= 17%, podemos decir
con un 90% de certeza que el valor de porosidad del yacimiento se encuentra entre 8 y
17%, con un valor esperado del 10%.
Otra forma de expresarlo sera: Con un intervalo de confianza del 90% la variable
Porosidad se encuentra entre 8 y 17%.
Karina Semeco
Buenos Das Gustavo, gusto en saludarte.
En cuanto a las Pruebas de Bondad de Ajustes (Chi-cuadrado, Kolmogorov - Smirnov,
Anderson Darling), puedo comentarte:
La prueba de Chi-cuadrado arroja sus mejores resultados cuando las muestras son
grandes, ya que realiza la comparacin sobre el histograma en su formato de frecuencia
de densidad, y depende del nmero de los intervalos de clases definidos.
A diferencia de la prueba Chi Cuadrado, las prueba de Komogorov Smirnov y
Anderson Darling no agrupan los datos en intervalos o clases. En su lugar, para la
prueba se utiliza la funcin de probabilidad acumulada hipottica seleccionada, la cual
es comparada con la funcin de probabilidad acumulada emprica proveniente de los
datos. Esto resulta til, cuando el tamao de la muestra es menor, solo que pudiera
presentar alguna discrepancia con las probabilidades de las colas. Siendo este aspecto
mejorado con Anderson-Darling.
Adjunto un archivo con un Extracto del Libro de R2M sobre las Pruebas de Bondad de
Ajuste.
Mi recomendacin, para la seleccin de una Prueba de Bondad de Ajuste usando el
programa Crsytal Ball es seleccionar la opcin "Anderson-Darling", ya que se hace la

comparacin sobre el histograma acumulado y se reduce la discrepancia de las


probabilidades de la cola.
Karina Semeco
Estimada Karina.
En una distribucin binomial, cual es el concepto de nivel de confianza real y cual es su
aplicacin?. De acuerdo a la lectura complementaria 1, indica que es muy importante cuando
se trabaja con procedimientos que son asintticos.
Edwin Bonilla

Buenas Tardes Edwin, espero este muy bien.


La Distribucin Binomial es una distribucin discreta, que permite estimar el nmero de
xitos o fracasos que se alcanzarn en un nmero especfico de intentos, dada una
probabilidad de xito o fracaso por intento determinada.
Los parmetros de la distribucin son: Probabilidad (p) y Nmero de intentos .
Las variables que pueden representarse con la Distribucin Binomial, tienen tres
caractersticas bsicas:
1. Por cada intento, hay slo dos posibles resultados: xito o fracaso.
2. Los ensayos son independientes. Los resultados de un primer ensayo no afectan los
posteriores.
3. La probabilidad de ocurrencia permanece constante en cualquier ensayo.
De acuerdo a lo revisado en el material podemos darle incertidumbre al parmetro
probabilidad en funcin del tamao de la muestra, es decir, determinar un Intervalo de
Confianza para dicho parmetro (p lower<p estimate<p upper). Podemos en este punto
recordar el Ejemplo No 1 realizado en clase, que usando la herramienta RARE,
logramos darle incertidumbre a la probabilidad de fracaso en la perforacin de un pozo.
La Lectura Complementaria 1. Intervalos de Confianza para el Parmetro de la Dist
Binomial.pdf presenta como referencia general una revisin de los diferentes mtodos
matemticos para la construccin de dichos intervalos, que luego son comparados. En
esta comparacin se usa el concepto de nivel de confianza real, que es el porcentaje de
intervalos que en las simulaciones cubren el verdadero valor de p.
Karina Semeco
Karina,
Variables relacionadas con tiempo:

Cuando tenemos muestras pequeas, es importante realizar el histograma de


frecuencia? ...Ya que al realizar un ajuste de bondad lo realize con la variable
Beta.... y al comparar los resultados son de +/- al histograma?

Variables Fisicas:

Cuando tenemos muestras grandes: como interpretar el valor p en la tabla de


ajustes de Crystal ball ? ...... si al observar tenemos valores similares en media?
y a su ves que son mayores al valor p >0.05

Eduardo Herrera
Saludos Wilson, buenas tardes.
.- Es correcto Wilson, cuando se tienen muestras pequeas (ms de 6 y menos 15 datos),
una opcin recomendada es construir un histograma de frecuencia, para definir un valor
ms probable estimado, y a partir del mnimo y mximo de la muestra, asumir una
Distribucin BetaPert.
.- El Valor-p se define como el nivel de significancia de la diferencia entre el Valor del
Test y el valor crtico de la Prueba de Bondad de Ajuste. El valor-p es una probabilidad,
y mientras ese valor sea ms cercano a 1, quiere decir que el Valor de Test es mucho
menor al valor crtico, y la hiptesis de la prueba es aceptada. La lmina 65 de la
presentacin del material del mdulo, muestra una imagen que sirve de referencia.
Este tema ser ampliado en el siguiente Mdulo del diplomado.
Karina Semeco
Saludos,
Se podra decir que el valor-p es el que determina realmente la aplicacin de un
modelo u otro?
Si es as, primero se verificara el valor-p y seguidamente el valor del Test?
En caso de valores Test similares, el valor-p definiria el modelo?
En caso de valores-p similares el valor del Test definira el modelo?

Saludos Karina
Favor su ayuda para aclarar lo siguiente:
Se menciona que la seleccin de la curva de probabilidad, depende de la informacin
disponible. Para datos anlogos recolectados en otros activos, los mismos que no sean
considerados como muestras pequeas, podramos darles un tratamiento o anlisis, con
tcnicas para grandes muestras, basados en los test de bondad?
Gracias ...
Buenas Tardes Ernesto, gusto en saludarte.
Es correcto, siempre que se tenga una muestra de datos (para el Crystal Ball ms de 15
datos) podrs aplicar una Prueba de Bondad de Ajuste para determinar cual es la mejor
distribucin de probabilidad que la representa.
Karina Semeco
Buenas tardes Karina
La distribucin Probabilistica que con mayor precisin pudiera representar los datos
mucho depende del tamao de la muestra y del grado de satisfaccin o exactitud que se
los quiera dar.
Favor su ayuda con esta pregunta.

Por que se dice que la estadistica basada en Bondad de Ajuste es usualmente utilizada
con sentido relativo mediante la comparacin de los valores de Bondad de Ajuste de
otras funciones de Dist. de Probabilidad?
Buenas Tardes Miguel Angel, es correcta tu inquietud las pruebas de bondad de ajuste
tienen por objetivo determinar si los datos se ajustan a una determinada distribucin, y
para ello se parten de comparar un conjunto de hiptesis (normal, lognormal,
exponencial, etc). La hiptesis seleccionada ser aquella cuyo valor del test sea menor
al valor critico de la prueba.
Saludos Cordiales
Karina Semeco
Buenas Tardes Compaeros
Estimada Karina.
Al hablar de muestras pequeas entre 6 y 15 datos, los valores a considerar deberan ser
el valor mximo, el mnimo y la moda o valor con mayor frecuencia, para con estos
datos y con la ayuda del Cristall Ball efectuar la construccin de una Distribucin
BetaPert. Al efectuar una entrevista a un experto, cuando no se tiene una evidencia
muestral, los datos que se ha de procurar conseguir en dialogo deberan ser: un valor
optimista (Mximo), valor pesimista (mnimo) y el valor ms probable (moda), para con
estos datos construir la distribucin. Al efectuar este anlisis el grado de incertidumbre
va hacer mayor, ya que solo se depende de la experiencia de una persona y a lo mejor
otro experto tiene otro punto de vista referente al mismo tema.
Diego Ortiz
Buenas Tardes Diego,
Es correcto tu comentario, la opinin de experto es una fuente valiosisima de
informacin. Pero si hablamos de la opinin o juicio de un solo experto, debe tenerse
mucho cuidado, ya que el juicio puede ir acompaado de subjetividad. Es por ello que
se recomienda trabajar con grupos de expertos, que logren un consenso de la
informacin.
Karina Semeco
Buenas noches Karina, en lo referente a las distribuciones empricas, podramos afirmar
como una regla que siempre las asociaramos con un grfico de Histogramas de
frecuencia?
Estimada Karina
Hay otro programa similar al CRISTAL BALL que podamos emplear para realizar
estos clculos y encontrar modelos de distribuciones que tambin sirvan para nuestro
propsito?.... o quiz ste fue escogido porque se acopla al EXCEL y es utilizado como
una herramienta adicional? Podramos comparar las bondades con otro programa...!
Buenos Das Eduardo, saludos.

Es correcta tu observacin, las distribuciones empricas (llamadas en Crystal Ball


Distribuciones Personalizadas) se construyen tomando como referencia los datos
provenientes de un histograma de frecuencia. Este tipo de distribucin es muy poco
utilizada en la prctica, ya que se usan para representar una situacin nica que no se
puede describir con otros tipos de distribucin.
En cuanto a tu pregunta sobre si existen programas similares al Crystal Ball, la
respuesta es s, en el mercado existen muchos programas, uno de los principales
competidores de Crystal Ball se llama @Risk de Palisade, el cual tambin trabaja como
complemento del Excel. Ambos programas son excelentes, pero en mi opinin el
Crystal Ball se hace un poco ms amigable.
En este link encontraras informacin sobre @Risk: http://www.palisade-lta.com/risk/
Karina Semeco
Buenas noches, nuevamente la molesto.
La dispersin en una distribucin de probabilidad se relaciona con la incertidumbre, es
decir al cuantificar la dispersin se est cuantificando la incertidumbre; a mayor
dispersin mayor incertidumbre!.
Ahora, en el intervalo de confianza, la probabilidad aumenta, cuando tambin lo hace
este intervalo.
Si la desviacin estndar es la medida de la dispersin, puedo concluir que a mayor
desviacin es mayor el intervalo de confianza?...
Puedo tambin concluir que son trminos anlogos, es decir que los puedo asociar para
utilizarlos como criterio de evaluacin?... o son dos valores deben ser evaluados
independientemente.
Entonces en un intervalo de confianza amplio, la incertidumbre es alta, porque la
dispersin es amplia?.... los grficos de X en funcin de f(x) as lo evidencian... Por
favor aydeme en esta duda (incertidumbre)..
Eduardo, saludos nuevamente.
Es correcto tu comentario la desviacin estndar es una medida de la incertidumbre o
dispersin de la variable.
En cuanto a tu inquietud sobre la definicin del Intervalo de Confianza y su
interpretacin, te comento:
Cuando se hacen pronsticos de variables aleatorias, dicho pronstico bsicamente
consiste en determinar la distribucin de probabilidades que representa a la variable de
inters. En estos casos, la estimacin no debe expresarse como un slo valor estimado
(media); sino tambin la precisin de esa estimacin. Una forma de expresar la
precisin consiste en especificar unos lmites que, con una probabilidad dada, incluyan
el valor verdadero de la variable. A dichos lmites se les denominan "lmites de
confianza".
Para definir o determinar un intervalo de confianza puede hacerse a travs de sus
percentiles, a continuacin un ejemplo para aclarar su interpretacin:
. Supongamos que hemos caracterizado probabilsticamente a la Variable Porosidad
de un yacimiento, que tiene como valor esperado o media un 10%, y adicionalmente

conocemos que su Percentil 5 (P5)= 8% y su Percentil 95 (P95)= 17%, podemos decir


con un 90% de certeza que el valor de porosidad del yacimiento se encuentra entre 8 y
17%, con un valor esperado del 10%.
Otra forma de expresarlo sera: Con un intervalo de confianza del 90% la variable
Porosidad se encuentra entre 8 y 17%.
Ahora, para enlazar este ejemplo con tu comentario, la separacin que exista entre los
valores P5 y P95 (Intervalo de Confianza del 90%), da una idea de que tanta
incertidumbre tiene la variable.
Saludos Cordiales
Karina Semeco
Estimada Karina:
Las consideraciones que debemos tomar en cuenta para una ptima
caracterizacin de las variables sern:
El nmero de datos deben ser suficientes en cantidad
Los datos deben ser de la calidad que represente a todo el
proceso en su totalidad
Los datos debern ser consistentes con la realidad del proceso.
La frmula proporcionada por Usted a Ivn, el 17 de septiembre 2013
en este foro para determinar el tamao de la muestra, ser de gran
utilidad en el caso que nos toque hacer un muestreo.
Normalmente en nuestro caso se presenta que tenemos o nos
proporcionan un nmero de datos y con ellos pasaremos a realizar la
caracterizacin de los mismos basndonos en el nmero de la
siguiente manera:
- Mas de 15 datos, trabajaremos con test de bondad a travs del
Crystal ball
- Entre 6 y 15 datos con las dos opciones:
a. Estimar el valor ms probable, mnimo y mximo y
seleccionamos Beta Pert
b. Estimar percentil 5%, 10% y seleccionamos Lognormal
- Menos de 6 datos usamos el teorema de Bayes.
- Opinin de expertos usamos Beta Pert.
Me podra aclarar un poco acerca de que son los test de bondad?
Gracias y Saludos
Guillermo Bonilla
Buenos Das Guillermo, espero este muy bien.
Excelente tu resumen sobre las consideraciones que deben tenerse para la correcta la
caracterizacin probabilstica de variables.
En el archivo adjunto encontrar un Extracto del Libro de Confiabilidad de R2M sobre
las Pruebas de Bondad de Ajuste.
Karina Semeco
Buenas noches

Siendo la distribucin exponencial, ampliamente usada en anlisis de


confiabilidad como distribucin de la variable aleatoria tiempo. Me
podra indicar si tengo un histrico de produccin de petrleo; que se
lo registra en funcin de tiempo, seria la esta distribucin la ms
apropiada para utilizarla?, si est aseveracin no es la correcta, cual
sera la mejor distribucin de probabilidad para este caso y porque?
Saludos
Enrique Espin
Buenos Das Manuel,
En relacin a tu inquietud, la variable Caudal Inicial de Produccin, podramos
tratarla como variable fsica, y representarla a travs de distribuciones como la normal,
lognormal, beta, gamma, exponencial, weibull. Una vez definido un caudal inicial,
podremos modelar el comportamiento en el tiempo del pronstico de produccin del
pozo, utilizando algn modelo de declinacin (Por ejemplo: Exponencial). En el
prximo mdulo trabajaremos con este caso en particular, y podremos aclarar mejor tu
duda. Reforzaremos los conceptos de probabilstico y estocstico, siendo este ltimo
concepto referido a lo probabilstico que cambia en el tiempo.
Karina Semeco
Dentro de los mtodos de pronstico, se clasifica el metodo Delphi dentro de los
mtodos cualitativos o subjetivos.
De que dependeria la calidad de los resultados ?
Buenos Das Carlos, espero este muy bien.
Efectivamente el Mtodo Delphi, se clasifica como un mtodo subjetivo para la
obtencin de opinin de un grupo de expertos. Con base, a la elaboracin de encuestas.
La investigacin sobre este mtodo, forma parte de la Asignacin No 2, le permitir
ampliar sobre este tema.
Karina Semeco
Saludos Karina. Mucho gusto
Tengo la inquietud al utilizar el RARE, en la pantalla de los datos si son estimados o
conocidos, cual es el criterio de seleccin, porque en clase utilizamos la seleccin
conocidos pero en la carpeta se encontraba el punto en estimados.
Si este software estima los intervalos usando una posible distribucin deberan ser solo
datos estimados porque desconoceramos la poblacin.
Si existe esa posible seleccin, cuando se da el caso de escoger datos conocidos.
Gracias.
Buenos Das Carlos, espero se encuentre muy bien.
Le escribo en relacin a su inquietud sobre el uso del RARE, especficamente para el
Ejemplo visto en clases ( Ejemplo No 4 - Incertidumbre Parmetros - Media.xls). Es

correcta su observacin la opcin que debe seleccionarse para "Sample SD" es


"Estimated", ya que como Usted bien lo indica se estiman los parmetros media y
desviacin estndar de la muestra conocida, y no se conoce las caractersticas completas
de la poblacin.
Para comprobar el tema le anexo un ejercicio que compara los estimados hechos por
cada una de las opciones. Adicionalmente, se realiza la misma estimacin usando la
ecuacin presentada en la lamina 45 de la presentacin del mdulo cargada en el portal
(Presentacin "Bsico de Probabilidad y Estadstica Descriptiva".pdf).
La Lectura No 3 Estimacin Intervalos Parmetros Normal RARE.pdf ser
corregida, con base a los comentarios anteriores, y cargada actualizada nuevamente en
el portal. Prximamente recibir una nota informativa indicndole lista la actualizacin
para su descarga.
Karina Semeco
SALUDOS KARINA
En el transcurso de esta semana he ledo nuevamente el Mdulo 1 , ya que en el curso se
lo trat rpidamente, lo que a continuacin escribo espero que usted lo lea y sobre esa
secuencia de estudio espero me d su opinin, pues puedo estar equivocado, he seguido
una secuencia tratando de entender bien los conceptos antes de realizar consultas, he
examinado conceptos como Incertidumbre, Riesgo, Anlisis de Riesgo, Decisin,
conceptos necesarios para llegar a la Probabilidad y Estadstica, que son los trminos
matemticos bsicos para tomar decisiones mediante la administracin del riesgo y la
incertidumbre. he ledo sobre Poblacin, Muestras grandes y pequeas, para establecer
que tipo de muestra genera mayor confianza en la toma de decisiones, ya que esta tiene
influencia en el clculo de la probabilidad "p", que es el parmetro de la probabilidad
de la "Distribucin Binomial", la que sirve para determinar el nmero de xitos y
fracasos de un proceso.
Entendiendo estos conceptos ingres a leer sobre la Estadstica Descriptiva que es la
ciencia que estudia la variacin, dispersin o incertidumbre de las variables "Random y
, Aleatorias, esta Estadstica se apoya en la Distribucin de probabilidades y en el
comportamiento de los datos que es la Estadstica de la variable aleatoria.
Finalmente me dediqu al tema del Foro "Caracterizacin probabilstica de variables"
(Distribucin de Probabilidad), sobre este tema Karina pienso que el tema principal es la
Distribucin de Probabilidad que es generada por una variable aleatoria, la que puede
ser Discreta o Continua, ya entiendo a que se refiere cada una, estas variables nos
generan una distribucin de probabilidad que puede ser Distribucin de probabilidad
discreta , o Distribucin de probabilidad continua, Karina creo ya entender estos
conceptos.
Analic los conceptos de Media y Desviacin Estandar, Percentiles, clculos que los
realizamos continuamente en los ejercicios del mdulo

Le sobre Distribucin de Probabilidad no Paramtricas ( Histogramas de Frecuencia)


(Poblacin o muestra, rangos o clases y el clculo de la frecuencia relativa),
Distribuciones de Probabilidades no Paramtricas (Estadsticas), la influencia de la
muestra en el clculo de la incertidumbre de la Media o promedio, etc.
Karina me he enriquecido leyendo las inquietudes de mis compaeros y su entendible
respuesta, he tratado de no hacer preguntas antes de entender bien los conceptos, espero
culminar con el estudio del Mdulo I y ser ms participativo en un segundo Foro,
espero que con los conocimientos adquiridos se me facilite el desarrollo del segundo
Mdulo.
Favor deseo conocer su comentario sobre mi escrito.
Ing. FRANCISCO CASTILLO

Buenos Das Francisco, espero se encuentre muy bien.


En relacin a su inquietud puedo comentarle que me parece excelente su inters por
retomar a detalle la revisin de todos los conceptos y el material vistos en el Mdulo I.
La secuencia de la revisin me parece muy bien. Le comento adicionalmente que todos
estos conceptos los iremos consolidando en la medida que avancemos en el Diplomado.
El Mdulo II que tratar sobre la Gerencia de Ia Incertidumbre reforzar muchos de los
trminos hasta ahora vistos.
Los Foros nos permitirn ir compartiendo todas esas inquietudes y dudas, que harn que
todo este proceso de capacitacin mutua sea realmente productivo.
Saludos Cordiales
Karina Semeco
KARINA
UNA VARIABLE ALEATORIA PUEDE SER DISCRETA O CONTINUA, ESTAS
GENERAN LA DISTRIBUCION DE PROBABILIDAD DISCRETA Y LA
DISTRIBUCION DE PROBABILIDAD CONTINUA, EN QUE CASO CASO LA
SUMATORIA DE LAS PROBABLIDADES ASOCIADAS A CADA UNO DE LOS
VALORES QUE TOMA X ES IGUAL A 1, Y EN QUE CASO ES MAYOR O IGUAL
A CERO?
FRANCISCO CASTILLO
Saludos Karina,
En clase se nos indic que entre las opciones para la caracterizacin probabilstica de
variables, desde la opinin de expertos, se tienen las tcnicas BetaPert y la LogNormal.
Por favor me puede indicar, por qu se considera en desuso tcnicas matemticas como
la Triangular y la Uniforme. Tal vez presentaron resultados fuera de contexto?

Gracias.
Buenas Tardes Ernesto, como bien Usted lo indica entre las distribuciones de
probabilidad utilizadas comnmente para modelar opinin de expertos se encuentran la
Beta Pert, Triangular, Lognormal y Uniforme.
En el caso de la Beta Pert y la Triangular se construyen a partir de los valores mnimos,
ms probable y mximos ofrecido por el experto. Normalmente se recomienda la
BetaPert para representar variables fsicas, y se reserva el uso de la Triangular para
aquellas variables relacionadas con Costos. Bsicamente debido a la forma de la
distribucin Beta Pert, cuyos extremos tienen bajas probabilidades, y se asemeja mejor
al comportamiento fsico de las variables.
Por otro lado las distribuciones Lognormal y Uniforme, se construyen a partir de los
valores mnimos y mximo. La diferencia fundamental entre una y otra, es que en la
distribucin uniforme existe igual probabilidad de cualquier valor entre el mnimo y
mximo, mientras que la Distribucin Lognormal, asume por su forma que los valores
ms probables tienden hacia el mnimo ofrecido por el experto. Esta ultima se asume
con mayor frecuencia, debido al comportamiento real de las variables analizadas.
Karina Semeco
Saludos Compaeros
Si los datos obtenidos en la muestra incluyen valores negativos, la funcin de
distribucin de probabilidad reflejar tambin el cruce por cero? A qu
modelos o funciones de distribucin afecta que la variable sea cero o
negativa?
Buenas Tardes Daniel, es correcto cuando la variable que se desea caracterizar contiene
valores negativos, los mismos deben ser representados a travs de la distribucin de
probabilidades seleccionada.
Saludos Cordiales
Karina Semeco
Estimados
Compaeros del Diplomado
Compartos con ustedes estos conceptos que a mi modo de ver me parece muy
interesante y adems unos objetivos interesantes de leerlos:
Los valores de una variable sirven para describir o clasificar individuos o distinguir
entre ellos. La mayora de nosotros hacemos algo ms que simplemente describir,
clasificar o distinguir, porque tenemos ideas respecto a las frecuencias relativas de
los valores de una variable. En estadstica decimos que la variable tiene una
funcin de probabilidad, una funcin de densidad de probabilidad o simplemente
una funcin de distribucin (Badii & Castillo, 2007).
Las distribuciones de probabilidad estn relacionadas con la distribucin de
frecuencias. De hecho, podemos pensar en la distribucin de probabilidad
como una distribucin de frecuencias terica. Una distribucin de frecuencias
terica es una distribucin de probabilidades que describe la forma en que se
espera que varen los resultados. Debido a que estas distribuciones tratan
sobre expectativas de que algo suceda, resultan ser modelos tiles para hacer
inferencias y tomar decisiones de incertidumbre (Badii et al., 2007a, 2007b).
Los objetivos de distribuciones de probabilidad son:

a) Introducir las distribuciones de probabilidad que ms se utilizan en la toma


de decisiones.
b) Utilizar el concepto de valor esperado para tomar decisiones.
c) Mostrar qu distribucin de probabilidad utilizar, y cmo encontrar sus
valores.
d) Entender las limitaciones de cada una de las distribuciones de probabilidad
que utilice.
Estimada Karina,
Adems por favor que me aclare el concepto de distribucin de
muestreo asintticamente normal ????
Angel Villavicencio Z.

Buenos Das Angel, gusto en saludarlo.


En relacin a su inquietud sobre el termino "distribucin de muestro asintticamente
normal", considero que puede estar referido al uso de la distribucin normal. La curva
normal es asinttica al eje de abscisas. Por ello, cualquier valor entre -infinito y
+infinito es tericamente posible. El rea total bajo la curva es, por tanto, igual a 1.
Saludos Cordiales
Karina Semeco
Karina:
Para la caracterizacin de variables como porosidad y permeabilidad cuales
distribuciones de probabilidad crees tu que se acoplaran mejor,las Fsicas o las referidas
a Opinion de Expertos, tomando en cuenta que las variables petrofsicas dependen
mucho de la aleatoreidad de la naturaleza?.
Por otro lado si nos basamos en la opinin de expertos, tambin puede haber
discrepancia en ellos, como llegar a un consenso entre varias opiniones, existe un
nmero mnimo de encuestados y como se los deberan escoger?
Buenos Das Angel, saludos.
Para las variables porosidad y permeabilidad, si se disponen de una muestra >15 datos,
por ser variables fsicas, se recomienda: Normal, Lognormal, Exponencial, Weibull,
Gamma o Beta. La seleccin depender de los resultados que arroje la Prueba de
Bondad de Ajuste.
Cuando no se cuenta con suficiente informacin, y la misma proviene de opinin de
experto se recomienda para dichas variables la distribucin Beta Pert.
En cuanto a tu inquietud, de como lograr consenso entre un grupo de expertos, existen
tcnicas como el Mtodo Delphi, la misma forma parte de la investigacin propuesta en
la Asignacin No 2.
Karina Semeco
Karina, buenas noches.
Primeramente permitame manifestarle que todas las inquietudes, preguntas y respuestas
de todos los compaeros del Diplomado, han resultado muy enriquecedoras en el
aprendizaje; por lo que de hecho, me encuentro muy halagado y satisfecho.

Quisiera tambin que por favor me aclare o explique, suscintamente, el tema


"Intervalos de Confianza en el clculo de Parmetros".
Y finalmente una pregunta: Siendo una variable dispersa, que tiene rangos de baja,
optimista y alta, se puede dar el caso que se trabaje con un parmetro alto o pesimista,
es decir se tome este valor para toma de decisiones?
Slds.
Disculpe, creo que en Venezuela ya son las 00H46. En Quito son las 22h46
Buenas noches Karina
disculpas por la hora, he estado leyendo todas las inquietudes y aportes de los participantes,
dentro del tema de la caracterizacin de las variables quisiera que se amplie un poco ms
estos conceptos tomados de un texto de probabilidades:
uno de los conceptos ms importantes de la teora de probabilidades es el de variable
aleatoria que, intuitivamente, puede definirse como cualquier caracterstica medible quetoma
diferentes valores con probabilidades determinadas. Toda variable aleatoria posee
una distribucin de probabilidad que describe su comportamiento (vale decir, que desagrega
el 1 a lo largo de los valores posibles de la variable).

Si la variable es discreta, es decir, si toma valores aislados dentro de un intervalo, su


distribucin de probabilidad especifica todos los valores posibles de la variable junto con la
probabilidad de que cada uno ocurra. En el caso continuo, es decir, cuando la variable puede
tomar cualquier valor de un intervalo, la distribucin de probabilidad permite determinar las
probabilidades correspondientes a con subintervalos de valores.

En la prctica hay unas cuantas leyes de probabilidad tericas, como son, por ejemplo, la ley
binomial o la de Poisson para variables discretas o la ley normal para variables continuas,
que sirven de modelo para representar las distribuciones empricas ms frecuentes
la pregunta adicional es: una variable aleatoria es a la vez contnua, y como cada tipo de estas
variables podra afectar el tamao de la muestra?

Saludos cordiales
Olga Guerrero
Buenos Das Olga, espero este muy bien.
En lnea con su comentario. Las variables aleatorias o distribuidas, recordamos de lo
visto en clases que una variable aleatoria es aquella que por sus caractersticas pueda
tomar un conjunto de valores (x1, x2, x3, x4,... xn-1,) cada uno de los cuales tiene una
probabilidad de ocurrencia (p1, p2, p3, p4,... pn-1,). Adicionalmente es importante
hacer otra clasificacin de dichas variables, en variables continuas y variables
discretas. Si una variable aleatoria slo puede tomar valores enteros, es decir, un
nmero finito o infinito de valores numerables o contables se dice, que es discreta. Si
tericamente, puede tomar todos los valores de un intervalo dado, entonces es continua.

Por otro lado sabemos que las Distribuciones de Probabilidad son modelos que
describen la forma en que se espera que varen los resultados o probables valores de una
variable aleatoria.
Algunas de las distribuciones de probabilidad paramtricas ms usadas para variables
discretas son las siguientes: Binomial, Poisson, Geomtrica, Custom.
Algunas de las distribuciones de probabilidad paramtricas ms usadas para variables
continuas son las siguientes: Normal, Lognormal, Exponencial, Weibull, Beta, Gamma,
Triangular y Uniforme.
Karina Semeco
Buenos Das Miguel, espero este muy bien. Muchas gracias por sus comentarios.
Cuando se trabaja con distribuciones de probabilidad, estamos acostumbrados a definir
sus parmetros de forma determinstica. Hemos visto como parte del material del
Mdulo I una introduccin al tema de Intervalos de Confianza en el clculo de
Parmetros, que plantea que un parmetro estadstico no es una cantidad
determinstica, sino que puede ser una variable dispersa, cuya dispersin varia en un
rango, y que el ancho o incertidumbre de este rango depende del tamao de la muestra
analizada y del grado de confianza que se le dar a la estimacin.
En el Diplomado estudiamos dos casos de aplicacin, que son:
. Influencia del Tamao de la muestra en la estimacin del parmetro p probabilidad
de xito o fracaso Distribucin Binomial.
. Influencia del Tamao de la muestra en la estimacin de la medio o el promedio
Distribucin Normal.
Ahora bien, una vez que hemos determinado ese rango de incertidumbre para los
parmetros p y media, es importante considerar para la toma de decisin el rango
completo, es decir, caracterizar probabilsticamente el valor bajo, medio y alto. Este
tema ser ampliado en nuestro prximo Mdulo.
Karina Semeco
Buenos Das a todos, espero se encuentren muy bien.
Hemos dado por concluida el da de hoy la discusin en el Foro sobre el Tema No 1 del
Foro "Caracterizacin Probabilstica de Variables (Distribucin de Probabilidad)".
Agradeciendo su participacin.
Les recuerdo que el prximo tema a discutir a travs del Foro esta programado para la
semana del 30 de Septiembre al 04 de Octubre, sobre Simulacin de Montecarlo.
Karina Semeco

Вам также может понравиться