Академический Документы
Профессиональный Документы
Культура Документы
http://r2menlinea.com/w3/file.php/12/moddata/forum/16/45/Tamano_de_la_
Muestra_Representativa.pdf
Karina,
Entonces a su criterio cual sera la distribucin probabilstica que con mayor
precisin pudiera representar los datos.
Ivn
Para muestras y ajuste hechos para la opinin de expertos, Cul es el grado de error
admisible para que este tipo de informacin sea confiable.
Buenos Das Hector, saludos.
En relacin a la confiabilidad y validez de los estimados hechos por un Experto o grupo
de ellos, mi opinin es que depender fundamentalmente de la experiencia y el
conocimiento que estos posean de las variables y el proceso que se desee modelar, es
decir, que sean realmente conocedores y que ofrezcan informacin clara y sin sesgo. Es
difcil medir el grado de error admisible.
Existen tcnicas o mtodos para la obtencin de juicios u opinin de expertos, uno de
los ms conocidos es el llamado Mtodo Delphi. Este mtodo forma parte de la
investigacin a desarrollar como Asignacin No 2 para el presente Mdulo del
Diplomado.
Por otro lado, y no menos importante, una vez que se tiene la informacin del Experto
(mnimo, ms probable y mximo), es clave considerar la distribucin de probabilidad
correcta (Beta Pert, Triangular, Uniforme y Lognormal) a utilizar.
Karina Semeco
Gracias Karina
El motivo de mi pregunta se debe a que muchas veces es la nica fuente informacin
disponible, por ende se debe buscar un mnimo de calidad para garantizar confiabilidad
al momento de presentar un proyecto o cualquier recomendacin requerida.
Cordiales saludos, estimada Karina y compaeros del diplomado.
Ms que realizar una pregunta, quisiera agregar un comentario.
Dependiendo del tipo, cantidad y calidad de datos de una variable o fenmeno
analizado, corresponder elegir el modelo ms apropiado. Herramientas informticas o
programas como el CRISTAL BALL, RARE y el mismo EXCEL, han simplificado
totalmente nuestra labor de clculo, porque se encuentran insertadas todas esas
expresiones matemticas. Estas herramientas ayudan a minimizar la incertidumbre,
probabilidad de fracaso con un alto nivel de confiabilidad, ya que incluso presentan
alternativas jerarquizadas para su correcta eleccin.
Sin embargo, considero muy importante recalcar que todos estos programas deben ser
alimentados con una base de datos reales, confiables, aceptables, que representen
fidedignamente una muestra. Adems, el resultado obtenido debe ser revisado,
analizado e interpretado antes de tomar la decisin final. Habrn ocasiones en las cuales
se presenten casos de modelos similares, en donde el buen criterio, experiencia y
capacidad de interpretacin que tenga el analista, ser fundamental para elegir la mejor
alternativa.
Por lo tanto es nuestra responsabilidad dominar estos temas, puesto que la decisin final
ser tomada por cada uno de nosotros.
Eduardo Posso
Considerando que una poblacin debe tener caractersticas medibles o
contables, de naturaleza cualitativa o cuantitativa. A esa caracterstica
medible se le denominara variable estadstica y a los valores que toma se
los llama observaciones. En cambio la muestra es un grupo de unidades
seleccionadas de un grupo mayor (es decir la poblacin) y del cual se
espera obtener conclusiones. El parmetro es un valor usualmente
desconocido, y que por tanto tiene que ser estimado, se lo usa para
representar cierta caracterstica de la poblacin. AFIRMACIN: Parmetro es
un valor fijo: es decir no vara; pero es posible obtener ms de una muestra
de la misma poblacin con lo cual los valores estadsticos (media muestral o
promedio, total muestral, varianza muestral, desviacin estndar muestral,
proporcin muestral) variaran de muestra a muestra. Esto se debe a que el
estadstico es una variable aleatoria que sigue la ley de probabilidad o que
tendr una ley de probabilidad asociada. Lo expuesto es correcto?
Karina
Acerca de Intervalos de confianza:
En intervalo de confianza es un rango de nmeros, elaborado alrededor de la estimacin
puntual, el que se construye de manera que la probabilidad del parmetro de la
poblacin se localice en algn lugar dentro del intervalo conocido. Por lo tanto, el nivel
de confianza mide la probabilidad de buen funcionamiento de un intervalo, y por este
motivo, el nivel de confianza siempre se elige prximo a 1.
Cules son los mtodos ms utilizados para determinar los intervalos de confianza?.
Gustavo
Buenos Das Gustavo,
Cuando se hacen pronsticos de variables aleatorias, dicho pronstico bsicamente
consiste en determinar la distribucin de probabilidades que representa a la variable de
inters. En estos casos, la estimacin no debe expresarse como un slo valor estimado
(media); sino tambin la precisin de esa estimacin. Una forma de expresar la
precisin consiste en especificar unos lmites que, con una probabilidad dada, incluyan
el valor verdadero de la variable. A dichos lmites se les denominan "lmites de
confianza".
Para definir o determinar un intervalo de confianza puede hacerse a travs de sus
percentiles, a continuacin un ejemplo:
. Supongamos que hemos caracterizado probabilsticamente a la Variable Porosidad
de un yacimiento, que tiene como valor esperado o media un 10%, y adicionalmente
conocemos que su Percentil 5 (P5)= 8% y su Percentil 95 (P95)= 17%, podemos decir
con un 90% de certeza que el valor de porosidad del yacimiento se encuentra entre 8 y
17%, con un valor esperado del 10%.
Otra forma de expresarlo sera: Con un intervalo de confianza del 90% la variable
Porosidad se encuentra entre 8 y 17%.
Karina Semeco
Buenos Das Gustavo, gusto en saludarte.
En cuanto a las Pruebas de Bondad de Ajustes (Chi-cuadrado, Kolmogorov - Smirnov,
Anderson Darling), puedo comentarte:
La prueba de Chi-cuadrado arroja sus mejores resultados cuando las muestras son
grandes, ya que realiza la comparacin sobre el histograma en su formato de frecuencia
de densidad, y depende del nmero de los intervalos de clases definidos.
A diferencia de la prueba Chi Cuadrado, las prueba de Komogorov Smirnov y
Anderson Darling no agrupan los datos en intervalos o clases. En su lugar, para la
prueba se utiliza la funcin de probabilidad acumulada hipottica seleccionada, la cual
es comparada con la funcin de probabilidad acumulada emprica proveniente de los
datos. Esto resulta til, cuando el tamao de la muestra es menor, solo que pudiera
presentar alguna discrepancia con las probabilidades de las colas. Siendo este aspecto
mejorado con Anderson-Darling.
Adjunto un archivo con un Extracto del Libro de R2M sobre las Pruebas de Bondad de
Ajuste.
Mi recomendacin, para la seleccin de una Prueba de Bondad de Ajuste usando el
programa Crsytal Ball es seleccionar la opcin "Anderson-Darling", ya que se hace la
Variables Fisicas:
Eduardo Herrera
Saludos Wilson, buenas tardes.
.- Es correcto Wilson, cuando se tienen muestras pequeas (ms de 6 y menos 15 datos),
una opcin recomendada es construir un histograma de frecuencia, para definir un valor
ms probable estimado, y a partir del mnimo y mximo de la muestra, asumir una
Distribucin BetaPert.
.- El Valor-p se define como el nivel de significancia de la diferencia entre el Valor del
Test y el valor crtico de la Prueba de Bondad de Ajuste. El valor-p es una probabilidad,
y mientras ese valor sea ms cercano a 1, quiere decir que el Valor de Test es mucho
menor al valor crtico, y la hiptesis de la prueba es aceptada. La lmina 65 de la
presentacin del material del mdulo, muestra una imagen que sirve de referencia.
Este tema ser ampliado en el siguiente Mdulo del diplomado.
Karina Semeco
Saludos,
Se podra decir que el valor-p es el que determina realmente la aplicacin de un
modelo u otro?
Si es as, primero se verificara el valor-p y seguidamente el valor del Test?
En caso de valores Test similares, el valor-p definiria el modelo?
En caso de valores-p similares el valor del Test definira el modelo?
Saludos Karina
Favor su ayuda para aclarar lo siguiente:
Se menciona que la seleccin de la curva de probabilidad, depende de la informacin
disponible. Para datos anlogos recolectados en otros activos, los mismos que no sean
considerados como muestras pequeas, podramos darles un tratamiento o anlisis, con
tcnicas para grandes muestras, basados en los test de bondad?
Gracias ...
Buenas Tardes Ernesto, gusto en saludarte.
Es correcto, siempre que se tenga una muestra de datos (para el Crystal Ball ms de 15
datos) podrs aplicar una Prueba de Bondad de Ajuste para determinar cual es la mejor
distribucin de probabilidad que la representa.
Karina Semeco
Buenas tardes Karina
La distribucin Probabilistica que con mayor precisin pudiera representar los datos
mucho depende del tamao de la muestra y del grado de satisfaccin o exactitud que se
los quiera dar.
Favor su ayuda con esta pregunta.
Por que se dice que la estadistica basada en Bondad de Ajuste es usualmente utilizada
con sentido relativo mediante la comparacin de los valores de Bondad de Ajuste de
otras funciones de Dist. de Probabilidad?
Buenas Tardes Miguel Angel, es correcta tu inquietud las pruebas de bondad de ajuste
tienen por objetivo determinar si los datos se ajustan a una determinada distribucin, y
para ello se parten de comparar un conjunto de hiptesis (normal, lognormal,
exponencial, etc). La hiptesis seleccionada ser aquella cuyo valor del test sea menor
al valor critico de la prueba.
Saludos Cordiales
Karina Semeco
Buenas Tardes Compaeros
Estimada Karina.
Al hablar de muestras pequeas entre 6 y 15 datos, los valores a considerar deberan ser
el valor mximo, el mnimo y la moda o valor con mayor frecuencia, para con estos
datos y con la ayuda del Cristall Ball efectuar la construccin de una Distribucin
BetaPert. Al efectuar una entrevista a un experto, cuando no se tiene una evidencia
muestral, los datos que se ha de procurar conseguir en dialogo deberan ser: un valor
optimista (Mximo), valor pesimista (mnimo) y el valor ms probable (moda), para con
estos datos construir la distribucin. Al efectuar este anlisis el grado de incertidumbre
va hacer mayor, ya que solo se depende de la experiencia de una persona y a lo mejor
otro experto tiene otro punto de vista referente al mismo tema.
Diego Ortiz
Buenas Tardes Diego,
Es correcto tu comentario, la opinin de experto es una fuente valiosisima de
informacin. Pero si hablamos de la opinin o juicio de un solo experto, debe tenerse
mucho cuidado, ya que el juicio puede ir acompaado de subjetividad. Es por ello que
se recomienda trabajar con grupos de expertos, que logren un consenso de la
informacin.
Karina Semeco
Buenas noches Karina, en lo referente a las distribuciones empricas, podramos afirmar
como una regla que siempre las asociaramos con un grfico de Histogramas de
frecuencia?
Estimada Karina
Hay otro programa similar al CRISTAL BALL que podamos emplear para realizar
estos clculos y encontrar modelos de distribuciones que tambin sirvan para nuestro
propsito?.... o quiz ste fue escogido porque se acopla al EXCEL y es utilizado como
una herramienta adicional? Podramos comparar las bondades con otro programa...!
Buenos Das Eduardo, saludos.
Gracias.
Buenas Tardes Ernesto, como bien Usted lo indica entre las distribuciones de
probabilidad utilizadas comnmente para modelar opinin de expertos se encuentran la
Beta Pert, Triangular, Lognormal y Uniforme.
En el caso de la Beta Pert y la Triangular se construyen a partir de los valores mnimos,
ms probable y mximos ofrecido por el experto. Normalmente se recomienda la
BetaPert para representar variables fsicas, y se reserva el uso de la Triangular para
aquellas variables relacionadas con Costos. Bsicamente debido a la forma de la
distribucin Beta Pert, cuyos extremos tienen bajas probabilidades, y se asemeja mejor
al comportamiento fsico de las variables.
Por otro lado las distribuciones Lognormal y Uniforme, se construyen a partir de los
valores mnimos y mximo. La diferencia fundamental entre una y otra, es que en la
distribucin uniforme existe igual probabilidad de cualquier valor entre el mnimo y
mximo, mientras que la Distribucin Lognormal, asume por su forma que los valores
ms probables tienden hacia el mnimo ofrecido por el experto. Esta ultima se asume
con mayor frecuencia, debido al comportamiento real de las variables analizadas.
Karina Semeco
Saludos Compaeros
Si los datos obtenidos en la muestra incluyen valores negativos, la funcin de
distribucin de probabilidad reflejar tambin el cruce por cero? A qu
modelos o funciones de distribucin afecta que la variable sea cero o
negativa?
Buenas Tardes Daniel, es correcto cuando la variable que se desea caracterizar contiene
valores negativos, los mismos deben ser representados a travs de la distribucin de
probabilidades seleccionada.
Saludos Cordiales
Karina Semeco
Estimados
Compaeros del Diplomado
Compartos con ustedes estos conceptos que a mi modo de ver me parece muy
interesante y adems unos objetivos interesantes de leerlos:
Los valores de una variable sirven para describir o clasificar individuos o distinguir
entre ellos. La mayora de nosotros hacemos algo ms que simplemente describir,
clasificar o distinguir, porque tenemos ideas respecto a las frecuencias relativas de
los valores de una variable. En estadstica decimos que la variable tiene una
funcin de probabilidad, una funcin de densidad de probabilidad o simplemente
una funcin de distribucin (Badii & Castillo, 2007).
Las distribuciones de probabilidad estn relacionadas con la distribucin de
frecuencias. De hecho, podemos pensar en la distribucin de probabilidad
como una distribucin de frecuencias terica. Una distribucin de frecuencias
terica es una distribucin de probabilidades que describe la forma en que se
espera que varen los resultados. Debido a que estas distribuciones tratan
sobre expectativas de que algo suceda, resultan ser modelos tiles para hacer
inferencias y tomar decisiones de incertidumbre (Badii et al., 2007a, 2007b).
Los objetivos de distribuciones de probabilidad son:
En la prctica hay unas cuantas leyes de probabilidad tericas, como son, por ejemplo, la ley
binomial o la de Poisson para variables discretas o la ley normal para variables continuas,
que sirven de modelo para representar las distribuciones empricas ms frecuentes
la pregunta adicional es: una variable aleatoria es a la vez contnua, y como cada tipo de estas
variables podra afectar el tamao de la muestra?
Saludos cordiales
Olga Guerrero
Buenos Das Olga, espero este muy bien.
En lnea con su comentario. Las variables aleatorias o distribuidas, recordamos de lo
visto en clases que una variable aleatoria es aquella que por sus caractersticas pueda
tomar un conjunto de valores (x1, x2, x3, x4,... xn-1,) cada uno de los cuales tiene una
probabilidad de ocurrencia (p1, p2, p3, p4,... pn-1,). Adicionalmente es importante
hacer otra clasificacin de dichas variables, en variables continuas y variables
discretas. Si una variable aleatoria slo puede tomar valores enteros, es decir, un
nmero finito o infinito de valores numerables o contables se dice, que es discreta. Si
tericamente, puede tomar todos los valores de un intervalo dado, entonces es continua.
Por otro lado sabemos que las Distribuciones de Probabilidad son modelos que
describen la forma en que se espera que varen los resultados o probables valores de una
variable aleatoria.
Algunas de las distribuciones de probabilidad paramtricas ms usadas para variables
discretas son las siguientes: Binomial, Poisson, Geomtrica, Custom.
Algunas de las distribuciones de probabilidad paramtricas ms usadas para variables
continuas son las siguientes: Normal, Lognormal, Exponencial, Weibull, Beta, Gamma,
Triangular y Uniforme.
Karina Semeco
Buenos Das Miguel, espero este muy bien. Muchas gracias por sus comentarios.
Cuando se trabaja con distribuciones de probabilidad, estamos acostumbrados a definir
sus parmetros de forma determinstica. Hemos visto como parte del material del
Mdulo I una introduccin al tema de Intervalos de Confianza en el clculo de
Parmetros, que plantea que un parmetro estadstico no es una cantidad
determinstica, sino que puede ser una variable dispersa, cuya dispersin varia en un
rango, y que el ancho o incertidumbre de este rango depende del tamao de la muestra
analizada y del grado de confianza que se le dar a la estimacin.
En el Diplomado estudiamos dos casos de aplicacin, que son:
. Influencia del Tamao de la muestra en la estimacin del parmetro p probabilidad
de xito o fracaso Distribucin Binomial.
. Influencia del Tamao de la muestra en la estimacin de la medio o el promedio
Distribucin Normal.
Ahora bien, una vez que hemos determinado ese rango de incertidumbre para los
parmetros p y media, es importante considerar para la toma de decisin el rango
completo, es decir, caracterizar probabilsticamente el valor bajo, medio y alto. Este
tema ser ampliado en nuestro prximo Mdulo.
Karina Semeco
Buenos Das a todos, espero se encuentren muy bien.
Hemos dado por concluida el da de hoy la discusin en el Foro sobre el Tema No 1 del
Foro "Caracterizacin Probabilstica de Variables (Distribucin de Probabilidad)".
Agradeciendo su participacin.
Les recuerdo que el prximo tema a discutir a travs del Foro esta programado para la
semana del 30 de Septiembre al 04 de Octubre, sobre Simulacin de Montecarlo.
Karina Semeco