Вы находитесь на странице: 1из 48

Universidade de So Paulo (USP) Instituto de Cincias Matemticas e de Computao (ICMC)

Disciplina

Tpicos de Probabilidade e Estatstica I

Professores Responsveis Marinho Gomes De Andrade Filho Ricardo Sandes Ehlers

Estudo sobre Distribuies de Probabilidades Lagrangianas

Thiago Christiano Silva

So Carlos, 29 de junho de 2010

1. Distribuio de Borel

1.1. Definio

Uma varivel aleatria discreta X dita seguir a distribuio de Borel se sua funo massa de probabilidade dada por: , ! 0, = 1,2,3,

= onde 0 <

primeiramente obtida por Borel em 1942.

< 1. A distribuio de probabilidade quantificada conforme a equao (1) foi

(1)

Suponha que uma fila inicializada apenas com um nico membro e que tenha uma intensidade de trfego sob uma distribuio de Poisson e um tempo constante de servio. Nestas condies, Haight e Breuer (1960) descobriram que a distribuio de Borel em (1) representa a probabilidade que exatamente x membros da fila sejam servidos antes que a fila acabe [1]. A mdia e a varincia da distribuio em (1) so calculadas a partir de: = 1 =

(2)

O modelo de Borel satisfaz as propriedades de sub-disperso e sobre-disperso1. Haver sobre-

disperso caso satisfaa a inequalidade 3 2 5 2 < < 1. Por outro lado, o modelo ser

Em Estatstica, o fenmeno de sobre-disperso ocorre quando h a presena de uma variabilidade maior (disperso estatstica) no conjunto de dados do que seria esperado em uma variabilidade de um modelo estatstico simples. Normalmente, compara-se o resultado observado com o terico, ou seja, caso, por exemplo, a varincia observada seja maior que a terica, diz-se que o fenmeno de sobre-disperso ocorreu. O mesmo raciocnio pode ser feito para o efeito de sub-disperso.

sub-disperso quando = 3 2 5 2 [4]. 1.2. Funes Geradoras

< 3 2 5 2 . A mdia e a varincia so ambas iguais quando

A distribuio de Borel pode ser gerada a partir de uma expanso de Langrange com o parmetro (0 < < 1 sob a transformao = a qual gera: = ! (4) = . Isto leva seguinte equao:

(3)

o que mostra que a soma da distribuio de Borel em (1) equivale a 1. Podemos tambm falar de funes geradoras de probabilidade, as quais representam, algumas vezes, um artifcio para resoluo de problemas, pois a representao da distribuio fica em termos de uma srie de potncias da funo de probabilidade de massa e esta, por sua vez, goza de meios eficientes para o clculo computacional [3]. Outra vantagem desta representao que a teoria de sries de potncias j foram amplamente utilizadas e, por conseguinte, a manipulao matemtica sobre distribuies complexas realizada com mais facilidade. No caso da distribuio de Borel, sua funo geradora de probabilidade dada pela expanso lagrangiana de: = , = , 0 < < 1

(5)

Alm da representao por funo geradora de probabilidade, existem as funes geradoras de momento que representam uma alternativa para a distribuio de probabilidade em forma de uma soma de momentos. Fazendo a transformao = e = em (5), podemos deduzir a

funo geradora de momento da distribuio de Borel que : = 3 ,

(6)

1.3. Relaes de Recorrncias e Momentos Todos os momentos para a distribuio de Borel existem quando 0 < < 1. Considere que

denote o k-simo momento no-central de uma distribuio de Borel. Portanto, = =

(7)

Diferenciando (7) com respeito a varivel e simplificando o resultado, pode-se chegar seguinte relao de recorrncia: = . 1 + , = 0, 1, 2,

(8)

onde

Utilizando

= 1

para denotar o k-simo momento central, a relao de recorrncia entre os

momentos centrais dada por: = 1 + , = 1, 2, 3,

(9)

onde

obtidos utilizando (9) e estes, especificamente, so dados por: = 1+2 enquanto que: = 1+8 +6 1

= dado pela equao (2). O terceiro e quarto momentos centrais podem ser

(10)

+3

(11)

Alm da anlise de momentos, outras medidas importantes so a obliquidade (skewness, no ingls) e a curtose (kurtosis, no ingls). A primeira se define como uma medida de simetria, ou, mais precisamente, uma medida de falta de simetria [5]. Sabendo que uma distribuio simtrica quando o seu lado direito e esquerdo so idnticos quanto a um ponto central, podemos inferir que uma alta obliquidade incorre de uma distribuio que no tem simetria

alguma, enquanto que uma distribuio com baixa obliquidade acarreta uma distribuio espelho sobre um ponto central (alta simetria). Quanto curtose, esta definida como uma medida que verifica se a distribuio tem pico ou plana relativa a uma distribuio Normal. Isto , uma distribuio tem alta curtose se existe um pico destoante perto de sua mdia, descresce relativamente rpido quando nos afastamos dela e tem pontas pesadas. Por outro lado, distribuies com baixa curtose se traduzem em regies planas perto da mdia, ao invs de um pico (note que a distribuio uniforme seria um caso extremo de baixa curtose). No caso da distribuio de Borel, o coeficiente de obliquidade, denotado por = J, o coeficiente de curtose, denotado por 1+2 , dado por:

(12)

, calculado por: =3+ 1+8 +6 1

(13)

De (13), fica claro que a distribuio Borel tem sempre a obliquidade positiva. J, de (14), fica evidente que a curtose sempre maior que 3 e, desta forma, a distribuio Borel caracterizado por ser leptocurtose2.

1.4. Estimativa

Suponha uma amostra aleatria de tamanho n criada seguindo uma distribuio de Borel e seja as frequncias observadas denotadas por A mdia amostral dada por = , = 1, 2, , , de tal forma que

. Com isto em mente, 3 mtodos para estimao

= .

do parmetro so propostos para a distribuio de Boreal [4] conforme equao (1).

Leptocurtose uma distribuio com excesso de curtose positiva. Em termos de forma, este tipo de distribuio tem um pico mais acentuado perto da mdia. No outro extremo, temos as funes que tem picos poucos acentuados (se os tiverem, ainda) as quais se denominam como distribuies platycurtose (curtose negativa excessiva).

a. Estimao do momento. No equacionamento da mdia amostral com a mdia populacional, o estimador de momento de dado por:

=1

(14) =1

b. Mtodo baseado na primeira frequncia. No equacionamento correspondente proporo amostral, = =

para a

(15)

o qual produz o estimador da primeira frequncia de como

= log

(16)

c. Estimador de mxima verossimilhana. A funo log de verossimilhana para a distribuio de Boreal pode ser escrita como:

log =

1 log

1 log log !

(17)

Para maximizarmos a verossimilhana, devemos derivar (17) com respeito ao e igualar a zero para encontrar os s crticos. Pode ser facilmente mostrado que o estimador de mxima verossimilhana de : =1 1 x

(18)

Note que a equao (18), resultado do MLE, idntica primeiro estimador descrito aqui, basta observar a equao (14).

1.5. Aplicaes

Nesta seo apresentaremos uma lista, nem perto de ser considerada exaustiva, das aplicaes da distribuio de Borel em problemas reais. Entre as principais estudadas na literatura, podemos destacar: Como j citada anteriormente, o nmero de clientes servidos em um perodo de noocioso de um nico servidor de filas com entrada seguindo a distribuio de Poisson e tempo de servio constante segue uma distribuio de Borel. Especificamente, podemos simular a intensidade do trfego, congestionamentos em espaos semi-infinitos discretos e processos de bifurcao. A distribuio de Borel, nesse caso, toma o lugar da distribuio binomial negativa bivariada, comum nesses casos de fila [1]. A ordem de condensao de uma cadeia de polmeros com uma probabilidade inicial de tamanho especificado pode ser descrita por uma distribuio de Borel, caso utilize-se processos em cascatas durante a condensao [2]. Pode ser utilizada para servir como heurstica para distribuio aleatrias de clusterizao a partir de seu condicionamento com outras funes lagrangianas (Poisson generalizado) [6].

1.6. Simulaes

Nesta seo apresentaremos simulaes utilizando a distribuio de Borel para diversos valores de . Nesta unidade, proporemos algoritmos escritos em MATLAB. A partir da equao (1), podemos derivar um script que retorna um vetor com os valores de Borel(x), para todo x = 1, 2, 3, .... O Script 1 demostra isto. A funo geraBorel aceita 4 parmetros, os quais so: Inferior: Representa o limite inferior pelo qual a gerao dos nmeros se iniciar. Superior: Representa o limite superior pelo qual a gerao dos nmeros terminar. Precisao: Representa os incrementos entre um ponto e outro. Deve ser um nmero natural. Lambda: O nico parmetro da distribuio de Borel.

Como sada, a funo retorna um conjunto de pontos x1, x2, ..., espaados por um inteiro Precisao com incio em Inferior e trmino em Superior.

function [vetor] = geraBorel(inferior, superior, precisao, lambda) i = inferior; vetor = []; %o incremento deve ser um inteiro (i = 1, 2, 3, ...) precisao = round(precisao); while(i <= superior) %Calcula o novo valor da distribuio de Borel no ponto i valor = borelDistribution(i, lambda); %Coloca no vetor vetor = horzcat(vetor, valor); %Incrementa o valor de i de acordo com a preciso i = i + precisao; end end %Calcula o valor da distribuio de Borel em um dado ponto x com %a parametrizao lambda. function [valor] = borelDistribution(x, lambda) if(x == 0 || lambda == 0) valor = 0; else valor = (x * lambda)^(x - 1) * exp(-lambda * x) / factorial(x); end end
Script 1: Algoritmo que gera pontos seguindo a distribuio de Borel.

A partir do Script 1, uma vez carregado no MATLAB a partir da funo load, podemos aplicar o Script 2 para gerar um grfico que compara uma distribuio sub-dispersiva, sobre-dispersiva e outra no limite entre as duas anteriores, conforme explicado na seo 1.1. Como j sabemos, haver sobre-disperso caso satisfaa a inequalidade 3 2 5 2 < < 1. Por outro lado, o modelo ser sub-disperso quando = 3 2 5 2. Tomaremos valores nestes trs intervalos para ver a < 3 2 5 2. J, no caso limite, a mdia e a varincia so

ambas iguais quando

caracterstica grfica da funo.

limite = (3 + sqrt(5))/2; figure; t = 1:10; plot(t, geraBorel(1, 10, 1, limite/2), 'r'); hold on; plot(t, geraBorel(1, 10, 1, limite), 'g'); hold on; plot(t, geraBorel(1, 10, 1, 2*limite), 'm'); legend('Sub-dispersivo', 'Limite', 'Sobre-dispersivo'); xlabel('x'); ylabel('Borel(x)'); title('Comportamento da Distribuio de Borel'); hold off;
Script 2: Sequncia de comandos para gerao de 3 grficos sobrepostos ao mesmo espao.

A Figura 1 ilustra a simulao. Os parmetros para foram: no caso sub-dispersivo, = 3 4 4 , no caso limite, 3 2 5 2 e, no caso sobre-dispersivo, 3 5. Note que

claramente no caso sobre-dispersivo a funo descresce muito mais devagar do que no caso sub-dispersivo, mostrando sua alta varincia. O caso limite denota a delimitao formal entre essas duas regies.

Figura 1: Simulao com a distribuio de Borel para 3 diferentes caractersticas implcitas esta distribuio, i.e., sub e sobre-dispersidade, alm do caso limite.

Agora passaremos para a gerao de nmeros aleatrios. Com o auxlio de [16], oferecida, neste documento, uma funo geradora de nmeros aleatrios. O Script 3 uma verso modificada do script disponibilizado por [16], pois este capaz de criar vetores aleatrios, ao invs s de nmeros escalares.
% Gerao de nmeros aleatrios seguindo a distribuio de Borel % Parmetros de entrada: %% lambda representa o hiper-parmetro da distribuio %% N representa a quantidade de nmeros aleatrios no vetor de sada v function [v] = gerarVetorAleatorioBorel(lambda, N) v = []; i = 0; while(i < N) w = lambda * exp(-lambda); x = 1; s = exp(-lambda); p = s; randomNumber = unifrnd(0, 1, 1) while(randomNumber > s) x = x + 1; c = (1 + 1 / (x - 1))^(x - 2) p = w * c * p; s = s + p; end v = horzcat(v, x); i = i + 1; end end % Mtodo retirado e modificado de Springer, Lagrangian Probability Distribution, pg. 320
Script 3: Gerao de nmeros aleatrios seguindo uma distribuio de Borel.

Mister se faz registrar que, quanto aos parmetros de entrada, N representa a quantidade de nmeros aleatrios que se deseja produzir, enquanto que , o hiper-parmetro da funo, conforme equao (1). Para todas as simulaes, fixaremos um N relativamente grande, de forma a obter uma boa aproximao da distribuio de nmeros aleatrios. Seja, portanto, N fixado em 10000. A Figura 2 ilustra o resultado para = 0.2, enquanto que a Figura 3 e a Figura 4, para = 0.5 e = 0.9,

respectivamente. Note que conforme aumentamos , a massa de probabilidade se concentra mais e mais prximo da origem.

10

Figura 2: Resultados da simulao para Borel(0.2) com N = 10000.

Figura 3: Resultados da simulao para Borel(0.5) com N = 10000.

11

Figura 4: Resultados da simulao para Borel(0.9) com N = 10000.

2. Distribuio Delta-Simples

2.1. Definio A distribuio Lagrangiana Delta-simples constitui um conjunto de equaes de distribuio na litetura. Conforme equao estipulada em aula, iremos estudar apenas a Delta-Poisson, cuja funo massa de probabilidade dada por: =

(19)

Esta famlia de equaes serve de caso geral para diversas outras distribuies. Por exemplo, tomando 1, temos que (19) se reduz para uma distribuio de Borel, j estudada aqui.

2.2. Aplicaes

Entre as principais aplicaes da famlia Delta-Simples, especificamente a Delta-Poisson, podemos destacar as seguintes:

12

O processo de herana gentica. Uma varivel pseudo-aleatria X gerada baseada em uma recriao parcial de um dado processo de herana gentica. Neste mtodo, no h clculos computacionais pesados. A distribuio Delta-Poisson Lagrangiana definida a partir das funes geradoras , , onde = e = uma funo geradora de coloca massa 1 no ponto

probabilidade. A funo geradora de probabilidade

deixam-se todos os indivduos produzirem descendentes independentemente, de acordo com a distribuio definida na funo geradora de probabilidade . Seja o

= . Em um processo de Galton-Watson, comea-se com apenas um indivduo e

tamanho X o nmero de elementos que continuam vivos num dado tempo nesta populao finita. A funo geradora de probabilidade para X soluo nica da seguinte equao: = , 0, 1 indivduos, onde , a qual igual a

(20) a varivel

Se o processo de herana gentica comea com aleatria possuindo funo geradora de probabilidade probabilidade de X : = , ,

, ento a funo geradora de

20

(21)

Uma vez que a distribuio de X uma distribuio Lagrangiana Delta-Simples com funo geradora , podemos usar esta propriedade de forma a fazer com que o

mtodo de herana gentica gere a distribuio Lagrangiana [16]. Mtodos de Limitantes superiores uniformes. A distribuio de Delta-Poisson e algumas outras funes de distribuio Delta-Simples possuem a seguinte propriedade:
,

para todo , onde

for uma distribuio de probabilidade tal que pseudo-aleatria X com probabilidade

< , e

(22) a coleo de parmetros. Se para todo , ento uma varivel ,

pode ser gerada a partir do mtodo de ,

aceitao-rejeio. Para tanto, deve-se gerar pares de variveis independentes 13

onde

tem uma distribuio

para uma dada constante (que pode ser representa uma varivel < ,

aleatria gerada a partir de umam distribuio uniforme 0, 1 . Quando possui alta convergncia mesmo quando muda.

analiticamente estipulada, conforme visto em aula) e

deve-se retornar . Esta tcnica, chamada mtodo de limitantes superiores uniformes,

2.3. Simulaes

Esta seo ilustra os scripts e as simulaes realizados no que concerne a gerao de nmeros aleatrios seguindo a distribuio Delta-Poisson. O Script 4 abaixo ilustra a sequncia de comandos para gerao de um vetor de tamanho N, com cada entrada seguindo o algoritmo estipulado em [16], o qual foi modificado para conseguir gerar uma quantidade genrica de nmeros aleatrios.

% Gerao de nmeros aleatrios seguindo a distribuio de DeltaPoisson % Parmetros de entrada: %% lambda representa o primeiro hiper-parmetro da distribuio %% n representa o segundo hiper-parmetro da distribuio %% N representa a quantidade de nmeros aleatrios no vetor de sada v function [v] = gerarVetorAleatorioDeltaPoisson(lambda, n, N) v = []; i = 0; while(i < N) w = lambda * exp(-lambda); x = n; s = exp(-lambda * n); p = s; randomNumber = unifrnd(0, 1, 1); while(randomNumber < s) x = x + 1; c = (x - 1) * (1 + 1 / (x - 1))^(x - n - 1); p = w * c * p / (x - n); s = s + p; end v = horzcat(v, x); i = i + 1; end end % Mtodo retirado e modificado de Springer, Lagrangian Probability % Distribution, pg. 322
Script 4: Gerao de nmeros aleatrios seguindo uma distribuio de Delta-Poisson.

14

A Figura 5 ilustra o resultado da simulao aplicando o script desenvolvido para N = 10000, = 0.2 e 2. J a Figura 6, mostra o resultado para N = 10000, 0.5 e 2.

Figura 5: Resultados da simulao para Delta-Poisson(0.2, 2) com N = 10000.

Figura 6: Resultados da simulao para Delta-Poisson(0.5, 2) com N = 10000.

15

3. Distribuio de Poisson Generalizada

3.1. Introduo

A distribuio de Poisson convencional aplicada a modelos resultantes de um processo de contagem. Esta distribuio depende de um nico parmetro, , o qual representa a taxa de ocorrncia dos eventos sendo contados. O parmetro como a varincia desta distribuio. Esse modelo implicitamente assume taxa de ocorrncia homognea para os processos. H, entretanto, uma variedade de situaes em que tal hiptese falha em ser verdade; uma, por exemplo, a distribuio de nmeros de organismos em uma colnia de bactrias, onde a taxa de nascimento de qualquer lugar no espao ou tempo dependente do nmero anterior de organismos prximos quele lugar em questo (devido disponibilidade de comida, temperatura, comportamento social, etc) [7]. Uma variedade de distribuies de Poisson generalizadas foram propostas; particularmente, o trabalho de Consul e Jain trouxeram esta distribuio com apenas dois parmetros, e , os quais generalizam a distribuio de Poisson convencional de uma maneira flexvel. Mudando , possvel induzir um aumento ou reduo da taxa de ocorrncia sendo modelada. A distribuio de Poisson generalizada aparece em vrios modelos discretos onde as probabilidades dependem ou do nmero anterior de ocorrncias ou no nmero mdio de eventos em qualquer espao. Alguns modelos de urnas, onde a distribuio de probabilidades depende do nmero total de bolas em vrias urnas, estes, tambm seguem a distribuio de Poisson generalizada. Existe tambm o processo de Poisson generalizado, um processo pontual onde as probabilidades de ocorrncia em qualquer pequeno espao dependem do estado anterior do processo, assim como do tempo especfico e do tamanho do local em que ocorreu o evento. Outros modelos que geram a distribuio de Poisson generalizada so: a distribuio binomial negativa, a qual converge em probabilidade para uma distribuio de Poisson generalizada quando o nmero de tentativas vai para o infinito de tal forma que distribuio Quasi-binomial, em condies similares, quando e . = ; a tambm, neste caso, tanto a mdia

3.2. Definio

16

Seja X uma varivel aleatria discreta definida sobre todos os inteiros naturais e seja

um denotador da probabilidade que a varivel aleatria X assuma um valor especfico x. Nestas condies, a varivel aleatria X dita seguir a distribuio de Poisson Generalizada com parmetros e se: + , = 0, 1, 2, >

! 0 , > , max 1,

<0

(23)

e zero caso contrrio, onde

positivo para o qual a relao

independentes, mas os limites inferiores de e

> 0 , quando

menos cinco classes com probabilidades no-nulas quando

definiram, estudaram e discutiram algumas aplicaes da distribuio de Poisson Generalizada. Quando negativo, o modelo inclui um truncamento devido a a soma , , = 0 para todo , >

= 0, o modelo de Poisson Generalizado se reduz distribuio de Poisson. Consul e Jain

4 so impostos para assegurar que h pelo negativo. Perceba que, quando

1e

< 0 . Os parmetros

4 o maior inteiro e

so

, no caso geral e usualmente, menor que 1. Entretanto, esse erro de 4 e, portanto, este erro de truncamento no faz , por , onde:

truncamento menor que 0.5% quando

diferena em aplicaes prticas. A multiplicao de cada , =

(24)

foi sugerido para eliminao do erro de truncamento [4]. A mdia e a varincia so dadas por: = = , , 0 (25) 0

1 1

17

e, quando

distribuio de Poisson generalizada maior, igual ou menor do que a mdia levando em conta se Uma propriedade interessante desta distribuio reside no fato que de a convoluo de duas distribuies de Poisson generalizadas com parmetros + , , e , gera a mesma > 0, = 0 ou < 0, respectivamente.

= 0, = =

(caso de Poisson convencional). Perceba que a varincia da

distribuio com parmetros

. Consul caracterizou a distribuio pela propriedade

que, se a soma de duas variveis aleatrias independentes possui uma distribuio Lagrangiana de Poisson, ento cada uma em isolado tambm deve possui a distribuio Lagrangiana de Poisson. Outra propriedade interessante refere-se sua unimodalidade, caracterstica tambm apontada por Consul em suas pesquisas [9].

3.3. Funes Geradoras

A funo geradora de probabilidade parmetros ,

de uma distribuio de Poisson generalizada com

dada por uma expanso Lagrangiana com: G u = , =

(26)

A funo geradora de probabilidade pode tambm ser escrita na forma: G u = onde a funo definida pela relao: w u =

(27)

(28) = 1, e sua derivada dada por: (29)

A funo

equivale a zero em

= 0 e 1 em =

Fazendo =

seguindo a distribuio de Poisson generalizada como:

em (22), pode-se obter a funo geradora de momento para o modelo

18

(30)

3.4. Relaes de Recorrncias e Momentos < 1. Consul e

Todos os momentos existem da distribuio de Poisson generalizada para centrais, denotados por para o k-simo momento no central, vale: 1 E a relao = os + +

Shenton observaram e deduziram a seguinte relao de recorrncia para os momentos no-

, = 0, 1, 2, denotados

(31) por

entre

momentos

centrais,

, de uma distribuio de Poisson generalizada : = onde + 1 1 com e , = 1, 2, 3, substitudos por e

(32)

representa o momento central

respectivamente [4]. Alguns dos primeiros momentos so ilustrados abaixo (lembrando que o primeiro e segundo momentos centrais equivalem a mdia e a varincia. = =

3 1

1+2 1

1+8 +6 1

(33)

J, os ndices de obliquidade,representado por , e curtose, por , so dados por: 19

= =

1+8 +6 =3+ 1

1+2 1

(1)

Para qualquer valor de , a obliquidade de uma distribuio de Poisson generalizada reduz enquanto o valor de um dado valor de aumenta e atinge zero quando infinitamente alto. Alm disso, para

qualquer, a obliquidade infinitamente alta quando aproxima-se da e para todos os valores de entre 0 < < 1, a distribuio de 1 2 1 2 10 < < 10 6 3 6 3 < 1 2.

unidade. A obliquidade negativa para qualquer Para todos os valores de

Poisson generalizada leptocurtose se > 3. Quando:

(34)

que 3.

a distribuio de Poisson generalizada se torna platycurtose, uma vez que se torna menor

3.5. Estimativa

Considere uma amostra aleatria de n itens tomada de uma distribuio de Poisson generalizada e sejam x1, x2, ..., xn seus valores correspondentes. Se os valores da amostra so classificados em classes de frequncias e ni denotar a frequncia da i-sima classe, a soma da amostra y pode ser escrita como:

y= onde k a maior das observaes, =

= e =

(35)

a mdia amostral. A varincia

amostral dada por:

20

s =

1 1

1 1

(36)

O estimador mais utilizado o de mxima verossimilhana que pode ser obtido resolvendo, para encontrar o estimador de : 1 +

H J, para o estimador de obtida por:

(37)

= 1 Consul e Shoukri provaram que as estimativas para mxima verossimilhana

(38) >0e > 0 so

nicos quando a varincia amostral maior que a mdia amostral [10]. Alm disso, Consul e >0e < 0 so tambm nicos [11].

Famoye provaram que se a varincia amostral for menor que a mdia amostral, ento os estimadores de ML

3.6. Aplicaes

A distribuio de Poisson generalizada se relaciona com um grande nmero de problemas cientficos e, portanto, pode ser utilizada para descrever muitos fenmenos do mundo real. Entre alguns deles, podem ser citados os seguintes:

Limite de uma Distribuio Binomial Negativa Generalizada. O modelo discreto de probabilidade de uma distribuio binomial negativa generalizada, a qual ser ainda discutida neste documento, dada, na sua forma geral, por: = = + 1 , para = 0, 1, 2, > 0.

e zero, caso contrrio, onde 0 <

(39)

< 1 e 1 21

<1

Tomando

grandes e

pequeno, de tal forma que

distribuio binomial negativa generalizada pode ser aproximada por uma distribuio de Poisson generalizada [11]. Limite de uma Distribuio Quasi-Binomial. Quando foi elaborada o modelo de urnas dependentes de uma estratgia pr-determinada, Consul obteve uma distribuio quasi-binomial de trs parmetros. Se e = , ento foi provado que esta

, a

distribuio se aproxima de uma distribuio de Poisson generalizada [11].

Modelos baseado em Equaes Diferenciais. Consul tambm elaborou modelos baseado em equaes diferenciais, as quais geravam um modelo seguindo a distribuio de Poisson generalizada. Considere um infinito, mas contvel, nmero de espaos disponveis para bactrias ou vrus ou quaisquer outros micro-organismos. Seja a probabilidade de encontrar Suponha que a mdia , micro-organismos em um dado espao dada por + , .

para a distribuio de probabilidade de micro-organismos para , de tal forma que:

seja aumentada, modificando, para tanto, o parmetro , = , + ,

(40)

e:

para todos os valores

foi provado por Consul que

> 0 com a condio inicial

o modelo de probabilidade

0,

+ ,

(41) =1e 0, = 0, ento

configura uma distribuio de Poisson generalizada [4]. Processos de fila. Seja

= 0, 1, 2,

uma funo geradora de probabilidade seguindo uma

distribuio de Poisson com mdia , de tal forma que esta funo indique o nmero de clientes chegando com o intuito de utilizar algum tipo de servio em uma superfcie ou lugar e, finalmente, considere X como sendo uma varivel aleatria a qual aponta o nmero de clientes j esperando pelo servio na superfcie ou objeto antes do servio iniciar. Consul e Shenton provaram que o nmero de clientes servidos em um perodo de congestionamento da superfcie ou objeto segue uma distribuio de Poisson generalizada [4].

22

Processos de Herana de Caractersticas Genticas. Suponha que: (a) O nmero total de indivduos em um grupo seja grande; (b) A probabilidade de adquirir uma caracterstica especfica por um ser em um grupo seja pequena; (c) Cada um dos indivduos que tem uma caracterstica particular tornam-se uma fonte de espalhamento daquela caracterstica para os outros seres por um pequeno perodo de tempo; (d) O nmero de membros em um grupo onde um ser dotado de uma caracterstica particular e, portanto, espalhador de uma caracterstica tem grande chance dos membros do mesmo grupo tambm herdarem esta caracterstica.

Consul e Shoukri provaram que o nmero total de indivduos que possuem uma determinada caracterstica especfica, isto , o total de descendentes em um processo de herana gentica, segue uma distribuio de Poisson generalizada [12].

Processos de Termodinmica. Consul descreveu uma

maneira de descrever uma

distribuio de Poisson generalizada a partir de um processo termodinmico com taxas forward e backward. Sejam as taxas forward e backwards dadas, respectivamente, por: = + = +

(42)

as quais tornam-se menores se o valor de

aumentar. Sob estas taxas forward e

backwards, a distribuio de probabilidade do regime estacionrio de um processo de energia cintica de primeira ordem segue uma distribuio de Poisson generalizada. Schaeffer et al. Desenvolveram um link formal entre a distribuio de Poisson generalizada e processos de energia livre em termodinmica atravs do uso de modelos de cadeia de Markov e estimaram que a energia livre necessria para produzir quebras isocromticas ou dicntricas gira em torno de 3.67 DNA [12]. e 18.4 , o que est

em pleno acordo com as estimativas de energia livre necessria para a formao do

23

Aberraes cromossmicas. Os cromossomos so danificados uma ou mais vezes no processo de produo, e destes, zero ou mais so recuperados em um processo de restituio. Os cromossomos em boas condies formam uma fila no processo de produo e os cromossomos danificados, uma fila no processo de restituio. Janardan e Schaeffer mostraram que se X o nmero lquido de aberraes (cromossomos danificados) esperando por restituio na fila, ento a distribuio de probabilidade da varivel aleatria X segue uma distribuio de Poisson generalizada dada por (19). Foi sugerido que o parmetro na distribuio de Poisson generalizada representava uma constante de equilbrio a qual o limite da razo entre a taxa de induo e a taxa de restituio, e, portanto, a distribuio de Poisson generalizada pode ser utilizada para estimar a energia lquida disponvel para a produo de aberraes cromossmicas induzidas [15].

Janardan, Kerster e Schaeffer consideraram um conjunto de dados de aranhas, bichosde-conta, ovos de besouro e dados de ovos de ourio-do-mar. Eles mostraram que os padres observados poderiam ser facilmente explicados e descritos por modelos seguindo a distribuio de Poisson generalizada. Significados interpretativos foram dados para o parmetro e na distribuio [13].

Consul descreveu a utilizao da distribuio de Poisson generalizada para estudar acidentes de manobra em indstrias e ferimentos sofridos por indivduos dentro de sua prpria casa. Significados foram estipulados para os parmetros [14]. e nas aplicaes

O nmero de unidades de diferentes bens comprados por consumidores em um determinado perodo de tempo segue um modelo cuja distribuio uma Poisson generalizada. Consul sugeriu a seguinte interpretao para os parmetros: reflete o

potencial de venda de um produto e representa a taxa mdia de aceitao do produto pelos consumidores [14].

24

3.7. Simulaes

Nesta seo iremos desenvolver scripts e realizar simulaes para confrontar a validade dos nmeros aleatrios produzidos por aquele. Primeiramente, iremos implementar o script o qual uma verso modificada, mais genrica, com possibilidade de criao de qualquer quantidade de nmeros aleatrios, da verso proposta em [16]. O Script 5 ilustra isto.

% Gerao de nmeros aleatrios seguindo a distribuio de Poisson % Generalizada % Parmetros de entrada: %% theta representa o primeiro hiper-parmetro da distribuio %% lambda representa o segundo hiper-parmetro da distribuio %% N representa a quantidade de nmeros aleatrios no vetor de sada v function [v] = gerarVetorAleatorioPoissonGeneralizada(theta, lambda, N) v = []; i = 0; while(i < N) w = exp(-lambda); x = 0; s = exp(-theta); p = s; randomNumber = unifrnd(0, 1, 1); while(randomNumber > s) x = x + 1; c = theta - lambda + lambda * x; p = w * c * (1 + lambda / c)^(x - 1) * p / x; s = s + p; end v = horzcat(v, x); i = i + 1; end end % Mtodo retirado e modificado de Springer, Lagrangian Probability % Distribution, pg. 324
Script 5: Gerao de nmeros aleatrios seguindo uma distribuio de Poisson Generalizada.

Todas as simulaes nesta seo sero feitas com N fixado em 10000. A Figura 7 ilustra o resultado para =2e = 0. Note que este grfico se reduz a uma Poisson(2), devido ao = 0.2 . Este parmetro =2e

parmetro ser 0. J a Figura 8, demonstra o resultado para uma Poisson Generalizada de fato, com parmetros =2e demonstra a no-uniformidade dos

eventos com o transcorrer do tempo, conforme visto nas sees anteriores. A Figura 9, por sua vez, plota o resultado para parmetros = 0.5. Note que a distribuio de massa de

probabilidade fica cada vez mais esparsa. Em caso extremo, finalmente, a Figura 10 ilustra o 25

resultado da simulao para

at x = 50, mostrando a grande disperso que foi ocasionada pelo grande valor de , o qual equivale a 50% do valor de .

=2e

1. Note que h uma quantidade de massa significativa

Figura 7: Resultados da simulao para Poisson Generalizada(Theta = 2, Lambda = 0) com N = 10000.

Figura 8: Resultados da simulao para Poisson Generalizada(Theta = 2, Lambda = 0.2) com N = 10000.

26

Figura 9: Resultados da simulao para Poisson Generalizada(Theta = 2, Lambda = 0.5) com N = 10000.

Figura 10: Resultados da simulao para Poisson Generalizada(Theta = 2, Lambda = 1) com N = 10000.

27

4. Distribuio Binomial Negativa Generalizada

4.1. Definio e Introduo

Uma varivel aleatria parmetros ,

dita possuir a Distribuio Binomial Negativa Generalizada com

se sua funo de massa de probabilidade dada por: , , = + < 1, 1

para

Alm disso, quando

= 0, 1, 2, 3, e zero, caso contrrio, onde 0 < = 0, o parmetro

(43) > 0.

um inteiro positivo. O modelo de probabilidade

(43) se reduz para uma distribuio binomial quando binomial quando

momento de Distribuio Binomial Negativa Generalizada [17].

= 1. Johnson, Kotz e Kemp entitularam o modelo objeto de estudo no

= 0 e para uma distribuio negativa

= 0 ou 1

O modelo de Distribuio Binomial Negativa Generalizada foi definido , estudado e aplicado por Jain e Consul [18], entretanto, na definio de domnio do parmetro possibilidade do mesmo assumir valores em 0, 1 , assim como para valores negativos. Para valores negativos de , a Distribuio Binomial Negativa Generalizada fica truncada e as probabilidades no somam a unidade. Em um estudo no publicado de Consul e Famoye, estes mostraram que para valores pequenos de , valores os quais a funo massa de probabilidade (43) ainda fique positiva, o erro de truncamento atinge, no mximo, 5%. O erro fica menor que o erro de truncamento devido ao processo de amostragem, exceto quando amostras de grande tamanho (mais de centenas) so tomadas [19]. A Distribuio Binomial Negativa Generalizada um membro da classe de distribuies lagrangiana ; ; e tambm um membro de todas as suas subclasses [16]. Pode-se , eles excluram a

mostrar que a mdia e a varincia de uma Distribuio Binomial Negativa Generalizada dada por: = 1 = 1 1

(44)

que existe para 1

. Alm disso, o modelo existe para

varincia no existem, neste caso. 28

= 1, mas a sua mdia e

4.2. Funes Geradoras

De acordo com os resultados demonstrados em [16], a funo geradora de probabilidade de uma Distribuio Binomial Negativa Generalizada dada por: = = 1 + , = 1 +

(45)

para todos os valores de parmetros. Outra funo geradora para uma Distribuio Binomial Negativa Generalizada : = onde: = 1 1 = 1 1

(46)

(47)

Portanto, a Distribuio Binomial Negativa Generalizada um dos poucos modelos de probabilidades que pode ser gerada a partir de dois conjuntos distintos de equaes.

4.3. Momentos, Cumulantes e Relaes de Recorrncia

Todos os momentos da Distribuio Binomial Negativa Generalizada em (43) existem para 1 . Jain e Consul obtiveram os primeiros quatro momentos no-centrais utilizando a

seguinte relao de recorrncia: 1 =

= para = 1, 2, 3, , e onde

+ , .

(48)

a funo de parmetros

O r-simo momento no-central de uma Distribuio Binomial Negativa Generalizada dado por:

29

(49)

Diferenciando a equao (49) com respeito ao parmetro , obtemos: = Portanto, 1 1 = 1 1 , ,

(50)

(51)

E, enfim, uma relao de recorrncia entre os momentos no-centrais dada por: = 1 1 +

(52)

Ali-Amidi mostrou que uma relao de recorrncia entre os momentos centrais de uma Distribuio Binomial Negativa Generalizada escrita por: 1

= para = 2, 3, 4, .

(53)

A relao de recorrncia em (53) tambm pode ser transcrita como: = 1 1 +

(54)

para

= 1, 2, 3, .

A partir das equaes de momento apresentadas, fica possvel realizar o clculo das medidas de obliquidade, , e curtose, , as quais so dadas por: 30

e =3+ 16 +6

= +2

12 + 1

(55)

49 +4 + 66 + 1 1

(56)

aproxima-se da unidade, do zero ou de 1

Alm disso, para pequenos valores de , a obliquidade infinitamente grande quando . A obliquidade se torna negativa quando: < 2 1 2

Para qualquer valor de , a obliquidade do modelo de Distribuio Binomial Negativa Generalizada reduz se o valor de aumentar e se torna zero quando infinitamente grande.

(57)

Uma vez que o segundo termo de (56) sempre positivo se > 0 , a curtose sempre maior que 3 e, portanto, o modelo de Distribuio Binomial Negativa Generalizada leptocurtose quando > 0.

4.4. Aplicaes

A Distribuio Binomial Negativa Generalizada um modelo verstil e foi derivado por vrios distintos pesquisadores sob diversas condies de pesquisa. Alguns deles modelos descobertos sero elencados a seguir.

Modelos de Caminhada Aleatria. Suponha que = 1

probabilidade 1 . Considere que a probabilidade que o tempo de primeira passagem atravs de passagem atravs de = 1, 2, . Se com ; , , . Mohanty mostrou que se = 0, ; , 0,

instante do processo, possa se mover ou para 1 com probabilidade

= 1. Considere uma caminhada aleatria onde a partcula, em qualquer ou para +1 com

seja um inteiro, por exemplo,

denotar a probabilidade do tempo de primeira uma

distribuio binomial negativa:

31

onde =

fim dado por:

de caminhos de 0, 0 para

, com exceo do fim. Mohanty tambm provou que para + , que no tocam a linha +

o nmero de caminhos de 0, 1 para

; , 0,

, = 0, 1, 2, ,

(58)

que no tocam a linha = 1, o nmero = + exceto no

(59)

Utilizando (59), a distribuio de probabilidade do tempo de primeira passagem dada por: ; , 1, = + 1

(60)

o que nada mais a Distribuio Binomial Negativa Generalizada.

Modelo de Filas. Suponha que j existam

clientes esperando por servio em um

servidor de filas nico, o qual suposto acabar de iniciar. Considere tambm que o processo de os clientes chegarem durante o perodo de servio dos k clientes iniciais siga uma distribuio binomial com parmetros e, adicionalmente, a poltica de

ingresso obedea condio de FCFS (First come, first served). O primeiro perodo de congestionamento terminar quando o servidor ficar ocioso. Alm disso, suponha que o nmero uma varivel aleatria binomial com parmetros . Consul e Shenton

mostraram que a distribuio de probabilidade , o nmero de clientes servidos no

primeiro perodo de congestionamento, uma distribuio dupla-binomial, conforme a equao: P Y = 0, i. e. quando o perodo de congestionamento terminar = 1 e:

(61)

32

P Y=y = para

1 = min ,

binomial em (62) obtida utilizando

= 1, 2, 3, , onde

1 1

1 1

(62)

Generalizada como um modelo de filas [21].

= . Isto produz a Distribuio Binomial Negativa

. Um caso especial para a distribuio dupla-

Modelo de Urna. Sejam duas urnas, demarcadas com A e B. A urna A contm um nmero fixo de bolas brancas e um nmero fixo de bolas pretas, de tal forma que a pegar uma bola branca, 1 . A urna B deixada inicialmente vazia. Quando uma bola probabilidade de pegar uma bola preta, com reposio, seja e a probabilidade de

escolhida aleatoriamente da urna A, ou seja, sem ter sido vista pelo jogador, outra bola da mesma cor colocada na urna B. O jogador observa as seguintes 3 condies: (i) O jogador escolhe uma estratgia, escolhendo um nmero inteiro positivo um outro nmero no-negativo . (ii)

Ao jogador permitido retirar bolas da urna A uma a uma, d-las, sem as ver, para o juiz, o qual, por sua vez, as retorna toda vez para a urna A e coloca uma outra bola da mesma cor na urna B. O jogador continua neste processo de retirada de bolas at que o nmero de bolas brancas na urna B exceda 1

vezes o nmero de bolas pretas na urna B. O jogador perde o jogo to logo que esta condio seja violada. (iii)

O jogador ser declarado vitorioso no jogo se ele parar quando o nmero de bolas pretas e o nmero de bolas brancas na urna B sejam exatamente igual a e + 1 , respectivamente.

A probabilidade de realizar a condio (iii) dada por: P X = x = f x, y onde = + , 1 1 (63)

o nmero de sequncias em que a quantidade de bolas brancas na urna B sempre excede 1 + 1 . Por meio da utilizao destas , > 1

condies no jogo, Famoye e Consul obteram o seguinte resultado: f x, y = +

(64)

33

Usando

o jogo dada por:

em (64), chegamos que a probabilidade de um jogador ganhar +

P X=x =

(65)

o que nada mais que a Distribuio Binomial Negativa Generalizada [22]. Distribuio do peso molecular em polmeros. A Distribuio Binomial Negativa Generalizada tem um importante uso na qumica no que tange reaes de polimeralizao onde as substncias formadas so, de modo geral, classificadas em cadeias lineares singulares ou no-singulares. A distribuio de peso molecular pode ser convenientemente representada por uma Distribuio Binomial Negativa Generalizada. Gordon derivou uma distribuio de polmeros singulares por meio da utilizao de teorias de cascatas aplicadas em processos estocsticos [23]. Yan tambm usou a teoria de cascatas para processos estocsticos para obter uma distribuio Stockmayer univariada, com o intuito de descrever a condensao das cadeias de polmeros com uma distribuio de tamanho inicial qualquer. Os polmeros primrios so chamados cadeias e os agregados so formados depois de haver um cross-linking, os quais denominam-se moleculas [24].

4.5. Simulaes

Nesta seo, sero realizadas vrias simulaes por meio da troca dos 3 parmetros da funo de Distribuio Binomial Negativa Generalizada. Iniciamos, pois, com o script gerador de nmeros aleatrios que seguem este tipo de distribuio. O Script 6 ilustra isto.
% Gerao de nmeros aleatrios seguindo a distribuio de Borel % Parmetros de entrada: %% lambda representa o primeiro hiper-parmetro da distribuio %% beta representa o segundo hiper-parmetro da distribuio %% m representa o terceiro hiper-parmetro da distribuio %% N representa a quantidade de nmeros aleatrios no vetor de sada v function [v] = gerarVetorAleatorioBorel(lambda, beta, m, N) v = []; i = 0; while(i < N)

34

w = theta * (1 - theta)^(beta - 1); x = 0; s = (1 - theta)^(m); p = s; u = unifrnd(0, 1, 1); if(u <= s) v = horzcat(v, x); else x = x + 1; p = w * m * p; s = s + p; if(u <= s) v = horzcat(v, x); else while(u > s) x = x + 1; c = 1; for(j = 1:1:x - 1) c = c * (1 + beta / (m + beta * x - beta - j)); end p = w * c * (m + (beta - 1) * (x - 1)) * p / x; s = s + p; end v = horzcat(v, x); end end i = i + 1; end end % Mtodo retirado de Springer, Lagrangian Probability Distribution, pg. 329
Script 6: Sequncia de comandos para gerao de nmeros aleatrios seguindo a distribuio binomial negativa generalizada.

Perceba que esta distribuio deve seguir as seguintes restries 0 < primeira simulao, tomamos 1 e > 0. Alm disso, quando = 0.5, = 1.5 = 0, o parmetro

Figura 11. Adicionalmente, como segunda simulao, sabemos que para = 0.5, = 1.5

= 10. O resultado da simulao dado na

um inteiro positivo. Como

< 1,

= 0 ou

reduz ao modelo binomial. Iremos verificar isto por meio de uma simulao, tomando

que o modelo realmente segue a distribuio binomial. Analiticamente, a mdia dos valores aleatrios produzidos dado por 5.108 e a varincia, 2.5027, valores os quais se assemelham muito aos valores tericos da binomial convencional, as quais, a ttulo de exemplificao, valem = = 10 0.5 = 5 e = 1 = 10 0.5 0.5 = 2.5 . Como terceira e ltima

= 10, a qual mostrada na Figura 12. De fato, pela simetria podemos ver

= 0, o modelo se

simulao mostraremos a reduo deste modelo para a binomial negativa, a qual pode ser gerada se tomarmos = 1. De fato, como mostrado na Figura 13, ele realmente se assemelha 35

muito a uma binomial negativa. Analiticamente, temos que a mdia da amostra aleatria gerada equivale a 10.0631, enquanto que a varincia, 20.2709. Mister se faz destacar que o valor terico exato destas duas quantidades so dados por: 0.5 1 0.5

e:

10

10

(66)

10

0.5 0.5

20

(67)

Pelos resultados prticos expostos e pelos valores tericos calculados, ambos bem prximos, evidente que a veracidade do algoritmo criado no Script 6 procede.

Figura 11: Resultado da simulao para gerao de 10000 nmeros aleatrios seguindo a distribuio binomial negativa generalizada com parmetros . , . .

36

Figura 12: Resultado da simulao para gerao de 10000 nmeros aleatrios seguindo a distribuio binomial negativa generalizada com parmetros =0.5,=0 e m=10. Note que o modelo se reduz para a distribuio Binomial convencional.

Figura 13: Resultado da simulao para gerao de 10000 nmeros aleatrios seguindo a distribuio binomial negativa generalizada com parmetros =0.5,=1 e m=10. Note que o modelo se reduz para a distribuio Binomial Negativa convencional.

37

5. Srie Logartmica Generalizada

5.1. Introduo e Definio

Uma varivel aleatria discreta

dita seguir a Distribuio da Srie Logartmica Generalizada

se sua funo de probabilidade dada por: 1 , = 1, 2, 3, ln 1 0, 1

, onde 0 < <1e1 <

(68)

. Quando

para uma distribuio da srie logartmica convencional. A Distribuio da Srie Logartmica Generalizada pertence s distribuies da classe Lagrangiana.

= 1, a funo de probabilidade em (68) se reduz

5.2. Funes Geradoras

A funo geradora de probabilidade da Distribuio da Srie Logartmica Generalizada dada por: = ln 1 . = = +

(69)

onde

Por meio da utilizao de

em (69), podemos obter a funo geradora de

momento para a Distribuio da Srie Logartmica Generalizada, a qual denotada por: = ln 1 + , = + ln 1 +

(70)

Outra funo geradora de probabilidade para uma Distribuio da Srie Logartmica Generalizada dada por: = = 1 1 38 , = 1 1

(71)

Correspondentemente, podemos obter a funo geradora de momento a partir de (71): = 1 1 , = + 1 1 1

(72)

5.3. Momentos, cumulantes e relaes de recorrncia Todos os momentos da Distribuio da Srie Logartmica Generalizada existem para 1 . O k-simo momento no-central em relao origem pode ser escrito como: = = 1 1 ln 1 <

(73)

Diferenciando (73) com respeito a , chegamos a: d d Portanto, = 1 1 d d + , = 1, 2, 3, = 1 1

(74)

(75)

J o k-simo momento central da Distribuio da Srie Logartmica Generalizada dado por: = 1 1 ln 1

(76)

Diferenciando (76) e realizando algumas manipulaes algbricas, podemos chegar a: = 1 1 d d + , = 2, 3,

(77)

39

5.4. Aplicaes A Distribuio da Srie Logartmica Generalizada til em reas de pesquisa onde a distribuio de srie logartmica aplicada. A Distribuio da Srie Logartmica Generalizada pode ser utilizada para a distribuio de espcies de animais para representa o crescimento populacional. Jain e Gupta usaram a Distribuio da Srie Logartmica Generalizada para modelar o nmero de publicaes escritas por bilogos [25]. Hansen e Willekens mostraram que, pelo menos assintoticamente, a Distribuio da Srie Logartmica Generalizada uma verso discretizada da distribuio da Gaussiana inversa. Alm disso, os autores consideraram a aplicao da Distribuio da Srie Logartmica Generalizada em teoria de riscos. Suponha uma companhia de seguros tenha um portfolio no qual = 1, 2, 3, ocorra em pontos consecutivos = 1, 2, . Assumindo que representem

exponenciais negativas independentes com parmetro e que

seja uma sequncia de ,a

variveis aleatrias independentes com a mesma distribuio , mas independentes de distribuio do tamanho total recuperado pelo portfolio no tempo t dado por: = onde

1 !

(78)

a convoluo da k-sima potncia de . Hansen e Willekens assumiram que

era

uma Distribuio da Srie Logartmica Generalizada e obtiveram que a distribuio do total recuperado pelo portfolio era dada por: 1 1 (1 ) 1 log(1 ) ) log(1

P( onde (68).

= )=

( , )

(79)

( , ) representa a Distribuio da Srie Logartmica Generalizada, conforme equao

5.5. Simulaes

Nesta seo sero realizadas diferentes simulaes no mbito de gerao de amostras aleatrias seguindo a Distribuio da Srie Logartmica Generalizada para diferentes hiperparmetros. 40

Inicialmente, o Script 7 ilustra a sequncia de passos necessrias para criar uma amostra aleatria de tamanho . Note que alm do tamanho da amostra, a funo aceita os parmetros e , os quais nada mais representam que o da equao (68).

% Gerao de nmeros aleatrios seguindo a distribuio de Srie Logartmica Generalizada % Parmetros de entrada: %% theta representa o primeiro hiper-parmetro da distribuio %% beta representa o segundo hiper-parmetro da distribuio %% N representa a quantidade de nmeros aleatrios no vetor de sada v function [v] = gerarVetorAleatorioSerieLogaritmica(theta, beta, N) v = []; i = 0; while(i < N) w = theta * (1 - theta)^(beta - 1); x = 1; s = w / (-log(1 - theta)); p = s; u = unifrnd(0, 1, 1); while(u > s) x = x + 1; c = 1; for(j = 1 : 1 : x - 1) c = c * (1 + beta / (beta * x - beta - j)); end p = w * c * (beta - 1) * (x - 1) * p / x; s = s + p; end v = horzcat(v, x); i = i + 1; end end % Mtodo retirado de Springer, Lagrangian Probability Distribution, pg. 332
Script 7: Sequncia de passos para gerao de nmeros aleatrios seguindo a distribuio da Srie Logartmica Generalizada.

Para todas as simulaes que aqui sero realizadas, fixaremos satisfazer 0 < <1e1 < , em que quando

conforme foi visto na seo de definio desta distribuio, os hiper-parmetros devem

se reduz para uma distribuio da srie logartmica convencional.

= 1, a funo de probabilidade em (68)

= 10000. Mister faz notar que,

Para as simulaes, primeiramente, fixaremos o valor de , variando

para analisar como o = 0.5 = 1.5 . aumenta.

histograma da amostra aleatria se comporta. Tendo isto em mente, a Figura 14 ilustra o resultado para os parmetros = 0.5 = 1.1. J a Figura 15, para = 0.5 = 1.8. Fica evidente que

Finalmente, a Figura 16 demonstra o resultado obtido para

a massa de nmeros aleatrios fica expressiva em um intervalo maior, conforme 41

Note que para 1.5, em 0 0 50 .

= 1.1, grande massa est concentrada entre 0 10 e, por ltimo, para

2 , enquanto que para

1.8, onde a massa atinge expressividade entre

Como ltimas simulaes, realizaremos testes para ver como a amostra aleatria se comporta para valores prximos do extremo de . Vale notar que devido restrio paramtrica, 1 , nem sempre haver possibilidade de fixar o valor de , variando . A Figura 17 0.1 1.5 e a Figura 18, para 0.9 1.1. Fica fcil aumenta, h

ilustra este resultado para

tambm perceber que nesse caso, como tambm aconteceu no anterior, quando uma maior disperso de dados aleatrios.

Figura 14: Resultado da simulao realizada da distribuio de Srie Logartmica Generalizada com os parmetros =0.5 e =1.1.

42

Figura 15: Resultado da simulao realizada da distribuio de Srie Logartmica Generalizada com os parmetros =0.5 e =1.5.

Figura 16: Resultado da simulao realizada da distribuio de Srie Logartmica Generalizada com os parmetros =0.5 e =1.8.

43

Figura 17: Resultado da simulao realizada da distribuio de Srie Logartmica Generalizada com os parmetros =0.1 e =1.5.

Figura 18: Resultado da simulao realizada da distribuio de Srie Logartmica Generalizada com os parmetros =0.9 e =1.1.

6. Quase-tipo v.a.

% Gerao de nmeros aleatrios seguindo a distribuio de QuaseBinomial % Parmetros de entrada:

44

%% p representa o primeiro hiper-parmetro da distribuio %% phi representa o segundo hiper-parmetro da distribuio %% m representa o segundo hiper-parmetro da distribuio %% N representa a quantidade de nmeros aleatrios no vetor de sada v function [v] = gerarVetorAleatorioQuasiBinomial(p, phi, m, N) v = []; i = 0; while(i < N) w = p - phi; x = 0; s = (1 - p)^(m); p = s; while(u > s) x = x + 1; c = (1 + phi / (w + x * phi))^(x - 1) * (1 - phi / (1 - w x * phi))^(m - x); p = c * (m - x + 1) * (w + x * phi) * p / (x * (1 - w - x * phi)); s = s + p; end v = horzcat(v, x); i = i + 1; end end % Mtodo retirado de Springer, Lagrangian Probability Distribution, pg. 334
Script 8: Sequncia de passos para gerao de nmeros aleatrios seguindo a distribuio da Quasi-Binomial.

TOMA N = 100000 pra d certo

Figura 19: Resultado da simulao realizada da distribuio de Srie Logartmica Generalizada com os parmetros p = 0.4, = 0.01 e m = 10.

45

Figura 20: Resultado da simulao realizada da distribuio de Srie Logartmica Generalizada com os parmetros p = 0.4, = 0.02 e m = 10.

Figura 21: Resultado da simulao realizada da distribuio de Srie Logartmica Generalizada com os parmetros p = 0.4, = 0.03 e m = 10.

46

REFERNCIAS [1] Dr. R. P. Gupta, Dr. G. C. Jain, Some Applications of a Bivariate BOREL-TANNER Distribution. [2] Johnson F. Yan, Cross-Linking of Polymers with a Primary Size Distribution, Weyerhaeuser Company - Weyerhaeuser Technology Center, 1978. [3] Tanner, J. C. (1953) A problem of interference between two queues. Biometrika, 40, 5869. [4] Consul, P. C. and Famoye, F. (2006) Lagrangian Probability Distributions, Boston: Birkhauser. [5] Weisstein, Eric W., "Pearson's skewness coefficients" Mathworld [6] Nobuaki Hoshino, On a limiting quasi-multinomial distribution, Faculty of Economics, Kanazawa University, August 2005 [7] Paulo C. Hubert Jr., Marcelo S. Lauretto, Julio M. Stern, FBST for Generalized Poisson Distribution [8] P. C. Consul, Generalized Poisson Distributions, CRC, Florida, USA, 1988. [9] Johnson N. L., Kemp A. W., Kotz S., Univariate Discrete Distribution, Wiley Series in Probability and Statistics, Wiley, Terceira Edio. [10] P. C. Consul, On the distributions of order statistics for a random sample size, Statistica Neerlandica, 38:249-256, 1984. [11] P. C. Consul, On some models leading to the generalized Poisson distribution, Communications in Statistics Theory and Methods, 17:423-424. [12] P. C. Consul e M. M. Shoukri, Some chance mechanisms related to a generalized Poisson probability model, American Journal of Mathematical and Management Sciences, 8:181 202, 1988. [13] K. G. Janardan, H. W. Kerster e D. J. Schaeffer, Biological applications of the Lagrangian Poisson distribuition, Bioscience, 29:599 602. [14] P. C. Consul, Generalized Poisson Distributions: Applications and Properties, Marcel Dekker Inc. New York, 1989. [15] K. G. Janardan e D. J. Schaeffer, Models for the analysis of chromosomal aberrations in human leukocytes, Biometrical Journal, 19:599 612. [16] Springer, Lagrangian Probability Distributions, 2005 [17]N.L. Johnson, Samuel Kotz and Adriene W. Kemp, Univariate Discrete Distributions. John Wiley & Sons, Inc., New York., Second edition, 1992. [18]G.C. Jain and P.C. Consul, A generalized negative binomial distribution, SIAM Journal of Applied Mathematics, 21:501513, 1971. [19]P.C. Consul and F. Famoye, Type I error in estimation and its control, Unpublished Research Work, 1985. [20]S.G. Mohanty, Lattice Path Counting and Applications, Academic Press Inc., New York, 1979. [21]P.C. Consul and L.R. Shenton, On the probabilistic structure and properties of discrete Lagrangian distributions. In G.P. Patil, S. Kotz, and J.K. Ord, editors, Statistical Distributions in Scientific Work, 1: Models and Structures, pages 4157. D. Reidel Publishing Company, Boston, MA, 1975.

47

[22]P.C. Consul and F. Famoye, The truncated generalized Poisson distribution and its estimation. Communications in Statistics Theory and Methods, 18:36353648, 1989. [23]M. Gordon, Goods theory of cascade processes applied to the statistics of polymer distributions, Proceedings of the Royal Statistical Society of London, Series A, 268:240256, 1962. [24]J.F. Yan, Cross-linking of polymers with a primary size distribution, Macromolecules, 12:260264, 1979. [25]G.C. Jain and R.P. Gupta, A logarithmic series type distribution, Trabajos de Estadstica, 24:99105, 1973. [26]B.B. Hansen and E. Willekens, The generalized logarithmic series distribution, Statistics and Probability Letters, 9:311316, 1990. [27]

48

Вам также может понравиться