Вы находитесь на странице: 1из 4

Determinao do tamanho da amostra em pesquisas experimentais na rea de sade

Gasto Rbio de S Weyne*


Resumo No presente trabalho so apresentados e discutidos alguns mtodos para determinao do tamanho da amostra para atributos e para variveis, operando-se com dados pareados e no-pareados, visando validade estatstica de trabalhos de pesquisa experimental na rea da sade. Os mtodos conduzem a valores mnimos do tamanho da amostra, calculados por equaes matemticas, que devem ser coerentemente majorados de acordo com as condies dos experimentos. So apresentados e discutidos exemplos ilustrativos para melhor entendimento dos mtodos sugeridos. Unitermos Tamanho de amostra; estatstica.

Reviso Artigo de Reviso

Abstract This paper introduces statistical methods for calculating the appropriate sample size for comparing two independent groups of subjects (parallel group design), or for comparing paired observations (paired or crossover group design). These methods includes categorical or qualitative data (attributes) and numerical or quantitative data (variables). The main idea behind the sample size calculations is to improve the reliability and credibility of the findings from health field research, giving some guarantee that the statistical aspects have been handled well or even validly. Keywords Sample size; statistics.

Introduo
A determinao do tamanho da amostra em trabalho de pesquisa experimental na rea de sade, ou seja, a seleo do nmero de pacientes a serem utilizados nesta tarefa, de significativa importncia, considerando-se que a correo desta determinao d validade estatstica ao experimento e condio bsica primordial para a aceitao de trabalhos na comunidade cientfica. Em razo da experincia vivida pelo autor, as perguntas iniciais mais freqentes, feitas, s vezes, at aps a concluso da coleta de dados, nesta rea, esto, geralmente, entre as seguintes: a) O tamanho da amostra escolhido no meu trabalho est correto? b) Quando eu iniciar o meu trabalho, qual o tamanho da amostra que deverei utilizar?

c) Em razo do tamanho da amostra que utilizei, os resultados obtidos tm significncia estatstica? d) Com o tamanho da amostra utilizado, como devem ser correlacionados os dados disponveis? d) Com o tamanho da amostra que utilizei, o meu trabalho pode ser aceito? O que tenho a corrigir para a aceitao? No resta dvida, portanto, de que o problema da determinao do tamanho da amostra considerado de fundamental relevncia, basicamente, porque a rea de sade apresenta particularidades de tal especificidade que o tratamento a ser dispensado coleta e anlise de dados requer um procedimento especial. Isto se justifica porque a complexidade do ser humano incomparavelmente maior que as dificuldades que se apresentam, por exemplo, na rea de cincias exatas, com mquinas e/ou computadores. Para caracterizar esta complexidade, veja-se que o ser humano constitudo, aproximadamente, por 30.000 genes e que, no crtex cerebral, existem cerca de 9,2 x 109 clulas nervosas interconectadas2. Estes nmeros, extremamente elevados, levam a concluir sobre a marcante complexidade do organismo humano. Por outro lado, verifica-se que, nos seres humanos, a tolerncia bioestatstica , numericamente, muito ampla. Duas pessoas que tm, cada uma delas, por exemplo, ndices glicmicos de 85 e de 110 mg/dL (diferena de 25 mg/dL), so indivduos considerados normais, o mesmo acontecendo com dois pacientes que, individualmente, apresentem presses sistlicas de 100 mmHg e 120 mmHg (diferena de 20 mmHg). Estes valores representam uma ampla tolerncia, aceita na rea de sade, que no admitida, a ttulo de ilustrao, na rea de engenharia, cincia na qual, por exemplo, uma pea somente poderia ser aceita se a diferena entre sua medida e a medida de um padro (valor nominal) no excedesse a 1 micrmetro (10 -6 m). Esta ampla tolerncia em cincias da sade concorre, substancialmente, como se ver adiante, para que as amostras nesta rea sejam muito pequenas em relao a outras reas, como a de engenharia. Por esta razo, enquanto a ordem de grandeza para uma amostra na rea de sade poderia ser, por exemplo, de 30 pacientes (N = 30), na rea de engenharia poderia ser aceita uma amostra de 1.000 peas (N = 1.000).

* Livre-Docente pela Escola Politcnica da USP e Professor Titular do Curso de Cincias Farmacuticas da F aculdade de Medicina do ABC.

Arq. Med. ABC

v. 29

no 2 Jul/Dez 2004

87

Perguntas que antecedem os clculos do tamanho da amostra


No desenvolvimento de um trabalho de pesquisa na rea da sade, particularmente na determinao do tamanho da amostra a ser usada, necessrio se faz que sejam formuladas e respondidas algumas perguntas bsicas, entre as quais citam-se as seguintes:

1) A pesquisa vai lidar com uma varivel ou com um atributo?


Uma varivel pode assumir diferentes valores, oscilando em torno de um valor mdio (ou valor nominal), limitando-se superior e inferiormente por uma tolerncia e sendo caracterizada por uma medida definida por um nmero. Logo, trata-se de um conceito quantitativo. Uma varivel X, portanto, pode ser dada por X = valor nominal tolerncia. Como exemplo, admita-se que X um ndice glicmico (expresso em mg/dL). Se X = 110 15, significa que Xmx = 125 mg/dL e Xmn = 95 mg/dL. Como exemplos de variveis bioestatsticas, pode-se citar: 1) presso sistlica de 120 mmHg; 2) peso do indivduo igual a 78 kg; 3) ndice glicmico de 110 mg/dL; 4) temperatura corporal de 36,5 o C; 5) altura da pessoa igual a 1,75 m; 6) dimetro de vaso igual a 3,25 mm; 7) umidade de 0,016 g de gua/g de ar seco; 8) presso atmosfrica de 101,35 kPa; 9) nvel de colesterol total de 190 mg/dL. O atributo, tambm chamado de varivel categrica, uma qualidade dicotmica, que define um sim ou um no, sendo, portanto, um conceito qualitativo. Ao contrrio da varivel, o atributo no assume diferentes valores que oscilam em torno de um valor mdio. Citamse, como exemplos de atributos, as seguintes questes que apresentam alternativas: 1) O paciente est ou no febril? 2) Joo est ou no imunizado? 3) A lmpada acende ou no? Nestas situaes, no h meio termo ou tolerncia. No seria razovel, portanto, dizer que um paciente estaria 20% imunizado. No entanto, um atributo pode ser quantificado por uma frao de sucesso (ou de insucesso). Exemplos: 1) uma vacina A, sendo considerada eficiente se imunizar 80% dos vacinados; 2) um lote B aceitvel de lmpadas quando contenha, no mximo, 0,01% de unidades queimadas. Um atributo pode tambm ser quantificado com atribuio de pesos ou escores, dando-se pesos maiores, obviamente, para os atributos de maior importncia no trabalho experimental. Exemplo: na pesquisa de um paciente tendncia de acidentes vasculares cerebrais, possivelmente poder-se-ia atribuir peso 3 a fatores hereditrios e peso 2 ao tipo de alimentao do paciente em determinadas circunstncias.

um tratamento. So caracterizados por se referirem a uma mesma amostra, testada antes e depois de um certo procedimento. Os dados no-pareados so simultneos e correspondem a dois grupos de pesquisa: o grupo de controle e o grupo experimental. Neste caso, o tamanho da amostra, calculada matematicamente como ser mostrado, deve ser multiplicado por 2, admitindo-se que o nmero de participantes dos dois grupos seja o mesmo, o que, em geral, pode ocorrer.

3) Qual o intervalo de confiana na pesquisa?


A preciso das pesquisas na rea de sade admite, usualmente, um erro de 5%, o que equivale a dizer que o intervalo de confiana dos testes de 95%. Utilizando a distribuio normal com estes dados, o nmero de desvios-padro 1,96. Observe-se que, quanto maior o intervalo de confiana, maior o nmero de desvios-padro e maior o tamanho da amostra, uma vez que o erro dever ser menor. A ttulo de exemplo, enquanto na rea de engenharia trabalha-se com intervalo de confiana de 99,74% (trs desvios-padro e erro de 0,26%), na rea de sade utiliza-se, como j se fez meno, um intervalo de confiana de 95% (1,96 desvio-padro e erro de 5%).

4) A medida a ser realizada tem preciso e exatido?


A preciso e a exatido (ou acurcia) do teste so fatores de significncia no clculo do tamanho da amostra. A preciso de uma medida caracterizada pela reprodutibilidade, situao em que os testes resultam em medidas sempre muito prximas umas das outras e depende do processo usado, como o caso de uma balana precisa, que acusa sempre a mesma medida, mesmo estando viciada (descalibrada). A medida dita exata (ou com acurcia) quando se aproxima satisfatoriamente do valor real dado por um padro, logo, uma medida exata ou acurada tem um compromisso com a verdade.

5) O teste tem sensibilidade? um teste especfico?


A sensibilidade de um teste a capacidade do teste para detectar uma doena quando ela est presente. Na triagem, todos os doentes e alguns no- doentes podem ser indicados. A especificidade de um teste mostra que, no ocorrendo a doena, o teste sempre acusar a no existncia da enfermidade. Em outras palavras, a especificidade a capacidade do teste em indicar a ausncia de uma doena quando ela no est presente. Os no-doentes so, portanto, excludos de suspeita.

Equaes bsicas e exemplos Equao para variveis


Sendo X um valor da varivel, X a mdia dos valores desta varivel, s o desvio-padro da amostra e N, o tamanho da amostra, tem-se, pela distribuio de Student, vlida para pequenas amostras (N = 30):

2) Os dados so pareados ou no pareados?


Os dados pareados so dados sucessivos, como os resultantes da situao fsica de um paciente antes e depois de
88 Arq. Med. ABC v. 29 no 2 Jul/Dez 2004

t= X - X s N Como o nmero de desvios-padro, t, na distribuio de Student, depende dos graus de liberdade, que pressupem conhecido o tamanho da amostra, t substitudo pelo nmero de desvios-padro Z da distribuio normal. Uma transformao algbrica simples d o tamanho da amostra N.
2 2 N=Z S d2

Xmx = p + Zp (1 - p)/N , o que d Xmx p = Zp (1 - p)/N (X mx p)2 = Z 2p (1 - p)/N, o que resulta para N o valor:
2 2 N=Z p (1 - p) ou N=Z p (1 - p) (Xmx - p) 2 d2

Veja-se que N inversamente proporcional a d2 (d = diferena) e, no caso das amostras da rea de sade, como a diferena d muito grande (e d2, com mais forte razo), conforme se fez meno, resulta em valor pequeno para N, ao contrrio das pesquisas em engenharia, em que a tolerncia, caracterizada tambm por d, muitssimo menor, o que conduz a amostras de tamanho N muito elevadas. Exemplo ilustrativo: Verificou-se que a populao de um bairro de uma cidade litornea apresentou um elevado valor da presso arterial sistlica, na faixa mdia de 160 mmHg. Deseja-se aplicar um medicamento experimental, com o fim de abaixar o valor mdio da presso arterial sistlica at a faixa de 120 mmHg. Como estimar o tamanho da amostra para ensaio dos efeitos do medicamento antes e depois de corretamente aplicado, com um intervalo de confiana de 95% (usual na rea de sade), para o teste ser significativo? Soluo: A tabela da cur va normal fornece, para intervalo de confiana de 95%, o nmero de desviospadro, indicando o valor Z = 1,96. A diferena ser d = 160 - 120 = 40 mmHg. Como no h como calcular o desvio-padro s, deve-se arbitrar uma condio logicamente mais desfavorvel, escolhendo-se, por exemplo, um desvio-padro s = 80 mmHg, valor que dificilmente ocorrer na populao estudada. Neste caso, ter-se-: N = 1,962. 802/40 2 16 indivduos Como se trata de dados pareados (sucessivos), o tamanho da amostra de, no mnimo, 16 indivduos. Se o teste fosse conduzido com uso de um grupo de controle e um grupo experimental, cada um destes grupos deveria ter 16 pessoas, ou seja, um total de 32 indivduos, no mnimo.

Verifica-se que deve ser maximizado o valor de p (1 - p) e minimizado o valor da diferena d = Xmx - p, para maximizar o valor do tamanho da amostra N (situao mais desfavorvel). Para dados no pareados (simultneos), o valor de N deve ser multiplicado por 2. Exemplo ilustrativo: Uma vacina est sendo testada em certa populao, admitindo-se que um valor considerado satisfatrio ser a obteno de uma frao de sucesso em torno de 70%. Valores da literatura indicam que, em condies razoveis, pode-se obter uma frao de sucesso da ordem de 90%. Qual dever ser o tamanho da amostra, para um intervalo de confiana de 95%? Soluo: Tm-se os seguintes valores: Z = 1,96 (da curva normal) p = 0,705 d = Xmx - p = 0,90 - 0,70 = 0,20. Substituindo estes valores, obtm-se: N = 1,962 . 0,70 (1 - 0,70)/0,202 21 indivduos, no mnimo. Se forem usados dados no-pareados (simultneos), o grupo experimental e o grupo de controle devero ter, cada um deles, 21 pessoas, com um total de, no mnimo, 42 indivduos.

Observaes sobre o tamanho da amostra (N)


1) Para a determinao do tamanho da amostra, as condies mais desfavorveis devem ser escolhidas, ou seja: maior s, no caso de variveis, maior produto p (1-p), no caso de atributos e menor d possvel, para que N seja maximizado. 2) O valor de N calculado vale para dados pareados (sucessivos, como no caso de pacientes antes e depois do tratamento). Se os dados forem no-pareados (simultneos, para um grupo de controle e um grupo experimental), o valor de N deve ser multiplicado por 2. 3) Em qualquer situao (varivel ou atributo), o valor de N, calculado matematicamente, um valor mnimo a ser utilizado na pesquisa e, na prtica, deve ser majorado, usando-se um critrio razovel. Exemplo: se o clculo indicou um valor de N =13 pessoas, ser possvel escolher 13, 15, 20 ou mais indivduos, desde que o aumento da amostra no implique perda significativa de tempo gasto na pesquisa ou, ainda, que seja praticvel nas condies do experimento. 4) No trabalho de
Arq. Med. ABC v. 29 no 2 Jul/Dez 2004 89

Equao para atributos


Para atributos, conforme estudos anteriores, considerando-se que p a frao de sucesso (ou de insucesso), Z o nmero de desvios-padro e Xmx , o valor mximo do atributo quantificado, a estatstica fornece:

pesquisa na rea de sade, recomendvel apresentar sempre os detalhes que indiquem como foi calculado o tamanho da amostra. 5) Quando o tamanho N de pacientes, muito grande, deve ser escolhida uma soluo entre as seguintes: a) aumentar a taxa ou o tempo de recrutamento; b) reduzir o nvel de rigor cientfico; c) abandonar a pesquisa. Esta ltima hiptese deve ser afastada a todo custo.

Alguns programas de microcomputador so de extrema importncia no clculo do tamanho da amostra e na determinao de outros parmetros de interesse da bioestatstica. Entre estes programas, esto o Microsoft Excel, o EPIINFO, o SPSS (Statistical Package of Social Science), o Statsoft Statistica 5.0 e o Matlab 6.

Programas especficos auxiliares de microcomputador

Bibliografia
Altman, Douglas G. Practical statistics for medical research. London: Chapman & Hall: 1999. Dawson B, Trapp KG. Bioestatstica bsica e clnica. Rio de Janeiro: Mc Graw Hill: 2001. Cox DR. Planning of experiments. New Y ork: Wiley: 1992. Herrick CJ. Brains of rats and man. New York: Hafner Publishing Co: 1993. Jekel JF. Epidemiologia, bioestatstica e medicina preventiva. Porto Alegre: Artmed: 1999. Petrie A, Sabin C. Compndio de estatstica mdica. Lisboa: Instituto Piaget: 2000. Soares JF, Siqueira AL. Introduo estatstica mdica. Belo Horizonte: Cooperativa Editora e de Cultura Mdica: 2002. Zar JH. Bioestatistical analysis. London: Prentice Hall: 1999.

Endereo para correspondncia Coordenao do Curso de Cincias Farmacuticas da FMABC Av. Prncipe de Gales, 821 Vila Prncipe de Gales Santo Andr, SP CEP 09060-650 Tel.: (11) 4993-5411

90

Arq. Med. ABC

v. 29

no 2 Jul/Dez 2004

Вам также может понравиться