Вы находитесь на странице: 1из 28

INCT: Informao

Gentico-Sanitria da
Pecuria Brasileira

SRIE TCNICA:
GENTICA

Publicado on line em www.animal.unb.br em 03/11/2010

Glossrio de Termos Estatsticos


Concepta McManus
1

1,2

, Luiza Seixas 1, Cristiano Barros de Melo

1,3

CNPq / INCT / Informao Gentico Sanitria da Pecuria Brasileira, Universidade de Braslia (UnB) /
Universidade Federal de Minas Gerais (UFMG), Belo Horizonte, MG.
2

Universidade Federal do Rio Grande do Sul (UFRGS), Porto Alegre, RS.


3

Universidade Braslia (UnB), Braslia, DF.

Estatstica

Expresso em Latim statisticum collegium,

algum que palestra

sobre os assuntos do Estado ou conselho de Estado;

surgiu a palavra em lngua italiana statista;

significa "homem de estado", estadista ou poltico;

Palavra alem Statistik;


o

A anlise de dados sobre o Estado;

significando a "cincia do Estado"

Palavra foi proposta pela primeira vez no sculo XVII, em


latim, por Schmeitzel na Universidade de Lena e adotada pelo
acadmico alemo Godofredo Achenwall;

Aparece como vocabulrio na Enciclopdia Britnica em 1797;

Adquiriu um significado de coleta e classificao de dados, no incio


do sculo 19.

(1 - alfa) Nvel de confiana: a probabilidade de que o Intervalo de


Confiana contenha o verdadeiro valor do parmetro.
(alfa): a probabilidade de Rejeitar Ho, quando ela verdadeira.
Neste caso, seria a probabilidade de afirmar que as atitudes em
relao Matemtica interferem na formao das atitudes em
relao Estatstica, quando na realidade no existe nenhuma
relao. Este erro controlado pelo pesquisador, e ele que define a
margem de erro que est disposto a correr. Existem vrios fatores
que influenciam na escolha do nvel de significncia. Em pesquisas,
como nas cincias exatas, biolgicas, agronmicas, onde as variveis
so mais fceis de mensurar, onde os instrumentos de medida so
confiveis, onde o controle de fatores intervenientes razovel, o
conhecimento da rea maior, a gravidade das conseqncias do
erro menor, entre outros, permitem um maior rigor e, portanto,
pode-se ser mais exigente, diminuindo o nvel de significncia.
Contudo, em pesquisas, nas cincias humanas, que lida com pessoas,
com construtos polmicos, instrumentos ainda no testados, as
consequncias do erro no so to graves, entre outros, pode-se ser
mais flexvel. Via de regra, usa-se o nvel de 5%.
Alfa (alpha): a probabilidade de se cometer Erro do Tipo I (rejeitar
a hiptese nula quando ela verdadeira) no teste de hipteses.
Algoritmo(algorithm): Um algoritmo um conjunto definido de
operaes e passos ou procedimentos que objetivam levar a um
particular resultado. Por exemplo, com algumas excees, os
programas computacionais, as frmulas matemticas e (de forma
ideal) receitas mdicas e culinrias so algoritmos.
Amostra: Uma amostra um subconjunto de indivduos da populao
alvo. Existem dois tipos de amostras, as probabilsticas, baseadas
nas leis de probabilidades, e as amostras no inferncia estatstica. n
- tamanho da amostra probabilsticas, que tentam reproduzir o mais
fielmente possvel a populao alvo. Entretanto, somente as
amostras probabilsticas podem, por definio, originar uma
generalizao estatstica, apoiada no clculo de probabilidades.
Amostra (sample): Uma parte finita e no vazia extrada de uma
populao.
Amostra Amodal: uma amostra que no tem moda.
Amostra Bimodal: uma amostra que tem duas modas.
Amostra Imparcial: uma amostra em que todos os elementos
2

tiveram uma igual oportunidade de fazer parte da mesma.


Amostra Multimodal: uma amostra que tem mais do que duas
modas.
Amostra Representativa: aquela que deve conter em proporo
todas as caractersticas qualitativas e quantitativas da populao.
Amostra: envolve premissas que dizem respeito s caractersticas do
evento estudado, dos fatores que exeram influncia sobre este
evento e da anlise que se pretenda fazer. Portanto, antes de definir
o tamanho da amostra, o pesquisador dever ocupar-se das
definies de um planejamento amostral, cujas caractersticas sero
particulares para cada estudo. Em geral, o planejamento do tamanho
da amostra leva em considerao os erros do Tipo I e do Tipo II, de
forma que as estimativas de interesse tenham preciso suficiente
para serem utilizadas. Portanto, para dimensionar a amostra o
pesquisador deve fornecer o nvel de significncia e o poder do teste
desejado
Amostragem (sampling): o mtodo de retirada de amostras de uma
populao.
Amostragem Aleatria (random sample): A amostragem dita
aleatria, probabilstica ou ao acaso se todos os elementos da
populao tiveram probabilidade conhecida e diferente de zero de
pertencerem a amostra.
Amostragem Aleatria Simples: aquela em que qualquer elemento
da populao tem a mesma probabilidade de ser escolhido.
Amostragem aleatria simples (simple random sampling): A
amostragem dita aleatria simples se todos os elementos da
populao possurem a mesma probabilidade de pertencerem a
amostra.
Amostragem Estratificada: aquela em que a populao est dividida
em estratos ou grupos diferenciados.
Amostragem
estratificada
(stratified
sampling):
Mtodo
de
amostragem na qual os elementos so retirados de subpopulaes
agrupadas por algum critrio.
Amostragem por conglomerados (cluster sampling): Mtodo de
amostragem onde o que sorteado o aglomerado e no a unidade
individual.
Amostragem Sistemtica: aquela em que os elementos so

escolhidos a partir de uma regra previamente estabelecida.


Amostragem sistemtica (systematic sampling): Mtodo de
amostragem na qual o primeiro elemento de uma lista da populao
selecionado ao acaso e aps cada k-simo elemento selecionado.
Amostragem: um campo da estatstica que estuda tcnicas de
planejamento de pesquisa para possibilitar inferncias sobre um
universo a partir do estudo de uma pequena parte de seus
componentes, uma amostra.
Amplitude (range): a diferena entre os extremos de um conjunto,
isto , a distncia entre o mximo e o mnimo do conjunto.
Amplitude de um Conjunto de Dados: a diferena entre o maior
valor e o menor valor desse conjunto. Se os dados estiverem
agrupados em classes, a amplitude a diferena entre o limite
superior da ltima classe e o limite inferior da primeira.
Anlise de componentes principais (principal component analysis):
Transformar
um
conjunto
de
variveis
originais,
intercorrelacionadas, num novo conjunto de variveis no
correlacionadas, as componentes principais. O objetivo mais
imediato da ACP verificar se existe um pequeno nmero das
primeiras componentes principais que seja responsvel por explicar
uma proporo elevada da variao total associada ao conjunto
original
Anlise de conglomerados (cluster analysis): O propsito da Anlise
de Cluster buscar uma classificao de acordo com as relaes
naturais que a amostra apresenta, formando grupos de objetos
(individuos, empresas, cidades ou outra unidade experimental) por
similaridade
Anlise de sobrevivncia (survival analysis): o estudo de indivduos
(itens observados) onde um evento bem definido (falha) ocorre
depois de algum tempo (tempo de falha).
Anlise discriminante (discriminant analysis): encontrar a melhor
funo discriminante linear de um conjunto de variveis que
reproduza, tanto quanto possvel, um agrupamento a priori de casos
considerados
Anlise multivariada (multivariate analysis): Trata-se de um
conjunto de mtodos que permite a anlise simultnea de medidas
mltiplas para cada indivduo ou objecto em anlise, ou seja,
qualquer mtodo que permita a anlise simultnea de duas ou mais

variveis pode ser considerado como multivariado.


Anlise Probit (probit analysis): Em teoria de probabilidade e
estatstica, probit a funo inverso funo de distribuio
cumulativa (CDF), ou funo do quantile associado com o padro
distribuio normal. Tem aplicaes dentro grficos estatsticos
exploratrios e especializado modelar da regresso de variveis
binrias da resposta.
ANDEVA (Analise de varincia): tcnica estatstica cujo objetivo
testar a igualdade entre trs ou mais mdias. Ela permite testar se a
variabilidade dentro dos grupos maior que a existente entre os
grupos. A tcnica supe independncia e normalidade das
observaes, e igualdade entre as varincias dos grupos.
ANOVA (Analysis of Variance): Teste de hiptese que objetiva
comparar mais de duas mdias. isto mesmo, a anlise de varincia
um teste para comparar mdias, que realizado atravs das
varincias dentro e entre os conjuntos envolvidos. uma extenso
do teste "t" para duas mdias.
ANOVA: ver Andeva
Assimetria (skeweness): Se um conjunto de dados for dividido em
duas partes a partir da mediana e estas duas partes no forem
iguais, ento ele dito assimtrico. Outra maneira de verificar se um
conjunto assimtrico calcular o seu coeficiente de assimetria ou o
momento de terceira ordem. Se ele for diferente de zero ento o
conjunto dito assimtrico.
Atpico (outlier): um valor de um conjunto de dados que se afasta
dos demais. um valor normalmente muito grande ou muito
pequeno quando comparado com o restante do conjunto. Pode ter
sido resultado de um erro de medida ou, ento, pode ser um
indicativo de um comportamento atpico do conjunto sob
determinadas condies.
Atributo (attribute): uma denominao alternativa
possveis valores assumidos por uma varivel qualitativa.

para

os

Atributos Qualitativos: so atributos que esto relacionados com


uma qualidade e apresentam-se com vrias modalidades.
Atributos Quantitativos: so atributos aos quais possvel atribuir
uma medida e apresentam-se com diferentes intensidades ou
valores.
Autocorrelao (autocorrelation): uma medida que informa o

quanto o valor de uma realizao de uma varivel aleatria capaz


de influenciar seus vizinhos
Bootstrapping: um mtodo de reamostragem onde se utiliza para
aproximar distribuio na amostra de um levantamento estatstico.
Se usa frequentemente para aproximar o vis ou a varincia de um
conjunto de dados estatsticos, assim como para construir intervalos
de confiana ou realizar contrastes de hipteses sobre parmetros de
interesse. Na maior parte dos casos no pode obter-se expresses
fechadas para as aproximaes bootstrap e portanto necessrio
obter reamostragens em um ordenador para por em prtica o
mtodo. A enorme capacidade de clculo dos computadores atuais
facilita consideravelmente a aplicabilidade deste mtodo to custoso
computacionalmente
Censo: um estudo estatstico que resulta da observao de todos os
indivduos da populao relativamente a diferentes atributos prdefinidos.
Classe Mediana ( ): a classe, para dados classificados, que contem
a Mediana (neste caso considera-se como Mediana o valor da
varivel estatstica que corresponde a n/2, quer n seja par, quer n
seja mpar).
Classe Modal: a classe, para dados classificados, que aparece com
maior frequncia.
Coeficiente angular ou inclinao (da reta de regresso: Y = a + b *
X): a variao de Y por cada variao de X.
Coeficiente de confiana: corresponde a 1- (probabilidade de
aceitar a hiptese nula quando esta verdadeira) e indica a
probabilidade de deciso correta baseada na hiptese nula.
Coeficiente de correlao de Pearson (Pearson correlation
coeficient): uma medida do grau de relao linear entre duas
variveis quantitativas. Este coeficiente varia entre os valores -1 e 1.
O valor 0 (zero) significa que no h relao linear, o valor 1 indica
uma relao linear perfeita e o valor -1 tambm indica uma relao
linear perfeita mas inversa, ou seja quando uma das variveis
aumenta a outra diminui. Quanto mais prximo estiver de 1 ou -1,
mais forte a associao linear entre as duas variveis
Coeficiente de correlao de Spearman (Spearman rho correlation
coeficient): O coeficiente de Spearman mede a intensidade da
relao entre variveis ordinais. Usa, em vez do valor observado,
apenas a ordem das observaes.

Deste modo, este coeficiente no sensvel a assimetrias na


distribuio, nem presena de outliers, no exigindo portanto que
os dados provenham de duas populaes normais
Coeficiente de Correlao Linear ( r ): medida estatstica que permite
calcular o valor numrico correspondente ao grau de dependncia
entre duas variveis, o qual varia entre -1 e 1.
Coeficiente de correlao parcial (partial correlation coeficient): O
coeficiente de correlao parcial( rAB.C) permite conhecer o valor da
correlao entre duas variables A e B, se a variable C tinha
permanecido constante para a srie de observaes consideradas. O
rAB.C o coeficiente de correlao total entre as variables A e B
quando se lhes retirou sua melhor explicao lineal em termo de C.
Coeficiente de determinao (coefficient of determination): indica
quanto da varincia da varivel resposta explicada pela varincia
das variveis explicativas. Seu valor est no intervalo de 0 a 1:
Quanto maior, mais explicativo o modelo
Coeficiente de determinao (R2): o quadrado do coeficiente de
correlao de Pearson e expresso em porcentagem. o percentual
explicado da variao da varivel dependente pela reta de regresso
(modelo). O restante explicado pelo erro, que pode ser devido a
ausncia de outras variveis, erros de mensurao das variveis e ao
erro aleatrio.
Coeficiente de variao (coefficient of variation): o quociente entre
o desvio padro e a mdia de um conjunto de dados. um percentual
e portanto adequado para efetuar comparaes entre diferentes
conjuntos de dados.
Coeficiente gama (gamma coeficient).
Consistncia
(consistency):
Propriedade
que
descreve
o
comportamento de um estimador quando o tamanho da amostra
tende ao infinito.
Correlao: a relao ou dependncia entre as duas variveis de
uma distribuio bidimensional.
Correlao (correlation): Um termo geral utilizado para descrever o
fato de que duas ou mais variveis (conjuntos de dados) esto
relacionados. Galton, em 1869, foi provavelmente o primeiro a
utilizar o termo com este sentido. O termo utilizado mais
precisamente para denominar relacionamento linear entre dois
conjuntos de dados ou variveis.
Correlao amostral (r): Serve para estimar a correlao linear

populacional.
Correlao cannica (canonical correlation).
Correlao Fraca ou Nula: quando o Diagrama de Disperso no
permite o ajustamento de nenhuma reta, o que significa que r = .
Diz-se, ento, que no existe nenhuma relao entre as variveis da
Distribuio Bidimensional.
Correlao Negativa Forte: quando a reta de regresso, obtida a
partir do Diagrama de Disperso, tem declive negativo. A correlao
negativa quando r varia entre -1 e 0 e ser tanto mais forte quanto
r se aproxima de -1.
Correlao Negativa Perfeita ou Linear: quando a reta de regresso,
obtida a partir do Diagrama de Disperso, tem declive negativo com r
Correlao populacional (r): um valor que mede o grau de relao
linear entre duas variveis quantitativas. igual a covarincia
dividida pelo desvio padro de cada uma das variveis.
Correlao Positiva Forte: quando a reta de regresso, obtida a partir
do Diagrama de Disperso, tem declive positivo. A correlao
positiva quando r varia entre 0 e 1 e ser tanto mais forte quanto r
se aproxima de 1.
Correlao Positiva Perfeita ou Linear: quando a reta de regresso,
obtida a partir do Diagrama de Disperso, tem declive positivo com r
Covarincia populacional C(X,Y): um valor que mede o grau de
disperso simultnea de duas variveis quantitativas em relao as
suas mdias. a soma dos produtos dos desvios das variveis em
relao a sua mdia, dividido pelo nmero de observaes: Soma[(Xi
mdiaX)*(Yi mdiaY)]/N. o numerador do coeficiente de
correlao.
Covarivel (covariate or control variable): Uma varivel que
apresenta um efeito que no se tem interesse direto. A anlise da
varivel de interesse apresentar melhores resultados se a variao
da covarivel for controlada.

Curtose (kurtosis): uma medida de um conjunto de dados que


informa o quanto este conjunto se desvia do modelo (curva) normal.
o grau de achatamento do conjunto. A curva normal teria um
coeficiente de curtose igual a trs (alguns autores utilizam zero) e
denominada de mesocrtica. Uma medida acima de trs (ou positiva)
caracterizaria o conjunto como leptocrtico (mais afinado que a
curva normal). Se o coeficiente de curtose for menor do que trs (ou
negativo) ento o conjunto denominado de platicrtico (mais
achatado do que a curva normal). Foi proposto por Karl Pearson
antes de 1905. representado por g2 e calculado por: g2= m4/m22,
onde m4 o momento central de quarta ordem e m2 a varincia
Dado
Estatstico:

o
resultado
da
atributo/varivel qualitativa ou quantitativa.

observao

de

um

Dados (data): Os nmeros e atributos que so coletados, analisados


e interpretados.
Dados Classificados: so valores que uma dada varivel pode tomar
dentro de certo intervalo. Estes dados so classificados ou agrupados
em classes.
Dados de seo transversal (cross section data): Dados coletados no
mesmo ou aproximadamente no mesmo ponto do tempo.
Dados de srie histrica (data): Dados coletados em perodos de
tempo sucessivos.
Dados Simples: vo valores associados a uma dada varivel e cuja
representao feita atravs de uma tabela.
Definio do Problema: a primeira fase do estudo estatstico e
consiste na definio e formulao correcta do problema a ser
estudado.
Densidade da classe (class density): a freqncia da classe dividida
pela sua amplitude.
Descrio das variveis: A varivel constitui um primeiro nvel de
operacionalizao de uma construo terica e, para cada uma, se
deve dar, em seguida, uma descrio operacional. Para algumas
variveis a descrio simples, porm, em outros casos, essa
definio mais complexa. Uma varivel contnua, pode ser
transformada em discreta e depois em categrica ordinal, por
exemplo idade (como diferena entre a data atual e data de
nascimento, anos completos, faixas de idade). recomendvel tomar
o valor bruto e depois categoriz-lo, isso d mais flexibilidade ao

pesquisador.
Desvio (deviation): A diferena entre o valor de um conjunto (dado)
e a mdia deste conjunto.
Desvio Mdio (d): a mdia aritmtica do valor absoluto da
diferena entre cada valor e a mdia, no caso dos dados no
classificados. No caso dos dados classificados, tem que se entrar em
conta com a frequncia absoluta de cada observao.
Desvio Padro (standard deviation): a raiz quadrada da soma dos
quadrados dos desvios dividida pelo nmero de elementos, ou dito
de outra forma, raiz quadrada da mdia aritmtica dos quadrados
dos desvios.
Desvio Padro (s): a raiz quadrada positiva da varincia.
Diagrama de
Frequncias.

Caule-e-Folhas:

mesmo

que

Separador

de

Diagrama de Disperso: a representao num referencial


ortonormado de um conjunto de pares ordenados de valores (x , y),
onde cada par ordenado corresponde a uma observao.
Diagrama de disperso (scattergram).
Diagrama de Extremos e Quartis: um diagrama que representa os
valores extremos e os quartis de uma varivel estatstica.
Disperso (dispersion): O quanto um conjunto de dados est
espalhado. A disperso normalmente avaliada em torno da mdia,
atravs da varincia, do desvio padro e do desvio mdio. Mas
tambm pode ser definida pela amplitude que a diferena entre o
mximo e o mnimo do conjunto ou ainda pela amplitude interquartlica, isto , a diferena entre o terceiro e o primeiro quartil.
Distncia de Mahalanobis (Mahalanobis distance): Uma medida que
fornece o quanto um ponto (dado) se afasta da mdia da amostra
(ou centride) no espao das variveis independentes utilizadas no
ajuste de um modelo de regresso mltipla. Ela fornece uma forma
de descobrir pontos que esto mais afastados do que os demais no
espao multidimensional.
Distribuio Bidimensional: a representao de uma varivel
bidimensional (xi , xj), com 1 i n e xi
e xj duas variveis
unidimensionais.
Distribuio de Frequncias: o mesmo que Tabela de Frequncias.

10

Epsilon (epsilon): Se for desejado corrigir o teste F univariado


utiliza-se o "epsilon" de Huynh-Feldt ou de Greenhouse-Geisser.
Lembrando que F a razo entre os quadrados mdios entre grupos
e dentro dos grupos e que os graus de liberdade entre os grupos
"k - 1", enquanto que o dentro dos grupos "n - k - 1". Para corrigir
o valor de F, uma vez que se tenha percebido a falta de esfericidade,
deve-se multiplicar o grau de liberdade entre os grupos pelo valor de
epsilon. Para violaes mais severas da esfericidade (epsilon < 0,75)
o epsilon de Greenhouse-Geisser, mais conservador, deve ser
utilizado.
Erro de estimao: a diferena entre o verdadeiro valor do
parmetro e o valor calculado a partir do dados de uma amostra.
Este depende diretamente do grau de disperso (variabilidade) da
varivel em estudo e inversamente ao tamanho da amostra.
Erro do tipo I (alpha error): No teste de hipteses consiste em
rejeitar a hiptese nula quando ela verdadeira.
Erro do tipo II (beta error): No teste de hipteses consiste em
aceitar a hiptese nula quando ela falsa.
Erro quadrado mdio (mean square error): a soma dos quadrados
dos desvios entre os valores do estimador (varivel) e o parmetro
que ele se prope a estimar.
Erro Tipo-I: rejeitar a hipttese nula quando esta verdadeira. A
probabilidade de cometer este erro denotada por e recebe o
nome de nvel de significncia do teste.
Erro Tipo-II: aceitar a hipttese nula quando esta falsa. A
probabilidade de cometer este erro denotada por
Esfericidade (sphericity): Propriedade de que a matriz das
varincias/covarincias de um conjunto de dados multivariados um
mltiplo escalar da matriz identidade.
Esfericidade: O teste de esfericidade checa se a matriz de correlao
igual a matriz identidade, ou seja, na diagonal formados por uns e
zero fora da diagonal.
ESS (Expert Statistical System): Sistema especialista estatstico.
Estatstica: o mtodo que ensina a recolher, classificar, apresentar
e interpretar um conjunto de dados numricos.
Estatstica (Statistics): A arte e a Cincia de coletar, analisar,
apresentar e interpretar dados.

11

Estatstica (statistics): Um nmero ou valor. Na teoria da estimao


utilizada tambm como sinmino de estimador, isto , uma funo
dos elementos da amostra. Este termo foi introduzido por Sir Ronald
A. Fisher em 1922.
Estatstica Descritiva: ramo da Estatstica que tem por finalidade
descrever certas propriedades relativas a um conjunto de dados.
Estatstica Descritiva (descritive statistics): Parte da Estatstica que
trata do resumo e da apresentao de conjuntos de dados.
Estatstica Indutiva: ramo da Estatstica que procura inferir
propriedades da populao a partir de propriedades verificadas numa
amostra da mesma.
Estatstica inferencial ou indutiva (inferential or indutive statistic): O
processo de tirar concluses sobre a natureza ou o modelo de
populaes a partir de amostras aleatrias retiradas destas
populaes.
Estatstica ou estimador: uma funo dos valores da amostra, ou
seja uma varivel aleatria, pois seu resultado depende dos
elementos selecionados naquela amostra. So utilizados para
estimar os parmetros populacionais, para isto preciso conhecer
sua distribuio de probabilidades, que via de regra, pressupe
normalidade ou amostras grandes. Por exemplo: a mdia amostral, a
proporo amostral, a varincia amostral, etc.
Estatstica robusta (statistics): conjunto de tcnicas utilizadas para
atenuar o efeito de outliers e preservar a forma de uma distribuio
to aderente quanto possvel aos dados empricos
Estatstica teste (test statistic): o valor amostral da estatstica
utilizada para testar um parmetro no teste de hipteses.
Estatisticamente
significante:
dizer
que
um
resultado

estatisticamente significante significa que as diferenas encontradas


so grandes o suficiente para no serem atribudas ao acaso. Uma
diferena " estatisticamente significante" pode no ser "
clinicamente importante"; a importncia em termos biolgicos no
deve ser julgada pelos estatsticos, mas sim pelos profissionais da
rea em que a pesquisa est sendo feita.
Estimao (estimation): Parte da inferncia estatstica que trata do
processo de estimao e das propriedades dos estimadores.
Estimador (estimator): A eststica (frmula ou expresso) utilizada
para avaliar o valor de um parmetro. Um estimador uma varivel
12

aleatria.
Estimador de mxima verossimilhana (likehood stimator): usado
para determinar valores dos livres parmetros de um modelo
estatstico. No sempre desejvel usar estimadores de mxima
verosimilhana, pois eles podem estar sujeitos a sobreajuste: para
evitar isso, recomenda-se usar regularizao, aonde se adiciona
funo objetiva termos que penalizam grandes coeficientes,
resultando em estimadores de mxima verosimilhana penalizada. O
estimador MV da varincia de uma distribuio Gaussiana
enviezado.
Estimador de mnimos quadrados (least square stimator): uma
tcnica de otimizao matemtica que procura encontrar o melhor
ajustamento para um conjunto de dados tentando minimizar a soma
dos quadrados das diferenas entre o valor estimado e os dados
observados (tais diferenas so chamadas resduos).
Estimativa (estimate): o valor particular de um estimador, isto ,
o resultado de algum clculo realizado sobre valores amostrais.
Estimativa (ou Estimativa pontual): o valor que a estatstica ou
estimador toma em uma amostra determinada.
Estimativa por ponto (point estimate): O valor da estatstica
amostral que corresponde ao parmetro populacional.
Estudo caso-controle: comparao entre um grupo de doentes
(casos) e um grupo de pessoas no doentes (controles). O objetivo
verificar se os casos diferem significativamente dos controles, em
relao exposio a um dado fator de risco.
Estudo de coorte (cohort study): Um estudo longitudinal com o
mesmo conjunto (o coorte) de pessoas ao longo de um determinado
tempo.
Estudo de coorte: comparao entre um grupo exposto a um fator de
risco e outro grupo no exposto. Visa verificar se indivduos expostos
ao fator de risco desenvolvem a doena em questo, em maior ou
menor proporo, do que um grupo de indivduos no expostos.
Eta quadrado (eta-square): uma medida do efeito tamanho que
igual ao quociente entre a soma dos quadrados dos grupos entre
pela soma dos quadrados somados para todos os efeitos principais,
de interao e de erro (os efeitos das covariveis no so
computados). Esta medida pode ser interpretada como o percentual
da varincia da varivel dependente que so explicadas pelos
fatores. Quando existem relaes curvilneas entre a varivel
dependente e os fatores o Eta Quadrado ser maior que o

13

correspondente coeficiente de correlao mltiplo ou R2.

Fator (fator): Um fator uma denominao alternativa, utilizada na


anlise de varincia, para uma varivel. Assim se num determinado
experimento consiste em determinar o efeito da dosagem de um
remdio, a "dosagem do remdio" um fator. Se neste experimento
for levado em conta no apenas a dosagem mas tambm o tempo em
que o remdio ser tomado, ento "o tempo" ser um segundo fator.
Cada valor que o fator (varivel) assume denominado nvel do
fator. Assim se a dosagem testado for de: 100, 110, 115 e 120 mg,
este fator ter quatro nveis. Um fator deve ter pelo menos dois
nveis.
Fenmenos Independentes: so fenmenos respeitantes mesma
varivel que no tm qualquer ligao um com o outro.
Frequncia Absoluta (fi): o nmero de vezes que o valor de
determinada varivel observado.
Frequncia Absoluta Acumulada (Fi): a soma das frequncias
absolutas anteriores com a frequncia absoluta deste valor.
Frequncia absoluta acumulada de um valor da varivel: o
somatrio da sua frequncia absoluta com todas as anteriores (as
dos valores anteriores).
Frequncia absoluta de um valor da varivel: o nmero de vezes
que esse valor aparece na lista de dados.
Freqncia esperada (expected frequency): Nmero de vezes que um
valor da varivel deve se repetir se a hiptese nula for verdadeira ou
ainda nmero de vezes que um valor da varivel deve se repetir de
acordo com um determinado modelo.
Freqncia observada (observed frequency): Nmero de vezes que o
valor de uma varivel se repete.
Frequncia Relativa ( fri ): o quociente entre a frequncia absoluta
do valor da varivel e o nmero total de observaes.
Frequncia Relativa Acumulada ( Fri ): a soma das frequncias

14

relativas anteriores com a frequncia relativa desse valor.


Frequncia relativa acumulada de um valor da varivel: o
somatrio da sua frequncia relativa com todas as anteriores (as dos
valores anteriores).
Frequncia relativa de um valor da varivel: o quociente entre a
sua freqncia absoluta e o nmero total de dados.
Funo Cumulativa: funo que indica para cada valor real x a
frequncia absoluta (ou relativa) de observaes com intensidade
menor ou igual a x. A representao grfica desta funo em forma
de escada.
Funo de distribuio (cumulative distribuition function): A funo
de distribuio acumulada ou simplesmente funo de distribuio
de uma varivel aleatria definida em cada valor "x" real como
sendo F(x) = P(X x).
Grfico Circular: representado por um crculo que est dividido em
sectores cujas amplitudes so proporcionais frequncia que lhe
corresponde.
Grfico de Barras: constitudo por barras, horizontais ou verticais,
de comprimento proporcional frequncia.
Graus de liberdade (degree of freedon): a quantidade informaes
(variveis) livres que sero utilizadas para o clculo de uma
estatstica (frmula). O nmero de valores independentes que sero
utilizados na estimativa de um parmetro. Em geral, o nmero de
graus de liberdade de uma estimativa igual ao nmero de valores
utilizados no seu clculo menos o nmero de parmetros estimados
no clculo intermedirio para a sua obteno. Assim para calcular a
mdia de uma amostra de tamanho "n", so necessrios as "n"
observaes fazendo com que esta estatstica tenha "n" graus de
liberdade. J a estimativa da varincia atravs de uma amostra de
tamanho "n" ter "n - 1" graus de liberdade, pois para a obteno da
varincia amostral necessrio antes o clculo da mdia amostral.
Graus de liberdade: um conceito ligado ao nmero de dados
disponveis (livres) para o clculo da estatstica.
H1: As atitudes em relao Matemtica interferem na formao das
atitudes em relao Estatstica. (rxy 0)
Hiptese alternativa (alternative hipothesis): No teste de hipteses
a hiptese que ser provar. geralmente uma desigualdade.
Hiptese alternativa (H1): As hipteses de uma pesquisa devem
15

enunciar-se por propostas to claras e especficas quanto possvel,


via de regra, o que voc quer mostrar, por exemplo: as atitudes
em relao a Matemtica interferem diretamente na formao das
atitudes em relao Estatstica
Hiptese alternativa: hiptese que ser considerada como aceitvel,
caso a hipttese nula seja rejeitada.
Hiptese nula (Ho): A hiptese nula a negao da hiptese
alternativa, por isso, via de regra, voc sempre torce para que ela
seja rejeitada, como no caso seguinte: as atitudes em relao a
Matemtica no interferem na formao das atitudes em relao
Estatstica. Est a hiptese que esta sendo testada por qualquer
teste estatstico. A se tomar uma deciso estatstica, existem duas
possibilidades de erro: o Erro de tipo I: rejeitar a hiptese nula (Ho),
quando ela verdadeira e, o Erro de tipo II: aceitar a hiptese nula
(Ho), quando ela falsa. Infelizmente, quando a probabilidade de
cometer um diminui, a probabilidade de cometer o outro aumenta.
Assim, os testes estatsticos foram delineados para controlar o erro
de tipo I, chamado de nvel de significncia.
Hiptese nula (null hipothesis): No teste de hipteses a hiptese
que representa o que j se conhece e formulada com o objetivo de
ser rejeitada.
Hiptese nula: hiptese que colocada a prova em teste de hiptese.
Em geral indica uma igualdade a ser contestada.
Hiptese: Uma hiptese um enunciado formal das relaes
esperadas entre pelo menos uma varivel independente e uma
varivel dependente. Nas pesquisas exploratrias, as hipteses
podem se tornar questes de pesquisa. Estas questes pela sua
especificidade, devem dar testemunho do trabalho conceitual
efetuado pelo pesquisador e, pela sua clareza, permitir uma resposta
interpretvel.
Histograma: um grfico de barras em que a rea destas
proporcional frequncia, no havendo espao entre as mesmas. S
se utiliza em variveis quantitativas contnuas.
Histograma (histogram): Grfico de colunas justapostas (retngulos)
onde a base a amplitude da classe e a altura a densidade ou a
densidade relativa da classe. utilizado, normalmente, para
representar uma varivel contnua.
Ho: As atitudes em relao Matemtica no interferem na formao
das atitudes em relao Estatstica (rxy = 0)

16

Homocedasticidade ou igualdade de varincias: Este pressuposto


exige que o nvel de disperso da varivel dentro dos grupos seja
similar. O SPSS automaticamente testa esta hiptese: Ho: s1 = s2 =
s3 = s4, atravs do teste de Levene.
Independncia (independence): Em teoria de probabilidade, para
dizer que dois eventos sejam independentes, significa intuitivamente
que a ocorrncia de um evento o faz nem mais nem mais menos o
provvel esse outro ocorre.
Inferncia Estatstica (inferential statistics): A utilizao de
amostras de uma populao com o objetivo de tomar decises sobre
a populao.
Interao (interaction): Em estatstica, interao um termo em a
modelo estatstico adicionado quando o efeito de dois ou mais
variveis no for simplesmente aditivo. Tal termo reflete que o efeito
de uma varivel depende dos valores de um ou de mais outras
variveis.
Intercepto (da reta de regresso: Y = a + b * X): o valor de Y,
quando X = 0. A maioria das vezes no faz sentido interpretar este
valor.
Intervalo de confiana (confidence interval): A estimativa de um
parmetro populacional atravs de um intervalo de valores ao invs
de um nico valor.
Intervalo de confiana: um intervalo centrado na estimava pontual,
cuja probabilidade de conter o verdadeiro valor do parmetro igual
ao nvel de confiana.a: a probabilidade de erro na estimao por
intervalo.
ISS
(Intelligent
inteligente.

Statistical

Software):

Software

estatstico

Kruskall-Wallis (Kruskall-Wallis): Ver teste de Kruskall-Wallis.


Lambda de Wilks (Wilks's lambda): um teste multivariado para
verificar diferenas de mdias para os casos de mltiplas variveis
dependentes intervalares e mltiplos grupos (mais de dois)
formados pelas variveis independentes. O teste t, o T de Hotelling e
o teste F so casos especiais deste teste.
Logit (logit): Se U for uma varivel definida no intervalo [0; 1], ento
a transformao que associa a cada valor "u", neste intervalo, um
valor "v" no intervalo (-; +) denominada de logit (ou logstica) e
definida por: v = logit(u) = ln[u/(1 - u)]. A transformao inversa
17

executada por: logit-1(v) = ev/(1 + ev).


Matriz de correlao: uma matriz quadrada, simtrica, cuja
diagonal formada pela unidade, pois trata-se da correlao da
varivel com ela mesma, e em cada interseo linha (i) coluna (j) a
correlao das variveis Xi e Xj.
Matriz de covarincia: uma matriz quadrada, simtrica, cuja
diagonal contm a varincia da varivel e em cada interseo linha
(i) coluna (j) a covarincia das variveis Xi e Xj.
Mximo(maximum): o maior valor de um conjunto de dados.
Mdia amostral: (X, se l X barra), uma varivel aleatria, funo
dos valores da amostra, definida como a soma de todos os valores
da amostra dividido pelo nmero de observaes da amostra. Serve
para estimar a mdia populacional.
Mdia aritmtica: o valor que se obtm dividindo a soma dos
valores pelo nmero de dados.
Mediana: o valor que est no centro da sequncia dos dados quando
ela est ordenada de forma crescente ou decrescente. Quando o
nmero de valores impar, s o valor central, e quando o nmero
de valores par, somam-se os dois valores centrais e dividem-se por
dois (mdia aritmtica).
Medida de associao (Measure of association): Um valor que
fornece uma idia da fora do relacionamento (e direo) entre duas
ou mais variveis.
Medidas de Disperso: um conjunto de medidas (Amplitude,
Varincia e Desvio Padro) utilizadas no estudo da variabilidade de
uma determinada distribuio, permitindo obter uma informao
mais completa acerca da "forma" da mesma.
Medidas de Localizao: um conjunto de medidas (Mdia, Mediana,
Moda e Quartis) que representam de uma forma global um conjunto
de dados.
Medidas de Tendncia Central: o mesmo que Medidas de Localizao.
Medidas de tendncia central: Moda, Mediana, Mdia
Melhor estimador linear no-viciado (best linear unbiased
estimator): Um estimador dito estimador linear se ele uma
combinao linear das observaes amostrais. dito o melhor
estimador linear no-viciado se de todas as combinaes lineares da

18

amostra ele apresentar a menor varincia.


Moda ( m ): observao que ocorre com maior frequncia numa
amostra.
Moda: o valor mais freqente da varivel.
Modelo ARIMA (AutoRegressive Integrated Moving Average): um
modelo utilizado em Sries Temporais e que pode representar o
comportamento dinmico que muitos conjuntos de dados
apresentam.
Modelo autoregressivo (autoregressive model).
Modelo log-linear (log-linear model).
Monitoramento: Observaes contnuas, sem ter uma ao com base
no resultado.
Multicolinearidade: Este um pressuposto importante na anlise
regresso mltipla, pois se uma varivel independente for uma
combinao linear de outras variveis independentes, coloca em
risco toda a anlise. No adianta tentar modelar uma varivel em
funo de vrias variveis correlacionadas, essas no incrementam o
poder explicativo do modelo. Neste caso, use o modelo de regresso
stepwise, backward ou foreward.
Nvel de confiana (confidence level): a probabilidade de que um
intervalo de confiana contenha o valor do parmetro que ele se
prope a estimar.
Nvel de significncia (alfa): definida como a probabilidade de
cometer o erro de tipo I, ou seja, rejeitar a hiptese nula (Ho),
quando ela verdadeira. Por exemplo:
Nvel de significncia (alpha level): a probabilidade de se cometer
erro do tipo I no teste de hipteses, isto , a probabilidade de se
rejeitar a hiptese nula quando ela verdadeira.
Normal: Uma varivel quantitativa segue uma distribuio normal, se
sua distribuio de frequncias tem o formato similar ao de um sino,
ou seja a maioria dos valores se concentram em torno da mdia e, a
medida que se afasta do centro as observaes so cada vez mais
raras. Essa distribuio simtrica. Muitas variveis tm essa
distribuio, tais como altura das pessoas adultas do sexo masculino,
coeficiente de inteligncia, etc. Para examinar visualmente, voc
pode fazer o histograma com a curva ajustada, o SPSS faz isso. O
teste que checa a normalidade de uma varivel o teste de Lilliefors,
que se encontra no comando EXPLORE do SPSS. A hiptese nula
19

que a varivel segue uma distribuio normal, por isso voc espera
aceitar Ho, e espera que o p-valor seja maior do que o nvel de
significncia especificado por voc.
Normalidade: dizer que h normalidade ou que os dados so
normalmente distribudos significa que eles seguem uma distribuio
normal, isto , valores concentrados simetricamente em torno da
mdia e quanto maior a distncia da mdia, menor a freqncia das
observaes.
Nmero aleatrio (random number): Nmero gerado num
computador atravs de um algoritmo recursivo. Na realidade o
correto seria dizer nmero pseudo aleatrio uma vez que as
seqncias geradas so reprodutveis.
Nmero de repeties: o nmero de unidades experimentais que
recebem o mesmo tratamento.
Nuvem de Pontos: o mesmo que Diagrama de Disperso.
Odds ratio: chance de se observar casos expostos ao fator de risco
sobre a chance de se observar controles expostos ao fator de risco.
Se a exposio ao fator de risco for a mesma para casos e controles o
odds ratio vale 1. Tambm chamado de razo de chances (odds
ratio).
Organizao dos Dados: consiste em "resumir" os dados atravs da
sua contagem e agrupamento.
Parmetro: uma medida usada para descrever, de forma resumida,
uma caracterstica da populao, Por exemplo, a mdia populacional
(m), a proporo populacional (p), a varincia populacional (s), o
coeficiente de correlao (r), etc. Os parmetros, via de regra, so
valores desconhecidos e desejamos estimar, ou testar, a partir dos
dados de uma amostra.
Pictogramas: so grficos onde se utilizam figuras ou smbolos
alusivos ao problema em estudo.
Planificao do Problema: consiste na determinao de um processo
para resolver o problema e, em especial, como obter informaes
sobra a varivel em estudo.

20

Poder do teste (power of a statistical test): Denomina-se poder de


um teste estatstico a probabilidade de aceitar a hiptese nula
quando ela verdadeira. A probabilidade de se cometer erro do tipo
II, isto , aceitar a hiptese nula quando ela falsa representada
por b, ento o poder do teste ser 1 - b = P(Aceitar H0 /H0
verdadeira), isto o poder do teste definido como a probabilidade
de no se cometer erro do tipo II.
Poder do teste: corresponde a 1-
Polgono de Frequncias: so grficos com aspecto de linhas
quebradas. Constroem-se unindo por segmentos de recta os pontos
mdios das bases superiores dos rectngulos de um histograma.
Populao: um conjunto de seres com uma dada caracterstica em
comum e com interesse para o estudo.
Populao (population): Conjunto de elementos de interesse com
pelo menos uma caracterstica em comum.
Populao: Toda questo de pesquisa define um universo de objetos
aos quais os resultados do estudo devero ser aplicados. A
populao alvo, tambm, chamada populao estudada, composta
de elementos distintos possuindo um certo nmero de caractersticas
comuns (pelo menos uma). Essa caracterstica comum deve delimitar
inequivocamente quais os elementos que pertencem populao e
quais os que no pertencem. Estes elementos, chamados de
unidades populacionais, so as unidades de anlise sobre as quais
sero recolhidas informaes.
Preciso absoluta: a preciso especificada diretamente e na mesma
unidade da estimativa que se pretende calcular.
Preciso relativa: a preciso especificada no diretamente como
preciso absoluta, mas sim proporcionalmente como porcentagem
em relao ao verdadeiro valor.
Pressuposto de independncia: chave para a maioria das
estatsticas. Isto significa que o resultado de uma observao no
interfere no resultado de outra observao. Por exemplo, a nota de
um aluno no interfere na nota de um outro aluno. J esse
pressuposto quebrado para amostras relacionadas como, por
exemplo, passar uma prova antes de uma interveno e a mesma
prova (ou outra) depois da interveno; essas duas medidas so
correlacionadas, uma vez que os sujeitos so os mesmos. Neste
caso, deve-se utilizar o teste para dados emparelhadas, ou ANOVA
com medidas repetidas. Logo, cuidado com os estudos longitudinais,

21

em que se acompanha os mesmos sujeitos em vrios momentos.


Pressuposto de normalidade: chave para toda a estatstica
paramtrica, por essa razo voc sempre deve checar a validade do
mesmo. Contudo, quando sua amostra for suficientemente grande (n
> 30), dependendo do formato da distribuio, o Teorema Central do
Limite garante a convergncia da mdia amostral para a
normalidade, veja a pgina 197 do livro de Estatstica Bsica de
Moretin e Bussab.
Probit (probit): Se U for uma varivel definida no intervalo [0; 1],
ento a transformao que associa a cada valor "u", neste intervalo,
um valor "v" no intervalo (-; +) denominada de probit se v = F1
(u), onde F Funo de Distribuio da Normal Padro.
Proporo amostral: ( p se l p barra), serve para estimar a
proporo populacional.
Proporo populacional (p): um valor resultante do cociente entre
o nmero de casos favorveis e o nmero de casos possveis na
populao. Por exemplo: proporo de eleitores que votaro no
candidato XYZ nas prximas eleies.
p-valor: a probabilidade de cometer o erro de tipo I (rejeitar Ho
quando ela verdadeira), com os dados de uma amostra especfica.
Este valor dado pelo pacote estatstico, assim o comparamos com o
nvel de significncia escolhido e tomamos a deciso. Se o p-valor for
menor que o nvel de significncia escolhido rejeitamos Ho, caso
contrrio, aceitamos Ho.
P-value: corresponde ao menor nvel de significncia que pode ser
assumido para rejeitar a hiptese nula. Dizemos que h significncia
estatstica quando o p-value menor que o nvel de significncia
adotado. Por exemplo, quando p=0.0001 pode-se dizer que o
resultado bastante significativo, pois este valor muito inferior aos
nveis de significncia usuais. Por outro lado, se p=0.048 pode haver
dvida pois, embora o valor seja inferior, ele est muito prximo ao
nvel usual de 5%.
Quartil (quartil): Valores (so trs) que dividem um conjunto de
dados em quatro partes iguais. ( Q1 a Q3 )
Qui-quadrado (chi-square): teste qui-quadrado
Razo de chances (odds ratio): a chance a favor dividida pela
chance contra, ou seja o nmero de casos favorveis dividido pelo
nmero de casos no favorveis.

22

Recenseamento: o mesmo que Censo.


Recolha de Dados: a primeira etapa depois de definido o problema
em estudo.
Reta de Regresso: a recta traada sobre uma dada Nvem de
Pontos, sendo um modelo matemtico que pretende descrever a
relao existente entre duas variveis unidimensionais de uma
distribuio bidimensional.
Reduo de categorias (bracketing, collapsing or grouping): a
operao de combinar categorias ou intervalos de valores de uma
varivel para produzir um nmero menor de categorias.
Regio crtica ou de rejeio (critical region or region of rejection): A
rea sob a distribuio amostral que determinada de acordo com o
nvel de significncia do teste.
Relaes Estatsticas: so relaes que se podem estabelecer entre
determinadas variveis de um problema em estudo.
Risco relativo: proporo de pessoas expostas ao fator de risco que
desenvolveram a doena sobre a proporo de pessoas no expostas
que desenvolveram a doena. Vale 1 se as pessoas expostas e no
expostas desenvolveram a doena na mesma proporo.
Separador de Frequncias: um tipo de tabela que permite ter uma
percepo imediata do aspecto global dos dados sem perda da
informao contida na coleco dos dados inicial.
Somatrio ( ): representa, de forma abreviada, uma soma.
Sondagem: o estudo estatstico que se baseia numa parte da
populao, isto , numa amostra que deve ser representativa dessa
populao.
Surveillance: Observaes contnuas com um plano de ao com base
nos resultados
Survey: Observao com um objetivo/meta especfica, semelhante a
um estudo epidemiolgico transversal.
T quadrado de Hotteling (Hotelling's t-square): um teste
multivariado para verificar diferenas de mdias para casos onde
existam mltiplas variveis dependentes intervalares e dois grupos
formados por variveis independentes categricas. Para passar do
trao de Hotelling ou trao de Lawley-Hotelling para o T quadrado
deve-se multiplicar o trao por (n - l), onde "n" o tamanho da
amostra considerando todos os grupos e "l" o nmero de
23

subgrupos.
Tabela de Frequncias: so tabelas onde se apresentam os dados por
classes e as frequncias respectivas.
Tamanho da Amostra: o nmero de elementos que constituem uma
dada amostra.
Teste bicaudal: teste cujo objetivo testar apenas se as mdias (ou
propores) so iguais ou diferentes e no estabelecer qual delas
maior ou menor.
Teste bilateral (two-tailed test): Um teste dito bilateral se a regio
crtica estiver dividida meio a meio entre valores superiores e
inferiores.
Teste da soma dos postos de Wilcoxon (Wilcoxon's rank sum test):
Um nome alternativo para o teste de Mann-Whitney.
Teste de esfericidade de Bartlett (Bartlett's sphericity test): Testa a
hiptese nula de que a matriz das covarincias das variveis
dependentes ortonormalizadas proporcional a uma matriz
identidade.
Teste de esfericidade de Mauchly (Mauchly sphericity test): Testa a
hiptese nula de que a matriz populacional de correlaes uma
matriz identidade. Se o valor da estatstica qui-quadrado obtido
significativo ento a matriz de correlaes a ser analisada no
aleatria. Neste caso conveniente utilizar o teste de Humphrey e
Ilgen.
Teste dos sinais de Wilcoxon (Wilcoxon's signed rank test): Um
teste no paramtrico ou de distribuio livre para testar a diferena
entre duas populaes utilizando amostras emparelhadas. O teste
toma por base as diferenas absolutas dos pares de observaes das
duas amostras, ordenados de acordo com o seu valor onde cada
posto (diferena) recebe o sinal da diferena original. A estatstica
teste a soma dos postos positivos.
Teste exato de Fisher (Fisher's exact test): Um teste de
independncia entre duas variveis categricas dicotmicas. Foi
introduzido por Sir Ronald A. Fisher em 1935. O teste envolve o uso
da distribuio hipergeomtrica para calcular a probabilidade de uma
determinada combinao de totais parciais (somas de linhas ou
colunas) sob a hiptese nula de independncia.
Teste monocaudal: teste cuja hiptese alternativa uma
desigualdade, ou seja, deseja-se testar se o valor observado maior
24

ou menor ao valor crtico correspondente hiptese nula.


Teste no paramtrico (nonparametric test): Um teste no
paramtrico testa associaes, dependncia/independncia e
modelos ao invs de parmetros.
Teste Q de Cochran (Cochran's Q test).
Teste qui-quadrado (chi square test).
Teste t - de Student (t test or Student t test): Teste paramtrico que
utiliza duas amostras independentes. Testa a diferena entre duas
mdias populacionais quando os desvios padres populacionais so
desconhecidos (o que ocorre na grande maioria dos casos).
Teste t: teste estatstico cujo objetivo testar a igualdade entre duas
mdias. O teste supe independncia e normalidade das
observaes. As varincias dos dois grupos podem ser iguais ou
diferentes, havendo alternativas de teste para as duas situaes.
Neste servio, consideramos apenas o caso em que as varincias so
iguais.
Teste U de Mann-Whitney (Mann-Whitney U test).
Teste unilateral (one-tailed test): Um teste dito unilateral quando a
regio crtica ou regio de rejeio est situada direita
Teste Z: teste estatstico cujo objetivo testar a igualdade entre uma
mdia conhecida (numa populao ) e uma mdia calculada pelo
pesquisador (numa amostra). O teste supe normalidade das
observaes.
Unidade Amostral: a menor diviso do material que se mede em
separado
Unidade Estatstica ou Indivduo: cada um dos elementos da
populao.
Unidade Experimental: a menor diviso do material experimental que
poderia receber qualquer tratamento.
Validade externa: refere-se inferncia estatstica, ou seja, a
generalizao dos resultados para toda a populao de interesse.
Validade interna: a validao dos resultados apenas para a amostra
considerada, ou seja, a validade das inferncias para os indivduos
que participaram do estudo. Os clculos de tamanho de amostra
feitos aqui so baseados principalmente nas tcnicas estatsticas a
serem utilizadas. Entretanto, importante ressaltar que, o fato do

25

nmero de observaes ser suficiente no garante a utilizao da


tcnica estatstica. Em geral, existem algumas suposies que devem
ser satisfeitas como por exemplo, a normalidade das observaes em
testes de comparao de mdias.
Valor crtico (critical value): Valor da distribuio amostral que
separa a regio de regio da de no rejeio.
Varincia ( 2 ): a medida que permite avaliar o grau de disperso
dos valores da varivel em relao mdia.
Varincia (variance): a mdia do quadrado das distncias
euclidianos que cada ponto do conjunto est da mdia aritmtica.
Varincia amostral (s2): Serve para estimar a varincia populacional.
Varincia populacional (s2): um valor que mede o grau de
disperso dos valores da varivel, na populao, em relao mdia
populacional. Definida como a soma dos quadrados dos desvios dos
valores da varivel em relao a sua mdia, divido pelo nmero de
observaes: Soma[(Xi mdia)2]/N
Varincia relativa (relative variance): o quociente entre a varincia
e o quadrado da mdia.
Variveis Contnuas: so as variveis que podem tomar qualquer
valor de um determinado intervalo.
Variveis Discretas: so as variveis que podem tomar um nmero
finito ou uma infinidade numervel de valores.
Variveis Qualitativas: o mesmo que Atributos Qualitativos.
Variveis Quantitativas: o mesmo que Atributos Quantitativos.
Varivel (variable): Uma caracterstica comum a todos os dados.
Varivel aleatria: uma varivel cujo valor numrico atual
determinado por probabilidades. Por exemplo, X: pontuao na
escala de atitudes em relao Estatstica, Y: nmero de disciplinas
reprovadas em Estatstica, etc. Observe que o resultado depende do
aluno selecionado. A varivel aleatria tem uma distribuio de
probabilidades associada, o que nos permite calcular a probabilidade
de ocorrncia de certos valores.
Varivel contnua: varivel cujos possveis valores formam um
intervalo de nmeros reais e que resultam, normalmente, de uma
mensurao, como por exemplo peso, altura e presso arterial.
Varivel dependente (VD): Mede o fenmeno que se estuda e que se
26

quer explicar. So aquelas cujos efeitos so esperados de acordo


com as causas. Elas se situam, habitualmente, no fim do processo
causal e so sempre definidas na hiptese ou na questo de
pesquisa. No nosso exemplo: desempenho em estatstica e atitudes
em relao Estatstica.
Varivel dicotmica: varivel em que s existem duas respostas
possveis, como por exemplo sim/no, doente/no doente.
Varivel discreta: varivel quantitativa cujos possveis valores
formam um conjunto finito ou enumervel de nmeros e que
geralmente resultam de uma contagem, como por exemplo o nmero
de filhos.
Varivel independente (VI): So aquelas variveis candidatas a
explicar a(s) varivel(eis) dependente(s), cujos efeitos queremos
medir. Aqui devemos ter cuidado, pois mesmo encontrando relao
entre as variveis isto, no necessariamente, significa relao
causal.
Varivel qualitativa (ou categrica) nominal: So aquelas cujas
respostas podem ser encaixadas em categorias, sendo que cada
categoria independente, sem nenhuma relao com as outras: sexo
(masculino, feminino), raa (branco, preto, outro), etc.
Varivel qualitativa (ou categrica) ordinal: So aquelas cujas
categorias mantm uma relao de ordem com as outras, que podem
ser regulares ou no (existe uma ordem natural nas categorias):
classe social (alta, mdia, baixa), auto-percepo de desempenho em
Matemtica (pssimo, ruim, regular, bom , timo), etc. A rigor, no
tratamento estatstico das variveis categricas, no existe diferena
se ela for nominal ou ordinal, a nica observao que quando voc
est lidando com uma varivel ordinal, aconselhvel manter a
ordem natural das categorias, de menor para maior, na hora da
apresentao, seja em tabela ou em grficos.
Varivel quantitativa contnua: Resultados de mensuraes, podem
tomar infinitos valores: pontuao na escala de atitude, nota na
prova de matemtica, pontuao no vestibular, etc.
Varivel quantitativa discreta: So aquelas resultantes de contagens,
constituem um conjunto finito de valores: nmero de filhos, nmero
de reprovaes em matemtica, idade em anos completos, etc.
Varivel: uma caracterstica da populao. Toda questo de
pesquisa define um nmero de construes tericas que o
pesquisador quer associar. O grau de operacionalizao destas
construes no faz parte de um consenso. Por essa razo, a seo
27

que trata das definies das variveis deve permitir ao leitor avaliar
a adequao dos instrumentos utilizados, as variveis escolhidas e
as construes tericas descritas no quadro conceitual.
Vcio (bias): Conceito referente a uma estatstica ou estimador. Um
estimador dito sem vcio (no-viciado), no- tendencioso ou
imparcial se a mdia de sua distribuio amostral coincide com o
parmetro a ser estimado.
Wavelet
(Wavelet):

uma
funo
matemtica
til
para
processamento de sinais e compresso de imagens, embora seu uso
com estes propsitos seja recente a teoria no nova. Os princpios
so semelhantes ao da Anlise de Fourier. Na WWW wavelets tem
sido utilizadas para a compresso de imagens com mais sucesso do
que o mtodo familiar JPEG.

Referencias:
http://www.pucrs.br/famat/statweb/glossarios/gloesta/ge_yz.htm
http://www2.esec-miguel-torga.rcts.pt/Projectos/estatistica.pdf
http://www.educ.fc.ul.pt/icm/icm2003/icm24/dicionario.htm
http://www.unibero.edu.br/glossarios_def.asp
http://www.socio-estatistica.com.br/Edestatistica/glossario.htm

28

Вам также может понравиться