Вы находитесь на странице: 1из 10

1

Mtodos II Varivel: uma caracterstica referente a um conjunto de elementos(geralmente pessoas em cs), que assume valores diferenciados para cada um desses elementos. uma noo abstracta, porque o que existe so indivduos com determinadas caractersticas especficas, assumindo cada um deles, um e s um valor determinado. Classificao de variveis: a) Quanto contiguidade dos valores (para variveis numricas): varivel contnua no tem intervalos entre os valores que teoricamente pode assumir. Varivel discreta os valores so separados uns dos outros. b) Quanto aglutinao dos valores (tambm para variveis numricas): chama se varivel desagregada valores que so diretamente recolhidos dos indivduos. Na varivel categorizada ou classificada - os valores j foram tratados, de modo a aparecerem aglutinados em intervalos regulares (classes ou categorias), sejam ou no de igual amplitude. Normalmente, tomam se como valores da varivel categorizada os pontos mdios dos intervalos, pois considera se que a esto agrupados todos os elementos pertencentes ao respetivo intervalo. c) Quanto perfeio de medio (ou nvel de medio), devemos distinguir entre: variveis nominais; variveis ordinais; variveis de intervalo; variveis de razo (ou de proporo)

Nveis de medio: os nveis de medio so estabelecidos em funo do grau de quantificao dos valores da escala de referncia e do tipo de operaes que estes valores permitem. Varivel nominal: mera classificao dos objectos; os diferentes valores de escala so apenas diferenciados pelo nome respectivo . Os objectos so colocados segundo os valores de uma escala qualitativa. A sua ordem arbitrria, no quantitativa. (ex: gnero; opo poltica) Varivel ordinal: os valores so ordenados segundo a grandeza (crescente ou decrescente) da caracterstica mas no possvel determinar exactamente a quantidade de cada valor. J a referncia quantitativa, mas falta a unidade de medida e no podemos saber a quanto corresponde a diferena entre as duasAqui j no podemos ordenar as categorias segundo um critrio intrnseco: a quantidade da caracterstica a que corresponde a varivel. (ex: muito, pouco, s vezes) Varivel intervalo: existe unidade de medida, o que permite a quantificao exacta de qualquer dos seus valores e a possibilidade de comparar os valores entre si(quantidade) e tambm os respectivos intervalos entre valores. No h zero absoluto (convencional), o que impede de comparar valores em termos de proporo. (ex: QI) Descrio e anlise de uma varivel Existe um conjunto de tcnicas que tm como objectivo descrever, sintetizar as caractersticas de cada varivel de uma populao ou de uma amostra. E com o conhecimento destas caractersticas que ficamos com a ideia do modo como os valores dessa varivel se comportam.

Exemplo: no caso da varivel altura de um grupo podemos comear por calcular a mdia das alturas, que no entanto no diz se h muitas pessoas baixas a compensar muitas pessoas altas, ou se pelo contrrio a maior parte se encontra em alturas mdias (uma medida de disperso dos valores ir-nos- ajudar a precisar a imagem nesse aspecto) Frequncia: o nmero de casos que aparecem com determinado valor da varivel
Exemplo: varivel altura- valores 1,70;1,80) f170 = 13 nmero de casos

Distribuio de frequncias: conjunto de todas as frequncias relativas a uma varivel

Variveis de intervalares
a) Apresentao de dados: tabelas e grficos - quando recolhemos os dados de forma direta, obtemos los em bruto, sem nenhuma especial sistematizao, o que faz com que se trate de uma varivel desagregada, ou seja uma varivel com dados desagregados. A grande quantidade de dados apresentados acaba por fazer com que a identificao e anlise dos dados seja mais difcil, assim como nos dificulta a perceo das suas caractersticas mais especficas. - precisamente por isso que, importante organizarmos os dados em classes ou categorias (processo a que chamamos classificao ou categorizao), que nos permite um melhor conhecimento da varivel. - Para melhor visualizar a distribuio dos dados(idade), prefervel classifica los em categorias com amplitude de por exemplo de 10 anos. Perdemos alguma informao relativa a cada caso Ganhamos na capacidade de interpretao e manipulao dos dados.

Torna se mais til para comparar esta distribuio de valores com qualquer outra distribuio - Trata se de uma distribuio ordenada, que o modo mais lgico de apresentar os dados Ordenao feita segundo valores crescente da varivel, mas tambm pode ser ao contrrio - Frequncias acumuladas: quando os dados esto ordenados - Frequncias acumuladas permitem introduzir a noo genrica de quantil

Representao grfica: recorre-se aos grficos para uma visualizao mais intuitiva dos dados, fazemos uma melhore leitura da realidade numa forma visual. Histograma- grfico de barras para variveis intervalares categorizadas, em que cada barra tem um comprimento proporcional ao nmero de casos encontrados na categoria correspondente. A altura das barras proporcional frequncia da respectiva categoria. Polgono de frequncias- se traarmos uma linha pelos pontos mdios de cada uma das colunas do histograma. O polgono prolonga-se para ambos os lados at atingir os pontos mdios das bases das duas classes extremas com frequncia igual a zero. Ogiva de Galton- a primeira curva obtida a partir de frequncias acumuladas. Os valores do eixo vertical so agora a das frequncias acumuladas, numa escala muito diferente da dos grficos anteriores. Tambm se pode traar com as frequncias relativas acumuladas.

Medidas de tendncia central


Zonas de distribuio em que h mais possibilidade de encontrar maior nmero de casos Mdia aritmtica- obtm-se dividindo a soma dos valores pelo seu nmero. Aqui os valores tm o mesmo peso (50/50). Soma-se tudo e divide-se. Exige-se dados quantitativos (varivel de intervalo) e para distribuies assimtricas. Mdia ponderada- cada valor tem um determinado peso (ex: no clculo da mdia de um curso as UC no tm igual peso, exemplo 60% 40%) Mediana- divide-se a distribuio em duas partes iguais, podendo dar uma melhor ideia de tendncia central. Como na mdia entram todos os valores (extremos) , eles vo arrastar a mdia na sua direco para fora dos valores mais centrais. A mediana, como um valor posicional, no sofre esse arrastamento . Clculo- dados desagregados: se o nmero for impar, a mediana est no meio; se for par, soma-se os dois valores do meio e faz-se a mdia aritmtica. Dados agregados a mediana onde se situam os 50% de frequncia acumulada. Nmero impar: 1,2,3,4,5 nmero par: 1,2,3,4,5,6 3+4=7 7/2 = 3,5---mediana Moda- o valor mais frequente nessa distribuio. Se ela for categorizada, a categoria modal a que apresenta maior frequncia. Se existirem mais de 2 valores com igual frequncia mxima, a distribuio pode ser bimodal ou multimodal. Mas se for unimodal e simtrica, a moda coincide com a mdia e a mediana.

Medidas de localizao
Quartil -1 quartil (25%) Tem abaixo de si a primeira quarta parte dos elementos(Exemplo: se a minha idade se situa sobre
o 1 quartil, significa que h 1/4 de pessoas com idades inferiores minha e 3/4 com idade superior.

-2 quartil (50%)- coincide com a mediana -3 quartil (75%) - tem acima de si a ltima quarta parte dos elementos Exemplo: se a minha idade se situa sobre o
3 quartil, significa que h 1/4 de pessoas com idades superiores minha e 3/4 com idade inferior.

- metade das pessoas se situam acima e outra metade abaixo Decil-Dividem a distribuio ordenada em 10 partes iguais(ex: um aluno teve 17 eo decil 6(60%)- 60% teve menos de 17 e 40% teve mais) Percentil- divide a distribuio ordenada em 100 partes iguais

Medidas de disperso Noo de heterogeneidade da amostra, no que se refere maior ou menor disperso dos dados Ajudam a comparar o comportamento das distribuies no que se refere maior ou menor disperso Amplitude- diferena entre o valor mais alto e o mais baixo; rpida e bvia, mas como se baseia nos extremos, nada indica acerca da variabilidade dos valores, pouco representativa( mais elevada em amostras com maior nmero de elementos) Desvio quartlico- mede a distncia entre o 1 e o 3 quartil Desvio mdio- mdia aritmtica das distncias de cada valor da varivel mdia da mesma varivel. Indica como que em mdia os valores se distanciam da mdia da varivel. Tomando os desvios em valor absoluto, somamo-los e dividimos pelo nmero de casos.
Porque as diferenas positivas iriam superar as negativas , temos de livrar-nos do sinal Desvio padro- a mais importante e a mais usada, pode servir de unidade de medida para medir a distncia de qualquer valor relativamente mdia. Ex: se a distribuio A tiver mdia igual a 70 e desvio padro igual a 5, o valor 80 encontra-se a 2 desvios padro da mdia. Varincia- o quadrado do desvio padro, indicando o quo dispersos so os dados. a mdia do quadrado dos desvios. A varincia atribui maior peso aos casos extremos da varivel porque os desvios ao quadrado vo influenciar mais na soma total. Coeficiente de variao- controla o desvio padro pela mdia, comparando amostras para ver se as diferenas do desvio padro so grandes como aparentam. Variveis nominais Distribuio qualitativa na distribuio da frequncia no h intervalos nem categorias; nem frequncias cumulativas. As frequncias da varivel nominal recorrem a grficos (no assumem significado quantitativo e s cabe a moda) - medidas de tendncia central-categoria modal -medidas de disperso no fazem sentido

Propores- indicam as frequncias em relao a um padro comum; em relao unidade para as propores e em relao a um para as percentagens -a soma das propores de todas as categorias igual unidade - o quociente entre a frequncia e o nmero total de elementos - so teis para comparar distribuies de frequncias de populao de diferentes tamanhos Percentagens- mais usadas e obtm-se facilmente, multiplicando -se estas por 100. Ao analis-las deve-se fazer sempre referncia aos nmeros absolutos correspondentes. importante fazer referncia ao total, somando. Rcios- permitem estabelecer comparaes entre frequncias de diferentes valores da mesma varvel Quando h um nmero elevado de rcios prefervel utilizar a percentagem Taxas- a mesma lgica das percentagens; dizem respeito a uma base convencional. Ex.taxa de nascimentos o nmero de nados vivos por 1000 mulheres em idade frtil Variveis ordinais -quartil, decil, porque os seus valores so quantitativos e ordenados. -Usa-se tambm o desvio quartlico(medida de disperso) -Medidas de tendncia central: moda e mediana

Estatstica indutiva -determina margens de segurana ao generalizar (para a populao) os resultados obtidos no estudo de uma amostra extrada dessa mesma populao. A condio primeira desta generalizao que a amostra seja aleatria. Exemplo 1: Rendimento: 50 euros A media correspondente na populao muito provavelmente, encontrar-se- perto daquele valor. Mas quao perto? Os procedimentos da estatistica indutiva vo permitir-nos calcular (em certas circunstancias) um intervalo, centrado no valor de 500, que far com que podemos afirmar que a probabilidade da populao estar contida no valor de 500 euros forte, por exemplo de 95%. Exemplo 2: - Definir uma hiptese acerca do valor de uma determinada caracterstica da populao (populao 550 euros) - Na amostra que estudamos, o valor correspondente encontrado de 500 euros - Podemos atravs da estatstica indutiva rejeitar a 1 hiptese, como sendo muito provavelmente falsa. Populao : o conjunto de elementos cujas caractersticas queremos estudar. No entanto como nem sempre possvel ter acesso a todos esses elementos, recorre se ento a uma amostra que no fundo, o conjunto de elementos (escolhido na populao em questo) que vamos estudar, com o objetivo de posteriormente generalizar a toda a populao, as concluses que obtivemos. Amostragem : o processo de escolha da amostra. Damos o nome de amostragem probabilstica aquela que se realiza aleatoriamente, isto , segundo normas de escolha de acaso. Na estatstica indutiva, pressupomos que as amostragens so sempre probabilsticas, ou seja, aqui todos os elementos da populao tem igual probabilidade de serem escolhidos para a amostra.

Parmetro : o nome dado a uma caracterstica (quantitativa) da populao, assim como a mdia e o desvio-padro de cada varivel, na populao; ou mesmo a frequncia de um determinado valor da varivel. Os parmetros So nicos, no sentido em que cada um deles tem um s valor, na nica populao. Chamamos distribuio de amostragem (ou distribuio amostral) de determinada estatstica (por exemplo, a distribuio de amostragem das medias) distribuio de frequncias dos valores dessa estatstica, quando resultantes de amostras aleatrias, independentes e do mesmo tamanho, tiradas sucessivamente (teoricamente, em numero infinito) de uma s populao. Probabilidade : tem que ver com as expectativas relativamente a realizao de determinado acontecimento (acontecimento favorvel), se conseguirmos temos um caso de sucesso. Adotando uma definio operativa de probabilidade, dizemos que probabilidade e igual ao numero de casos favorveis sobre o numero de casos possveis. - Proporo, varia entre zero(acontecimento impossvel) e a unidade(acontecimento certo). - Pode se indicar em termos de percentagem, multiplicando por 100 o valor da proporo.

a) Testes ou ensaios de hipteses neste contexto que se definiu hiptese como uma afirmao relativa a um especto no conhecido, elaborada de tal modo que pode ser rejeitada, ou seja, pode provar-se que e falsa, por analise dos dados empricos. No entanto antes de esta afirmao ser posta a prova, devemos ter o cuidado de indicar claramente que resultados da experiencia nos levaro a rejeitar a hiptese e que resultados implicaro a no rejeio da mesma. Deste modo, esta situao implica que se proceda a uma fronteira de separao (ponto crtico) entre o rejeitar e o no rejeitar a hiptese. No entanto, apesar disso, corremos sempre o risco de nos enganarmos.
Exemplos: Seja a hiptese que nos diz que A da origem a B (A B). Se esta correta, sempre que A ocorre, verifica-se B. Assim, se ocorrer A e, por observao da realidade, no encontrarmos B, podemos afirmar que a hiptese e falsa, rejeitando-a. Mas, se encontrarmos B, isso, em geral, no prova Indiscutivelmente que a hiptese e verdadeira, pois e sempre (ou quase sempre) possvel imaginar uma teoria alternativa (C) que explique B. Portanto, neste segundo caso, no poderemos rejeitar a hiptese, mas tambm no ficara inequivocamente demonstrado que ela e a verdadeira. Se, de facto, a hiptese e falsa (embora nao o possamos saber com os dados acessveis), a experiencia Realizada falha no objetivo de rejeitar uma hiptese falsa. Cometemos, ento, o chamado erro , ou erro de tipo II.( no rejeio de uma hiptese falsa) A, muito provavelmente (ou, na maior parte dos casos), implica B. O que significa que se admite a verificacao da afirmacao na grande maioria das circunstancias, embora com a possibilidade de algumas excepcoes, em numero relativamente reduzido de casos. Portanto, se na nossa observacao da realidade nao encontrarmos B, isso pode ser devido ao facto de a hipotese ser falsa (e o mais provavel, segundo o que ficou dito acima) ou ao facto de estarmos a lidar com um dos casos-excepcao. Sendo este tipo de casos muito raro (pouco provavel), atrevemo-nos a rejeitar a hipotese, correndo, no entanto, um pequeno risco de nos enganarmos. Se, precisamente, acontecesse que nos tivesse calhado, na analise, um dos poucos casos raros, estariamos, sem o sabermos, a rejeitar uma hiptese verdadeira. A rejeio de uma hiptese verdadeira e um erro: o erro ou de tipo I.( rejeio de uma hiptese verdadeira)

- O caminho normal no e provar diretamente uma teoria mas rejeitar as suas contrrias, ou seja, devemos tentar rejeitar uma hiptese no conveniente e no procurar provar diretamente a hiptese que nos interessa. Hiptese nula : Uma hiptese acerca de uma caracterstica da populao, que, de facto, esperamos rejeitar. - Admite se a hiptese nula verdadeira

- Decide-se que risco que se est disposto a correr de rejeitar a hiptese nula, sendo ela verdadeira (risco de erro ou de tipo I). Este nvel de risco (chamado nvel de significncia do teste) tem que ver com o grau de segurana pretendido ao concluir pela rejeio da hiptese nula. - Calcula-se o valor da estatstica relevante, na amostra, que d a possibilidade de saber qual e a probabilidade de obter o valor que, de facto, viemos a obter para esta estatstica. - Se a probabilidade calculada no ponto anterior for muito pequena rejeita-se, embora sabendo que corremos um certo risco de estar a rejeitar uma hiptese verdadeira. Se aquela probabilidade for maior do que , no se rejeita a hiptese nula, nada se conclui sobre a sua veracidade. Associao entre duas variveis -Existncia de associao quando as duas variveis vo no mesmo sentido seja a subir ou a descer - intensidade: fraca ou forte -direco: positiva ou negativa

No estudo das associaes entre variveis, distinguimos 3 aspetos: - Existncia da associao - Intensidade de associao: - associao perfeita se a determinao entre uma varivel e outra completa - associao imperfeita: associao fraca ou forte - Direo da associao (apenas para variveis de intervalo e ordinais): Associao positiva, se os valores das 2 variveis tendem a aumentar em simultneo Associao negativa, se os valores de uma das variveis tenderem a diminuir quando os da outra crescem
Amostragem aleatria: pode fazer-se teste de hiptese, caso contrrio no. Associao de variveis: Da mesma amostra (idade e hbitos de leitura) De amostras independentes (between subjects) entre CC e direito De amostras emparelhadas (within subjects) hbitos de leitura no incio e no fim do ano

Associao entre duas variveis nominais: V de Cramer derivado do qui quadrado -varia entre 0 e 1 (- que 0,1 fraca; 0,1 e 0,3 moderada; + que 0,3 interessante) -igual a zero se no h associao -no tem direco -varia com o valor de N -teste de hipteses: amostra aleatria e N grande (nem sempre possvel calcular) - no pode haver nenhuma clula de frequncia esperada, seno invalida tudo(no podemos usar o V de Cramer, descrevemos apenas a tabela) - s admite 5 em 100 erros e a vrgula na primeira direita(aprox.sig.) Associao entre duas variveis ordinais: Gamma de Goodmann - para dados agrupados -varia entre -1 e 1 -variveis com categorias ordenadas no mesmo sentido! Seno basta mudar de sinal

Associao entre duas variveis de intervalo: R de Pearson ou correlao -varia entre -1 e 1 - coeficiente de correlao linear -distribuio normal (- que 0,2 muito fraca (0,2 e 0,3 fraca (0,3 e 0,7 moderada (0,7 e 0,9 forte (0,9 e 1 muito forte - podemos usar medidas de medio inferior na varivel superior mas o contrrio j no possvel -os testes de hiptese s quendo a amostra aleatria e na populao quando temos certeza -entre 2 variveis diferentes usamos sempre a medida com o nvel de medida inferior Parte prtica

10

tica e epistemologia em cincias sociais -valorao de comportamentos no sentido do que proibido ou no fazer. o que moralmente correcto -deontologia- tica aplicada s profisses Questes ticas e falhas -forar as pessoas a participar nas investigaes -obrigara as pessoas a participarem nas investigaes -ocultar aos participantes o verdadeiro objectivo da investigao -induzir os participantes em erro -sujeitar os participantes a alguma forma de stress fsico ou mental -desrespeitar a privacidade do participante Princpios ticos na recolha de dados -participao voluntria -no ocultao da informao -justia no trabalho de todos os envolvidos -proteco da privacidade dos participantes -No causar dano (causar beneficio) -rigor no tratamento de dados -fidelidade nos dados -honestidade, abertura relativamente aos instrumentos de recolha e anlise de dados

Вам также может понравиться