You are on page 1of 31

Instituto Politcnico de Bragana Escola Superior de Educao

Escola Superior de Educao - Instituto Politcnico de Bragana

Descrio, anlise e interpretao de informao quantitativa

Escalas de medida, estatstica descritiva e inferncia estatstica

Prof. Carlos Morais Bragana

Instituto Politcnico de Bragana Escola Superior de Educao

ndice
1. Descrio, anlise e interpretao de informao quantitativa ............. 3 1.1. 1.2. Introduo ........................................................................................ 3 Escalas de medida ............................................................................ 3

1.2.1. Estrutura do processo de medio ................................................... 3 1.2.2. Natureza da medida das variveis.................................................... 4 1.2.3. Escalas de medida das variveis ...................................................... 5 1.2.4. Tipos de escalas ............................................................................... 5 1.3. Estatstica descritiva ........................................................................ 8 1.3.1. Interpretao de dados ..................................................................... 8 1.3.1.1. Dados qualitativos .................................................................... 8 1.3.1.2. Dados quantitativos .................................................................. 9 1.3.2. Organizao e apresentao de dados.............................................. 9 1.3.3. Distribuio de frequncias ............................................................. 9 1.3.4. Distribuies de frequncias (exemplos)....................................... 10 1.3.5. Medidas de estatstica descritiva ................................................... 12 1.3.6. Medidas de tendncia central......................................................... 12 1.3.6.1. Mdia aritmtica ..................................................................... 12 1.3.6.2. Moda ....................................................................................... 12 1.3.6.3. Mediana .................................................................................. 13 1.3.7. Medidas de disperso..................................................................... 13 1.3.7.1. Desvio absoluto mdio ........................................................... 13 1.3.7.2. Varincia................................................................................. 13 1.3.7.3. Desvio padro ......................................................................... 13 1.4. Inferncia estatstica ...................................................................... 15 1.4.1. Unidade, amostra, populao......................................................... 16 1.4.2. Amostragem, recenseamento e sondagem ..................................... 16 1.4.3. Parmetros e estatsticas ................................................................ 16 1.4.4. Estatuto das variveis na investigao........................................... 16 1.4.5. Amostra.......................................................................................... 18 1.4.5.1. Modelos de amostras .............................................................. 18 1.4.5.2. Amostras probabilsticas......................................................... 18 1.4.5.3. Amostras no probabilsticas .................................................. 19 1.4.6. Conhecimento cientfico e tipos de investigao........................... 20 1.4.7. Hipteses........................................................................................ 20
____________ Carlos Morais

Instituto Politcnico de Bragana Escola Superior de Educao

1.4.8. Hipteses estatsticas ..................................................................... 21 1.4.9. Testes estatsticos........................................................................... 22 1.4.10. Procedimentos na aplicao de testes estatsticos ......................... 23 1.4.11. Exemplo de tratamento de dados numa situao concreta ............ 23 1.4.11.1. Contexto................................................................................ 23 1.4.11.2. Procedimentos de tratamento de dados................................. 24 1.4.11.3. Representao grfica de dados............................................ 25 1.4.11.4. Representao de dados em tabelas ...................................... 25 1.4.11.5. Hipteses estatsticas ............................................................ 27 2. Bibliografia ............................................................................................ 29

ndice de Figuras
Figura 1: Figura 2: Figura 3: Figura 4: Figura 5: Figura 6: Figura 7: Figura 8: Figura 9: Figura 10: Figura 11: Figura 12: Estrutura do processo de medio (um exemplo) ......................... 4 Distribuio de frequncia da varivel avaliao final ........... 10 Distribuio de frequncia da varivel idade .......................... 10 Observaes por classes.............................................................. 11 Distribuio de frequncia da varivel altura.......................... 11 Fases na definio e investigao de um problema .................... 15 Modelos de amostras probabilsticas .......................................... 18 Modelos de amostras no probabilsticas ................................... 19 Escalas de medida e procedimentos............................................ 22 Resultados globais dos alunos .................................................. 25 Distribuies das pontuaes - ps-teste .................................. 26 Resultados estatsticos .............................................................. 27

____________ Carlos Morais

Instituto Politcnico de Bragana Escola Superior de Educao

1. Descrio, anlise e interpretao de informao quantitativa 1.1. Introduo


Com a apresentao deste documento sobre o mdulo, fazendo referncia aos seus contedos pretende-se facultar aos mestrandos algumas designaes e conceitos, que para alm da sua apreciao e anlise no contexto das sesses de trabalho podero facilitar a sua utilizao no contexto da investigao que se proponham realizar. Considerando-se, no entanto, que a estatstica uma cincia recente com muitos dos seus conceitos a admitirem diversas designaes e interpretaes, pelo que cada designao ou conceito, que figure neste documento, deve ser visto como uma proposta de entendimento, que embora fundamentada, poder ser sempre aprofundada. Os contedos deste mdulo fazem parte da Estatstica. A Estatstica tem por objectivo fornecer mtodos e tcnicas para se lidar, racionalmente, com situaes sujeitas a incertezas. A Estatstica pode ser considerada como um conjunto de tcnicas e mtodos de pesquisa que entre outros tpicos envolve a planificao de experincias, a recolha e organizao de dados, a inferncia, o processamento, a anlise e a disseminao de informao. Por vezes, a Estatstica, considerada um ramo da Matemtica, que tem como principais objectivos obter, organizar e analisar dados, determinar as correlaes entre eles, proporcionando concluses e previses. tambm uma cincia de desenvolvimento de conhecimento humano atravs do uso de dados empricos. Baseiase na teoria estatstica, um ramo da matemtica aplicada. Na teoria estatstica, o aleatrio e a incerteza so modelados pela teoria das probabilidades. Algumas prticas estatsticas incluem, por exemplo, o planeamento, o resumo e a interpretao de observaes. Actualmente os dados estatsticos so obtidos, classificados e armazenados em suportes digitais e disponibilizados em diversos sistemas de informao acessveis a investigadores, cidados e organizaes da sociedade que, por sua vez, podem utilizlos no desenvolvimento das suas actividades. O processo de obteno, armazenamento e disseminao de informaes estatsticas tem sido acompanhado pelo rpido desenvolvimento de novos recursos, tcnicas e metodologias de anlise de dados.

1.2. Escalas de medida


1.2.1. Estrutura do processo de medio De acordo com Herrero & Cuesta (2005) a estrutura do processo de medio tem quatro nveis: a) a varivel (propriedade que se quer medir exemplos: inteligncia, memria, temperatura); b) o atributo (o grau ou modalidade em que se manifesta a propriedade medida exemplos: baixo, mdio, alto); c) o valor (modo de expressar de forma numrica o atributo exemplo: 1, 2 e 3); e d) a relao (ligao entre os vrios valores da varivel).

____________ Carlos Morais

Instituto Politcnico de Bragana Escola Superior de Educao

Os nmeros que codificam os valores dos atributos podem ser definidos a partir de diferentes regras. De um modo geral, so definidos a partir de quatro tipos de escalas de medida: nominal, ordinal, intervalar e proporcional (ou razo). Figura 1: Varivel Estrutura do processo de medio (um exemplo) Classificao final

Atributos

Excelente

Satisfaz bastante

Satisfaz

Satisfaz pouco

No satisfaz

Valores

Relao 1.2.2. Natureza da medida das variveis Como o termo sugere, varivel reporta-se a caractersticas ou atributos que podem tomar diferentes valores ou categorias, o que se ope ao conceito de constante (Almeida & Freire: 2000: 59). As variveis, se apenas considerarmos a natureza dos valores que podem assumir, podem ser: variveis qualitativas e variveis quantitativas. Os valores possveis de uma varivel qualitativa so: qualidades ou smbolos. A relao entre esses valores s tem sentido em termos de igualdade e de desigualdade. As variveis qualitativas (descrevem tipos ou classes) podem ser: dicotmicas (apenas duas categorias) ou politmicas (trs ou mais categorias). Os valores de uma varivel quantitativa so representados atravs de nmeros. As variveis quantitativas podem ser discretas ou contnuas. Uma varivel diz-se discreta quando os seus valores podem ser relacionados por uma correspondncia biunvoca com um subconjunto de nmeros inteiros. Uma varivel diz-se contnua quando os seus valores podem ser relacionados por uma correspondncia biunvoca com intervalos de nmeros reais. Assim, as variveis discretas assumem valores inteiros e as variveis contnuas assumem valores reais. Em sntese, as variveis em psicologia podem dividir-se em: a) qualitativas (atributos ou categorias), permitindo apenas descrever sujeitos ou situaes; e, b) quantitativas (caractersticas mensurveis e que se podem exprimir em valores numricos reportados a uma unidade de medida ou de ordem), permitindo j uma avaliao tomando critrios de frequncia, de grau ou de intensidade (variveis intervalares) ou critrios de sequncia ou ordem (variveis ordinais).

____________ Carlos Morais

Instituto Politcnico de Bragana Escola Superior de Educao

1.2.3. Escalas de medida das variveis O registo das ocorrncias de um estudo cientfico necessita de formas para representar os acontecimentos e os fenmenos adequadamente, ou seja, formas de registar os dados, que so valores associados a cada varivel. Este registo de valores enquadra-se em escalas de medida. Estas escalas consistem em modos de expressar a qualidade ou a quantidade dos dados. Para que as escalas utilizadas possam responder aos vrios tipos de valores que os atributos assumem numa investigao, estas escalas precisam de apresentar duas propriedades: - Exaustividade: abrangncia que permite representar todos os dados possveis; - Exclusividade: coerncia para que qualquer dado ou acontecimento s possa ser representado de uma nica forma. Em sntese, em cada investigao, cada dado no pode ser integrado, simultaneamente, em mais do que uma escala e a reunio dos dados nas diversas escalas deve englobar a totalidade dos dados considerados para anlise. 1.2.4. Tipos de escalas As variveis relativamente escala de medida podem distribuir-se por escalas: nominais, ordinais, intervalares e proporcionais (ou de razo). As escalas nominais so meramente classificativas, permitindo descrever as variveis ou designar os sujeitos, sem recurso quantificao. o nvel mais elementar de representao, baseado no agrupamento e classificao de elementos para a formao de conjuntos distintos. As observaes so divididas em categorias segundo um ou mais dos seus atributos. Assim, tm-se registos, essencialmente, qualitativos, referentes ao tipo de sujeito, de objecto ou de acontecimento. Para que se satisfaa o princpio da exaustividade, preciso que todos os casos possveis tenham uma classificao, o que implica, muitas vezes, a definio de uma categoria complementar denominada por "outros". As variveis expressas na escala nominal podem ser comparadas utilizando, apenas, as relaes de igualdade ou de diferena. Os nmeros atribudos s variveis servem como identificao, ou para associar a pertena a uma dada categoria. Exemplos: matrculas de automveis, cdigos postais, estado civil, sexo, cor dos olhos, cdigo de artigo, cdigo de barras. Nas escalas ordinais os indivduos ou as observaes distribuem-se segundo uma certa ordem, que pode ser crescente ou decrescente, permitindo estabelecerem-se diferenciaes. A escala ordinal a avaliao de um fenmeno em termos da sua situao dentro de um conjunto de patamares ordenados, variando desde um patamar mnimo at um patamar mximo. Geralmente, designam-se os valores de uma escala ordinal em termos de numerais, ranking ou rtulos, sendo estes apenas modos diferentes de expressar o mesmo tipo de dados. Na escala ordinal a varivel utilizada para medir uma determinada caracterstica, alm de identificar a pertena a uma classe, tambm pressupe que as diferentes classes esto ordenadas sob um determinado critrio. Cada observao faz a associao do indivduo medido a uma determinada classe, sem, no entanto, quantificar a magnitude
____________ Carlos Morais

Instituto Politcnico de Bragana Escola Superior de Educao

da diferena face aos outros indivduos. Exemplo: nvel social, nvel salarial e escalas usadas na medida de opinies. A escala intervalar uma forma quantitativa de registar um fenmeno, medindoo em termos da sua intensidade especfica, ou seja, posicionando-o em relao a um valor conhecido arbitrariamente denominado como ponto zero. Tal aferio realizada definindo-se a unidade de medida a ser usada nessa comparao a partir da diferena entre o valor no ponto zero e um segundo valor conhecido. Uma propriedade bsica da escala intervalar, derivada do modo como ela definida, o facto de a variaes iguais em termos de medidas intervalares, corresponderem, necessariamente, a variaes iguais em termos dos valores que assume a varivel. Nas escalas intervalares a diferenciao dos indivduos ou das observaes assume um valor quantitativo constante. Esses valores envolvem classificao, grandeza e unidades de tamanho idntico. A escala intervalar pode ser considerada como um caso particular das escalas mtricas, em que possvel quantificar as distncias entre as medies mas no existe um ponto zero natural. Exemplos clssicos so as escalas de temperatura, onde no se pode assumir um ponto zero como ausncia de temperatura, ou dizer que a temperatura X o dobro da temperatura Y. Nas escalas proporcionais ou de razo, em acrescento s intervalares, dispe-se de um zero absoluto. Tais pontos zero (total ausncia de uma caracterstica ou propriedade) so difceis de fixar em psicologia ou em educao (Almeida & Freire: 2000, pp. 62-66). A escala de razo a mais completa e sofisticada das escalas. Ela uma quantificao produzida a partir da identificao de um ponto zero que fixo e absoluto, representando, de facto, um ponto mnimo. Nesta escala, uma unidade de medida definida em termos da diferena entre o ponto zero e uma intensidade conhecida. A partir disso, cada observao aferida segundo a sua distncia ao ponto zero, distncia essa expressa na unidade de medida previamente definida. Um aspecto importante a ser observado que, nas escalas de razo, um valor "2" indica, efectivamente, uma quantidade duas vezes maior do que o valor "1", o que no acontece, necessariamente, nas outras escalas. Nesta escala, alm de ser possvel quantificar as diferenas entre as medies, tambm esto garantidas certas propriedades matemticas. Isto permite determinar o quociente de duas medies, independentemente da unidade de medida. possvel fazer diferenas e quocientes e, consequentemente, converses entre medidas expressas em unidades diferentes. A mais simples e limitada das escalas a escala nominal, permitindo apenas a identificao de categorias. Em seguida, tem-se a escala ordinal, que permite diferenciar patamares. De maior alcance a escala intervalar, que permite o posicionamento de valores em relao a um ponto arbitrrio. Finalmente, a mais poderosa de todas as escalas a escala de razo, que permite a comparao de valores em termos absolutos. Existe a possibilidade de se transformarem dados que foram registados num determinado tipo de escala numrica em dados de outro tipo de escala, desde que se respeite a hierarquia e os atributos bsicos de cada uma. Assim, os dados de uma escala de razo podem ser transformados em dados intervalares, os intervalares podem ser transformados em ordinais e os ordinais podem ser transformados em nominais. Tais transformaes envolvem, necessariamente, alguma perda de informao. A escolha de uma escala particular de medida tem como consequncias:
____________ Carlos Morais

Instituto Politcnico de Bragana Escola Superior de Educao

- As operaes matemticas que so permitidas com as respectivas variveis; - As transformaes que se podem fazer com as respectivas variveis sem perda ou alterao da informao; - A informao sustentada pela varivel e as possveis interpretaes; - As estatsticas de tendncia central ou de disperso que possvel determinar.

____________ Carlos Morais

Instituto Politcnico de Bragana Escola Superior de Educao

1.3. Estatstica descritiva


A estatstica descritiva consiste na recolha, anlise e interpretao de dados numricos atravs da criao de instrumentos adequados: quadros, grficos e indicadores numricos (Reis, 1996: 15). Huot (2002: 60) define estatstica descritiva como o conjunto das tcnicas e das regras que resumem a informao recolhida sobre uma amostra ou uma populao, e isso sem distoro nem perda de informao. A estatstica descritiva pode ser considerada como um conjunto de tcnicas analticas utilizado para resumir o conjunto dos dados recolhidos numa dada investigao, que so organizados, geralmente, atravs de nmeros, tabelas e grficos. Pretende proporcionar relatrios que apresentem informaes sobre a tendncia central e a disperso dos dados. Para tal, deve-se evidenciar: valor mnimo, valor mximo, soma dos valores, contagens, mdia, moda, mediana, varincia e desvio padro. 1.3.1. Interpretao de dados Os dados so o resultado final dos processos de observao e experimentao (Vairinhos, 1996: 21). Na interpretao de dados deveremos produzir um resumo verbal ou numrico ou usar mtodos grficos para descrever as suas principais caractersticas. O mtodo mais apropriado depender da natureza dos dados, e aqui podemos distinguir dois tipos fundamentais: dados qualitativos e dados quantitativos. 1.3.1.1. Dados qualitativos Os dados qualitativos representam a informao que identifica alguma qualidade, categoria ou caracterstica, no susceptvel de medida, mas de classificao, assumindo vrias modalidades. Exemplo: o estado civil de um indivduo, um dado qualitativo que assume as categorias: solteiro, casado, vivo e divorciado. Para sumariar dados qualitativos numericamente utilizam-se, entre outras formas, contagens, propores, percentagens, taxas por 1000, taxas por 1000000, dependendo da escala apropriada. Por exemplo, se soubermos que 40 de 160 estudantes de Matemtica so homens, poderamos traduzir este facto dizendo que 25% dos estudantes de Matemtica so homens. Se soubermos que 8 sujeitos de uma amostra de 6000 pessoas so portadores de uma doena rara, podemos traduzir esta informao, dizendo que 0,0013 das pessoas da amostra tm essa doena rara, ou que 0,13% tm a doena, ou ainda, podemos afirmar que existem, aproximadamente, 1,3 casos da doena por cada mil pessoas. Os dados qualitativos, ou categricos, podem ser: - Nominais, por exemplo o sexo: masculino, feminino; - Ordinais, por exemplo o desempenho: baixo, mdio, alto.

____________ Carlos Morais

Instituto Politcnico de Bragana Escola Superior de Educao

1.3.1.2. Dados quantitativos Os dados quantitativos representam informao resultante de caractersticas susceptveis de serem medidas, apresentando-se com diferentes intensidades, que podem ser de natureza discreta (descontnua) ou contnua. Os dados quantitativos, ou numricos, podem ser: - Discretos: salientamos como exemplos - contagens, nmero de alunos de uma escola; nmero de ataques de asma no ano passado ou, o nmero de irmos de 10 alunos de uma determinada turma, cujos valores so: 3, 4, 1, 1, 3, 1, 0, 2, 1, 2; - Contnuos: apresentamos como exemplos - medidas numa escala contnua, tais como volume, rea, peso, massa ou as alturas de um grupo de 10 alunos representadas, em cm, por: 153, 157, 161, 160, 158, 155, 162, 156, 152, 159. As distines dos tipos de dados so menos rgidas do que a descrio apresenta. Por exemplo, em geral trataramos a idade das pessoas de uma amostra como uma varivel contnua, mas se a idade for apresentada pelo nmero de anos concludos, podemos trata-la como discreta, e se separarmos a amostra, em funo da classificao, em crianas, jovens, pessoas de meia idade e velhos, ento temos a idade como uma varivel qualitativa. No entanto, em geral recomendado manter os dados na sua forma original, categorizando-os apenas para propsitos de apresentao. 1.3.2. Organizao e apresentao de dados A utilidade dos dados estatsticos depende, muitas vezes, da forma como so organizados e apresentados. A apresentao dos dados feita, muitas vezes, atravs de quadros, grficos e de distribuies de frequncia. Para Reis (1996), os quadros e os grficos devem apresentar sempre trs partes: o cabealho, o corpo e o rodap. No cabealho deve ser dada informao sobre os dados, no corpo representam-se os dados e no rodap deve ser indicada a fonte dos dados e observaes pertinentes. Dos vrios tipos de grficos destacamos: grfico de linhas, grfico de barras, grfico de sectores e pictogramas, os quais podem ser facilmente construdos a partir de diversos programas informticos ou estatsticos, dos quais destacamos a folha de clculo Excel e o SPSS, respectivamente. 1.3.3. Distribuio de frequncias Consideramos que uma varivel pode ser representada por um smbolo e que assume valores relativos a determinadas caractersticas ou atributos de uma populao ou amostra. Definimos frequncia absoluta de um valor da varivel como sendo o nmero de vezes que esse valor ocorre na amostra ou na populao. Definimos frequncia relativa de um valor da varivel como o quociente entre a frequncia absoluta desse valor e o nmero total de ocorrncias de todos os valores da varivel na amostra ou na populao.
____________ Carlos Morais

Instituto Politcnico de Bragana Escola Superior de Educao

1.3.4. Distribuies de frequncias (exemplos) Consideremos os 20 alunos de uma turma de 9 ano e as variveis: avaliao final, idade e altura. Varivel: avaliao final Vamos considerar que a varivel Avaliao final pode assumir os valores: Aprovado (A) e Reprovado (R). Assim temos a varivel qualitativa Avaliao final que assume dois valores A e R, expressos numa escala nominal. Feita a recolha dos dados obtiveram-se as seguintes observaes: R-A-A-A-A-A-R-A-A-A-R-A-A-AA-R-R-A-A-A. A distribuio de frequncia apresentada na figura 2. Figura 2: Valor A R Distribuio de frequncia da varivel avaliao final Frequncia absoluta 15 5 Frequncia relativa 15 20 5 20 1

Total
Varivel: idade

20

Considerando a idade como o nmero de anos completos de cada aluno, a varivel quantitativa do tipo discreto, que assume valores numa escala proporcional ou de razo. Os dados obtidos so os seguintes: 14-14-13-13-15-15-16-17-14-14-14-14-1415-15-15-15-14-14-15.
Contagem

13---xx (2); 14---xxxxxxxxx (9); 15---xxxxxxx (7); 16---x (1); 17---x (1) Figura 3:
Valor

Distribuio de frequncia da varivel idade


Frequncia absoluta acumulada Frequncia relativa
2 20 9 20 7 20 1 20 1 20 1

Frequncia absoluta

13 14 15 16 17 Total

2 9 7 1 1 20

2 11 18 19 20

Frequncia relativa acumulada 2 20 11 20 18 20 19 20 20 20

____________ Carlos Morais

10

Instituto Politcnico de Bragana Escola Superior de Educao

Varivel: altura

Considerando a altura, expressa em centmetros, podemos admitir esta varivel como quantitativa do tipo contnuo, que assume valores numa escala intervalar. Os dados obtidos so os seguintes: 150-165-140-155-145-165-146-157-149-154-154-164154-165-155-148-163-154-144-150. Na definio de classes deve-se tentar conseguir aplicar as seguintes regras: a) Determinar a amplitude de variao (diferena entre os extremos das observaes (mximo e mnimo)); b) Determinar o nmero de classes. Para uma amostra de tamanho n, um critrio consiste em considerar o nmero de classes igual a k, sendo k o menor nmero natural tal que 2 k n; c) Usar classes de igual amplitude. Atendendo ao critrio referido: a amplitude de variao 25 (165-140); o nmero de classes 5, pois, 5 o menor nmero natural, tal que 2 5 20; a amplitude de cada classe 5 (25/5). Os intervalos correspondentes s cinco classes so: [140, 145[, [145, 150[, [150, 155[, [155, 160[, [160, 165]. Agrupando os dados em classes, obtemos: Figura 4:
Classes

Observaes por classes


Observaes

[140, 145[ [145, 150[ [150, 155[ [155, 160[ [160, 165] Figura 5:
Classes

140, 144 145, 146, 148, 149 150, 150, 154, 154, 154, 154 155, 155, 157 163,164, 165, 165, 165 Distribuio de frequncia da varivel altura
Frequncia absoluta acumulada Frequncia relativa
2 20 4 20 6 20 3 20 5 20 1

A tabela de frequncia que traduz os dados da figura anterior a seguinte:


Frequncia absoluta Frequncia relativa acumulada 2 20 6 20 12 20 15 20 20 20

[140, 145[ [145, 150[ [150, 155[ [155, 160[ [160, 165] Total
____________ Carlos Morais

2 4 6 3 5 20

2 6 12 15 20

11

Instituto Politcnico de Bragana Escola Superior de Educao

1.3.5. Medidas de estatstica descritiva

As medidas de estatstica descritiva, designadas por parmetros quando se referem populao e por estatsticas quando se referem s amostras, permitem sintetizar os dados da populao ou da amostra atravs de um s valor. As medidas descritivas mais utilizadas so: medidas de localizao, medidas de disperso, medidas de assimetria, medidas de curtose e medidas de concentrao. Apenas salientaremos algumas das medidas referidas, nomeadamente, nas medidas de localizao salientamos as medidas de tendncia central: mdia aritmtica, mediana e moda e; nas medidas de disperso: desvio absoluto mdio, varincia e desvio padro.
1.3.6. Medidas de tendncia central

As medidas da tendncia central so indicadores que permitem que se tenha uma primeira ideia ou um resumo, do modo como se distribuem os dados de uma experincia, informando sobre o valor (ou valores) da varivel aleatria.
1.3.6.1. Mdia aritmtica

A mdia aritmtica o quociente entre a soma de todos os valores observados e o nmero total de observaes. Considerando um conjunto n de observaes, x1, , xn, a mdia aritmtica ( x ) 1 1 n dada pela expresso: x = (x1 ++ xn ), que pode assumir a forma: x = x i . n n i =1
1.3.6.2. Moda

A moda de um conjunto de observaes o valor mais frequente, caso exista. Quando existe mais do que um valor com a frequncia mais elevada, o conjunto dos valores mais frequentes constituem uma classe modal. A moda pode ser considerada como o evento ou categoria de eventos que ocorreu com maior frequncia, indicando o valor ou categoria mais provvel. A moda de um conjunto de dados categricos a categoria que tem maior percentagem de dados. Para um conjunto de dados, define-se moda como sendo: o valor que surge com maior frequncia, se os dados so discretos; o intervalo da classe com maior frequncia se os dados so contnuos. Da observao da representao grfica dos dados, deduz-se, imediatamente, o valor que representa a moda ou a classe modal (conjunto de valores com a mesma frequncia mxima). Esta medida especialmente til para reduzir a informao de um conjunto de dados qualitativos, apresentados sob a forma de nomes ou categorias.

____________ Carlos Morais

12

Instituto Politcnico de Bragana Escola Superior de Educao

1.3.6.3. Mediana

A mediana uma medida de localizao do centro da distribuio dos dados. Aps a ordenao dos elementos da amostra de dados, a mediana o valor (pertencente ou no amostra) que a divide ao meio, isto , 50% dos elementos da amostra so menores ou iguais mediana e os outros 50% so maiores ou iguais mediana Para a determinao da mediana de um conjunto de n observaes, utiliza-se a seguinte regra, depois de ordenada a amostra das n observaes: - Se n mpar, a mediana o elemento mdio; - Se n par, a mediana a semi-soma dos dois elementos mdios. A mediana, bem como a moda, pode ser calculada para dados ordenados. Este valor mdio mais comummente utilizado para dados quantitativos.
1.3.7. Medidas de disperso

As medidas de disperso traduzem a variao de um conjunto de dados em torno da mdia, ou seja, da maior ou menor variabilidade dos resultados obtidos. Permitem identificar at que ponto os resultados se concentram ou no ao redor da tendncia central de um conjunto de observaes. Incluem, entre outras, o desvio absoluto mdio, a varincia e o desvio padro, cada uma expressando diferentes formas de quantificar a tendncia que os resultados de uma experincia aleatria tm para se concentrarem em determinados valores. Quanto maior for a disperso, menor a concentrao e viceversa. As medidas mais comuns de variabilidade para dados quantitativos so a varincia e o desvio padro.
1.3.7.1. Desvio absoluto mdio

O desvio absoluto mdio (DM), de um conjunto de n observaes x1, , xn, a mdia dos valores absolutos das diferenas entre as observaes e a mdia, ou seja, 1 n DM = xi- x . n i=1
1.3.7.2. Varincia

Define-se varincia, e representa-se por s2, como sendo a medida que se obtm somando os quadrados dos desvios das observaes da amostra, relativamente sua mdia, e dividindo por n ou por n-1, conforme o tamanho da amostra superior a 20 ou no superior a 20, respectivamente.
1 n 2 n 1 ( x i x ) ,.......n 20 s2 = n i =1 1 ( x x ) 2 ,............n > 20 n i i =1

1.3.7.3. Desvio padro

O desvio padro s a raiz quadrada da varincia s2.


____________ Carlos Morais

13

Instituto Politcnico de Bragana Escola Superior de Educao

O desvio padro uma medida que s pode assumir valores no negativos e quanto maior for, maior ser a disperso dos dados. Algumas propriedades do desvio padro, que resultam imediatamente da definio, so: - O desvio padro sempre no negativo e tanto maior, quanta maior for a variabilidade dos dados. - Se s = 0, ento no existe variabilidade, isto , os dados so todos iguais.

____________ Carlos Morais

14

Instituto Politcnico de Bragana Escola Superior de Educao

1.4. Inferncia estatstica


Inferncia estatstica o processo pelo qual possvel tirar concluses acerca da populao usando informao de uma amostra, constituindo questo central, saber como usar os dados da amostra para obter concluses acerca da populao. A estatstica inferencial permite a generalizao, a uma populao, de informaes obtidas a partir de uma amostra representativa e a tomada de deciso (Huot, 2002: 62). A base da Inferncia Estatstica consiste, assim, na possibilidade de se tomarem decises sobre os parmetros de uma populao, sem que seja necessrio proceder a um recenseamento de toda a populao (Reis et. al., 1999: 21). Reis (1996), sugere como etapas do mtodo estatstico para a resoluo de problemas, as seguintes: a) Identificao do problema ou situao; b) Recolha de dados; c) Crtica dos dados; d) Apresentao dos dados; e) Anlise e interpretao dos resultados. Neste sentido, Almeida & Freire (2000: 39-40) salientam que a necessidade de obter concluses a partir de uma amostra, por inferncia, surge no contexto de investigaes, das quais destacamos as seguintes fases. Figura 6:
Fases

Fases na definio e investigao de um problema (Adaptado de Almeida & Freire, 2000: 39-40)
Caracterizao Estratgia

1. Definio do - Identificar e descrever; problema - Estabelecer relaes; - Apreciar pertinncias; - Precisar o objectivo. 2. Reviso - Situar o problema; bibliogrfica - Precisar a metodologia. 3. Formulao de hipteses 4. Definio das variveis - Definir as hipteses: experimental, nula e alternativa. - Identificar as unidades a observar e a controlar; - Definir os papis das variveis; - Precisar a medida das variveis.

- Teoria existente; - Observao directa; - Investigaes anteriores; - Problemas anteriores. - Consulta de bases de dados; - Debates, consulta a especialistas; - Snteses temticas. - Possveis explicaes para os dados que se venham a obter. - Especificar o que se quer controlar, as relaes, as influncias e o seu sentido; - Indicar a escala de medida por varivel.

O desenvolvimento de metodologias que permitam fazer afirmaes gerais acerca do universo dos fenmenos geradores dos dados observados pertence inferncia estatstica (Vairinhos, 1995: 120).

____________ Carlos Morais

15

Instituto Politcnico de Bragana Escola Superior de Educao

1.4.1. Unidade, amostra, populao

Unidade estatstica: elemento da populao estudada (Huot, 2002: 19). Populao ou universo: conjunto de unidades com caractersticas comuns (Reis et al, 1999: 19). A populao pode ser considerada como uma coleco de unidades individuais, que podem ser pessoas ou resultados experimentais, com uma ou mais caractersticas comuns que se pretendem estudar. A populao refere-se a todos os casos ou situaes a que o investigador quer fazer inferncias ou estimativas. Uma amostra um subconjunto da populao usado para obter informao acerca do todo.
1.4.2. Amostragem, recenseamento e sondagem

Designamos por amostragem a obteno de informao sobre parte de uma populao (Reis et al, 1999: 19). Recenseamento uma recolha de dados, sobre certas caractersticas da populao, obtida directamente a partir do conjunto das unidades da populao. Sondagem uma recolha de dados, sobre certas caractersticas da populao, obtida a partir de uma amostra.
1.4.3. Parmetros e estatsticas

Designamos por estatstica, um nmero que represente caractersticas da amostra. Calcula-se o valor de uma estatstica a partir de valores observados na amostra. Utiliza-se uma estatstica para estimar um parmetro, desconhecido, na populao. Designamos por parmetro, um nmero que represente caractersticas da populao. Este nmero, embora seja fixo, normalmente desconhecido. Um parmetro desconhecido pode ser estimado a partir de uma estatstica (ou estimador). Para apreciar a mensurabilidade de uma caracterstica ou comportamento de um populao podemos considerar diversos parmetros. Desses parmetros destacamos: frequncia de ocorrncia de uma resposta; probabilidade de ocorrncia de uma resposta; durao da ocorrncia de uma resposta; durao do intervalo de tempo entre duas ou mais ocorrncias repetidas desse fenmeno; intensidade ou grau com que se manifesta uma resposta; e, velocidade e qualidade que as respostas podem assumir (Almeida & Freire, 2000: 58). Os parmetros que mostram como as diferentes observaes so semelhantes, costumam designar-se por parmetros de medidas de tendncia central. Os parmetros que mostram como as observaes de uma amostra diferem, costumam designar-se por parmetros de medidas de disperso estatstica.
1.4.4. Estatuto das variveis na investigao

As caractersticas de uma populao, que podem diferir de indivduo para indivduo, e as quais temos interesse em estudar so chamadas variveis. Como exemplo referimos: comprimento, massa, idade, temperatura e nmero de ocorrncias. Cada unidade da populao, que escolhida como parte de uma amostra, fornece uma medida de uma ou mais variveis, chamadas observaes.
____________ Carlos Morais

16

Instituto Politcnico de Bragana Escola Superior de Educao

As amostras que envolvem seres humanos so ricas na quantidade e na qualidade das variveis que podem influenciar o comportamento dos sujeitos que as constituem. Muitas dessas varveis so liminarmente ignoradas, outras admite-se que influenciam de forma pouco relevante os resultados esperados, restando apenas um nmero reduzido de variveis que so objecto de apreciao e anlise. "Uma varivel uma quantidade que pode tomar vrios valores, mas cujo valor numa dada situao muitas vezes desconhecido. Isto deve ser contrastado com uma quantidade constante" (Paulos, 1991: 242). Quando em cada objecto a observar, se est apenas interessado num nico aspecto, os dados resultantes dizem-se univariados; se pretendemos para cada objecto observado obter simultaneamente valores de dois aspectos relevantes, dizemos que os dados so bivariados; se pretendemos para cada objecto observado obter simultaneamente valores de vrios aspectos relevantes, dizemos que os dados so multivariados, mais precisamente se pretendemos obter, simultaneamente, valores de p aspectos diz-se que os dados so p-variados. "Uma amostra diz-se bivariada quando constituda por pares ordenados de dados. Em cada par ordenado, o primeiro elemento mede um atributo de um dos objectos em anlise e o segundo mede outro atributo do mesmo objecto" (Guimares e Cabral, 1997: 48). As variveis podem ser: independentes, dependentes, moderadoras e parasitas (Almeida & Freire: 2000: 56). Varivel independente: identifica-se com a dimenso ou a caracterstica que o investigador manipula deliberadamente para conhecer o impacto que produz noutra varivel. As variveis independentes permitem a sua manipulao, admitindo-se que a forma como so manipuladas podem condicionar o comportamento dos sujeitos e, consequentemente, os resultados no contexto do estudo. Varivel dependente: caracterstica que pode ser influenciada quando se manipula a varivel independente. Variveis moderadoras ou intervenientes: so geralmente assumidas como variveis alheias ao estudo que podem influenciar os resultados, situam-se entre as variveis independentes e as variveis dependentes, podendo actuar de forma interactiva. Variveis estranhas ou parasitas: variveis associadas varivel independente, que no so consideradas na experincia, mas que podem ter influncia nos resultados esperados para a varivel dependente. Como exemplo, salientamos a situao de um estado gripal para o qual se procura cura. - Varivel independente: estado gripal (actua-se relativamente gripe com medicamentos ou outros tratamentos); - Varivel dependente: a cura, ou a situao de sade resultante do tratamento; - Variveis intervenientes: conforto habitacional, bom tempo; - Variveis estranhas: corrente de ar, alimentao, ansiedade.
____________ Carlos Morais

17

Instituto Politcnico de Bragana Escola Superior de Educao

1.4.5. Amostra

Designamos por tamanho de uma amostra o nmero de unidades que a constituem. O tamanho da amostra no determina se ela de boa ou m qualidade, mais importante do que o seu tamanho a sua representatividade, ou seja, o seu grau de similaridade com a populao em estudo. Considera-se que a dimenso mnima de uma amostra deve ser de 30 unidades estatsticas. No entanto, o tamanho da amostra depende basicamente: - Do grau de confiana que se quer obter nos resultados; - Do grau de pormenor desejado na anlise; - Dos recursos e tempo disponveis.
1.4.5.1. Modelos de amostras

De acordo com Huot (2002) as amostras podem ser: probabilsticas e no probabilsticas. Apresentamos, baseados no mesmo autor, uma breve definio destes tipos de amostras e das suas modalidades. Uma amostra diz-se probabilstica quando as unidades que a constituem tiveram a mesma probabilidade de serem seleccionadas na populao, e considera-se amostra no probabilstica nas outras situaes.
1.4.5.2. Amostras probabilsticas

As amostras probabilsticas podem ser: aleatrias simples, aleatrias sistemticas, aleatrias estratificadas e agregados. Figura 7:
Modelos de amostras Aleatria simples

Modelos de amostras probabilsticas


Caractersticas - As unidades so seleccionadas, uma a uma, ao acaso, a partir de um conjunto. - Selecciona-se uma nica unidade ao acaso, as outras so extradas com intervalos fixos. - As unidades so seleccionadas ao acaso, no seio de subgrupos homogneos. Geralmente, uma amostra estratificada de dimenso n constituda a partir das vrias amostras simples, sendo cada unidade obtida num dos subgrupos que constituem a amostra. - constituda por subgrupos homogneos seleccionados ao acaso. No se seleccionam unidades mas grupos.

Aleatria sistemtica Aleatria estratificada

Agregados ou cachos

____________ Carlos Morais

18

Instituto Politcnico de Bragana Escola Superior de Educao

1.4.5.3. Amostras no probabilsticas

As amostras no probabilsticas podem ser: voluntrias, intencionais (por acerto), acidentais (ao acaso) e por quotas. Figura 8:
Modelos de amostras Voluntrias (ou por convenincia)

Modelos de amostras no probabilsticas


Caractersticas - Constitudas por unidades que se disponibilizam voluntariamente para integrar a amostra. Neste mtodo selecciona-se a amostra em funo da disponibilidade e acessibilidade dos elementos da populao. - Constitudas a partir das intenes ou necessidades do investigador para estudar uma situao particular, baseiam-se em opinies de uma ou mais pessoas que conhecem caractersticas especficas que se pretendem analisar da populao em estudo. - As unidades so seleccionadas respeitando a ordem com que aparecem. O mtodo consiste em seleccionar inicialmente os inquiridos de modo aleatrio e, em seguida, escolher unidades adicionais a partir da informao obtida dos primeiros. - A caracterstica principal de uma amostra por quotas a necessidade de se qualificar o respondente "a priori"; - Tm as vantagens da economia de tempo e de dinheiro; - So estratificadas com a locao proporcional ao nmero de sujeitos de cada estrato.

Intencionais (por acerto)

Acidentais (ao acaso)

Quotas

Os modelos de amostras no probabilsticos so bastante criticados pelos tericos por no se pautarem em moldes probabilsticos, ou seja, na ideia de que todos os elementos da populao tm a mesma probabilidade de serem seleccionados. Cada vez mais agilidade, criatividade e sobretudo racionalidade em termos da relao custo benefcio so exigidas por todos aqueles que tomam decises. Neste sentido, obtm-se amostras para fazer inferncias da populao. Essas inferncias so vlidas somente se as amostras so representativas da populao. Na prtica no existe forma de garantir essa representatividade sem ter informao da populao inteira para comparar com a amostra. E, em tais circunstncias no haveria necessidade de amostra. Podemos assegurar que no existem vcios sistemticos na amostra atravs de uma seleco aleatria nos membros da populao. Uma amostra aleatria independente uma amostra seleccionada de tal forma que: - Todos os membros da populao tm a mesma probabilidade de serem seleccionados; - Cada combinao possvel de um dado nmero de membros tem a mesma probabilidade de ser seleccionada. Em princpio, a melhor forma de obter uma amostra aleatria de tamanho n ter uma lista de todos os elementos da populao, numerar os elementos de 1 a N, e ento seleccionar aleatoriamente n nmeros, no conjunto {1, , N}. Depois de seleccionados
____________ Carlos Morais

19

Instituto Politcnico de Bragana Escola Superior de Educao

os n nmeros, basta fazer corresponder a cada nmero o respectivo elemento, que passar a constituir um elemento da amostra. Na prtica, este processo no exequvel, especialmente quando a populao infinita. Sempre que uma amostra obtida, o processo de amostragem deve estar bem documentado de tal forma que quaisquer inferncias retiradas acerca da populao possam ser avaliadas luz da estratgia amostral. Das muitas razes que poderiam ser evocadas para a utilizao de uma amostra, em vez de uma populao, salientamos: - Custos muito elevados para obter informao de toda a populao; - Demasiado tempo para obter informao de toda a populao; - Por vezes impossvel obter dados de toda a populao; - Por vezes condio impossvel testar a populao. Como exemplo, dessa impossibilidade, salientamos: testar todos os fsforos que produz uma fbrica para averiguar a sua qualidade.
1.4.6. Conhecimento cientfico e tipos de investigao

Almeida & Freire (2000) consideram a psicologia como uma cincia que procura descrever, explicar, predizer e controlar o comportamento humano. Neste sentido, sugerem trs tipos de investigao, designando-os por: investigao descritiva (descrever fenmenos, identificar variveis e inventariar factos), investigao correlacional (relacionar efeitos de variveis, apreciar interaces e diferenciar grupos) e, investigao experimental (procurar relaes causais, predizer e controlar fenmenos e, estabelecer leis). Acerca do conhecimento cientfico, Almeida & Freire (2000: 21-22), referem que um conhecimento obtido atravs do mtodo cientfico, salientando como principais caractersticas as seguintes: - Objectivo, descreve a realidade como e no como se gostaria que fosse; - Emprico, baseado nos fenmenos (ocorrncias) e nos factos (realidades); - Racional, mais assente na razo e na lgica do que na intuio; - Replicvel, as mesmas condies, em diferentes locais e com diferentes experimentadores, devem proporcionar resultados idnticos; - Sistemtico, deve constituir um todo coerente e integrado em sistemas mais amplos; - Metdico, obtido atravs de procedimentos e de estratgias fiveis mediante o cumprimento de planos rigorosos; - Comunicvel, conhecido, claro, preciso e, reconhecido pela comunidade cientfica; - Analtico, procura entrar na complexidade dos fenmenos; - Cumulativo, constri-se e estrutura-se a partir de conhecimentos cientficos anteriores.
1.4.7. Hipteses

Relativamente ao processo da sua formulao as hiptese podem classificar-se em: dedutivas e indutivas (Almeida & Freire, 2000). As hipteses dedutivas decorrem de um determinado campo terico e procuram comprovar dedues implcitas das mesmas teorias. As hipteses indutivas surgem da observao ou reflexo sobre a
____________ Carlos Morais

20

Instituto Politcnico de Bragana Escola Superior de Educao

realidade. Os mesmos autores, relativamente ao nvel de concretizao dividem as hipteses em: a) conceptuais (estabelecem uma relao entre variveis ou entre teorias), b) operativas (indicam as operaes necessrias para a sua observao), e c) estatsticas (expressam a relao esperada em termos quantitativos). A hiptese de investigao a resposta temporria, provisria, que o investigador prope perante uma interrogao formulada a partir de um problema de investigao (Huot, 2002: 53).
1.4.8. Hipteses estatsticas

As decises, acerca das caractersticas da populao, baseiam-se em hipteses que, de um modo geral, so afirmaes suportadas pelas distribuies dos dados relativas s caractersticas da amostra que se pretendem testar. Utilizamos estatsticas de uma amostra para estimar os verdadeiros valores populacionais. Exemplos so a mdia amostral, o desvio padro amostral, a mediana amostral, os quais permitem estimar a verdadeira mdia, desvio padro e mediana da populao (que so desconhecidos). Os verdadeiros valores populacionais (desconhecidos) so chamados parmetros. Para cada caracterstica a testar definem-se duas hipteses. Uma, designada por hiptese nula (H0), consiste em admitir que a aco experimental realizada com a amostra no provocou alteraes nas suas caractersticas. A outra, designada por hiptese alternativa (H1), consiste numa afirmao relativa s alteraes que se espera que ocorram nas caractersticas da amostra em funo da aco experimental realizada, cuja aceitao depende dos resultados da aplicao do teste estatstico e do nvel de significncia adoptados (Morais, 2000). Perante o resultado da aplicao do teste estatstico, considerado adequado, pode-se tomar a deciso de rejeitar ou de no-rejeitar a hiptese nula (Guimares e Cabral, 1997: 340). Em funo da rejeio da hiptese nula admite-se a hiptese alternativa; caso contrrio, ou seja, a no-rejeio da hiptese nula implica que no se possa tomar qualquer deciso acerca da hiptese alternativa. Sabemos que o valor estimado, para um parmetro da populao, na maior parte das vezes no exactamente igual ao valor verdadeiro. Ento, tem interesse encontrar um intervalo de confiana que fornea um intervalo de valores plausveis para o parmetro baseado nos dados amostrais. Um intervalo de confiana de 95% para um parmetro populacional fornece um intervalo no qual estaramos 95% confiantes, que integra o verdadeiro valor do parmetro. Tecnicamente, 95% de todos os intervalos de confiana que construirmos contero o verdadeiro valor do parmetro (desde que todas as suposies envolvidas estejam correctas). Formulada uma hiptese acerca do comportamento da populao, considera-se que um teste de hipteses uma regra de deciso que permite aceitar ou rejeitar essa hiptese, com base na informao obtida na amostra (Vairinhos, 1995). Quando se formulam hipteses esto-se a identificar variveis e as suas relaes, ou seja est-se a definir o papel das variveis na investigao. A explicitao das variveis e das suas relaes essencial na definio de um modelo para a investigao que se pretende efectuar.
____________ Carlos Morais

21

Instituto Politcnico de Bragana Escola Superior de Educao

A rejeio ou no-rejeio de uma hiptese depende da probabilidade de erro admitida (nvel de significncia) para cada situao, que nas investigaes no mbito da educao , geralmente, de 0,05. Na aceitao ou rejeio da hiptese nula, podem ser cometidos dois tipos de erro: erro tipo I e erro tipo II. O erro tipo I comete-se quando se opta por rejeitar a hiptese nula H0, sendo esta verdade. O erro tipo II comete-se quando se opta por no rejeitar a hiptese nula H0, sendo esta falsa.
1.4.9. Testes estatsticos

Para testar hipteses necessrio escolher o teste estatstico apropriado para cada design experimental. A seleco do teste estatstico depende sempre do design experimental escolhido para testar a hiptese experimental. Existem fundamentalmente dois tipos de testes estatsticos, designados por testes paramtricos e no-paramtricos. A principal diferena entre eles a sofisticao das medidas utilizadas para calcular a variabilidade dos resultados (D `Oliveira & Green, 1991: 69). Para os mesmos autores uma das vantagens dos testes noparamtricos que podem ser utilizados quando os dados experimentais apenas podem ser medidos numa escala ordinal, admitindo-se ainda a sua utilizao em algumas situaes, em que os dados so medidos numa escala nominal. Na figura seguinte apresentamos possveis relaes entre a escala de medida e o tipo de teste que se pode utilizar em algumas situaes experimentais. Figura 9:
Nvel Escala

Escalas de medida e procedimentos

1 2

Nominal Ordinal

3 4

Intervalar Proporcional (ou de razo)

(adaptado de Almeida & Freire: 2000: 66) Caractersticas Estatstica Procedimentos (Modelo) (Exemplos) - Classificao; - No - Frequncias; - Contagem. Paramtrico - % Acumuladas; - Qui-quadrado; - Valores ordenados; - r-bisserial; - Diferenas - Rh de Spearman; tomando os postos. - t-Wilcoxon; - Teste de sinaisMann-Whitney. - Intervalos iguais; - Paramtrico - Mdia; - Zero no absoluto. - Desvio padro; - Frequncia; - Intervalos iguais; - Anlise de varincia; - Zero absoluto; - r de Pearson; - Razo entre - Regresso. quantidades.

Segundo D`Oliveira & Green (1991) a funo dos dois tipos de testes, paramtricos e no-paramtricos idntica, com qualquer um deles o investigador pretende verificar se os resultados de uma experincia ocorreram devido a flutuaes
____________ Carlos Morais

22

Instituto Politcnico de Bragana Escola Superior de Educao

aleatrias causadas por variveis desconhecidas. Assim, o investigador poder decidir se esta probabilidade aleatria suficientemente baixa para rejeitar a hiptese nula e aceitar a hiptese experimental. A diferena entre testes, paramtricos e noparamtricos diz respeito ao mtodo de clculo destas probabilidades.
1.4.10. Procedimentos na aplicao de testes estatsticos

Os principais procedimentos que devem preceder a aplicao de um teste estatstico so: - Definir a hiptese nula H0 e a hiptese alternativa H1; - Decidir qual o teste a ser usado, analisando se este vlido para o problema; - Encontrar a probabilidade (p-valor); - Avaliar a fora da evidncia contra H0 (quanto menor for p-valor, maior a fora para rejeitar a hiptese nula); - Estabelecer as concluses e interpretao dos resultados. O p-valor a probabilidade que permite decidir sobre a hiptese nula. Seguemse algumas interpretaes acerca de p-valores: - Se p 0,1, no existe evidncia contra a H0, no possvel rejeitar a hiptese nula; - Se p < 0,1, fraca evidncia contra a H0; - Se p < 0,05, evidncia significativa contra a H0, possvel rejeitar a hiptese nula; - Se p < 0,01, evidncia altamente significativa contra a H0, possvel rejeitar a hiptese nula; - Se p < 0,001, evidncia muito altamente significativa contra a H0, possvel rejeitar a hiptese nula. Deve-se ter em ateno a diferena entre a significncia estatstica e a significncia prtica. Um efeito pode ser estatisticamente significativo mas no ter qualquer importncia prtica e vice-versa.

1.4.11. Exemplo de tratamento de dados numa situao concreta 1.4.11.1. Contexto

Contexto: comparar os resultados de desempenho em Matemtica de dois grupos de alunos de 7, um designado por grupo experimental (GE), sujeito a uma estratgia experimental, e o outro, designado por grupo de controlo (GC). - Dados: pontuaes obtidas pelos alunos dos grupos experimental e de controlo em cada uma das aplicaes do teste de avaliao de conhecimentos, ou seja, no prteste administrado antes do processo formal de ensino e aprendizagem e no ps-teste administrado depois deste ter terminado. - Instrumento de recolha de dados: teste de avaliao de conhecimentos. - Amostras de dados: pontuaes dos alunos do grupo experimental no pr-teste e no ps-teste; e pontuaes dos alunos do grupo de controlo no pr-teste e no ps-teste. - Apresentao dos dados: grficos e tabelas;
____________ Carlos Morais

23

Instituto Politcnico de Bragana Escola Superior de Educao

- Tratamento estatstico dos dados: Para efectuar o tratamento estatstico dos resultados de desempenho em Matemtica fez-se corresponder aos objectivos, que precederam a realizao dos testes de conhecimentos, variveis que assumiram as pontuaes obtidas pelos alunos nesses testes. Assim, as pontuaes relativas s questes subjacentes ao objectivo: a) "Resolver problemas que envolvem equaes", foram assumidas pela varivel "resoluo de problemas que envolvem equaes"; b) "Resolver equaes", foram assumidas pela varivel "resoluo de equaes"; c) "Resolver problemas", foram assumidas pela varivel "resoluo de problemas". No tratamento estatstico utilizou-se o teste t de Student para comparar a diferena entre as mdias das pontuaes obtidas pelos alunos dos dois grupos, relativas a cada uma das variveis consideradas. Para averiguar se tais diferenas foram significativas foi necessrios conhecer os resultados da aplicao do referido teste. "O teste t um mtodo que permite decidir se a diferena observada entre as mdias de duas amostras se pode atribuir a uma causa sistemtica ou se pode ser considerada como efeito de flutuaes devidas ao acaso" (D`Hainaut, 1990: 192). Segundo o mesmo autor, para que o teste t possa ser aplicado, a distribuio da populao dos dados de cada amostra no pode diferir muito da normal, as varincias das populaes de que se extraem as amostras e os seus tamanhos no podem ser excessivamente diferentes. Neste sentido, embora estes critrios apontem para uma certa flexibilidade, utilizou-se o teste de Kolmogorov-Smirnov para verificar se a distribuio de cada amostra de dados normal e o teste de Levene para verificar se as varincias das amostras de dados a comparar no so significativamente diferentes. Os resultados da aplicao dos testes de Kolmogorov-Smirnov, Levene e t de Student foram fornecidos pelo programa estatstico SPSS for Windows (Statistical Package for the Social Sciences). Os dados a testar, pontuaes obtidas no ps-teste pelos alunos dos grupos experimental e de controlo, foram organizados em tabelas de acordo com as variveis, j referidas, resoluo de problemas que envolvem equaes, resoluo de equaes e, resoluo de problemas.
1.4.11.2. Procedimentos de tratamento de dados

Vamos apresentar uma parte de um estudo, que teve como objectivo avaliar o efeito da utilizao de uma estratgia de ensino no desempenho, em matemtica, de um grupo de alunos de 7 ano (grupo experimental). Na apresentao dos dados considerou-se que as variveis: "resoluo de problemas que envolvem equaes" assume valores, no intervalo [0, 100]; "resoluo de equaes" assume valores no intervalo [0, 50] e "resoluo de problemas" assume valores no intervalo [0, 50]. A anlise e discusso dos dados obedeceram seguinte sequncia: representao grfica das amostras de dados relativas s pontuaes obtidas pelos alunos no pr-teste e no ps-teste, apresentao de uma tabela com as distribuies das pontuaes obtidas no ps-teste e apresentao dos resultados provenientes da aplicao dos testes estatsticos.
____________ Carlos Morais

24

Instituto Politcnico de Bragana Escola Superior de Educao

1.4.11.3.

Representao grfica de dados

Comeou-se por apresentar na mesma figura, as representaes grficas relativas s distribuies das pontuaes totais obtidas pelos alunos dos grupos experimental e de controlo no pr-teste e no ps-teste. Figura 10: Resultados globais dos alunos
Pr-teste (p) e teste (t) 100 80 Pontuaes 60 40 20 0 1 3 5 7 9 11 13 15 17 19 21 23 Alunos de 7 ano pge7 pgc7 tge7 tgc7

pge7 - pontuaes dos alunos de 7 ano do grupo experimental obtidas no pr-teste pgc7 - pontuaes dos alunos de 7 ano do grupo de controlo obtidas no pr-teste tge7 - pontuaes dos alunos de 7 ano do grupo experimental obtidas no ps-teste tgc7 - pontuaes dos alunos de 7 ano do grupo de controlo obtidas no ps-teste

As representaes da figura anterior evidenciam que as pontuaes relativas ao pr-teste foram idnticas nos dois grupos e que as relativas ao ps-teste foram mais elevadas no grupo experimental.
1.4.11.4. Representao de dados em tabelas

Enquanto que para representar os dados graficamente houve a preocupao de os ordenar e de igualar o tamanho das amostras, de acordo com um critrio definido para o efeito, nas tabelas apresentam-se a totalidade dos dados de cada grupo de sujeitos de acordo com a sequncia com que foram recolhidos. Como as pontuaes obtidas no pr-teste foram muito baixas e idnticas nos dois grupos, na tabela seguinte e no tratamento estatstico a realizar, consideraram-se apenas as distribuies das pontuaes obtidas pelos alunos no ps-teste.

____________ Carlos Morais

25

Instituto Politcnico de Bragana Escola Superior de Educao

Figura 11:
Grupo Experimental E7T1 E7T2 E7T3 E7T4 E7T5 E7T6 E7T7 E7T8 E7T9 E7T10 E7T11 E7T12 E7T13 E7T14 E7T15 E7T16 E7T17 E7T18 E7T19 E7T20 E7T21 E7T22 E7T23 E7T24 E7T25

Distribuies das pontuaes - ps-teste


Grupo de Controlo C7T1 C7T2 C7T3 C7T4 C7T5 C7T6 C7T7 C7T8 C7T9 C7T10 C7T11 C7T12 C7T13 C7T14 C7T15 C7T16 C7T17 C7T18 C7T19 C7T20 C7T21 C7T22 C7T23 C7T24 Pontuaes (%) O71gc O72gc O7gc 10 2,5 12,5 32,5 22,5 55 10 2,5 12,5 5 0 5 0 0 0 25 5 30 0 0 0 17,5 0 17,5 25 20 45 5 2,5 7,5 30 35 65 15 2,5 17,5 0 0 0 10 0 10 0 0 0 2,5 0 2,5 32,5 22,5 55 0 0 0 40 35 75 32,5 22,5 55 0 0 0 5 0 5 30 27,5 57,5 12,5 2,5 15

Pontuaes (%) O71ge O72ge O7ge 42,5 35 77,5 7,5 10 17,5 42,5 45 87,5 0 0 0 35 20 55 42,5 40 82,5 32,5 37,5 70 10 5 15 7,5 12,5 20 15 25 40 42,5 45 87,5 25 30 55 15 10 25 25 17,5 42,5 22,5 37,5 60 32,5 35 67,5 2,5 12,5 15 17,5 22,5 40 15 15 30 5 25 30 15 2,5 17,5 27,5 27,5 55 37,5 35 72,5 47,5 22,5 70 42,5 40 82,5

O7ge - pontuaes dos alunos de 7 ano do grupo experimental relativas varivel resoluo de problemas que envolvem equaes O71ge - pontuaes dos alunos de 7 ano do grupo experimental relativas varivel resoluo de equaes O72ge - pontuaes dos alunos de 7 ano do grupo experimental relativas varivel resoluo de problemas O7gc - pontuaes dos alunos de 7 ano do grupo de controlo relativas varivel resoluo de problemas que envolvem equaes O71gc - pontuaes dos alunos de 7 ano do grupo de controlo relativas varivel resoluo de equaes O72gc - pontuaes dos alunos de 7 ano do grupo de controlo relativas varivel resoluo de problemas

Na tabela anterior verifica-se que o valor mnimo assumido por cada varivel nos dois grupos zero. O valor mximo assumido na varivel: "resoluo de problemas que envolvem equaes" de 87,5 no grupo experimental e 75,0 no grupo de controlo; na varivel "resoluo de equaes" de 47,5 no grupo experimental e 40,0 no grupo de controlo; e na varivel "resoluo de problemas" de 45,0 no grupo experimental e 35,0 no grupo de controlo. O valor mximo que cada varivel assumiu nos dados do grupo experimental foi superior ao valor correspondente, nessa varivel, nos dados do grupo de controlo.

____________ Carlos Morais

26

Instituto Politcnico de Bragana Escola Superior de Educao

Conhecidos os resultados de desempenho, em termos de pontuaes, coloca-se o problema de saber se existiro diferenas significativas entre os resultados dos dois grupos, em cada uma das variveis.
1.4.11.5. Hipteses estatsticas

A comparao, ao nvel estatstico, dos resultados de desempenho em Matemtica dos dois grupos foi efectuada, tendo como orientao as seguintes hipteses: - H11: Os alunos de 7 ano de escolaridade que utilizam comunicao mediada por computador, no apoio s actividades lectivas, obtm resultados de desempenho mais elevados na resoluo de problemas que envolvem equaes do que aqueles que a no utilizam; - H12: Os alunos de 7 ano de escolaridade que utilizam comunicao mediada por computador, no apoio s actividades lectivas, obtm resultados de desempenho mais elevados na resoluo de equaes do que aqueles que a no utilizam; - H13: Os alunos de 7 ano de escolaridade que utilizam comunicao mediada por computador, no apoio s actividades lectivas, obtm resultados de desempenho mais elevados na resoluo de problemas do que aqueles que a no utilizam. Os dados utilizados para a verificao de cada uma das hipteses anteriores foram as pontuaes, relativas a cada varivel, obtidas pelos alunos de cada grupo de 7 ano. Para averiguar se as diferenas entre as pontuaes dos dois grupos foram significativas, utilizou-se o teste t de Student. Este teste permite verificar se a diferena entre as mdias das pontuaes associadas a cada varivel significativa. A anlise e discusso dos dados, em funo dos procedimentos estatsticos realizados, foram efectuadas a partir dos resultados constantes na tabela seguinte. Dela fazem parte, para alm da identificao das variveis e das amostras de dados, o valor da mdia e do desvio padro de cada amostra, bem como a diferena entre as mdias e os resultados da aplicao dos testes estatsticos de Kolmogorov-Smirnov, de Levene e de Student. Figura 12:
Variveis Amostras Mdia de dados (*)

Resultados estatsticos

(Comparao das pontuaes no ps-teste)


Desvio Teste de Teste de Teste t de Student Padro KolmogorovLevene (3) Smirnov (1) (2) Z Nvel F Nvel t Nvel Difer. de de de entre signif. signif. signif. mdias 26,66 0,604 0,859 0,294 0,590 3,524 0,001 26,00

Resoluo de O7ge 48,60 problemas que envolvem O7gc 22,60 24,90 1,214 0,105 equaes Resoluo de O71ge 24,30 14,76 0,678 0,747 0,402 0,529 2,520 0,015 10,13 equaes O71gc 14,17 13,30 0,839 0,482 Resoluo de O72ge 24,30 13,49 0,731 0,660 0,201 0,656 4,297 0,000 15,86 problemas O72gc 8,44 12,29 1,725 0,005 (*) As amostras de dados so as pontuaes apresentadas na tabela anterior e o tamanho das amostras O7ge, O71ge e O72ge 25 e das amostras O7gc, O71gc e O72gc 24 ____________ Carlos Morais

27

Instituto Politcnico de Bragana Escola Superior de Educao

(1) - Teste para verificar se a distribuio normal; (2) - Teste para verificar a igualdade de varincias; (3) - Teste para verificar a igualdade das mdias.

A mdia das pontuaes dos alunos do grupo experimental foi superior mdia das pontuaes do grupo de controlo em todas as variveis. de salientar, no entanto, que as mdias das pontuaes dos dois grupos foram bastante baixas em todas as variveis. Mesmo a mdia mais elevada (48,60), obtida pelo grupo experimental na varivel resoluo de problemas que envolvem equaes, baixa atendendo a que a mxima pontuao possvel para esta varivel de 100 pontos. Para efectuar a anlise da diferena entre as mdias recorreu-se aplicao do teste t de Student. Como a aplicao deste teste pressupe que as distribuies dos dados no difiram muito da distribuio normal, aplicou-se o teste de KolmogorovSmirnov para averiguar se tais distribuies satisfazem a caracterstica referida. Atendendo aos resultados da tabela anterior, com excepo da distribuio dos dados do grupo de controlo relativos varivel resoluo de problemas, todas as outras distribuies podem ser consideradas como normais. Para testar a diferena entre as mdias das pontuaes dos dois grupos de 7 ano assumidas pela varivel resoluo de problemas que envolvem equaes formulou-se a seguinte hiptese nula, associada hiptese alternativa H11: H01: No significativa a diferena entre as mdias das pontuaes, obtidas na resoluo de problemas que envolvem equaes, dos alunos de 7 ano de escolaridade que utilizam comunicao mediada por computador no apoio s actividades lectivas e aqueles que a no utilizam. Esta hiptese foi testada a partir das pontuaes obtidas pelos alunos de 7 ano na totalidade do teste, correspondentes varivel resoluo de problemas que envolvem equaes, assumindo valores no intervalo [0, 100]. Pela observao da tabela anterior pode-se concluir que o valor de t significativo para um nvel de significncia de 0,001, portanto inferior a 0,05, pelo que pode-se rejeitar a hiptese nula e admitir a hiptese alternativa. Assim, pode-se admitir que h diferenas significativas entre os resultados de desempenho do grupo experimental e os do grupo de controlo de 7 ano, relativamente varivel resoluo de problemas que envolvem equaes. Procedeu-se de modo anlogo para analisar a diferena entre as mdias das pontuaes dos dois grupos relativas varivel "resoluo de equaes". A hiptese nula, associada hiptese alternativa H12, a seguinte: H02: No significativa a diferena entre as mdias das pontuaes, obtidas na resoluo de equaes, dos alunos de 7 ano de escolaridade que utilizam comunicao mediada por computador no apoio s actividades lectivas e aqueles que a no utilizam. A hiptese H02 foi testada a partir das pontuaes obtidas pelos alunos nas questes do teste relativas a equaes, correspondentes varivel resoluo de equaes que assume valores no intervalo [0, 50]. O valor da mdia das pontuaes, relativas varivel resoluo equaes, do grupo experimental foi superior ao valor da mdia das pontuaes do grupo de controlo.
____________ Carlos Morais

28

Instituto Politcnico de Bragana Escola Superior de Educao

Pelos resultados provenientes da aplicao do teste t de Student, pode-se rejeitar a hiptese nula a um nvel de significncia de 0,015, ou seja, inferior a 0,05. Portanto admite-se que existem diferenas significativas entre os resultados de desempenho dos dois grupos, relativos varivel "resoluo de equaes". Para verificar se a diferena entre as mdias, relativa varivel resoluo de problemas, foi significativa utilizaram-se os resultados da aplicao do teste t de Student, tendo por base a seguinte hiptese nula, subjacente hiptese alternativa H13: H03: No significativa a diferena entre as mdias das pontuaes, obtidas na resoluo de problemas, dos alunos de 7 ano de escolaridade que utilizam comunicao mediada por computador no apoio s actividades lectivas e aqueles que a no utilizam. Esta hiptese foi testada a partir das pontuaes, obtidas pelos alunos de 7 ano nas questes do teste relativas a problemas, correspondentes varivel resoluo de problemas que assume valores no intervalo [0, 50]. Atendendo aos resultados constantes na tabela anterior no se pode concluir que existam diferenas significativas entre os resultados de desempenho do grupo experimental e os do grupo de controlo de 7 ano, relativos varivel resoluo de problemas. Embora o valor de t permitisse rejeitar a hiptese nula, mas atendendo aos resultados da aplicao do teste de Kolmogorov-Smirnov pode-se rejeitar a hiptese de que "a distribuio dos dados do grupo de controlo relativos varivel resoluo de problemas normal". Assim, nesta situao no esto garantidas as condies de aplicabilidade do teste t de Student e, portanto, no se podem aceitar os resultados provenientes da sua aplicao. Pelo exposto, apenas se pode afirmar que o valor da mdia das pontuaes, relativas varivel resoluo de problemas, obtidas pelo grupo experimental de 7 ano, foi superior ao valor da mdia das pontuaes obtidas pelo grupo de controlo desse ano. Em sntese, de acordo com os procedimentos estatsticos realizados, poderemos afirmar que: - Os alunos de 7 ano de escolaridade que utilizam comunicao mediada por computador, no apoio s actividades lectivas, obtm resultados de desempenho mais elevados na resoluo de problemas que envolvem equaes do que aqueles que a no utilizam; - Os alunos de 7 ano de escolaridade que utilizam comunicao mediada por computador, no apoio s actividades lectivas, obtm resultados de desempenho mais elevados na resoluo de equaes do que aqueles que a no utilizam.

2. Bibliografia
Almeida, L. &, Freire, T. (2000). Metodologia da investigao em psicologia e educao (2 ed.). Braga: Psiquilbrios. D`Ancona, M. ngeles (1999). Metodologa cuantitativa: Estratgias y tcnicas de investigacin social. Madrid: Editorial Sntesis, S. A.

____________ Carlos Morais

29

Instituto Politcnico de Bragana Escola Superior de Educao

D`Hainaut, L. (1990). Conceitos e Mtodos da Estatstica. Lisboa: Fundao Calouste Gulbenkian. Delgado, J. & Gutirrez, J. (org.) (1999). Metodos y tcnicas cualitativas de investigacin en ciencias sociales (3 ed.). Madrid: Editorial Sntesis, S. A. Green, J. & d`Oliveira, M. (1991). Testes estatsticos em psicologia. Lisboa: Editorial Estampa. Guimares, R. & Cabral, J. (1997). Estatstica. Lisboa: McGraw-Hill. Guimares, R. & Cabral, J. (1999). Estatstica (Edio Revista). Lisboa: McGraw-Hill. Herrero, F. & Cuesta, M. (s/d). Escalas de medida y estadstica. http://www.psico.uniovi.es/Dpto_Psicologia/metodos/tutor.2/Medida.html. (acedido em 16-06-2005) Hill, M. Magalhes & Hill, A. (2002). Investigao por questionrio (2 ed.). Lisboa: Edies Slabo. http://alea.ine.pt/html/nocoes/html/cap1_1_0.html (acedido em 20-06-2005) http://pt.wikipedia.org/wiki/Escala_%28estat%C3%ADstica%29 (10-06-05) http://www.est.ufpr.br/~paulojus/CE003/ce003/node2.html (10-06-20005) http://www.manhanelli.com.br/pesquisas.html#tipos (21-06-20005) http://www.vademecum.com.br/iatros/estdiscritiva.htm (10-06-20005) Huot, Rjean (2002). Mtodos quantitativos para as cincias humanas (traduo de Maria Lusa Figueiredo). Lisboa: Instituto Piaget. Morais, C. (2000). Complexidade e comunicao mediada por computador. Tese de Doutoramento em Educao rea do Conhecimento de Metodologia do Ensino da Matemtica. Braga: Universidade do Minho. Paulos, J. (1991). O circo da matemtica: Para alm do inumersmo. Mem Martins: Publicaes Europa - Amrica Lda.. Reis, E. (1996). Estatstica descritiva. Lisboa: Edies Slabo. Reis, E., Melo, P., Andrade, R., & Calapez, T. (1999). Estatstica aplicada (Vol. 2). Lisboa: Edies Slabo. Reis, E., Melo, P., Andrade, R., & Calapez, T. (1999). Estatstica aplicada (Vol. 1). Lisboa: Edies Slabo. Spigel, M. (1978). Probabilidade e estatstica (traduzido por Alfredo Faria). So Paulo: McGraw - Hill Ltda. Vairinhos, V. M. (1995). Estatstica. Lisboa: Universidade Aberta. Vairinhos, V. M. (1996). Elementos de probabilidade e estatstica. Lisboa: Universidade Aberta.

____________ Carlos Morais

30