As medidas de tendncia central so utilizadas numa amostra como forma de representar todos os valores de determinada amostra num nico valor. A medida de tendncia central ser um tipo de medida escolhida que ir representar uma concentrao de medidas em torno do valor estipulado. Existem trs tipos de medida central mais utilizados em amostras: a mdia aritmtica, a mediana e a moda.
Moda O termo moda foi utilizado pela primeira vez em 1895 por Karl Pearson (1857-1936), possivelmente em referncia ao seu significado usual. Embora a palavra moda possa estar relacionada a desfiles e roupas em geral, em um sentido mais amplo, significa uma ao, uma atitude ou um pensamento que mais praticado ou freqente. Observe alguns exemplos: Exemplo 1: A moda do conjunto igual a 3, pois este valor o mais freqente no conjunto P.
Exemplo 2: O conjunto no tem moda, pois no existe nenhum valor mais freqente no conjunto Q. Observao 1: A moda em um conjunto pode assumir quatro classificaes. So elas:
Amodal, quando no existe moda. Unimodal, quando a moda nica. Bimodal, quando h duas modas. Multimodal, quando h mais de duas modas.
Observao 2: A moda pode ser utilizada para representar tanto um conjunto de dados numricos como um conjunto de dados nominais
Mdia aritmtica Medida de tendncia central mais utilizada; definida como soma dos valores tericos de todas as observaes observao um Elemento de uma amostra dividida pelo nmero de observaes; O smbolo (mi) ser usado para denotar mdia de uma populao; O smbolo ser usado para denotar a mdia de uma amostra; Exemplo: Uma amostra constituda de 3 pesos de recm-nascidos: 2,75kg, 3,25kg e 3,80kg. Aqui, n, o tamanho da amostra, igual a 3. x1, primeira observao, 2,75kg; x2, segunda observao 3,25kg; x3 3,80kg. = (2,75 + 3,25 + 3,80) = 9,80/3 = 3,27, ou seja, peso mdio 3,27 kg.
Mediana: o valor central da amostra, quando o n um nmero mpar ele o valor central das observaes (exemplo:1,2,3,4,5 , neste caso a mediana ser o nmero 3). Quando o n um nmero par a mediana ser calculada pelos dois nmeros centrais divididos por 2 ( exemplo:1,2,3,4,5,6. Mediana = 3+4 dividido por 2, neste caso, a mediana 3,5).
Vantagens e Desvantagens Vantagens Desvantagens Tipo de Varivel aplicvel Mdia Reflete todos os valores das amostras. Possui propriedades matemticas definidas. influenciada por valores extremos. Continua Discreta(com reservas) Mediana Menos sensvel a valores extremos que a mdia Mais difcil de ser utilizada para grande quantidade de dados. Continua Discreta Moda Representa um valor tpico No tem funo em termos de clculo No tem funo em certos conjuntos de dados Categrica Ordinal
Portanto, importante saber que a mdia a melhor e mais importante medida de tendncia central, devido a sua maior estabilidade amostral, utilidade e facilidade de clculos. Porm, em distribuies assimtricas, a mdia no descreve adequadamente o centro. Nesses casos, prefere-se a mediana. Por exemplo, numa distribuio: ( 2, 4, 6, 9, 10, 11, 2000) na qual um dos valores(2000) destoa bastante dos outros. Nesse caso, temos: * mdia: 2+4+6+9+10+11+2000 / 7 = 291,7 * mediana: temos sete elementos nesse conjunto. Portanto, a mediana o elemento central desse conjunto ordenado 4 elemento (n+1/2, ou seja, 7 +1 /2 = 4). O quarto elemento desse conjunto corresponde observao 9. Mediana = 9. Nesse caso, verifica-se facilmente que a mediana representa melhor o centro da distribuio.
Medidas de Disperso As mais comuns e utilizadas so: Amplitude: representa a diferena entre os valores mnimo e mximo do conjunto de dados analisado. calculada atravs da simples frmula . Por exemplo: no conjunto de dados {2, 12, 13, 28, 46, 5}, o maior valor 46 e o menor 2, logo sua amplitude h = 46 2 = 44. Desvio mdio absoluto: a amplitude, embora nos d uma ideia inicial da variao, no leva em considerao todos os valores do conjunto. O desvio mdio absoluto , pois, a mdia das distncias que os valores do conjunto se encontram de sua mdia. Podemos calcul-lo atravs da frmula: . Ainda utilizando o conjunto de dados do exemplo anterior, a mdia dos valores apresentados 17,6. Se desejarmos saber quanto cada um dos valores se distancia dessa mdia, utilizamos o desvio mdio absoluto e obtemos 12,8. Varincia: uma varivel aleatria que indica o quanto os valores do conjunto esto distantes do valor esperado. Obtemos-na pela frmula :
Desvio padro: a raiz quadrada da varincia. Varincia Relativa: outra medida de disperso que leva em considerao o quadrado da mdia. Obtemos com . H, tambm, o coeficiente de variao, que nada mais do que a raiz quadrada da varincia relativa, isto , , til quando temos o desvio padro e no queremos calcular a varincia. DESVIO PADRO. AMPLITUDEVARIN
Assimetria e Curtose
MEDIDAS DE FORMATO
As Medidas de Formato indicam o padro da distribuio dos valores ao longo do intervalo contm o total dos dados.
Medidas de Assimetria De acordo com Fonseca (2011) d-se a nomenclatura de assimetria ao grau de afastamento de uma distribuio da unidade de assimetria. Uma Distribuio Simtrica quando seus valores de Mdia, Mediana e Moda coincidem. A comparao entre o valor da Mdia e o valor da Moda, d, portanto, uma indicao da inclinao da distribuio.
A Mdia puxa a cauda da Distribuio para seu lado, em funo de ser altamente sensvel aos valores extremos da srie de dados.
Existem vrias frmulas para o clculo do coeficiente de assimetria, dentre elas, destacam-se:
Medidas de Curtose
D-se o nome de curtose ao grau de achatamento da distribuio:
(a) Quando a distribuio apresenta uma curva de frequncia mais fechada (mais aguda em sua parte superior), ela denominada Leptocrtica (Lepto = Delgado, Alongado, Magro, etc.)
(b) A distribuio de referncia (Distribuio Normal) denominada Mesocrtica (Meso = Meio, Central, etc.).
(c) Quando a distribuio apresenta uma curva de frequncia mais aberta (mais achatada em sua parte superior), ela denominada Platicrtica (Plato = Chato, Plano, Largo, etc.).
Para medir o grau de curtose pode-se utilizar o seguinte coeficiente: