Вы находитесь на странице: 1из 6

CAPTULO VIII

PROCESAMIENTO, ANLISIS ESTADSTICO


E INTERPRETACIN DE LA INFORMACIN
Una vez captada la informacin, sta tendr que ser revisada (control de calidad), despus
habr que procesar y analizarla estadsticamente, para luego proceder a la interpretacin de los
resultados. Las dos actividades mencionadas (procesamiento y anlisis estadstico),
dependiendo de la cantidad de informacin, de los objetivos e hiptesis planteadas en el
protocolo, pueden efectuarse en forma manual o con computadora. As por ejemplo, si se
tienen pocos casos, pocas variables y slo se pretende llegar hasta un anlisis bivariado
(relacin entre dos variables), entonces para el procesamiento y anlisis respectivo, quizs no
sea necesario utilizar una computadora. Pero, efectuar un anlisis multivariado (ms de dos
variables) aunque sea con pocos casos en una simple calculadora ya sera muy laborioso, por
decir lo menos.
Para iniciar el procesamiento de la masa de informacin captada, stas tienen que ser
clasificadas; es decir, se debern agrupar las observaciones en categoras o intervalos de clase
(en lo posible mutuamente excluyentes), para una adecuada presentacin ya sea en forma
tabular o grfica. Asimismo, dependiendo del tipo de variable, se tendrn que calcular las
medidas descriptivas de resumen, entre las que destacan: las tasas, proporciones (%), razones,
promedios y las correspondientes medidas de dispersin. De estas dos ltimas son
particularmente importantes la media aritmtica y la desviacin estndar.
Al presentar la informacin a travs de tablas, stas debern contener preferentemente dos
variables (tablas de doble entrada), ya que la descripcin e interpretacin de tablas de ms de
dos variables pueden resultar confusas. Para el protocolo es recomendable elaborar los
esquemas de las tablas que se utilizarn para la presentacin y anlisis de los datos. Asimismo,
debern bosquejarse los posibles grficos que permitirn visualizar los datos del estudio
definitivo.
Los mtodos para el anlisis estadstico de los datos debern elegirse segn los objetivos
planteados y de acuerdo con las hiptesis que se deseen contrastar.
Principales mtodos de anlisis estadstico
A continuacin indicaremos los mtodos estadsticos bsicos mas utilizados en los trabajos de
investigacin.
1.

Una sola poblacin.

a.

Estimacin de la media poblacional ().


x Z

x t

S
n

Donde:
45

x = media aritmtica muestral

= desviacin estndar poblacional (si no se conoce se podr utilizar en el primer


modelo S, pero n debe ser mayor que 30)
S = desviacin estndar muestral
Z = coeficiente de confiabilidad (de la distribucin normal estndar), el valor depende
del nivel de confianza utilizado para la estimacin.
t = coeficiente de confiabilidad (valor de la distribucin t de Student con n - 1 grados
de libertad, depende del nivel de confianza utilizado para la estimacin).
b.

Estimacin de la proporcin poblacional (P).


P p Z

pq
n

Donde:
p = proporcin muestral
q=l-p
c.

Determinacin de la relacin entre dos variables categricas.


Para determinar si existe una relacin estadsticamente significativa entre dos variables
expresadas cualitativamente, tales como: sistema de cultivo (monocultivo, otros) con
roa de la papa (presencia, ausencia), programa de control de sanidad agraria (si, no)
presencia significativa de la plaga (si, no), etc. se puede utilizar el contraste de chi cuadrado (2) o, si la tabla es de 2 x 2, la prueba exacta de Fisher. Las frmulas
correspondientes son:
2

(oi ei ) 2
, donde:
ei

oi = frecuencias observadas, y
ei = frecuencias esperadas
Si el resultado nos indica la existencia de una asociacin significativa, es recomendable
cuantificar la intensidad de tal asociacin, para lo cual se calcula el coeficiente de
contingencia C:
C

2
, donde:
2 n

2 es el calculado y n el tamao de la muestra.


La prueba exacta de Fisher se usa, preferentemente, cuando en la tabla de 2x2 alguna
frecuencia esperada es 5. El esquema de la tabla es:
+

46

I
II

a
c
a+c

b
d
b+d

a+b
c+d
n

El valor de p (nivel de significacin) se calcula con la siguiente ecuacin:


p

d.

(a c)!(b d )!(a b)!(c d )!


a!b!c!d !n!

Determinacin de la relacin entre dos variables numricas.


Para estudiar la naturaleza y fuerza de la relacin de variables como: edad y peso,
precipitacin y escorrenta, dosis de un nutriente y produccin de maz, edad y
produccin de leche, etc.; y, cuando al graficar los puntos se observa una tendencia
lineal, puede usarse el anlisis de regresin y correlacin lineales simples y, si es de
tipo no lineal -como una exponencial, parablica, etc.- se recurrir al anlisis de
regresin y correlacin no lineales simples.
Para el anlisis de regresin lineal, los puntos se ajustan al modelo:
Y = a + bX, donde:
Y = variable cuyos valores se desea estimar o predecir
X = variable cuyos valores se usan para efectuar la estimacin o prediccin
a = ordenada en el origen
b = coeficiente de regresin lineal
Siendo X e Y variables, las constantes que hay que calcular son a y b.
a Y b X , donde:

Y = media de las Y
X = media de las X

n XY X Y
n X 2 ( X ) 2

n = tamao de la muestra.
Una vez calculado el valor de a y de b y, previa comprobacin de la linealidad de los
datos (puntos), el modelo est listo para ser utilizado; por ejemplo, en la prediccin o
estimacin de un valor de Y dado un valor de X.
Al efectuar el anlisis de correlacin lineal, la fuerza con que podran estar relacionadas
X e Y, se mide con el coeficiente de correlacin de Pearson (r).

47

n XY X Y
(n X ( X ) 2 )( n Y 2 ( Y ) 2 )
2

El coeficiente r vara de -1 a +1. Cuanto ms se acerque a -1 a 1, la fuerza de la


asociacin es mayor, slo que en el primer caso se trata de una relacin indirecta y en el
otro de una asociacin directa.
e.

Correlacin de dos variables de tipos diferentes.


Cuando el inters es correlacionar dos variables de tipos diferentes a los mencionados,
algunos coeficientes que pueden utilizarse, para los casos que se indican, son:
Ambas variables medidas en escala ordinal:

Coeficiente de correlacin de Spearman.

Una categrica dicotmica con una numrica medida en escala de intervalo o de razn:

Coeficiente de correlacin biserial - puntual.

Ambas categricas dicotmicas:

f.

Coeficiente de correlacin (phi).

Determinacin de la relacin entre ms de dos variables numricas.


En los casos en que una variable, Y, podra estar en funcin de dos o ms variables X1,
X2 Xk, es decir: Y = f(X1 X2, Xk) se tendr que emplear el anlisis de regresin y
correlacin mltiple. A este respecto, igual que para los casos anteriores, existen
programas y paquetes estadsticos de computadora que son de gran ayuda.
Es bueno mencionar, en este punto, que en realidad cualquier problema por lo general
es causado por mltiples factores. De donde es recomendable visualizar el fenmeno en
forma global e integral y no reducir el enfoque slo a situaciones bivariadas.

2.

Dos poblaciones independientes


Cuando se desea comparar dos poblaciones independientes pueden contrastarse
hiptesis relacionadas con:
a.

Dos medias aritmticas

En este caso puede utilizarse la prueba Z t" de Student. La primera se usa cuando
las desviaciones estndar poblacionales y 1 y 2 son conocidas; en tal caso, las
muestras pueden ser incluso pequeas. Si no se conocen las desviaciones estndar
poblacionales y las muestras son grandes (ambas mayores que 30), tambin puede
usarse el contraste Z; pero, si las nuestras son pequeas, se emplear el contraste t
de Student, previa comprobacin de las suposiciones de aleatoriedad, normalidad y
homogeneidad de varianzas poblacionales. Las ecuaciones correspondientes, son:

48

X1 X 2

S1 S 2

n1 n2

(n1 y n2 > 30), donde:

X 1 , X 2 y S1, S2 son medias aritmticas y desviaciones estndar de las dos muestras


respectivamente.

X1 X 2

Sp

n1

Sp

es una t con n1 + n2 -2 grados de libertad

n2

Donde Sp2 es la varianza ponderada que se calcula con:

Sp

(n 1) S1 (n2 1) S 2
1
n1 n2 2

Si los datos no satisfacen la suposicin de normalidad, no debe utilizarse el contraste


t; en tales casos, puede emplearse alguna prueba no paramtrica como la U de
Mann - Whitney o la prueba de la mediana.
b.

Dos proporciones

Para la comparacin estadstica de dos porporciones de poblaciones independientes se


usa:

p1 p 2
p1q1 p 2 q2

n1
n2

(n1 y n2 > 30), donde:

Donde: p1 y p2 son proporciones muestrales y q1 = 1 - p1, q2 = 1 - p2.


3.

Dos muestras relacionadas


Cuando se comparan dos muestras relacionadas (diseos antes - despus o pre - post
test, dos muestras pareadas, etc.) y los datos satisfacen las exigencias del contraste t
de Student, se usa:
t

d
Sd

t con n 1 grados de libertad

Este contraste se denomina comunmente t pareada.


Donde: d y Sd son la media aritmtica y la desviacin estndar de las diferencias.
Si no se satisface la suposicin de normalidad o los datos estn medidos en una escala
ordinal, se usar el contraste no paramtrico T de Wilcoxon o el test de signos (prueba
49

binomial).
Si se tiene dos muestras relacionadas de variables categricas dicotmicas (positivo negativo, si - no, correcto - incorrecto, etc.), se usa la prueba 2 de Mc Nemar. Este
contraste es particularmente importante para determinar la significacin de los cambios
en los diseos antes - despus. Los datos se tabulan de la siguiente manera:

Antes +
2

4.

Despus
+
a
b
c

( a d 1) 2
(a d )

2 con un grado de libertad

Ms de dos poblaciones.
Para la comparacin de ms de dos medias aritmticas y cuando los datos satisfacen las
principales suposiciones: aleatoriedad, normalidad y homogeneidad de varianzas, puede
hacerse uso del mtodo estadstico denominado Anlisis de Varianza (ANVA). Esta
tcnica no slo se usa para el caso de un factor o un criterio de clasificacin (donde se
haya empleado el diseo completamente aleatorizado), sino para dos o ms factores; as
como para analizar estadsticamente datos provenientes de otros diseos experimentales
tales como el diseo de bloques aleatorizados, cuadrados latinos, medidas repetidas,
etc.
Cuando no se satisfacen las suposiciones que fundamentan el uso del ANVA o los datos
consisten en rangos, deben usarse mtodos no paramtricos alternativos al ANVA, entre
los que sobresalen el tst de Kruskal - Wallis para un factor y el de Friedman para dos
factores.
Si el inters es comparar ms de dos muestras independientes respecto a una variable
categrica, se emplear el constraste 2.

50

Вам также может понравиться