Вы находитесь на странице: 1из 18

Universidad Nacional Jorge Basadre Grohmann

Facultad De Ciencias Agrcolas


Escuela Profesional De Medicina Veterinaria y Zootecnia

1
Anlisis de Variable Cualitativa
INTRODUCCION
En muchas ocasiones la informacin proporcionada en una tabla es tan singular o
importante que se decide presentar esos resultados de forma grfica. Cuando se
decide utilizar el grfico, este sustituye a la tabla, no la complementa. Por ello no se
deben tener tantos grficos como tablas. Como se presenta slo uno de los dos, se
acostumbra reflejar la informacin numrica en el grfico para que no sea
necesaria la tabla correspondiente. Incluso, un nmero innecesariamente grande
de grficos le puede restar lucidez al trabajo en lugar de proporcionarle calidad o
rigor cientfico. Se debe lograr un balance entre estas dos formas de presentacin
de resultados.
El objetivo bsico de un grfico es transmitir la informacin de forma tal que pueda
ser captada rpidamente, de un golpe de vista. Luego, un grfico debe ser ante todo
sencillo y claro, a pesar de su aspecto artstico, ya que se elabora para ser incluido
en un trabajo cientfico.
Existen mltiples tipos de grficos, pero aqu trataremos solamente de los usados
ms frecuentemente, que son: grfico de barras simples, grfico de sectores o
circular, grfico de barras mltiples, grfico de barras compuestas, histograma,
polgono de frecuencias, grfico de frecuencias acumuladas y grfico aritmtico
simple.







Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

2
Anlisis de Variable Cualitativa
ANALISIS DE VARIABLE CUALITATIVA

La representacin grfica contribuye a un mejor anlisis de los datos

Facilita la comprensin del fenmeno considerado

Pierde detalle de informacin pero se obtiene otro tipo de informacin

Grficos utilizados: histograma, polgono de frecuencia y ojiva son tiles
pues resaltan los patrones de los datos y atraen la atencin

1. CONSTRUCCIN DE UNA TABLA DE CONTINGENCIA

Para analizar la relacin de dependencia o independencia entre dos variables
cualitativas nominales o factores, es necesario estudiar su distribucin conjunta o tabla
de contingencia.
La tabla de contingencia es una tabla de doble entrada, donde en cada casilla
figurar el nmero de casos o individuos que poseen un nivel de uno de los factores o
caractersticas analizadas y otro nivel del otro factor analizado.

donde
nij = nmero de observaciones que tienen el atributo i y j
ni. = nmero de individuos que tie nen el atributo i (marginal i)
n.j = nmero de individuos que tienen el atributo j (marginal j)
La tabla de contingencia se define por el nmero de atributos o variables que se
analizan conjuntamente y el nmero de modalidades o niveles de los mismos. El
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

3
Anlisis de Variable Cualitativa
ejemplo propuesto es una tabla de contingencia 2x2, ya que tiene dos atributos (FUMA
Y SEXO) y cada uno de ellos tiene dos niveles. Si quisiramos analizar conjuntamente
tres variables nominales, como por ejemplo, Fumar, Sexo y Edad, y esta ltima variable
tuviera tres niveles (<20 aos, de 20 a 40 aos, >40 aos), obtendramos tres tablas
como la anterior, una para cada modalidad de edad y la tabla de contingencia tendra
una dimensin 322.
Las tablas de contingencia tienen dos objetivos fundamentales:
1) Organizar la informacin contenida en un experimento cuando sta es de carcter
bidimensional, es decir, cuando est referida a dos factores (variables cualitativas).

En esta tabla se puede observar en primer lugar que de los 233 individuos de los que
se tiene informacin 108 son hombres y 125 son mujeres. Asimismo se sabe que
123 de ellos fuman y 110 no. La tabla de contingencia nos permite tener
informacin cruzada sobre ambas variables: de los 108 hombres, 65 fuman y 43 no,
mientras que en el caso de las mujeres, 58 fuman y 67 no.
2) A partir de la tabla de contingencia se puede adems analizar si existe alguna
relacin de dependencia o independencia entre los niveles de las variables
cualitativas objeto de estudio. El hecho de que dos variables sean independiente
significa que los valores de una de ellas no estn influidos por la modalidad o nivel
que adopte la otra.
2. CONTRASTACIN ESTADSTICA DE LA RELACIN DE DEPENDENCIA
PARA VARIABLES CUALITATIVAS
Para identificar relaciones de dependencia entre variables cualitativas se utiliza un
contraste estadstico basado en el estadstico c2 (Chi-cuadrado), cuyo clculo nos
permitir afirmar con un nivel de confianza estadstico determinado si los niveles de
una variable cualitativa influyen en los niveles de la otra variable nominal analizada.
Siguiendo con el ejemplo propuesto, el clculo de la Chi-cuadrado nos permitira
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

4
Anlisis de Variable Cualitativa
saber si el sexo de una persona es un factor determinante en que dicha persona fume
o no fume.
Cmo podemos determinar si existe una relacin de dependencia o independencia
entre las variables analizadas?
Dos variables son independientes si:
a) las frecuencias relativas condicionadas son iguales a las frecuencias relativas
marginales, es decir:


b) O bien si se cumple que la frecuencia relativa conjunta es igual al producto de
las frecuencias relativas marginales:


De esta forma, comparando las frecuencias tericas esperadas en caso de
independencia entre los factores con las frecuencias observadas en la muestra,
podremos
concluir si existe una relacin de dependencia o independencia entre los factores o
atributos analizados.
Segn la notacin de la tabla inicial, y utilizando el concepto frecuentalista de
probabilidad, podemos estimar la probabilidad de que se de un suceso determinado a
partir de sus frecuencias relativas:
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

5
Anlisis de Variable Cualitativa



La hiptesis nula a contrastar ser la de independencia entre los factores, siendo la
hiptesis alternativa la de dependencia entre los factores.


Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

6
Anlisis de Variable Cualitativa

Frecuencias relativas marginales:
P (ser hombre) = 108/ 233 = 46.4%
P (ser mujer) = 125/ 233 = 53.6%
P (fumar) = 123/ 233 = 52.8%
P (no fumar) = 110/ 233 = 47.2%

Frecuencias relativas conjuntas:
P (hombre y fumar) = 65/ 233 = 27.9%
P (hombre y no fumar) = 43/ 233 = 18.5%
P (mujer y fumar) = 58/ 233 = 24.9%
P (mujer y no fumar) = 67/ 233 = 28.8%
Frecuencias relativas tericas esperadas en caso de independencia:
E (hombre y fumar) = 46.4% x 52.8% = 24.5%
E (hombre y no fumar) = 46.4% x 47.2% = 21.9%
E (mujer y fumar) = 53.6% x 52.8% = 28.3%
E (mujer y no fumar) = 53.6% x 47.2% = 25.3%
Frecuencias absolutas tericas esperadas en caso de independencia:
E (hombre y fumar) = 123 * 108 /233 = 57
E (hombre y no fumar) = 108*110/233 = 51
E (mujer y fumar) = 123*125/233 = 66
E (mujer y no fumar) = 125*110/233 = 59


Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

7
Anlisis de Variable Cualitativa

I. GRFICOS PARA VARIABLES CUANLITATIVAS:

Para las variables cuantitativas, consideraremos dos tipos de grficos, en
funcin de que para realizarlos se usen las frecuencias (absolutas o
relativas) o las frecuencias acumuladas:

Diagramas diferenciales: Son aquellos en los que se representan
frecuencias absolutas o relativas. En ellos se representa el nmero o
porcentaje de elementos que presenta una modalidad dada.

Diagramas integrales: Son aquellos en los que se representan el nmero
de elementos que presentan una modalidad inferior o igual a una dada.
Se realizan a partir de las frecuencias acumuladas, lo que da lugar a grficos
crecientes, y es obvio que este tipo de grficos no tiene sentido para
variables cualitativas.

Segn hemos visto existen dos tipos de variables cuantitativas: discretas y
continuas. Vemos a continuacin las diferentes representaciones graficas
que pueden realizarse para cada una de ellas as como los nombres
especficos que reciben.


1. CONTINUAS:

Cuando las variables son continuas, utilizamos como diagramas
diferenciales los histogramas y los polgonos de frecuencias.

a) HISTOGRAMA:

Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

8
Anlisis de Variable Cualitativa
El histograma es un grfico que representa las frecuencias mediante
reas. Sobre cada clase (o rango de valores) se dibuja un rectngulo
cuya rea representa la frecuencia (absoluta o relativa) de esa clase.
Cuando las clases (o intervalos) en que dividimos los datos son de
distinta longitud el eje vertical no tiene sentido. Como la frecuencia es el
rea de cada rectngulo, si dibujamos rectngulos con distinta base su
mayor o menor altura no nos da informacin.
Cuando las clases (o intervalos) son de la misma longitud, las
frecuencias son proporcionales a las alturas de los rectngulos. La
altura nos informa sobre la densidad o concentracin de datos en ese
intervalo:
- Donde los rectngulos son ms altos hay ms datos de la variable
- Donde los rectngulos son ms bajos los datos de la variable son ms
escasos.
En si el histograma se construye a partir de la tabla estadstica,
representando sobre cada intervalo, un rectngulo que tiene a este
segmento como base. el criterio para calcular la altura de cada rectngulo es
el de mantener la proporcionalidad entre las frecuencias absolutas (o
relativas) de cada intervalo y el rea de los mismos.

EJEMPLOS DE TIPOS DE REPRESENTACIONES GRFICAS

Histograma continua:
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

9
Anlisis de Variable Cualitativa




Histograma simple:

Se representan los intervalos de clase en el eje de abscisas (eje horizontal) y
las frecuencias, absolutas o relativas, en el de ordenadas (eje vertical).
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

10
Anlisis de Variable Cualitativa

Histograma acumulado:
A veces es ms til representar las frecuencias acumuladas
.


Histograma acumulado:
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

11
Anlisis de Variable Cualitativa

b) POLIGONO DE FRECUENCIA:
El polgono de frecuencias es una representacin grfica de las
frecuencias equivalente al histograma.
Se obtiene a partir del histograma uniendo los centros de la base
superior de sus rectngulos.
Se puede obtener para frecuencias acumuladas a partir del
histograma de frecuencias acumuladas.
La diferencia fundamental entre el histograma y el polgono es que
ste proporciona una representacin ms suavizada de la
distribucin de frecuencias.
Se construye fcilmente si tenemos representado previamente el
histograma, ya que consiste en unir mediante lneas rectas los puntos
del histograma que corresponden a las marcas de clase.
Para representar el polgono de frecuencias en el primer y ltimo
intervalo, suponemos que adyacentes a ellos existen otros intervalos
de la misma amplitud y frecuencia nula, y se unen por una lnea recta
los puntos del histograma que corresponden a sus marcas de clase.
Ej empl o Las t emperat uras en un d a de ot oo de una ci udad han
suf ri do l as si gui ent es vari aci ones:

Hora Temperatura
6 7
9 12
12 14
15 11
18 12
21 10
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

12
Anlisis de Variable Cualitativa
24 8




POLIGONO DE FRECUENCIA ACUMULADA:








Tabla 1

















Tabla 2
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

13
Anlisis de Variable Cualitativa

La frecuencia total de todos los valores menores que el lmite real superior de clase
de un intervalo de clase dado se conoce como frecuencia acumulada hasta ese
intervalo de clase inclusive. Por ejemplo, la frecuencia acumulada hasta el intervalo
de clase 66 - 68 inclusive en la Tabla 1, es 5 + 18 + 42 = 65, significando que 65
estudiantes tienen alturas menores que 68,5 pulgadas.
Una tabla que represente las frecuencias acumuladas se llama distribucin de
frecuencias acumuladas, tabla de frecuencias acumuladas o brevemente
distribucin acumulada, y se muestra en la Tabla 2, para la distribucin de la altura
de los estudiantes.
Un grfico que muestre las frecuencias acumuladas menores que cualquier lmite
real superior de clase trazado sobre los lmites reales superiores de clase se llama
polgono de frecuencias acumuladas u ojiva y se muestra en la Fig. 2-2 para la
distribucin de la altura de los estudiantes.
En algunos casos es preferible considerar una distribucin de frecuencias
acumuladas de todos los valores mayores o iguales al lmite real inferior de clase
de cada intervalo de clase. En este caso consideramos las alturas de 59,5 pulgadas
o ms, 62,5 pulgadas o ms, etc., sta se llama a veces distribucin acumulada o
ms, mientras que la considerada anteriormente es la distribucin acumulada
menor que. De la una se obtiene fcilmente la otra. Las correspondientes ojivas
se llaman o ms y menor que. Siempre que nos refiramos a distribuciones
acumuladas u ojivas sin especificar, se entender que son del tipo menor que.
DISTRIBUCIONES DE FRECUENCIAS RELATIVAS ACUMULADAS. OJIVAS
PORCENTUALES
La frecuencia relativa acumulada o frecuencia porcentual acumulada es la
frecuencia acumulada dividida por la frecuencia total. Por ejemplo, la frecuencia
relativa acumulada de alturas menores que 68,5 pulgadas es 65/100 = 65 %,
queriendo con ello decir que el 65 % de los estudiantes tienen alturas menores de
68,5 pulgadas.
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

14
Anlisis de Variable Cualitativa
Si se utilizan en la Tabla 2, y Fig. 2, las frecuencias relativas acumuladas en lugar de
las frecuencias acumuladas, los resultados se llaman distribuciones de frecuencias
relativas acumuladas o distribuciones porcentuales acumuladas y polgonos de
frecuencias relativas acumuladas u ojivas porcentuales, respectivamente.
CURVAS DE FRECUENCIAS. OJIVAS SUAVIZADAS
El conjunto de datos puede considerarse normalmente como perteneciente a una
muestra extrada de una poblacin grande. A causa de las muchas observaciones
que podemos realizar en la poblacin es posible tericamente (para datos
continuos) elegir los intervalos de clase muy pequeos y todava tener un nmero
adecuado de observaciones dentro de cada clase. As se tiene que el polgono de
frecuencias o el de frecuencias relativas para una poblacin grande puede estar
formado por muchos pequeos segmentos rectos que aproximan el conjunto a una
curva, las curvas de este tipo pueden llamarse curvas de frecuencias o curvas de
frecuencias relativas, respectivamente.
Es razonable esperar que tales curvas tericas provengan de la suavizacin de los
polgonos de frecuencias o de los polgonos de frecuencias relativas de la muestra,
la aproximacin es tanto ms exacta conforme aumenta el tamao de la muestra.
Por esta razn una curva de frecuencias se conoce como un polgono de
frecuencias suavizado.
De una forma anloga las ojivas suavizadas provienen de la suavizacin de los
polgonos de frecuencias acumuladas u ojivas. Normalmente es ms sencillo
suavizar una ojiva que un polgono de frecuencias.
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

15
Anlisis de Variable Cualitativa
TIPOS DE CURVAS DE FRECUENCIA
Las curvas de frecuencia presentan determinadas formas caractersticas que les
distinguen como se indica.
2. DISCRETAS:

Cuando representamos una variable discreta, usamos el diagrama de barras
cuando pretendemos hacer una grfica diferencial. Las barras deben ser
estrechas para representar el que los valores que toma la variable son
discretos.
El diagrama integral o acumulado tiene, por la naturaleza de la variable,
forma de escalera. Un ejemplo de diagrama de barras as como su diagrama
integral correspondiente estn representados en la figura 1.6.

a) LOS DIAGRAMAS DE BARRAS: Son similares a los grficos de sectores.
Se representan tantas barras como categoras tiene la variable, de modo
que la altura de cada una de ellas sea proporcional a la frecuencia o
porcentaje de casos en cada clase. Estos mismos grficos pueden
utilizarse tambin para describir variables numricas discretas que
toman pocos valores (nmero de hijos, nmero de recidivas, etc.).
Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

16
Anlisis de Variable Cualitativa

Ejemplo de variable discreta
Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el nmero de
caras, X, obtenindose los siguientes resultados:


Representar grficamente el resultado.
Solucin: En primer lugar observamos que la variable X es cuantitativa
discreta, presentando las modalidades: 0,1,2,3.
Ordenamos a continuacin los datos en una tabla estadstica, y se
representa la misma en la figura 1.6





Ejemplo de
representacin grfica
Clasificadas 12 familias por su nmero de hijos se obtuvo:



Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

17
Anlisis de Variable Cualitativa

Comparar los diagramas de barras para frecuencias absolutas y relativas. Realizar
el diagrama acumulativo creciente.

Solucin: En primer lugar, escribimos la tabla de frecuencias en el modo habitual:


Con las columnas relativas a

realizamos el diagrama de barras para


frecuencias absolutas, lo que se muestra en la figura 1.7. Como puede verse es
idntico (salvo un cambio de escala en el eje de ordenadas) al diagrama de barras
para frecuencias relativas y que ha sido calculado usando las columnas de

. El
diagrama escalonado (acumulado) se ha construido con la informacin procedente
de las columnas


Universidad Nacional Jorge Basadre Grohmann
Facultad De Ciencias Agrcolas
Escuela Profesional De Medicina Veterinaria y Zootecnia

18
Anlisis de Variable Cualitativa


BIBLIOGRAFIA:

Fundamentos de la bioestadistica de Morcello Pagano-Kimberlee Gouvreau
Editorial Thomson Learning

Principios y procedmientis segunda edicion de Robert G.D: y James H.
Torrie.

bioestadistica elaborado x Erica Taucher editorial Universitaria primera
edicin.

Estadistica de Murray R. Spiegiel --- segunda edicin, no endurezcas el
corazn

Вам также может понравиться