Академический Документы
Профессиональный Документы
Культура Документы
i
INTRODUCCIÓN 1
1. Conceptos Generales 1
2. Introducción al Muestreo 7
2.1. Métodos de Muestreo Probabilísticos 11
2.2. Métodos de Muestreo No Probabilísticos 15
2.3. Métodos Particulares de Selección 17
3. Consideraciones Finales 18
ETAPAS OPERATIVAS DE LA INVESTIGACIÓN ESTADÍSTICA 20
1. Formulación del Problema 21
2. Diseño del Experimento- Encuestas por Muestreo 22
3. Recopilación de Datos estadísticos 30
4. Organización de la Información 32
5. Presentación de la Información 33
6. Análisis de la Información 46
7. Interpretación de Resultados 47
ORGANIZACIÓN DE LA INFORMACIÓN ESTADÍSTICA 48
1. Clasificación de Variables 48
2. Variables Unidimensionales 50
2.1. Variables Cuantitativas Unidimensionales 51
3. Variables Bidimensionales 66
3.1. Variables Cuantitativas Bidimensionales 67
3.2. Variables Cualitativas Bidimensionales 76
MEDIDAS DESCRIPTIVAS 79
1. Introducción 79
2. Medidas de Posición 79
2.1. Promedios 80
2.2. Mediana 89
2.3. Modo 95
2.4. Cuartiles 100
2.5. Deciles 103
3. Medidas de Dispersión 103
3.1. Rango 104
3.2. Rango Intercuartil 104
3.3. Desviación Cuartílica 104
3.4. Desvío Standard 108
3.5. Dispersión Relativa 112
TÉCNICAS BÁSICAS DE ANÁLISIS 113
1. Variable Bidimensional 113
2. Variables cuantitativas 113
2.1. Covariancia 113
2.2. Coeficiente de Correlación muestral 116
3. Variables cualitativas 118
3.1. Asociación – Tablas 2x2 118
3.2. Contingencia - Coeficientes 121
3.3. Asociación – Coeficiente de Kendall 124
4. Variables ordinales 127
4.1 Coeficiente de Spearman 127
5. Análisis multivariante 128
ii
I. Introducción
INTRODUCCIÓN
1. Conceptos Generales
La concepción profana de la Estadística suele incluir en su concepto
la recopilación de grandes masas de datos y su presentación en cuadros y
gráficos, como así también el cálculo de totales, promedios, porcentajes,
entre otros. Esta concepción resulta simplista, considerando que estas
operaciones más o menos rutinarias constituyen solamente parte inciden-
tal de la Estadística de hoy.
Los métodos y procedimientos de la Estadística como ciencia, se
utilizan en diversos campos técnicos y científicos. Muchos estudiosos o in-
vestigadores, sean personas de negocios, empresarios, profesionales, ad-
ministradores públicos o privados, trabajando en un entorno propio a su
actividad requieren información sobre características o comportamientos
de dicho entorno, tanto para progresar en el conocimiento del problema,
indagar sus causas, como para tomar decisiones.
Es función del estadístico recopilar y caracterizar información con
análisis sencillos o más profundos y complejos, dependiendo esto último
de la cuestión a estudiar y de los objetivos especificados para su análisis.
En algunos casos el avance en el uso de las herramientas informáticas fa-
cilita el almacenamiento masivo y la disponibilidad de información, en
otros, se deberá recurrir a operativos específicos para su obtención.
La Estadística es la ciencia de la experimentación; el conoci-
miento de las Técnicas Estadísticas ayuda a tratar datos experimentales y
a programar experimentos de una forma más eficiente.
Utilizando el término experimentación en su acepción más amplia,
se debe entender que la Estadística proporciona no solo métodos de análi-
sis de datos disponibles, sino que también contribuye a la planificación y
organización de las tareas inherentes a la obtención de información. Al
aplicar sus procedimientos se alcanza en cada etapa: mayor eficacia, mí-
nimo error, aumento del rendimiento, economía en material, personal y
tiempo empleado, entre otras cuestiones.
Se describe a la Estadística como la tecnología del método cien-
tífico que proporciona instrumentos válidos para la toma de decisiones,
cuando prevalecen condiciones de incertidumbre. Estos instrumentos pue-
den ser de aplicación completamente general y útiles en cualquier campo
de la ciencia: físico, biológico ó social.
Mediante el razonamiento y en algunas situaciones la intuición el
método científico busca llegar a la verdad, para ello a partir de la teoría
pertinente, aplica un razonamiento deductivo o simplemente la inducción.
En muchos planteos no determinísticos, la experimentación es el punto de
partida para el avance en el conocimiento científico; para estas situacio-
nes el principio básico que se sustenta es: la evaluación debe ser objetiva
y controlada. Para ello se plantean hipótesis y se diseñan experimentos
1
I. Introducción
2
I. Introducción
3
I. Introducción
4
I. Introducción
al. Citando a Benzecri (1988) “el modelo debe seguir a los datos y no los
datos ajustarse al modelo”.
Dada la naturaleza de los datos y el concepto de “modelo”, es lógi-
co que la Teoría de Probabilidades sea la herramienta fundamental en
la Teoría Estadística.
Teoría Estadística: En general responde a las siguientes cuestio-
nes: fundamentar el uso de diversas técnicas y métodos que coadyuven a
encontrar soluciones a determinados problemas empíricos o teóricos; di-
señar experimentos, estudios o investigaciones, que estén condicionados
a los objetivos planteados, al análisis deseado, garantizando eficiencia y
por último evaluar la precisión midiendo los errores en las estimaciones y
predicciones.
Universo (UN): Es el conjunto de todas las unidades elementales,
objeto de estudio, definido en el tiempo y en el espacio. Es fundamental
su especificación detallada, determinando las características que le defi-
nen una composición o estructura. Esto permite determinar, taxativamen-
te, si un elemento pertenece o no a la Población en estudio.
Frecuentemente los términos Universo y Población se utilizan in-
distintamente. Esto se debe a que el concepto de “población “ tiene amplio
alcance para la Estadística de modo que, según el campo de aplicación del
que se trate, se puede estar trabajando con poblaciones de personas,
plantas, días, frutos, tornillos, etc..Sin embargo en la teoría Estadística el
término población, se utiliza para referirse a las distribuciones teóricas de
las variables involucradas en el análisis, concepto que se desarrollará más
adelante.
Podría mencionarse como dos ejemplos de posibles universos a es-
tudiar: Alumnos que cursan carreras de Economía en las Universidades
Nacionales Argentinas en el año 2008; o Producción de tornillos fabricados
por la empresa TT en el último mes del corriente año.
Una población estadística puede ser finita o infinita, en el sentido
de que está constituida por un número limitado o ilimitado de elementos.
Solamente en el caso de población finita puede establecerse el
marco poblacional enumerando sus elementos o listándolos físicamente. El
número total de elementos que la componen, se simboliza con N.
A los efectos de un muestreo, de existir un marco poblacional este
será la base sobre el cual deben definirse los procesos de selección. Este
marco en general posee deficiencias que deben detectarse y remediarse
antes de ser utilizado.
Las unidades que componen el Universo deben ser susceptibles de
ser observadas y presentar una o varias características de interés a las
que se referirán los resultados del Análisis Estadístico.
Censo: Es un operativo de recopilación de información que se rea-
liza considerando todos los elementos de la población. Ejemplos de ellos
son: Censo de Población, Hogares y Viviendas; Censo Económico, Censo
5
I. Introducción
6
I. Introducción
2. Introducción al Muestreo
Los conceptos anteriormente expuestos, permiten realizar una pre-
sentación general sobre qué implica el Muestreo Estadístico.
Es evidente que el empleo de una muestra es el único medio que
permite estudiar una población infinita o finita pero muy extensa. Aún en
el caso de poblaciones finitas que podrían ser abarcadas en su totalidad,
7
I. Introducción
8
I. Introducción
9
I. Introducción
10
I. Introducción
11
I. Introducción
12
I. Introducción
tenido entre los alumnos de una determinada provincia. Una forma de lle-
var adelante el estudio es realizar una encuesta por muestreo, seleccio-
nando una muestra de 600 (n). Se conoce de información brindada por el
Ministerio de Educación que de la población de 10.000 (N) alumnos esco-
larizados en las edades que interesa; 6000 acuden a colegios públicos,
3000 a colegios privados laicos y 1000 a colegios privados no laicos.
Como se presupone la existencia de variabilidad en las opiniones
según provengan de distintos colegios es que se realiza un muestreo es-
tratificado empleando como variable de estratificación el tipo de colegio.
En este caso se identifican tres sub- poblaciones que constituyen los es-
tratos: N1 = 6.000 alumnos, N2 = 3.000 alumnos N3 = 1.000 alumnos.
Luego se calcula qué proporción representa el tamaño de cada uno
de los estratos respecto de la población total, con el objeto de replicarla
en la muestra, resultando:
Colegio públicos: 6000/10000=0.60
Colegios privados laicos: 3000/10000=0.30
Colegios privados no laicos: 1000/10000=0.10
Para conocer el tamaño de la muestra correspondiente a cada es-
trato se debe multiplicar esa proporción por el tamaño muestral, obte-
niendo en este caso:
Colegios públicos: 0.60x600=360 alumnos
Colegios privados laicos: 0.30x600=180 alumnos
Colegios privados no laicos: 0.10x600= 60 alumnos
Los resultados finales se presentan en la siguiente tabla:
Estrato Ni ni
1 6000 360
2 3000 180
3 1000 60
Total 10000 600
Muestreo Sistemático
El muestreo sistemático consiste en la selección ordenada y perió-
dica de individuos, se escoge el primer individuo al azar, denominado se-
milla, y éste determina taxativamente el conjunto de individuos que con-
forman la muestra. Este método es utilizado si la población de unidades
está presentada en una secuencia determinada.
El procedimiento a aplicar, en símbolos, se describe a continuación.
Fijado el tamaño de la muestra se calcula el período de selección K,
se realiza el cociente entre el tamaño de la población y el de la muestra:
K = N/n , luego se elige aleatoriamente un número entre 1 y K , el cual
indica el orden del primer elemento seleccionado, los restantes (n-1) ele-
mentos se seleccionan sistemáticamente a partir de éste utilizando el pe-
ríodo K, de la siguiente forma: simbolizando con r al orden del primer
elemento seleccionado, el orden del segundo será r+K , el del tercero será
r+2K y así sucesivamente.
13
I. Introducción
14
I. Introducción
15
I. Introducción
16
I. Introducción
17
I. Introducción
3. Consideraciones Finales
Las propiedades deseadas e idealizadas de las muestras probabilís-
ticas solamente pueden realizarse en forma aproximada, puesto que se in-
troducen muchas imperfecciones en la ejecución de muestras en la practi-
ca. En el momento de realizar inferencias de valores de la muestra a valo-
res de la población intervienen suposiciones acerca de los posibles efectos
de estas imperfecciones; pero a menudo podemos investigar, reducir con
éxito y poner algunos límites a los efectos posibles o probables de las im-
18
I. Introducción
19
II. Etapas Operativas
20
II. Etapas Operativas
21
II. Etapas Operativas
22
II. Etapas Operativas
23
II. Etapas Operativas
24
II. Etapas Operativas
25
II. Etapas Operativas
26
II. Etapas Operativas
27
II. Etapas Operativas
28
II. Etapas Operativas
29
II. Etapas Operativas
30
II. Etapas Operativas
31
II. Etapas Operativas
4. Organización de la Información
Cuando se obtienen los datos a través de una encuesta, es decir de
fuente directa éstos se deberán organizar y ordenar en forma sistemática
32
II. Etapas Operativas
5. Presentación de la Información
Una vez que se ha recopilado y organizado el conjunto de datos es-
tadísticos, es muy probable, mas allá del análisis que se realice luego, que
sea necesario presentarlos como el resultado obtenido de nuestra tarea. Si
esta es la situación, existen pautas a tener en cuenta para lograr un in-
forme claro y preciso.
33
II. Etapas Operativas
Cuadros Estadísticos
Esta forma de presentación de información suele usarse con mayor
frecuencia que el anterior. Consiste en el arreglo sistemático de las cifras
en una matriz, identificando filas y columnas, o sea utilizando una tabla
de doble entrada. Para su construcción existen ciertas normas básicas que
permiten que el cuadro cumpla con su objetivo que es presentar la infor-
mación ordenadamente, facilitando su interpretación y análisis.
34
II. Etapas Operativas
35
II. Etapas Operativas
36
II. Etapas Operativas
37
II. Etapas Operativas
Incluso, si éstas cifras son números grandes, puede llevarse el dato a mi-
les o millones, en cuyo caso deberá indicarse la unidad utilizada (esto
puede ser en las notas de introducción).
- Si algún dato se desconoce, debe colocarse el símbolo: s/i (acla-
rando en una nota su significado). Y si algún dato es cero, debe colocarse
una rayita.
- Por último, se recomienda simplicidad en la presentación de los
cuadros, para lo cual se sugiere tratar el menor número posible de temas
por tabla, elegir tamaño y forma adecuadas al informe que se presenta,
no trazar más rayas de las necesarias para dividir columnas o filas, dejar
sólo las esenciales que separan encabezados, subencabezados, la columna
matriz y los totales. Todo el cuadro debe enmarcarse en un recuadro.
Ejemplo 2-2:
Nota: (1) Error estándar relativo (EER): es un indicador de la precisión de los resultados obtenidos a par-
tir de la muestra seleccionada. Cuanto menor es el EER, mayor es el nivel de precisión de la estimación
correspondiente. En general se expresa en porcentaje y no tiene unidad de medida. Es habitual conside-
rar que errores estándar relativos menores o próximos al 10% señalan resultados muestrales confiables.
Fuente: INDEC, Encuesta de Turismo Internacional 2001.
38
II. Etapas Operativas
39
II. Etapas Operativas
40
II. Etapas Operativas
41
II. Etapas Operativas
B. Blanca
B. Aires
Rosario
0% 50% 100%
42
II. Etapas Operativas
50
0
1995 1996 1997
E x p o rta c io n e s d e g ra n o s
p ro v e n ie n te s d e B u e n s o A ire s - A ñ o s
9 5 -9 6 -9 7
100%
S o ja
80%
G ira s o l
60%
T rig o
40%
20%
0%
1995 1996 1997
43
II. Etapas Operativas
B. Blanca
B. Aires Soja
Girasol
Rosario Trigo
0 20 40 60 80 100
44
II. Etapas Operativas
tenis 20
0
1er trim. 2do trim. 3er trim. 4to trim.
Ford
Fiat
=100.000 unidades
45
II. Etapas Operativas
6. Análisis de la Información
El investigador, frecuentemente, se encuentra en la situación de
requerir para su trabajo gran cantidad de datos, resultándole imposible
absorberlos en su totalidad. Del mismo modo, en caso de disponer de
ellos, tampoco puede comprender intuitivamente lo que los datos contie-
nen. En estos casos debe resumir la información recopilada, para lo cual
emplea métodos de cálculo de medidas, coeficientes, que le permiten sus-
tituir la masa total de información por algunas pocas cantidades. En esta
46
II. Etapas Operativas
7. Interpretación de Resultados
En esta etapa, el investigador da una explicación comprensiva de la
investigación y de los resultados hallados, para así arribar a una conclu-
sión confiable.
En principio resulta recomendable responder a las siguientes pre-
guntas:
- ¿Cuáles son las conclusiones que se desprenden del análisis?
- ¿Qué nos dicen las cifras, que sea novedoso para el conocimiento ac-
tual del tema?
- ¿Este trabajo refuerza, modifica, hipótesis establecidas, o da lugar a
la formulación de nuevas hipótesis de trabajo?
- ¿Es el estudio lo suficientemente amplio que compruebe o refute
opiniones anteriores?
Los resultados deben interpretarse a la luz de las limitaciones del
material original. No deben deducirse conclusiones demasiado precisas de
datos que por si mismos no son más que aproximaciones. Sin embargo, es
de esencial importancia que el investigador descubra y aclare todo lo que
haya de útil o aplicable en sus datos.
Así como en el momento de recopilar la información existe una
propensión a aceptar cualquier dato estadístico sin dudar de su exactitud.
También suele ocurrir que se mal usen o se mal interpreten algunos resul-
tados provenientes de estudios fundamentados en métodos estadísticos,
tal como es el caso de tasas de desocupación obtenidas por lo general
como resultado de encuestas por muestreo, que se generalizan a toda la
población y no a las sub poblaciones de donde se extrae la muestra.
Para evitar esto, en esta etapa no se debe dejar de mencionar cual
fue el marco poblacional sobre el que se seleccionó la muestra y, si es po-
sible dar el grado de error o el intervalo de confianza con que se realiza la
predicción o estimación presentada.
47
III. Organización de la Información
1. Clasificación de Variables
En este capítulo se presentan y desarrollan algunos de los proce-
dimientos que corresponden a la organización de datos estadísticos, etapa
posterior a la recopilación. Con el propósito de describir el comportamien-
to de la variable objeto de estudio se recurre a la organización de los da-
tos construyendo las llamadas Tablas de Frecuencias, éstas generalmente
se presentan acompañadas de sus respectivas representaciones gráficas.
Las personas que hacen uso de las estadísticas suelen enfrentar
dos situaciones, una es cuando recurren a fuente directa para obtener sus
datos, generalmente publicaciones especializadas, en este caso pueden
obtener distribuciones de frecuencias ya construidas; otra situación se
plantea si realizan recopilación directa, ya que una vez obtenidos los datos
necesitan para su organización, elaborar sus propias distribuciones de fre-
cuencias.
En el segundo caso mencionado se dispone de un conjunto de ob-
servaciones estadísticas que presentan un orden conveniente al método
de obtención, por ejemplo éste puede ser el orden alfabético de una lista
de personas a quienes se les registra su edad, o el orden numérico del
cuestionario utilizado en una encuesta, o un orden cronológico si se trata
de datos vinculados a una unidad temporal. En esta circunstancia si el
número de unidades estadísticas estudiadas es pequeño, el conjunto de
datos obtenidos se considera una serie simple y su descripción es sencilla
e inmediata, sin embargo si el número de datos es grande el análisis es-
tadístico descriptivo se facilita y profundiza cuando se organizan los datos
originales en tablas de frecuencias.
Antes de proceder a la presentación del tema se requiere precisar
conceptos estadísticos básicos, que serán utilizados en éste y capítulos
subsiguientes.
Variable: es la característica que se estudia, mide u observa, a las
Unidades Estadísticas. Como ejemplos de variables a estudiar se puede
mencionar: el peso en kg., correspondientes a un grupo de atletas; el lu-
gar de nacimiento de los alumnos que cursan una carrera de postgrado; el
número de errores encontrados en cien artículos periodísticos; la cantidad
de cuartos correspondientes a las viviendas asentadas en determinado ba-
rrio de una ciudad; temperatura corporal promedio por día de los interna-
dos en un hospital; nº de integrantes por hogar obtenido de una Encues-
ta realizada a Hogares; producción de soja en miles de Tn. en los últimos
diez años referida a una región geográfica determinada.
Las variables se simbolizan utilizando las últimas letras del abece-
dario X, Y, Z. Estas pueden tomar cualquier valor (número o cualidad) de-
ntro de un conjunto determinado llamado dominio o campo de variación
de la variable.
Dato estadístico: es el valor obtenido al observar o medir una va-
riable referida a una unidad estadística predeterminada.
48
III. Organización de la Información
Cada variable puede presentar dos o más valores, pero éstos deben
ser excluyentes y exhaustivos, es decir que cada unidad estadística de la
población presenta una y sólo una de estas modalidades y el campo de
variación contempla todos los casos susceptibles de presentación. Corres-
ponde hacer una diferencia entre los valores posibles y los valores obser-
vados ya que éstos generan dos campos de variación distintos: los prime-
ros son los que puede asumir la variable y los segundos son los valores
que realmente se observaron o se obtuvieron en la recopilación.
De acuerdo a su naturaleza a las variables se las clasifica en:
- Cualitativas: son aquellas que corresponden a atributos de la uni-
dad estadística, asumen categorías nominales. Ejemplos: profesión; sexo;
nivel socioeconómico.
- Cuantitativas: son aquellas que asumen valores numéricos. A su
vez según como se originen, pueden clasificarse en:
Discretas: asumen una cantidad finita o infinita numerable de valo-
res posibles. Ejemplos: nº de hijos por familia; nº de habitantes por barrio
en una ciudad; nº de autos que pasan por un peaje en un intervalo de
tiempo determinado.
Continuas: asumen infinitos valores posibles en un intervalo real.
Ejemplos: velocidad promedio de un automóvil observada por tramos re-
corridos; altura media de un conjunto de personas; temperatura máxima
por día durante un mes determinado.
En general las mediciones dan origen a datos continuos y las enu-
meraciones o conteos originan datos discretos. En realidad, la distinción
entre discretas y continuas hace referencia a su naturaleza, considerando
que en la práctica toda medición es discreta, ya que se efectúa con algún
tipo de instrumento que tiene un grado de precisión limitado.
Otra forma de clasificar a las variables cuantitativas es consideran-
do su relación o no con el tiempo cronológico:
- Temporales o cronológicas: son aquellas variables que se estu-
dian considerando su valor observado en relación con el tiempo transcu-
rrido, por ejemplo: por mes, año, minutos, etc., que constituyen la unidad
estadística de observación. O sea que la recopilación de la información se
realiza en correspondencia biunívoca con la variable tiempo, que es prede-
terminada. Por ejemplo: producción de manzanas, en Tn, para el Alto Va-
lle por año en la última década; temperatura corporal por hora para un
paciente durante un día determinado. En general son las variables que
originan las llamadas series demográficas, estadísticas vitales, series eco-
nómicas, etc.
- Atemporal: cuando el orden de las observaciones no es conside-
rado determinante. Ejemplos: información recopilada a través de los Cen-
sos o Encuestas realizadas en una fecha establecida.
Asimismo, según la cantidad de características que se observan
simultáneamente a cada unidad de observación, se puede clasificar a las
variables en:
- Unidimensionales: son aquellas que se originan al observar la
unidad estadística teniendo en cuenta una sola característica.
49
III. Organización de la Información
2. Variables Unidimensionales
Para la aplicación del método estadístico es necesario cumplir con
ciertas etapas operativas, descriptas en el capítulo anterior, siendo la pri-
mera la formulación del problema. En ésta usualmente al definir un marco
teórico como sustento del tema objeto de estudio, no se puede ignorar
que la realidad social, económica, biológica, etc., es variada y compleja,
en consecuencia su estudio y análisis obliga, habitualmente, a trabajar
con datos multidimensionales.
50
III. Organización de la Información
51
III. Organización de la Información
∑f
i =1
i = f1 + … + fi + … + f n = n , y la propiedad : 0 ≤ fi ≤ n.
52
III. Organización de la Información
53
III. Organización de la Información
54
III. Organización de la Información
x fi hi hi % Fi Hi Hi %
x1 = 0 13 0,065 6,5 13 0,065 6,5
x2 = 1 24 0,120 12,0 37 0,185 18,5
x3 = 2 31 0,155 15,5 68 0,340 34
x4 = 3 46 0,230 23,0 114 0,570 57
x5 = 4 38 0,190 19,0 152 0,760 76
x6 = 5 29 0,145 14,5 181 0,905 90,5
x7 = 6 19 0,095 9,5 200 1,000 100
Total 200 1 100
55
III. Organización de la Información
56
III. Organización de la Información
Datos agrupados
En el caso que la variable en estudio X sea cuantitativa continua o
discreta con un campo de variación extenso, se trabaja con el recorrido de
la variable particionado en intervalos.
Hecha la recopilación para n unidades estadísticas, se dispone de
un volumen importante de datos presentados en forma de matriz o sim-
plemente en forma consecutiva. En este caso para describir adecuada-
mente el comportamiento de la variable en estudio resulta de gran utili-
dad agrupar los datos en intervalos o clases, generando luego la tabla de
frecuencias en forma similar a la anterior. Lógicamente que al agrupar los
datos se pierde precisión, pero las ventajas descriptivas son substanciales.
Respecto al número de clases o intervalos a utilizar para obtener la distri-
bución de frecuencias, no existe una regla rigurosa. Es importante recor-
dar que si el número de intervalos es demasiado grande, muchos de ellos
presentarán valores muy chicos de frecuencias o ningún caso incluido en
ellos. Además la distribución de frecuencias se puede presentar con dema-
siadas irregularidades, no permitiendo una descripción en detalle del com-
portamiento de la variable estudiada.
Tampoco es conveniente que el número de intervalos sea muy re-
ducido, en este caso se acumularán tantos casos en un mismo intervalo
que hará que se pierda la individualidad del dato.
Cuanto mayor sea el número de observaciones y más regular sea la
distribución de frecuencias, más intervalos podrán usarse al organizar
agrupando, los datos.
Podría decirse, en general, que es poco usual trabajar con menos
de 6 u 8 intervalos y que más de 16 serán útiles sólo cuando se trabaje
con un gran número de observaciones. Fijado el número de intervalos y
considerando el recorrido observado para la variable en estudio, la ampli-
tud de los intervalos queda determinada. Al respecto se desarrolla el caso
de intervalos de igual amplitud.
Para cálculos posteriores se requiere considerar los valores medios
de cada intervalo; este valor se tomará como representativo del conjunto
de valores observados del intervalo. El punto medio se determina como
semi promedio entre el límite inferior y superior del intervalo. Es deseable
que el punto medio coincida con un valor posible de la variable.
Atendiendo las observaciones realizadas, y para obtener las distri-
buciones de frecuencias en el caso de datos agrupados, se organizan los
datos en una tabla según se detalla a continuación.
a- Se calcula el rango de los valores asumidos por la variable tomando el
máximo valor observado xM y el mínimo valor observado xm: R= xM - xm
b- Luego, se divide este recorrido en una cantidad de intervalos o clases
según el total de observaciones. Un número razonable de clases (m) está
dado por la raíz cuadrada del número de observaciones (n): m = n
57
III. Organización de la Información
58
III. Organización de la Información
59
III. Organización de la Información
i
Se calcula: Hi% = Hi . 100 = ∑h %
j =1
j ∀i=1,...,m.
Las propiedades de estas frecuencias son las mismas que las enun-
ciadas para datos no agrupados.
60
III. Organización de la Información
61
III. Organización de la Información
que une el punto (xm-1', Fn-1 ) con el punto (xm' , Fn ), a partir del límite
superior del último intervalo el gráfico se continúa con una línea paralela
al eje X que se corresponde al valor Fn = n de la escala de las ordenadas.
Para las frecuencias relativas acumuladas se obtiene exactamente
el mismo diagrama, solo que para su lectura se debe utilizar la escala
adecuada, como se indica en el gráfico presentado.
Ejemplo 3-3: Retomando el planteo del ejemplo 3-1, se consideran ahora
a todos los hogares entrevistados, n=200, con el objeto de describir la va-
riable cuantitativa continua X: ingreso per cápita en pesos por hogar. Del
conjunto de datos recopilados se observa que el menor valor observado es
xm = 253 pesos y el máximo xM = 640 pesos, consecuentemente el rango
calculado para esta variable es R = 640 – 253 = 387 y el número de in-
tervalos razonable según la cantidad de datos sería: m = n , en este caso
200 = 14,14. Al dividir el rango por el número de intervalos se obtiene
como amplitud de intervalo 27,3; cifra que se redondea por una cuestión
práctica a h = 25. Resultando el número de intervalos m=7. Siguiendo el
procedimiento indicado anteriormente se presenta la información organi-
zada en la siguiente tabla de frecuencias:
Tabla 3-2
Intervalos i xi fi hi h i% Fi Hi Hi%
(250 – 280] 1 265 24 0,12 12,0 24 0,12 12
(280 – 310] 2 295 41 0,21 20,5 65 0,33 32,5
(310 – 340] 3 325 36 0,18 18,0 101 0,51 50,5
(340 – 370] 4 355 26 0,13 13,0 127 0,64 63,5
(370 – 400] 5 385 20 0,10 10,0 147 0,74 73,5
(400 – 430] 6 415 12 0,06 6,0 159 0,80 79,5
(430 – 460] 7 445 12 0,06 6,0 171 0,86 85,5
(460 – 490] 8 475 10 0,05 5,0 181 0,91 90,5
(490 – 520] 9 505 8 0,04 4,0 189 0,95 94,5
(520 – 550] 10 535 5 0,03 2,5 194 0,97 97
(550 – 580] 11 565 3 0,02 1,5 197 0,99 98,5
(580 – 610] 12 595 2 0,01 1,0 199 1,00 99,5
(610 - 640] 13 625 1 0,01 0,5 200 1,00 100
Total 200 1,00 100,0
62
III. Organización de la Información
63
III. Organización de la Información
64
III. Organización de la Información
65
III. Organización de la Información
3. Variables Bidimensionales
En el campo de la Estadística experimental es frecuente que varias
características sean observadas simultáneamente para un mismo conjunto
de unidades estadísticas. Por ejemplo, en una encuesta de opinión la per-
sona encuestada responde a varias preguntas realizadas en el mismo
momento; en una misma muestra de sangre se controlan al mismo tiem-
po varias variables hematológicas: cantidades de glóbulos, tasas de coles-
terol, nivel de glucosa. Las situaciones planteadas corresponden a estu-
dios multidimensionales.
En el caso particular que a cada unidad estadística se le observe o
mida, simultáneamente dos características, se obtienen datos correspon-
dientes a una variable bidimensional cuyas componentes pueden ser va-
riables cuantitativas, cualitativas u ordinales.
Como ejemplos sencillos se pueden mencionar los siguientes casos:
Vivien- X: nº de Y: m2
da cuartos cubier-
núme- tos Por tratarse de observaciones bidimensio-
ro nales los datos se consideran como par or-
1 3 82 denado, constituyendo una serie simple de
2 5 120
n = 5 observaciones: (3, 82); (5, 120); (2,
60); (3, 95);(1, 70) ; las componentes son
3 2 60
variables cuantitativas la primera discreta y
4 3 95 la segunda continua.
5 1 70
66
III. Organización de la Información
67
III. Organización de la Información
68
III. Organización de la Información
X
y1 … yi … yp fi•
Y
x1 f11 … f1j … f1p f1•
… … … … … … …
xi fi1 … fij … fip fi•
… … … … … … …
xm fm1 … fmi … fmp fm•
f•j … f•i … f•p N
Interpretando como:
x1 indica el menor valor que asume la componente X
xm indica el mayor valor que asume la componente X
m indica la cantidad de valores distintos observados de la componente X
69
III. Organización de la Información
m
nales se obtiene el total de observaciones: n = ∑f
i =1
i•
p
cias marginales se obtiene el total de observaciones: n = ∑f
j =1
•j
70
III. Organización de la Información
71
III. Organización de la Información
Y
22 23 24 25 26 27 fi.
X
0 4 3 2 1 1 0 11
1 2 5 3 4 4 5 23
2 2 2 3 1 2 1 11
3 0 1 1 3 6 8 19
4 0 3 2 1 3 2 11
f.j 8 14 11 10 16 16 75
72
III. Organización de la Información
Y
(y0'-y1'] … (yj-1'-yj'] … (yp-1'-yp'] fi•
X
… … … … … … …
… … … … … … …
73
III. Organización de la Información
asume un valor dentro del intervalo (x0'–x1'], sin tener en cuenta los valo-
res de Y.
fm•• indica la cantidad de veces que X asume un valor dentro del intervalo
(xm-1'-xm']sin tener en cuenta los valores de Y.
f•1 indica la cantidad de veces que Y asume un valor dentro del intervalo
(y0'-y1']. sin tener en cuenta los valores de X.
f•p indica la cantidad de veces que Y asume un valor dentro del intervalo
( yp-1' - yp'] sin tener en cuenta los valores de X.
En general:
fi•• representa la frecuencia marginal absoluta simple del i-ésimo intervalo
de la componente X, indica la cantidad de veces que la variable X asume
un valor dentro del i-ésimo intervalo (xi-1'-xi'] y se calcula :
p m
fi • = ∑
j =1
fij ∀i=1,...,m n= ∑f
i =1
i•
74
III. Organización de la Información
Gráfico 3-10
Distribución de frecuencias conjuntas
Variables cuantitativas continuas
fij
Y
5-7 7-9 9-11 11-15 fi.
X
5-7 4 3 2 1 10
7-9 2 5 3 4 14
9-11 2 2 3 1 8
11-15 2 2 1 3 8
f.j 10 12 9 9 40
75
III. Organización de la Información
76
IV. Medidas Descriptivas
77
IV. Medidas Descriptivas
Y
B1 … Bi … Bp fi•
X
A1 f11 … f1j … f1p f1•
… … … … … … …
Ai fi1 … fij … fip fi•
… … … … … … …
Am fm1 … fmi … fmp fm•
Insuficiente 10 30 30 70
Regular 10 10 20 40
Distinguido 20 60 10 90
40 100 60 200
78
IV. Medidas Descriptivas
MEDIDAS DESCRIPTIVAS
1. Introducción
Para cualquier conjunto de unidades estadísticas, universo o mues-
tra, a las cuales se les ha estudiado una o más variables cuantitativas,
puede resultar de gran utilidad a los fines de cumplimentar los objetivos
de la investigación, disponer de un resumen de sus características. Este es
el primer paso en el análisis de datos cuantitativos que implica describir el
comportamiento de la variable para el conjunto de unidades estadísticas
experimentales. En la etapa de análisis de la información, luego de haber
realizado la recopilación de los datos el investigador debe hacer usio de
mediadas que resuman, y además brinden la posibilidad de interpretar el
comportamiento de la variable en estudio en el conjunto de unidades es-
tadísticas.
Si estas medidas de resumen descriptivas de un conjunto de datos
se calculan utilizando los datos provenientes de una muestra se denomi-
nan estadísticos y si estas medidas descriptivas se calculan a partir de los
datos recopilados en toda la población, se llaman parámetros.
En función de encontrar medidas de resumen, la Estadística se
ocupa de analizar e interpretar, entre otras, tres características funda-
mentales: posición, que corresponde a la localización del conjunto de da-
tos cuantitativos recopilados respecto a valores de la variable en estudio;
dispersión, que implica analizar la variación de estos valores observados;
y forma de la distribución de frecuencias cuando el conjunto de datos es-
tá organizado de esta manera.
2. Medidas de Posición
Las medidas de posición son valores de la variable estudiada que
tienen como objetivo describir el comportamiento del conjunto de datos,
representando al mismo a través de un solo número.
Las características más usuales que describen a un conjunto de da-
tos hacen referencia a la posición de éstos respecto al recorrido de la va-
riable en estudio.
Su importancia radica en que para cualquier conjunto de datos in-
dican las tendencias de agrupamiento de los mismos, con distinto grado
de cercanía entorno a determinados valores de estas medidas de posición.
Es importante tener en cuenta que estas medidas se aplican a gru-
pos y no a individuos. Por ello no se podría usar ni el mayor ni el menor
valor observado, como representantes del conjunto, sino que es más ade-
cuado buscar un valor central respecto al campo de variación de la varia-
ble. Las medidas que describen un valor típico de estas características en
un grupo de observaciones, reciben el nombre de medidas de tendencia
central. Las más utilizadas son: promedios, mediana y modo. Asimismo
entre las medidas de posición se consideran las llamadas medidas de
79
IV. Medidas Descriptivas
2.1. Promedios
Los promedios son valores que resultan de trabajar matemática-
mente con todos los valores observados de las variables.
Existen tres tipos de promedios: aritmético, geométrico y ar-
mónico. Según la naturaleza y comportamiento de la variable correspon-
de usar uno u otro promedio. Cualquiera sea el utilizado, en su cálculo in-
tervienen todos los valores observado en la muestra y está comprendido
dentro del recorrido de la variable.
Serie simple de datos
Generalmente se está trabajando con una serie simple de datos
cuando el conjunto de unidades experimentales es reducido, por ejemplo
un n menor que 30.
Si se realiza un procesamiento electrónico, trabajando con un ta-
maño de muestra grande se pueden obtener las características descripti-
vas trabajando con los datos originales sin agrupar.
80
IV. Medidas Descriptivas
Promedio Aritmético
Por ser el promedio o media aritmética un concepto simple y de fá-
cil cálculo es la medida de tendencia central más conocida y de mayor
uso.
El promedio aritmético es el valor medio resultante de la
suma de todos los valores observados dividido por la cantidad de
observaciones; en el caso de serie simple de datos de una variable X,
simbólicamente se expresa:
n
∑x i =1
i
x 1 + ... + x i + ... + x n
M(x) = x = =
n n
Considerando:
x1,…,xi ,...,xn serie simple de observaciones
n: el total de observaciones
i : subíndice que indica el orden en que se ubica cada observación
Σ : símbolo que corresponde a la letra griega Sigma, se utiliza en forma
convencional para indicar “sumatoria”, en este caso, según lo definido en
los límites de la sumatoria se debe sumar desde el primer valor observado
hasta el último.
x = M (x) : símbolos que representan al promedio aritmético y se leen x
rayita o como operador matemático M de X.
Ejemplo 4-1: En una comunidad hay cuatro panaderías que venden el
kilo de pan a estos valores: 2$, 1,80$, 1,50$, 2,10$. La media aritmética
de estas cuatro cifras es igual a 1,85$ en símbolos:
n
∑x
i =1
i
2 + 1,80 + 1,50 + 2,10
x = = = 1,85$
n 4
Este resultado se interpreta diciendo que el precio promedio del pan por
kilo en ésta comunidad, es de 1,85$.
Se puede observar que el valor obtenido no corresponde a ninguno
de los registrados, sin embargo es un valor incluido en el campo de varia-
ción de la variable y resulta un valor medio de todos ellos.
Las propiedades de la media aritmética, que se enumeran a conti-
nuación resultan útiles tanto para los cálculos prácticos, como por sus
aplicaciones teóricas.
∑k
i=1 nk
Demostración M(k) = = =k
n n
81
IV. Medidas Descriptivas
∑ kx
j =1
j k ∑xj=1
j
Demostración = M(kx) =
= kM(x)
n n
3.- La media aritmética de una variable aumentada o disminuida en una
constante es igual a la media de la variable aumentada o disminuida esa
constante:
M (x ± k ) = M (x) ± k siendo k constante
Demostración
n n n n n
∑j =1
(x j ± k) ∑
j =1
xj ± ∑j=1
k ∑
j=1
xj ∑k
j =1
M(x ± k) = = = M(x) ± k = ±
n n n n
4.- La media aritmética de la combinación lineal de una variable, es igual
a la misma combinación lineal aplicada a la M(x):
M (a. x ± b) = a. M (x) ± b siendo a, b constantes
Aplicando las propiedades 2 y 3 anteriores se obtiene:
Demostración:
n n n n n
∑ (ax
j =1
j ± b) ∑ ax ± ∑ b
j =1
j
j =1
a ∑ x ∑b
j =1
j
j =1
M(ax ± b) = = = ± = aM(x) ± b
n n n n
5.- La media aritmética de los desvíos de las observaciones con respecto a
la media aritmética es igual a cero:
M (xi - x ) = 0 Demostración:
n n n
M (xi - x )=0 ⇒ ∑
i =1
(x i − x) = 0 ⇒ ∑
j =1
xj − ∑ x = nx − nx = 0
j =1
6.- La media aritmética de los cuadrados de los desvíos de las observacio-
nes con respecto a la media es un mínimo:
M (xi - x )2 = mínimo
82
IV. Medidas Descriptivas
∑ x .p
i =1
i i
x1.p1 + ...... + xm.pm
Mp (x) = x = =
m p1 + ....... + pm
∑p
i =1
i
83
IV. Medidas Descriptivas
Precio de Nº de Ponderación
Venta pasajes pi Para calcular el promedio del pre-
(dólares) xi fi cio de venta de los 200 pasajes, y
12 60 0.30 obtener un número representativo
14 100 0.50 para las ventas totales se debe
16 40 0.20 efectuar un promedio ponderado
Total 200 1.00
Promedio Geométrico
En la práctica cuando se desea promediar razones, índices, cifras
relativas, porcentajes, que son resultado de realizar cocientes o cuando se
trata de interpolar datos en una serie que proviene de una población, sea
del tipo de una progresión geométrica o de fenómenos cuya variación es
del tipo exponencial; corresponde calcular como valor promedio de los da-
tos la media geométrica.
Este promedio también se utiliza para determinar el incremento
porcentual promedio en ventas, producción u otras actividades o series
económicas de un periodo a otro.
Para un conjunto de n observaciones, el promedio geométrico se
calcula, para el caso de serie simple, como la raíz n-ésima del producto de
las n observaciones, simbólicamente:
n
xg = n x1x2....xn = n ∏x
i=1
i
Considerando:
x1,…,xi ,...,xn serie simple de observaciones.
n: el total de observaciones.
i: subíndice que indica el orden en que se ubica cada observación.
∏: símbolo que corresponde a la letra griega Pi, se utiliza en forma con-
vencional para indicar “productoria”, en este caso multiplicar, según lo in-
dican los límites de la productoria, sucesivamente desde el primer valor
observado hasta el último.
x g: símbolo que representa al promedio geométrico.
84
IV. Medidas Descriptivas
85
IV. Medidas Descriptivas
Promedio Armónico
Cuando se desea promediar valores de variables, como en los ca-
sos de productividad, velocidad, tiempo, rendimiento, cambio, todos ellos
resultados de cocientes en los cuales la relación numerador denominador
puede expresarse en forma recíproca, se debe recurrir al cálculo de la me-
dia armónica.
Para un conjunto de n observaciones la media armónica se calcula
como la inversa de la media aritmética de las inversas de las observacio-
nes, simbólicamente:
n
xh = n 1
∑
x
i =1 i
Definiendo:
x1,…,xi ,...,xn serie simple de observaciones.
n: el total de observaciones.
i: subíndice que indica el orden en que se ubica cada observación.
Σ: símbolo que corresponde a la letra griega Sigma, se utiliza en forma
convencional para indicar “sumatoria”, en este caso, según lo definido en
los límites de la sumatoria se debe sumar desde el primer valor observado
hasta el último.
Ejemplo 4-6: Aunque no es común que se trabaje con el precio de las
unidades cuando se compra fruta, supongamos que en una frutería se
ofrecen dos clases de limones, los de la clase A, 10 por 1$ y los de la cla-
10 + 20
se B, 20 por 1$. La media aritmética resulta: x = = 15
2
Esto significa que en promedio se está comprando 15 limones por
un peso, indica esto que el precio unitario es de $0.0067. Este es el pre-
cio que se debe pagar por limón si se gasta la misma cantidad de dinero
en cada clase de limones. Pagando $0.0067 por cada uno de los 30 limo-
nes se gastará $2.
Si se calcula la media armónica, el resultado es diferente:
2 2 40
xh = = = = 13,333
1 1 3 3
+
10 20 30
86
IV. Medidas Descriptivas
87
IV. Medidas Descriptivas
Promedio aritmético
En las tablas de frecuencias se ubican en la primera columna los
valores observados de la variable sin repetir, en el caso de datos no agru-
pados, y para datos agrupados los intervalos y sus puntos medios. A con-
tinuación se presentan las frecuencias absolutas y relativas simples. Utili-
zando los números registrados en estas tablas se presenta la expresión
algebraica a utilizar para el cálculo del promedio aritmético:
m m
∑ xi.fi ∑ x .f i i m
fi
m
M(x) = x = i=1
m
= i=1
n
= ∑ xi. ∑
= xihi
n i=1
∑i=1
fi i=1
Considerando:
x1,…,xi,...,xm en datos no agrupados: valores distintos observados y or-
denados sin repetir.
En datos agrupados: punto medio de los intervalos considerados.
fi: en datos no agrupados: cantidad de veces que se observó el valor de la
variable xi . En datos agrupados: cantidad de veces que se observó un va-
lor de X incluido en el intervalo (xi-1' - xi '].
m: para datos no agrupados: total de valores distintos observados. Para
datos agrupados: número total de intervalos considerados.
n: total de observaciones
i: subíndice que indica el orden en que se ubica cada observación
Σ: símbolo que corresponde a la letra griega Sigma, se utiliza en forma
convencional para indicar “sumatoria”, en este caso, según lo definido en
los límites de la sumatoria se debe sumar desde el primer valor observado
hasta el último, en este caso sumar ordenadamente los resultados del
producto x i * f i
x = M(x): símbolos que representan al promedio aritmético y se leen x ra-
yita. o como operador matemático M de X.
Al desarrollar el tema datos agrupados, se señaló que para cálculos
posteriores se requiere considerar los valores medios de cada intervalo,
valor que se considera representativo del conjunto de valores comprendi-
dos en el intervalo correspondiente. Este procedimiento implica pérdida de
información, sin embargo permite encontrar características descriptivas
útiles al momento de obtener conclusiones sobre el conjunto analizado.
A continuación se desarrollan dos ejemplos, el primero para datos
no agrupados y el siguiente para agrupados:
Ejemplo 4-7: Para conocer los requerimientos habitacionales de una ciu-
dad, se realiza un estudio en el que se recopiló información acerca del
número de habitaciones (X), para 34 (n) viviendas, entre otros indicado-
res de interés. A continuación se presenta dicha información organizada
en una tabla de frecuencia para datos no agrupados:
88
IV. Medidas Descriptivas
i Intervalos xi fi
1 (1400-1600] 1500 9 Para el cálculo del promedio se
2 (1600-1800] 1700 16 debe considerar el punto medio
3 (1800-2000] 1900 23 de los intervalos simbolizado con
4 (2000-2200] 2100 42 xi en la tabla. Utilizando los datos
5 (2200-2400] 2300 33 consignados y la fórmula corres-
6 (2400-2600] 2500 17
pondiente se calcula:
7 (2600-2800] 2700 10
Total 150
k
1 1
x =
n ∑x f
i=1
i i =
150
(1500 * 9 + ......... + 2500 * 17 + 2700 * 10) = 2120
m m n
xg = n ∏ x ii =
f ∑ fi
∏ x ii
f xh =
i=1 i=1
m f
∑ i
i=1 x i
2.2. Mediana
Como característica de posición y medida de tendencia central al-
ternativa, según corresponda se presenta el cálculo, aplicación e interpre-
tación de la Mediana.
89
IV. Medidas Descriptivas
90
IV. Medidas Descriptivas
91
IV. Medidas Descriptivas
Gráfico 4-1:
92
IV. Medidas Descriptivas
Datos agrupados
Cuando se trabaja con un volumen importante de datos y la varia-
ble es continua o discreta con campo de variación extenso, con el objeto
de lograr descripciones lo más completas posibles, se agrupan los datos
en intervalos, generando así las distribuciones de frecuencias para datos
agrupados, según se desarrolló en el capítulo anterior.
En esta situación para calcular la Mediana, se consideran los inter-
valos, las frecuencias absolutas simples y acumuladas. Una vez ordenados
los datos en la tabla correspondiente, el procedimiento se detalla a conti-
nuación:
1- En primer término se debe calcular el Orden de la Mediana. Para ello se
n
divide el tamaño de la muestra por 2, Orden = Or = .
2
2- Luego se ubica la Frecuencia Absoluta Acumulada Fi, tal que verifi-
que Fi − 1 < Or ≤ Fi . Se ubica el i-ésimo intervalo que corresponde a esa Fi. Es-
to indica que la Mediana será un valor de la variable comprendido en di-
cho intervalo, es decir: Mna ∈ (xi-1'-xi']
3- Para obtener el valor de la Mediana en forma analítica debe realizarse
una interpolación entre los límites inferior y superior del intervalo deter-
minado en el paso anterior. Para ello utilizando las propiedades de trián-
gulos semejantes, se deduce que la Mediana es el valor de la variable que
resulta del siguiente cálculo:
n
− Fi−1
Mna = xi-1'+ 2 . (xi'- xi-1'] donde: xi-1' representa el límite inferior
fi
del i-ésimo intervalo, ubicado según se indicó en el ítem anterior, y (xi' -
xi-1'] resulta ser la amplitud de dicho intervalo.
Para el cálculo gráfico se procede en forma similar al caso de datos
no agrupados:
Gráfico 4-3:
93
IV. Medidas Descriptivas
i Intervalos xi fi
1 (1400-1600] 1500 9
2 (1600-1800] 1700 16
3 (1800-2000] 1900 23
4 (2000-2200] 2100 42
5 (2200-2400] 2300 33
6 (2400-2600] 2500 17
7 (2600-2800] 2700 10
Total 150
94
IV. Medidas Descriptivas
2.3. Modo
Otra medida de posición, considerada de tendencia central es el
Modo. Este se define como el valor de la variable al que le correspon-
de la máxima Frecuencia Absoluta Simple. Es el valor típico corres-
pondiente a una distribución de frecuencias, por su propia definición no es
posible obtenerlo en una serie simple cualquiera sea su extensión.
Distribuciones de frecuencias
Nuevamente se debe advertir que según sea la forma en que se
realice la organización de los datos, el cálculo del Modo difiere, no así en
el concepto e interpretación de los resultados.
Datos sin agrupar
A partir de la tabla de frecuencias, para calcular analíticamente el
valor del Modo se debe proceder de la siguiente manera:
1- Ubicar la máxima frecuencia absoluta simple fi.
2- El Modo será el valor de la variable xi al cual le corresponde dicha fre-
cuencia simple fi.
Nota: se considera máxima frecuencia aquella que supera a la inmediata-
mente anterior y siguiente, es decir que verifique: f i-1 ‹ f i › f i-1. Esta defi-
nición implica que puede encontrarse en la misma distribución más de un
valor de la variable que verifique la condición de máximo relativo. Esta si-
tuación se analizará mas adelante.
Como forma alternativa o complementaria, la obtención del valor
Modal se puede realizar gráficamente. Para ello utilizando el gráfico de las
frecuencias absolutas simples, se ubica el bastón que supera en altura al
anterior y al siguiente, es decir el bastón que corresponde a la frecuencia
absoluta simple que verifica fi > fi+1 y fi > fi-1. El valor de X que corres-
ponde a esa frecuencia es el valor modal.
Gráfico 4-4:
95
IV. Medidas Descriptivas
96
IV. Medidas Descriptivas
97
IV. Medidas Descriptivas
98
IV. Medidas Descriptivas
Gráfico 4-10:
99
IV. Medidas Descriptivas
2.4. Cuartiles
A partir de un conjunto de datos ordenados en forma creciente o
decreciente, los cuartiles son tres valores que dividen el recorrido de la
variable en cuatro partes o intervalos a los que les corresponden igual
proporción de datos.
En el tratamiento y caracterización de la información, adquieren relevan-
cia particular dos de los cuartiles, uno de ellos, el Cuartil Inferior o primer
cuartil, es el valor de la variable que supera a no más de la cuarta parte
de las observaciones y a su vez es superado por no más de las tres cuar-
tas partes de las observaciones. El otro cuartil denominados Cuartil Supe-
rior o tercer cuartil, es el valor de la variable que supera a no más de las
tres cuartas partes de las observaciones y a su vez es superado por no
más de la cuarta parte de las observaciones. El segundo cuartil coincide
con la Mediana por lo tanto brinda la misma información que ésta.
Serie simple de datos
Cuando se tiene una serie simple de datos, para el cálculo de los
Cuartiles se debe proceder en primer lugar a ordenar la serie de menor a
100
IV. Medidas Descriptivas
Distribuciones de frecuencias
Al trabajar con tablas de frecuencias para el cálculo de los Cuartiles
se trabaja en forma análoga al caso de la Mediana diferenciando según
estén o no agrupados los datos.
Datos sin agrupar
Por lo general cuando la variable es discreta, se dispone de una ta-
bla de frecuencias con datos sin agrupar, en este caso el cálculo analítico
y gráfico de los cuartiles es exacto.
Los datos ya están ordenados y dispuestos en una tabla de fre-
cuencias, en la que debe constar como mínimo las frecuencias absolutas
simples y acumuladas.
El procedimiento de cálculo es muy sencillo y se detalla a continua-
ción:
1- En primer término se debe calcular el Orden de los Cuartiles. O sea de-
terminar su posición, esto implica calcular los valores:
n 3.n
O q i = O q1 = O qs = O q3 =
4 4
2- Luego se ubican las Frecuencias Absolutas Acumuladas Fi , para ambos
Cuartiles tal que verifiquen: Fi −1 < Oq ≤ Fi .
3- El valor del Cuartil correspondientes es aquél valor de la variable (xi) al
cual le corresponde dicha frecuencia acumulada Fi.
Si el cuartil de orden coincide con una de las frecuencias acumuladas, en-
xi + x i + 1
tonces el cuartil normalmente es calculado como Q = .
2
Para la determinación gráfica de los cuartiles se utiliza el gráfico de
las Frecuencias Acumuladas Simples. Calculado el orden de los Cuartiles,
se ubican estos valores en el eje de las ordenadas, desde ese punto de in-
101
IV. Medidas Descriptivas
tersección se traza una línea paralela al eje de las abscisas hasta inter-
ceptar el gráfico de frecuencias acumuladas, luego partiendo ese punto se
dibuja la perpendicular al eje de abscisas. El punto de intersección en el
eje de las abscisas es el valor de la variable del correspondiente Cuartil.
Datos agrupados
En el cálculo analítico se procede de forma similar al caso de la
mediana.
k.n
1- Se calcula el cuartil de orden, en general: O k = con k = 1, 2, 3
4
2- Luego se determina la frecuencia acumulada Fi tal que Fi −1 < O k ≤ Fi .
Esto indica que el cuartil es el valor de la variable que pertenece al i-
ésimo intervalo, para el cual corresponde la frecuencia acumulada Fi .
Es decir: Q k ∈ (x 'i − 1 ; x 'i ] .
En forma análoga al caso de la Mediana , por propiedades de triángulos
Q o − Fi − 1
semejantes, se deduce que: Q k = x 'i − 1 + k .(x i' − x i' − 1 )
fi
Para la determinación gráfica de los Cuartiles nuevamente se utili-
za el gráfico de Frecuencias acumuladas simples, y en forma análoga al
procedimiento utilizado para la Mediana, se ubican sobre el eje de la va-
riable en estudio los valores, aproximados, correspondiente a los Cuarti-
les.
Ejemplo 4-16: Retomando el caso de los 150 asalariados del
ejemplo 4-8, se calcula el cuartil superior:
3.n 3.150
O3 = = = 112,5 Luego se reemplaza en la fórmula
4 4
102
IV. Medidas Descriptivas
112,5 − 90
Q 3 = x 0,75 = 2200 + 200 = 2236 pesos
33
Esta medida de posición de tendencia no central está indicando que
el 75% de los asalariados gana menos de 2236 pesos y el 25% restante
ganan más de 2236$.
2.5. Deciles
A partir de un conjunto de datos ordenados en forma creciente o
decreciente, los deciles son nueve valores que dividen el recorrido de la
variable, en diez partes o intervalos a los que les corresponden igual pro-
porción de datos.
Es decir, proporcionan los valores correspondientes que acumulan
el 10%, 20%... y 90% de los datos. Se calculan utilizando procedimientos
similares a los casos anteriores.
3. Medidas de Dispersión
Las medidas de dispersión son aquellas que proporcionan infor-
mación acerca de la distancia o desvío que presentan los valores de la va-
riable respecto a un cierto valor central. Estas permiten identificar el gra-
do de concentración de los datos.
Gráficamente si se presen- Gráfico 4-15
tan tres poligonales correspon-
dientes a distribuciones de fre-
cuencias hipotéticas: A, B y C,
como en el Gráfico 4-15, se ob-
serva que la distribución A tiene
menor dispersión que la B y que
la C, las tres tienen igual medi-
das de tendencia central, pero di-
ferente concentración de datos
alrededor de la misma:
Otra situación que se pue- Gráfico 4-16
de presentar es aquella en que
las distribuciones de frecuencia
como las presentadas en el Grafi-
co 4-16, se observa igual disper-
sión respecto a sus medidas de
tendencia central siendo estas úl-
timas distintas por estar despla-
zadas, una respecto a la otra, so-
bre el eje de las abscisas.
103
IV. Medidas Descriptivas
3.1. Rango
Para un conjunto de n datos empíricos ordenados de menor a ma-
yor el Rango es la diferencia entre los valores correspondientes al
extremo superior e inferior . Es decir se calcula como el máximo valor
observado menos el mínimo valor observado del conjunto de valores:
R = xmáx - xmín
Ejemplo 4-16: Para una muestra de cinco datos: 1, 45, 50, 55, 100, el
dato menor magnitud es 1 y el dato mayor es 100. Luego los valores de
esta serie presentan un rango de: Rango = 100 – 1 =99
El rango como medida de dispersión fácil de entender y calcular no
tiene en cuenta como se distribuyen los datos entre los valores extremos.
Es una primera aproximación, puede resultar errático en el caso de tener
observaciones extremas, como en el ejemplo anterior.
104
IV. Medidas Descriptivas
Variancia
Serie simple
Sean x1,..., xi ,..., xn, los valores observados de la variable X.
Si interesa encontrar una medida del grado de concentración o dis-
persión con que se presentan todas las observaciones, tomando como
centro de referencia al promedio aritmético, es razonable considerar la
magnitud que resulta al hacer la diferencia entre el valor de cada observa-
ción y el valor del promedio aritmético correspondiente, valor que recibe
el nombre de desvío, éste se simboliza y calcula: di = x i − x
Un primer análisis de los posibles resultados para el conjunto de
desvíos es que éstos pueden resultar con signo positivo, negativo o cero,
según sea que la observación supere el valor del promedio, sea inferior o
igual a él.
Como se desea encontrar una medida que en su cálculo utilice to-
dos los datos observados, para que sea representativa del conjunto de
observaciones, se debe calcular la media aritmética de estos desvíos, se
está midiendo así la dispersión promedio en torno a la misma.
En este punto se debe recordar que por propiedad de la media
aritmética este cálculo resulta siempre igual a cero. Luego, un procedi-
miento posible es considerar estos desvíos elevados al cuadrado, obte-
niendo un cálculo promedio de distancias cuadradas, definiendo así la Va-
riancia. Otra alternativa puede ser considerar el valor absoluto de todos
los desvíos y luego promediar. Este último procedimiento no será conside-
rado por ahora.
Por lo tanto la Variancia se define y calcula como el promedio
de los cuadrados de los desvíos de cada observación respecto de la
media aritmética correspondiente a estos datos.
Su cálculo se realiza utilizando la siguiente expresión algebraica:
105
IV. Medidas Descriptivas
2 ∑ (x i − x)2
V(x) = S (x) = i =1
n
Interpretando:
x1,…,xi ,...,xn serie simple de observaciones.
n: total de observaciones.
i : subíndice que indica el orden en que se ubica cada observación.
Σ: símbolo que corresponde a la letra griega Sigma, se utiliza en forma
convencional para indicar “sumatoria”, en este caso, según lo definido en
los límites de la sumatoria se debe sumar desde el primer valor observado
hasta el último.
Distribuciones de frecuencias
La Variancia se define y calcula para datos agrupados o no, como el
promedio de los cuadrados de los desvíos respecto de la media aritmética,
ponderado por la frecuencia absoluta correspondiente. Simbólicamente:
m
∑ (x
i =1
i − x)2 . fi
V(x) = m
∑f
i =1
i
Considerando:
x1,…,xi ,...,xm en datos no agrupados: valores distintos observados y or-
denados sin repetir. En datos agrupados: punto medio de los intervalos
considerados.
fi en datos no agrupados: cantidad de veces que se observó el valor de la
variable xi. En datos agrupados: cantidad de veces que se observó un va-
lor de X incluido en el intervalo (xi-1' - xi '].
m: para datos no agrupados: total de valores distintos observados. Para
datos agrupados: número total de intervalos considerados.
n: total de observaciones
i: subíndice que indica el orden en que se ubica cada observación
Σ: símbolo que corresponde a la letra griega Sigma, se utiliza en forma
convencional para indicar “sumatoria”, en este caso, según lo definido en
los límites de la sumatoria se debe sumar desde el primer valor observado
hasta el último, en este caso sumar ordenadamente los resultados del
producto x i2 fi
Las propiedades de la Variancia que se enuncian a continuación,
resultan de interés tanto al momento de realizar cálculos, como así tam-
bién por sus aplicaciones teóricas, necesarias éstas en desarrollos poste-
riores.
1– La Variancia de una variable es estrictamente mayor que cero:
V(x) > 0 para X variable
106
IV. Medidas Descriptivas
∑
j=1
(k − M(k))2 ∑ (k − k)
j=1
2
V(k) = = =0
n n
3- La variancia de una variable aumentada o disminuida en una constante
es igual a la variancia de la variable:
V(x ± k) = V(x) para k constante.
Demostración:
∑ ((x ± k) − M(x ± k)2 ) ∑ (x ± k − M(x) m M(k))
n n
2
j=1 j=1
V(x ± k) = = =
n n
∑ (x − M(x))
n
2
j=1
= = V(x)
n
4- La variancia de una constante multiplicada por una variable es igual a
la constante al cuadrado multiplicada por la variancia de la variable:
V(k.x) = k2.V(x) para k constante.
Demostración:
j =1
2
j =1
2
k2 ∑ (x − M(x))
j =1
2
V(kx ) = = = = k 2 V(x)
n n n
5– La variancia de la combinación lineal de una variable, es igual a la
misma combinación lineal aplicando las propiedades de la V(x):
V(a.x ± b) = a2.V(x) para a y b constantes.
Demostración:
∑ ((ax ± b) − M(ax ± b)2 ) ∑ (ax ± b − M(ax) m M(b))
n n
2
j=1 j=1
V(ax ± b) = = =
n n
∑ (ax − M(ax))
n
2
j=1
= = a2 V(x)
n
6– La variancia de la suma o resta de dos variables independientes es
igual a la suma de las variancias de cada una de ellas:
V( x ± y )= V(x) + V(y) x, y independientes
7- La variancia de la suma o resta de dos variables no independientes es
igual a la suma de las variancias de cada una de ellas aumentada o dis-
minuida dos veces la covariancia entre ellas:
V( x ± y )= V(x) + V(y) ± 2 Cov (x,y) x, y no independientes
Nota: el concepto de Covariancia se desarrolla en el capítulo siguiente.
107
IV. Medidas Descriptivas
∑( x
i=1
i − x )2
S(x) =
n
Considerando:
x1,…,xi ,...,xn serie simple de observaciones.
n: el total de observaciones.
i: subíndice que indica el orden en que se ubica cada observación.
Σ: símbolo que corresponde a la letra griega Sigma, se utiliza en forma
convencional para indicar “sumatoria”, en este caso, según lo definido en
los límites de la sumatoria se debe sumar desde el primer valor observado
hasta el último.
Ejemplo 4-18 Retomando el ejemplo 4-1 relativo a información sobre
precios en pesos del kilo de pan: 2$, 1,80$, 1,50$, 2,10$. Cuya media
aritmética resultó igual a 1,85$, para calcular la Variancia y luego el des-
vío Standard se procede:
108
IV. Medidas Descriptivas
n
2 ∑ (xi − x)2 (2 − 1,85)2 + (1,80 − 1,85)2 + (1,50 − 1,85)2 + (2,10 − 1,85)2
V(x) = S (x) = i =1
= =
n 4
0,0225 + 0,0025 + 0,1225 + 0,5
V(x) = = 0,161875
4
S(x) = V(x) = 0,161875 = 0,4023
Distribuciones de frecuencias
Para calcular el desvío Standard en distribuciones de fre-
cuencias, la expresión algebraica es la siguiente:
m
∑(x
i =1
i − x )2 . fi
S(x) =
n
Definiendo:
x1,…,xi ,...,xm en datos no agrupados: valores distintos observados y or-
denados sin repetir. En datos agrupados: punto medio de los intervalos
considerados.
fi en datos no agrupados: cantidad de veces que se observó el valor de la
variable xi. En datos agrupados: cantidad de veces que se observó un va-
lor de X incluido en el intervalo (xi-1' - xi '].
m para datos no agrupados: total de valores distintos observados. Para
datos agrupados: número total de intervalos considerados.
n: total de observaciones
i : subíndice que indica el orden en que se ubica cada observación
Σ: símbolo que corresponde a la letra griega Sigma, se utiliza en forma
convencional para indicar “sumatoria”, en este caso, según lo definido en
los límites de la sumatoria se debe sumar desde el primer valor observado
hasta el último, en este caso sumar ordenadamente los resultados del
producto xi2.fi
Análogamente y por las mismas razones expresadas en el caso de
la Variancia, se enuncian las propiedades del desvío Standard:
1- El desvío standard de una variable es estrictamente mayor que cero:
S(x) > 0 para X variable
2– El desvío standard de una constante es igual a cero:
S(k) = 0 para k constante
3- El desvío standard de una variable aumentada o disminuida en una
constante es igual al desvío standard de la variable:
S(x ± k) = S(x) para k constante
4- El desvío standard de una constante multiplicada por una variable es
igual a la constante al cuadrado multiplicada por el desvío standard de la
variable:
S (k.x) = k.S(x) para k constante positiva
109
IV. Medidas Descriptivas
I Intervalos xi fi x i . fi
(x − x ) (x − x )2 (x − x )2 . fi
1 (1400-1600] 1500 9 13.500 -620 384.400 3.459.600
2 (1600-1800] 1700 16 27.200 -420 176.400 2.822.400
3 (1800-2000] 1900 23 43.700 -220 48.400 1.113.200
4 (2000-2200] 2100 42 88.200 -20 400 16.800
5 (2200-2400] 2300 33 75.900 180 32.400 1.069.200
6 (2400-2600] 2500 17 42.500 380 144.400 2.454.800
7 (2600-2800] 2700 10 27.000 580 336.400 3.364.000
150 318.000 1.122.800 14.300.000
m
∑ ( xi − x )2. fi 14.300.000
V(x) = i=1
= = 95.333,33
n 150
S(x) = V(x) = 308,76 pesos
110
IV. Medidas Descriptivas
111
En síntesis el Desvío Standard conceptualmente, mide la dispersión
promedio en torno a la media aritmética, considerando todas las observa-
ciones. En su uso práctico es muy útil al momento de sacar conclusiones o
tomar decisiones, ya que determina la mayor o menor representatividad
de la media aritmética y está vinculado al concepto de precisión, interpre-
tando su magnitud, según se expresa:
112
V. Técnicas básicas de análisis
1. Variable Bidimensional
En las etapas operativas de la investigación estadística, presenta-
das en el capítulo II, el Análisis de Datos se ubica dentro de las últimas
etapas. Esto implica estudiar, explorar, comparar, razonar, destacar lo
esencial de la información que los datos brindan, individualmente o en
conjunto, respetando siempre los objetivos planteados en la investigación.
Hasta ahora se ha presentado y desarrollado el análisis de los da-
tos cuando se trabaja con una sola variable. Sin embargo en estudios ex-
perimentales es muy frecuente realizar análisis bidimensionales, es decir a
cada unidad estadística se le observa o miden conjuntamente dos caracte-
rísticas y en este caso interesa analizar el comportamiento conjunto de
esas dos variables, realizando un análisis causa-efecto o simplemente mi-
diendo relación entre atributos..
Un primer análisis de las variables bidimensionales cuantitativas,
es estudiar el comportamiento de cada una de sus componentes en forma
unidimensional, de manera que se calculan las medidas de posición y dis-
persión ya estudiadas.
La Estadística Descriptiva bidimensional permite el estudio simul-
táneo de las componentes de la variable y tiene como propósito emplear
técnicas estadísticas a través de las cuales se consigue poner de manifies-
to las coincidencias de determinados valores o categorías entre dichas
componentes. Por medio del estudio bidimensional se podrá determinar si
existe algún tipo de dependencia estadística entre ellos. Es necesario
hacer hincapié en el carácter estadístico de dependencia, sin que de forma
alguna se pueda afirmar una relación causal entre ellas. Ninguna herra-
mienta estadística permite afirmar relaciones de causalidad; otra cosa es
que la dependencia estadística entre ambos caracteres pueda sugerir una
posible relación causal.
2. Variables cuantitativas
En el caso de estar trabajando con una variable bidimensional cu-
yas componentes sean ambas cuantitativas, es natural indagar a cerca de
la relación entre ambas componentes para ello es interesante comenzar a
describir si existe algún tipo de relación, calculando la covariancia.
2.1. Covariancia
Al trabajar con una serie simple de datos bidimensionales(x1, y1 ),
(x2, y2 ), (x3, y3 ), ..., (xn, yn ) y con el fin de analizar la relación entre las
componentes (variables) la primera exploración es graficar el conjunto de
n observaciones bidimensionales en un diagrama de dispersión o nube de
puntos:
113
V. Técnicas básicas de análisis
n
Para interpretar la covariancia, se debe comenzar con un análisis
del signo de los desvíos de las observaciones respecto a los promedios de
cada variable y del signo resultante de su producto, en forma individual y
conjunta. Para mejor comprensión del razonamiento ha realizar se acom-
paña la presentación con dos gráficos apropiados.
En el Gráfico A se presenta un diagrama de dispersión con un com-
portamiento de las observaciones que se ajusta al de una forma de rela-
ción lineal directa entre las variables, en cambio en el Gráfico B los datos
siguen aproximadamente un comportamiento lineal pero inverso.
Gráfico A Gráfico B
114
V. Técnicas básicas de análisis
Gráfico C Gráfico D
115
V. Técnicas básicas de análisis
Por lo tanto:
Cov (x, y) > 0 ⇒ existe relación directa entre las variables.
Cov (x, y) < 0 ⇒ existe relación inversa entre las variables.
Cov (x, y) = 0 ⇒ no existe relación lineal entre las variables.
De esta forma se concluye que:
La Covariancia mide la variancia conjunta entre dos variables cuan-
titativas X e Y e indica además el tipo de relación que existe entre ellas:
directa, inversa, o bien, la ausencia de una relación lineal.
Si bien el valor absoluto de la Covariancia aumenta a medida que
aumenta la intensidad de la relación, este valor no nos indica el "grado de
la relación", ya la Covariancia, como regla general, puede asumir cual-
quier valor real. Entonces se torna necesario disponer de un coeficiente
adimensional que mida, o cuantifique, la intensidad de la relación que
existe entre dos variables cuantitativas y que además asuma valores aco-
tados.
116
V. Técnicas básicas de análisis
117
V. Técnicas básicas de análisis
3. Variables cualitativas
En el caso de variables cualitativas el análisis consiste en la bús-
queda de la relación entre dos o más atributos, construyendo tablas de
contingencia en las cuales se puede estudiar la independencia estadística
entre los distintos atributos.
Al trabajar con estas variables la falta de independencia entre los
atributos suele denominarse asociación, y el análisis del grado de asocia-
ción entre variables cualitativas tiene fuerte incidencia en la estadística no
paramétrica.
Al analizar datos empíricos recopilados utilizando una encuesta, por
ejemplo de opinión, a menudo se desea analizar como respondieron los
entrevistados considerando en su tabulación simultánea dos o más pre-
guntas vinculadas entre sí de acuerdo al objetivo planteado por el investi-
gador. Para ello primero se debe organizar la información recogida, regis-
trando las observaciones en tablas que presentan dos o más sentidos de
clasificación. Se dice que dos atributos A y B son independientes cuando
entre ellos no existe ningún tipo de influencia mutua.
B B f i•
A f11 f12 f 1•
A f 21 f 22 f 2•
f•j f •1 f •2 n
118
V. Técnicas básicas de análisis
A 75 25 100%
A 40 60 100%
h•j% 54% 46% 100%
119
V. Técnicas básicas de análisis
120
V. Técnicas básicas de análisis
121
V. Técnicas básicas de análisis
fi• × f• j
Frecuencia esperada fe ij =
n
Coeficiente X 2
m p δ ij2 m p (fo ij − fe ij )2
X 2
= ∑∑ = ∑∑ X 2
≥0
i=1 j=1 fe ij i=1 j=1 fe ij
El recorrido del coeficiente, por ser suma de desvíos al cuadrado
divido frecuencia conjunta, siempre positiva, resulta: X2 ≥0
Si todas las frecuencias conjuntas observadas coinciden con las
frecuencias esperadas, entonces:
δ ij = 0 ∀i = 1...m, j = 1...p por lo tanto . X 2 = 0
Se interpreta el X 2 para valores distintos como:
2
X =0 indica que las variables X e Y son independientes.
2
X >0 indica existe alguna relación entre las variables X e Y.
Este coeficiente es concluyente si su resultado es cero pero para
valores mayores a cero no sirve para medir la fuerza de la asociación;
porque su valor varía en función de n.
En caso de ser positivo la intensidad de la relación entre las varia-
bles aumenta a medida que aumenta el valor numérico del coeficiente,
pero no está acotado superiormente, y por lo tanto, no es posible interpre-
tarlo cuantitativamente.
Su máximo valor o cota superior, depende de la cantidad total de
observaciones n, y también de la cantidad de modalidades de cada una de
las variables. Existen varios coeficientes derivados del X 2
122
V. Técnicas básicas de análisis
χ2 φ2
C= = 0≤ C <1
n + χ2 1 + φ2
2
El máximo valor o cota superior de estos coeficientes C y C es
siempre menor que la unidad y se puede vincular respecto a la cantidad
de modalidades de cada una de las variables:
123
V. Técnicas básicas de análisis
Coeficiente de Tchuprow - T2
Este coeficiente en situaciones especiales de la dimensión de la ta-
blas este coeficiente alcanza el valor uno. Se calcula como:
φ2
T2 = 0 ≤ T2 ≤ 1
(m − 1).(p − 1)
El mínimo valor de este coeficiente T 2 es cero, toma este valor
cuando las variables son independientes. No siempre el valor máximo de
T2 es la unidad sólo alcanza el valor uno si el formato de las tablas es cua-
drado: m=p, simbólicamente:
Si m=p entonces 0 ≤ T2 ≤ 1
Si m≠p entonces 0 ≤ T2 < 1
124
V. Técnicas básicas de análisis
−f21 × f12
Disociación Completa Q= = −1
+ f21 × f12
Este coeficiente es de fácil interpretación:
Siempre que exista asociación (completa o no) entonces Q > 0,
Siempre que exista disociación (completa o no) entonces Q < 0,
A modo de sugerencia se puede establecer la siguiente interpretación
Disociación completa Q = -1
Alta a moderada disociación -0,90 < Q < -0,60
Moderada a muy baja disociación -0,60 < Q < -0,10
Independencia entre modalidades Q =0
Muy baja a moderada asociación 0,10 < Q < 0,60
Moderada a alta asociación 0,60 < Q < 0,90
Asociación completa Q=1
f11 f f f11 f f
= 12 = 1 • = 21 = •1
f• 1 f• 2 n f1 • f2 • n
y
Verificando que
f × f1 • f × f• 1 f × f• 2 f × f• 2
f11 = •1 f21 = 2 • f12 = 1 • f22 = 2 •
n n n n
En esta situación el coeficiente de asociación de Kendall toma valor
0, según se demuestra reemplazando en la expresión:
f•1 × f1 • × f• 2 × f2 • / n2 − f•1 × f2 • × f• 2 × f1 • / n2 0
Q= = =0
2 2
f•1 × f1 • × f• 2 × f2 • / n + f•1 × f2 • × f• 2 × f1 • / n 2(f•1 × f1 • × f• 2 × f2 • / n2 )
125
V. Técnicas básicas de análisis
Ejemplo 5-4 el cálculo del coeficiente Q para el ejemplo 5-3 resulta igual
a:
41 × 11 − 9 × 39
Q= = 0,125 , valor que por ser prácticamente ce-
41 × 11 + 9 × 39
ro, indica independencia entre ser macho y tener reacción positiva a la va-
cuna.
Nivel de
Estudios Primario Secundario Terciario
Calificación
Insuficiente 10 30 30 70
Regular 10 10 20 40
Distinguido 20 60 10 90
40 100 60 200
2
Cálculo del Coeficiente X
23 20 12 5.33333333
Celda ij fo fe
(fo − fe)2 31 20 28 0.22222222
fe 32 60 45 5.00000000
33 10 27 10.7037037
11 10 14 1.14285714
Total 32.473545
12 30 35 0.71428571
13 30 21 3.85714286
21 10 8 0.50000000
22 10 20 5.00000000
126
V. Técnicas básicas de análisis
60 * 40
fe 23 = = 12
200
Explicación del cálculo:
Término f23 en el cálculo del X 2 (fo − fe)2 =
(20 − 12)2 = 5.3333
fe 12
4. Variables ordinales
En la investigación experimental en algunas oportunidades es im-
prescindible según el estudio, observar si una unidad de análisis posee en
mayor, menor o igual grado que otra la característica que se está eva-
luando generando de esta forma una variable ordinal.
La escala ordinal o escala de rango, define la posición relativa de
objetos o individuos con respecto a una característica sin implicación al-
guna en cuanto a la distancia entre posiciones pero si otorga un orden je-
rárquico.
Ejemplo de esta variable son: nivel socio económico, prestigio ocu-
pacional, dureza de Mohs (indicador que se aplica a los minerales), etc.
127
V. Técnicas básicas de análisis
5. Análisis Multivariante
En este punto considerando el nivel del tratamiento de los concep-
tos hasta aquí expuestos, es importante plantear, que la realidad de las
investigaciones en general no sólo se trabaja con datos uni o bidimensio-
nales sino que los análisis son mas complejos, por lo tanto se realiza una
breve presentación de lo que se denomina análisis multivariante.
128
V. Técnicas básicas de análisis
129
BIBLIOGRAFÍA
BARANGER Denis, “Construcción y análisis de datos”, Editorial Universita-
ria, Universidad Nacional de Misiones, Posadas, Misiones 1992.
BERENSON, Mark;LEVINE, David. (1991). Estadística para Administración
y Economía. Ed. McGraw-Hill. México.
BLALOCK, Hubert- “Estadística Sopcial”, Ed. FCE, México 2da. Edición
1978.
CHAO Lincoln, “Estadística para las ciencias administrativas”. Mc. Graw
Hill, Colombia 1993.
CORTADA DE KOHAN, Nuria. (1994). Diseño Estadístico. Ed.EUDEBA.
Buenos Aires.
FERNANDEZ AGUADO Carmen Manual de Estadística descriptiva aplicada
al sector turistico, Ed. Síntesis, Madrid, 2003
KAZMIER- DIAZ Estadística aplicada a la administración y economía Mc.
Graw Hill, México, 1991.
KISH, Leslie. (1979). Muestreo de Encuesta. Ed. Trillas. México.
LOHR, Sharon L. (2000). Muestreo: Diseño y Análisis. Ed. Thomson. Méxi-
co.
LUQUE MARTINEZ Teodoro, “Técnicas de análisis de datos en investigación
de mercados”, Ediciones Pirámide-2001
PEREYRA, A.M.;Abbiati, N.N.; Fernández, E.N. (2003). Manual de Estadís-
tica para Proyectos de Investigación. Ed. Universidad Nac. De Lomas de
Zamora, 2004
PERÉZ, César. (2000). Técnicas de Muestreo Estadístico. Ed. Alfaomega.
México.
SHAO, Stephen Pinyee, “Estadística para Economistas y administradores
de Empresas”, Ed. Herrero, México, 8va. Edición- 1973
YA LUN Chou, “Estadística” Ed Kapeluz-1990
130