Вы находитесь на странице: 1из 64

Facultad de Humanidades

Psicologa

Estadstica
Estadstica para
Psicologa

Profesora:
Mg. Diana Atar

Lunes a viernes de 9 a 21 h.
Torre Universitaria, Zabala 1837, primer nivel inferior.
C1426DQG - CABA
Telfono: 4788-5400, internos 5002 y 2122.
Email: fasciculos@ub.edu.ar
www.ub.edu.ar
ESTADSTICA DESCRIPTIVA

Mg. Diana Atar


Estadstica Descriptiva Mg. Diana Atar

1. INTRODUCCIN

Para actuar acertadamente en el mundo de hoy se requiere,


entre otras cosas, estar educado en cierto pensar estadstico que
permita no slo tener presente o saber buscar resultados anteriores
(recopilados en registros tabulados o en grficos), sino tambin saberlos
interpretar y aplicar adecuadamente en la toma de decisiones
Luis A. Santal

El trabajo de investigacin comienza con la formulacin del problema que se


pretende resolver o estudiar. Es comn partir de una situacin de ambigedad,
sin saber qu hacer.

La consulta bibliogrfica acerca del tema es conveniente para conocer si se han


realizado experiencias previas, analizarlas y considerarlas como marco terico
de referencia. Tambin es oportuna la consulta con expertos que puedan brindar
orientacin, o un marco terico ms amplio.

ALGUNOS CONCEPTOS Y DEFINICIONES

Estadstica

Es la ciencia que, como parte de la matemtica, tiene como su fundamento a la


teora de la probabilidad.

Estadstica descriptiva

Tiene por objetivo realizar descripciones numricas y grficas, a partir de los


datos obtenidos de la muestra.

Inferencia estadstica

Tiene por objetivo, a partir de la descripcin realizada:


- Analizar los datos y elaborar conclusiones respecto de la poblacin
- Testar las hiptesis planteadas

Poblacin estadstica

Se define como la totalidad de elementos: personas, objetos, hechos; sobre los


cuales se desea reunir informacin y estudiar un tema en particular y
fundamentalmente efectuar inferencias a partir de una muestra estadstica. Debe
ser definida con mucho cuidado; se debe especificar todas las caractersticas y
condiciones que la definan en forma clara, inequvoca.

Muestra

Se define como el subconjunto de una cierta poblacin. Pero no es un


subconjunto cualquiera ya que de acuerdo con la forma en que haya sido
extrada de la poblacin, posibilitar o no la realizacin de inferencias
estadsticas vlidas. Se vern un poco ms adelante las muestras probabilsticas
y no probabilsticas.
2
Estadstica Descriptiva Mg. Diana Atar

Para que se puedan realizar inferencias estadsticas vlidas, se requiere que la


muestra sea aleatoria (probabilstica), es decir que haya sido extrada de la
poblacin mediante un procedimiento de azar.

Debe quedar claro que para extraer una muestra, es imprescindible que se haya
precisado con mucho cuidado cul es la poblacin ya que las inferencias que se
realicen a partir de una muestra van dirigidas a la poblacin de la que se obtuvo,
y no a otra poblacin.

Estadsticos

Son valores numricos que resumen los datos de una muestra, como por
ejemplo, los promedios. Si los valores resumen los datos de toda una poblacin,
se los denomina parmetros.

Objetivo del anlisis

Es aquello que se quiere conocer. Incluye las hiptesis de trabajo, que


especifican qu es lo que se espera encontrar.

1.1. Las muestras: tcnicas de muestreo

Diversos motivos inducen a tomar muestras de las poblaciones para trabajar.


Algunos ejemplos son: cuando la poblacin es muy grande, por razones
econmicas, por falta de personal, si se quiere recoger los datos rpidamente
para mostrar los resultados, etc.

Las tcnicas de muestreo guan el trabajo de seleccin de muestras.

Gracias al clculo de probabilidades podemos obtener resultados, elaborar


conclusiones sobre la muestra, y luego extrapolar a toda la poblacin.

Con el fin de inferir conclusiones acerca de la poblacin, es imprescindible que


la muestra sea objetiva, lo cual es garantizado cuando la eleccin es al azar. Es
frecuente leer en los textos que la muestra debe ser representativa; esto no es
correcto, ya que al efectuar las extracciones al azar, es poco probable que se
encuentre tal representatividad de los elementos que la componen, y por tanto
NO se puede pretender, aunque sea deseable:

que se conserven en ella las caractersticas de la poblacin


que se encuentren presentes las variables que caracterizan a la poblacin

Las muestras que no son aleatorias pueden ser no probabilsticas, pueden ser
tiles pero no habilitan a efectuar inferencias cientficamente vlidas.

El trabajo con muestras aleatorias tiene sus limitaciones; no siempre se puede


contar con un marco muestral, que es el listado de todas las unidades o
elementos que componen la poblacin. A veces es fcil, por ejemplo, en las
escuelas donde llevan registros de todos sus alumnos, su desempeo escolar,
edades, etc.; o en las empresas que cuentan con una base de datos de su
personal.
3
Estadstica Descriptiva Mg. Diana Atar

De ese registro, o marco muestral, se puede sacar una muestra. En otras


ocasiones no se puede contar con un marco muestral, como por ejemplo, de los
consumidores de una marca de gaseosa; en este ltimo caso, habr que utilizar
otro tipo de procedimientos.

Entonces, podemos clasificar las muestras en:

Probabilsticas
Tambin llamadas aleatorias, o estocsticas o al azar.
Tal como se dijo antes, la muestra es probabilstica cuando las unidades son
extradas mediante procedimientos aleatorios.

No Probabilsticas
Las unidades muestrales son seleccionadas por criterio del investigador.
Si bien en muchas ocasiones prestan utilidad, debe tomarse en cuenta que es
ilegtima su utilizacin para fines inferenciales.

Muestras probabilsticas

La seleccin probabilstica puede realizarse por los siguientes mtodos:

Muestreo aleatorio simple: cada elemento de la poblacin tiene la misma


probabilidad de ser elegido. Se realiza sin reposicin y consiste en
seleccionar n elementos de entre N que componen la poblacin (n < N), de
tal forma que todas las muestras de tamao n que se puedan formar tengan
la misma probabilidad de ser elegidas.

En la prctica, cuando se dispone del marco muestral, se numera a los


elementos de la poblacin y se elige al azar cada uno de los nmeros que
van a formar la muestra, sabiendo que cada elemento puede ser elegido slo
una vez.

Muestreo aleatorio estratificado: consiste en establecer estratos, es decir


subconjuntos que sean lo ms homogneos posibles, parecidos en cuanto a
las caractersticas ms importantes para la investigacin. Cada estrato es una
suerte de subpoblacin, dentro de la que se obtendrn las muestras al azar
(una dentro de cada estrato). Existen diferentes criterios para fijar el tamao
muestral dentro de cada grupo, stos toman en cuenta factores tales como
cun parecidas son las unidades dentro de cada estrato, cantidad de
unidades que lo componen, costos de muestreo, etc.

Muestreo aleatorio por conglomerados: consiste en dividir a la poblacin


en subgrupos llamados conglomerados, como por ejemplo, barrios o edificios
o municipios, etc., buscando que cada uno sea representativo de la poblacin
total. En este caso la variabilidad interna dentro de cada conglomerado debe
ser grande, lo cual es lo opuesto a lo que se propone para el muestreo
estratificado. Luego, se selecciona la muestra al azar de conglomerados,
luego una muestra de entre los elementos de cada conglomerado
seleccionado al azar, logrando, as, que la muestra est ms concentrada,
a efectos de disminuir, por ejemplo, los gastos de desplazamiento.
4
Estadstica Descriptiva Mg. Diana Atar

Si los conglomerados se corresponden con zonas geogrficas, se denomina


muestreo por reas; tal es el caso de municipios, manzanas de viviendas,
etc.

Muestreo sistemtico: se trata ms bien de un procedimiento para


seleccionar las unidades de muestreo. Si el tamao de la muestra es n y el
de la poblacin es N, se determina un nmero k=n/N, luego se elige el
primer elemento de la muestra al azar sorteando un nmero entre 1 y k, y los
restantes se eligen sumando k al nmero sorteado, y as se contina hasta
completar el tamao muestral. Si bien no es estrictamente aleatorio en el
sentido que todos los elementos han sido obtenidos por el mtodo
probabilstico, al serlo el primero y sumando la constante k, es por lo menos,
objetivo y practicable. Existen circunstancias en las que este procedimiento
no es conveniente, pero no se considerarn aqu.

Muestras no probabilsticas

La seleccin no probabilstica se realiza por mtodos en los que no se eligen


los elementos de la muestra mediante procedimientos al azar. Algunos
procedimientos son:

Muestreo por conveniencia: se elige una muestra fcilmente accesible,


como por ejemplo, encuestar a un grupo de estudiantes y pretender
conclusiones acerca de todos los estudiantes de la universidad.

Muestreo intencional: los miembros son elegidos uno a uno por


considerarlos representativos. Sera el caso de elegir especficamente a
determinados estudiantes para encuestarlos.

Muestreo por cuota: es el muestreo realmente representativo, ya que se


le asignan a los entrevistadores cuotas, las que respetan las proporciones
de las caractersticas poblacionales, por ejemplo, las de gnero, grupos
etarios, nivel educativo, etc.

1.2. Los datos

Los datos estadsticos pueden provenir de dos tipos de fuentes:

Fuentes primarias.
Fuentes secundarias.

Las fuentes primarias son aquellas en las que los datos provienen directamente
de procedimientos ad hoc, tales como las encuestas. Mientras que, las fuentes
secundarias son las que parten de datos pre-elaborados, como pueden ser
datos obtenidos de anuarios estadsticos, pginas de Internet, de procedimientos
administrativos tales como los registros de automviles, de personas, etc.

A su vez, las fuentes primarias pueden subdividirse en:

5
Estadstica Descriptiva Mg. Diana Atar

Observacin directa.
Observacin indirecta.

La observacin directa es cuando el investigador toma directamente los datos


de la poblacin, sin necesidad de cuestionarios, entrevistadores, etc. Por
ejemplo, cuando una institucin educativa realiza un estudio estadstico sobre el
rendimiento de sus estudiantes o cuando se observa el comportamiento de un
cliente en el supermercado.

La observacin es indirecta cuando los datos no son obtenidos directamente


por el investigador, ya que precisa de un cuestionario, entrevistador u otros
medios para obtener los datos del estudio. Para lo que es preciso realizar una
encuesta.

Para la organizacin del trabajo estadstico, deben tenerse en cuenta las


siguientes acciones:

1. Establecer los objetivos y las hiptesis de trabajo


2. Determinar las variables y los procedimientos para sus mediciones.

Una variable es una caracterstica de inters a observar de cada elemento de


una poblacin o muestra. Por ejemplo:
Edad de un estudiante
Color de cabello
Estatura
Peso

Cada valor de variable asociado a un elemento de la poblacin o muestra se


llama dato (u observacin).

El siguiente esquema sintetiza los distintos tipos de variables a considerar en un


anlisis estadstico

VARIABLES
asumen

segn su segn su
VALORES CATEGORAS

Funcin Niveles de medicin

pueden ser de pueden ser de


tipo tipo
Cuantitativas Cualitativas

- Independiente - Nominal pueden ser de


- Dependiente - Ordinal tipo
- Intervalar
- De razn
Discretas Continuas

6
Estadstica Descriptiva Mg. Diana Atar

Tipos de variables

1.2.1. Variables segn su funcin

Las variables, segn su funcin, se clasifican en:

Independientes: si actan como determinantes, es decir, cuando los


factores que actan se espera sean la causa de algo.

Dependientes: si actan como resultado, es decir, son los factores que se


ven influidos por las variables independientes.

Por ejemplo

Si pretendemos estudiar el nivel de prejuicio de un grupo de


personas respecto a un tema, el nivel de informacin que posean al
respecto puede ser determinante del nivel de prejuicio.

As, el nivel de informacin funcionara como una variable


independiente y el prejuicio como una variable dependiente.

Controladas: siendo conocidas, influyen sobre las variables


independientes y su efecto es anulado por el experimentador. Se trata de
eliminar todas las fuentes que puedan establecer una relacin espuria
entre las variables independientes y las dependientes.

Por ejemplo

Volviendo al ejemplo del estudio sobre nivel de prejuicio y grado de


informacin, si sospechamos que el nivel de educacin alcanzado puede
influir en la variable dependiente, entonces se debe controlar o neutralizar.

Enmascaradas: son variables no controladas que influyen sobre las


variables dependientes. Varan al mismo tiempo que las independientes y
rivalizan con ellas como posible causa. Se las debe identificar y controlar.

Por ejemplo

Si hacemos una encuesta con voluntarios, debemos tener en cuenta si


la motivacin de los sujetos influy en los resultados.

Extraas: conocidas o no, son variables no controladas que influyen sobre


las independientes. Podemos sospechar de su existencia, si lo observado
en el experimento no puede explicarse en base a nuestras manipulaciones.

1.2.2. Variables por su naturaleza

Las clasificamos en cualitativas y cuantitativas:

7
Estadstica Descriptiva Mg. Diana Atar

Cualitativas: son aquellas que estn definidas por atributos o propiedades


como, por ejemplo, gnero, nivel educativo, nacionalidad.

Cuantitativas: son aquellas que, como su nombre lo indica, se expresan


por un nmero. Este nmero puede obtenerse simplemente por conteo
(variable discreta) o como resultado de mediciones (variable continua).

Las variables discretas slo pueden tomar valores enteros, como por ejemplo la
variable cantidad de hijos en una familia, cantidad de materias aprobadas.

Las variables continuas admiten valores decimales, tal es el caso de las


variables estatura o peso corporal.

1.3. Niveles de medicin

Las variables cualitativas y cuantitativas estn asociadas a distintos niveles de


medicin: Qu significa efectuar una medicin?
Efectuar una medicin es asignar un nmero a un objeto o evento de acuerdo
con reglas predeterminadas.

Veamos algunos ejemplos de asignacin o registro:

El peso corporal.
La edad de un paciente.
La temperatura del ambiente.
La categora ocupacional de los empleados de una empresa.

Existen distintas reglas de asignacin y, la medicin efectuada, puede tener


diferentes significados, dependiendo de las reglas de asignacin que se usen.

Repasemos las tres maneras distintas en que pueden usarse los nmeros:

Para asignar nombre a las cosas. Son los llamados nmeros nominales,
tales como el nmero de habitacin de un hotel, o bien, opcin 1 =
masculino y opcin 2 = femenino.

Para asignar orden o jerarqua a las cosas. Son los nmeros ordinales,
como por ejemplo, lugar de clasificacin de equipos de ftbol en un
campeonato, categora de un empleado de una fbrica.

Para representar cantidades. Son los nmeros cardinales, tales como la


edad, peso, estatura, duracin (en minutos) de una sesin de psicoterapia,
la temperatura.

Cada significado define distintos niveles para la medicin efectuada. Ellos son:

Nivel nominal: las variables estn representadas por palabras o nmeros que
no reflejan una cantidad sino un nombre. Son variables cualitativas o de
atributos.

Por ejemplo: sexo, estado civil, nmero de habitacin.


8
Estadstica Descriptiva Mg. Diana Atar

Nivel ordinal: los valores de las variables sirven para establecer un orden o
categora. Se las puede ordenar de mayor a menor. Se puede dar la posicin
relativa de un dato respecto de otro, pero sin cuantificar. Se dir que es mayor o
menor, pero no se podr establecer cunto mayor o cunto menor es. Son
variables cualitativas.

Por ejemplo: grado de acuerdo, nivel de estudios alcanzado, categora dentro de


un escalafn.

Nivel intervalar: permitir incorporar el concepto de intervalo, es decir, permite


hablar de la distancia entre dos valores. Se puede calcular la diferencia entre dos
valores cualesquiera y comparar las amplitudes de dos o ms intervalos. Las
variables pasan a ser cuantitativas.

Adems, el valor cero no indica ausencia de propiedad, sino que es una


referencia arbitraria, es decir, no significa que no tengamos la propiedad.

Un ejemplo clsico de variable medida en el nivel intervalar es la temperatura


en grados centgrados, la diferencia entre 0 y 20 es la misma que la diferencia
entre 20 y 40. No obstante, no se puede decir que 40 de temperatura significa
el doble de calor que una temperatura de 20. Esto es consecuencia de que 0
C es un valor arbitrario y por ende no existe un origen en este sistema de
medicin.

Otro ejemplo, puede ser el puntaje de un test de aptitud psicotcnica.

Nivel de razn: las variables tienen las mismas propiedades que en el nivel
intervalar, con el agregado del cero absoluto, es decir, que aqu el cero s indica
ausencia de propiedad.

Las variables son cuantitativas. Aqu, si las mediciones de temperatura fueran


realizadas en la escala Kelvin, se puede afirmar que 40 es el doble que 20,
existe un cero absoluto y ese es el origen.

Por ejemplo, el peso y la altura, tales que sus valores pueden compararse
efectuando la razn entre ambos, es decir, dividiendo los valores.

Otros ejemplos son la cantidad de pacientes atendidos por da; la cantidad de


horas de estudio semanales.

2. La organizacin de los datos

2.1. Distribucin de frecuencias

Mediante un ejemplo, veremos la manera de organizar y agrupar los datos


obtenidos, con el propsito de describir el comportamiento de la variable en
estudio, trabajar con ellos y obtener conclusiones.

9
Estadstica Descriptiva Mg. Diana Atar

Se realiza el recuento de datos de la variable carrera elegida. La muestra


consider 60 estudiantes del Departamento de Psicologa.

La siguiente tabla muestra los datos obtenidos:

Frecuencia Frecuencia
Variable Frecuencia
relativa porcentual
Psicologa 15 0,250 25%
Psicopedagoga 5 0,083 8,3%
Psicomotricidad 20 0,334 33,4%
Musicoterapia 5 0,083 8,3%
Asistencia Social 15 0,250 25%
Total 60 1 100%

Los valores de la columna de frecuencia corresponden al nmero de


alumnos por carrera
La frecuencia relativa es la razn entre cada una de las frecuencias y el
total. Indica la proporcin que representa cada valor de variable en el total,
expresada como nmero decimal.
La frecuencia porcentual es la frecuencia relativa expresada como
porcentaje.

La suma de las frecuencias absolutas es 60, la suma de frecuencias relativas


suma 1 y la suma de las frecuencias porcentuales es 100%.

Otro ejemplo, tomando la variable cantidad de materias aprobadas en el primer


ao de la carrera.

Cantidad de frecuencia frecuencia frecuencia


materias relativa porcentual
aprobadas
0 2 0,03 3%
1 6 0,10 10%
2 12 0,20 20%
3 15 0,25 25%
4 18 0,30 30%
5 7 0,12 12%
Total 60 1 100%

2.2. Representacin grfica

Una grfica es un dibujo complementario a una tabla o cuadro, que permite


observar el comportamiento de la variable en estudio, y facilita el anlisis
estadstico

Existe gran variedad de grficos. A continuacin mencionaremos los ms


utilizados

10
Estadstica Descriptiva Mg. Diana Atar

Grfico de columnas o barras

Constituido por columnas verticales u horizontales rectangulares de igual ancho


y con la altura de las barras proporcional a las frecuencias.

Se utiliza para mostrar y comparar frecuencias de variables cualitativas, de nivel


nominal u ordinal.

Ejemplos:

Carrera elegida

Psicologa

Psicomotricidad
Carrera elegida
Asistencia
0 10 20 30

Carrera elegida
30
20
10
0 Carrera elegida

Grfico de sectores circulares

Se usa, en general, para representar cantidades porcentuales. Tomemos el


mismo ejemplo de la variable carrera elegida.

CARRERA ELEGIDA

Asistencia Social Psicologa


25% 25%

Musicoterapia Psicopedagoga
8,3% 8,3%

Psicomotricidad
33,4%

11
Estadstica Descriptiva Mg. Diana Atar

Grfico a bastones

En el caso de la variable cuantitativa discreta el grfico es a bastones. En lugar


de barras, aparecen lneas que representan a las frecuencias.

Histograma

En el caso de variable cuantitativa continua, hemos visto que, en general, se


utilizan intervalos cuya amplitud debe ser igual en todos los casos, siempre que
esto sea posible. El grfico, entonces, es similar al de barras, pero, las barras
son adyacentes y toman como base la amplitud del intervalo.

Ejemplo: Distribucin por edad de un grupo de personas.

160 Histograma
Edad f
25 - 29 0 140 137

29 - 33 4 120

33 - 37 8 100
100

37 - 41 32
80 76
41 - 45 75 75

45 - 49 100 60
47

49 - 53 137 40
32

53 - 57 76 20 17

57 - 61 47 0
4
8
4

61 - 65 17 . 0
25 - 29 29 - 33 33 - 37 37 - 41 41 - 45 45 - 49 49 - 53 53 - 57 57 - 61 61 - 65 65 - 69

65 - 69 4

Grfico evolutivo

Generalmente se utiliza para representar la evolucin de la variable a travs del


tiempo (aos, meses, horas, etc.).
12
Estadstica Descriptiva Mg. Diana Atar

Sobre el eje horizontal figuran los perodos de tiempo.

3. Medidas de Posicin

La estadstica descriptiva trabaja con ciertas medidas descriptivas que


caracterizan a una poblacin o a una muestra. Estas son: por un lado, las
medidas de posicin y, por el otro, las medidas de dispersin que veremos
ms adelante.

Dentro de las medidas de posicin estn las llamadas de tendencia central, y


otras referidas al orden de los datos y a la forma de la distribucin

3.1. Medidas de tendencia central

Estas medidas deben su nombre a la situacin particular de distribuciones


simtricas. Informan sobre los valores centrales de un conjunto de datos.
Veremos las principales.

MODO (o moda):
Es el valor o categora de la variable que presenta el mayor nmero de veces, o
sea, el valor o categora ms frecuente.

Si hay un solo valor modal, la distribucin se llama unimodal.


Las distribuciones tambin pueden ser bimodales, trimodales y plurimodales. En
algunos casos, esto puede significar la existencia de grupos diversos en la
poblacin de donde se extrae la muestra.

En el ejemplo de la carrera elegida, el modo es Psicomotricidad pues


presenta la frecuencia ms alta, 20. Adems, como el modo es nico, la
distribucin es unimodal.

13
Estadstica Descriptiva Mg. Diana Atar

MEDIANA:
Es el valor del conjunto de datos que se sita justamente en el centro de la
muestra, un 50% son inferiores y el otro 50% son superiores a ella.

Veamos un ejemplo.

En una empresa se realiz un relevamiento de personal directivo y


administrativo. Con los datos obtenidos se confeccion la siguiente tabla:

Categora Frecuencia
Frecuencia
laboral acumulada
Presidente 1 1
Vicepresidente 1 1+1=2
Director
General 1 2+1=3
Director rea 1 4
Director 1 5
Gerente Gral. 4 9
Gerente 5 14
Jefe Divisin 3 16
Jefe Depto. 3 20
Encargado 3 23
Secretaria 2 25
Total 25

La columna de la frecuencia acumulada se obtuvo de sumar la frecuencia de


un valor dado de la variable con las frecuencias de los valores anteriores.

El modo es Gerente pues corresponde a la frecuencia mxima.

Buscamos la mediana:

1. Para calcular la mediana, primero, debemos ordenar los datos en forma


creciente o decreciente. En nuestra distribucin de frecuencias los datos ya
estn ordenados, ya que siguen una secuencia Presidente, Vicepresidente,
Director General,.

2. Una vez ordenados los datos, debemos obtener el valor central, que se ubica
en la mitad de la distribucin y tiene la misma cantidad de datos mayores y
menores a l.
Para calcular el orden o posicin donde se encuentra la mediana, hacemos
n 1
, siendo n la cantidad de datos.
2

Si el nmero de datos es impar, la mediana corresponder al valor que


se encuentre exactamente en el medio de la misma.
Si el nmero es par, se promedian los dos valores centrales.

14
Estadstica Descriptiva Mg. Diana Atar

En el ejemplo, el nmero de datos es impar (n = 25), entonces la mediana estar


en la posicin 25 1 13 . Es decir, 13 es el orden de la mediana.
2
3. Una vez obtenido el orden de la mediana, se busca en la columna de
frecuencias acumuladas: se ubica el orden encontrado y se determina a qu
valor de variable corresponde.

En nuestro ejemplo, la mediana es Gerente. Esto significa que el 50% del


personal relevado tiene jerarqua inferior a Gerente

Veamos otro ejemplo: Cmo viaja usted en el tren?

Opinin f F (frecuencia
(frecuencia) acumulada
Muy Mal 10 10
Mal 5 15
Regular 13 28
Bien 7 35
Muy Bien 5 40
acumulada)
TOTAL 40

Sobre un total de 40 observaciones, la mediana est en el lugar 40 1 20,5


2
El valor 20,5 separa la distribucin en dos partes iguales. Si observamos la
columna de frecuencias acumuladas, la observacin 20,5 se encuentra en la
categora Regular. En efecto, hasta Mal se cuenta con 15 datos solamente,
para llegar al valor 20,5 debemos considerar los Regular. Regular, entonces,
es la mediana.

Por ltimo, sealamos que la mediana no est influida por la presencia de valores
extremos y al ser una medida orden, no toma en su consideracin todo el
conjunto de datos.

MEDIA ARITMTICA:
Es el promedio aritmtico del conjunto de datos que resulta de la suma de
todos los valores obtenidos de la variable, dividido por el nmero total de datos.

Frmula de la media aritmtica poblacional

xi x1 x2 x3 ... x n

N N
Frmula de la media aritmtica muestral

xi x1 x2 x3 ... xn
X
n n

Utilizamos el smbolo de sumatoria, (sigma), para referirnos a la operacin


suma; xi son los distintos valores que toma la variable; la letra griega, (mu),
representa a la media aritmtica de la poblacin; y N es el tamao de la
poblacin.
15
Estadstica Descriptiva Mg. Diana Atar

Por su parte, X representa a la media aritmtica en la muestra, y n es el tamao


de la muestra.

El valor de la media aritmtica es susceptible a la presencia de valores extremos,


los que se apartan en exceso del resto de los datos. Estos valores pueden sesgar
en gran medida el valor de la media, perdiendo su representatividad.

Veamos el siguiente ejemplo.


Se mide la estatura (en metros) de los integrantes de la representacin deportiva
de una institucin educativa. Los valores se muestran en la siguiente tabla:

Estatura Estatura Estatura


1,15 1,53 1,21
1,48 1,16 1,59
1,49 1,40 1,86
1,50 1,81 1,52
1,51 1,98 1,48
1,52 1,20 1,37
1,53 1,42 1,16
1,53 1,45 1,73
1,55 1,20 1,62
1,49 1,98 1,01

Agrupamos los valores obtenidos.

Estatura f
1,01 1
1,15 1
1,16 2
1,20 2
1,21 1
1,37 1
1,40 1
1,42 1
1,45 1
1,48 2
1.49 2
1.50 1
1,51 1
1,52 2
1,53 3
1,55 1
1,59 1
1,62 1
1,73 1
1,81 1
1,86 1
1,98 2

16
Estadstica Descriptiva Mg. Diana Atar

En este caso, la media aritmtica debe tomar en cuenta la repeticin de valores,


es decir, las frecuencias. Por lo tanto, la frmula ser:

X
x f i i

x 1f1 x 2f2 x 3f3 ... x n fn
n n

1,01 1 1,15 1 1,16 2 ... 1,98 2


X 1,48m
30
La estatura media de la representacin deportiva es de 1,48m

A modo de revisin, buscaremos tambin el modo y la mediana en este conjunto


de datos.

El modo es 1,53, porque es la estatura que aparece con la mayor frecuencia.

Veamos la mediana.
Recordemos que los datos deben estar ordenados. Luego, se busca el orden de
la mediana: (n+1)/2 = (30+1)/2=15,5. Este nmero de orden, 15,5, nos lleva a
dos posiciones:
En la posicin 15, el valor es 1,49m
En la posicin 16, el valor 1,50m

Entonces, la mediana es el promedio de estos dos valores centrales

1,49m 1,50m
Me 1,495m
2

Continuando con este ejemplo, vamos a presentar la informacin en una tabla


de frecuencias, esta vez, agrupadas en intervalos, y hallaremos las tres medidas
de tendencia central:

Punto
Frecuencia
Estatura Frecuencia medio
Acumulada xf
x
1,00 - 1,10 1 1 1,05 1,05
1,10 - 1,20 3 4 1,15 3,45
1,20 - 1,30 3 7 1,25 3,75
1,30 - 1,40 2 9 1,35 2,70
1,40 - 1,50 6 15 1,45 8,70
1,50 - 1,60 4 19 1,55 6,20
1,60 - 1,70 3 22 1,65 4,95
1,70 - 1,80 3 25 1,75 5,25
1,80 - 1,90 2 27 1,85 3,70
1,90 - 2,00 3 30 1,95 5,85
Totales 30 45,60

Observemos que el intervalo 1,00 1,10 debe leerse [1,00;1,10); es decir,


cerrado a izquierda y abierto a derecha -el corchete indica que se incluye el valor
17
Estadstica Descriptiva Mg. Diana Atar

1,00 y el parntesis, que se excluye el valor 1,10-; y as, con el resto de los
intervalos.

Dado que tenemos los datos agrupados en intervalos, debemos hallar un valor
puntual que nos permita hacer los clculos. Tomamos, entonces, X, que es el
punto medio o marca de clase del intervalo.

Media Aritmtica

x f 45,6
x = = 1,52m
n 30

Mediana

n 2 - Fant 15 - 15
Me L inf a = Me 1,50 0,10 = 1,50m
f 4

Siendo,
LInf: Lmite inferior del intervalo que contiene a la mediana
Fant: Frecuencia acumulada hasta el intervalo anterior al que contiene a la
mediana
f: Frecuencia absoluta del intervalo que contiene a la mediana
n: Nmero de observaciones
a: Amplitud del intervalo

Modo

Si bien hay una frmula para hallar el valor puntual del modo, en este ejemplo,
diremos que el intervalo modal, es decir, el rango de estatura que presenta
mayor frecuencia es el intervalo 1,40 - 1,50.

3.2. Otras medidas de posicin

Estas medidas permiten conocer otros valores caractersticos de la distribucin.


Por ejemplo, valores que dividen a la muestra en porciones iguales:

Los Cuartiles

Son tres valores que dividen el conjunto de datos, una vez ordenado de forma
creciente o decreciente, en cuatro partes iguales, donde cada uno de ellos
concentra el 25% de los datos.

Q1 (cuartil1) es el valor de la variable que deja a su izquierda el 25% de la


distribucin, y el 75% a la derecha.
Q2 (cuartil 2) es la mediana de la distribucin.
Q3 (cuartil 3) es el valor de la variable que deja el 75% de la distribucin a
su, y el 25% a la derecha.

Para calcular el cuartil de orden k ( k=1,2,3), se usa la siguiente frmula:

18
Estadstica Descriptiva Mg. Diana Atar

k.n
Fant
Qk Linf 4 a
f

Siendo,
k: Orden del cuartel, k = 1, 2, 3
LInf: Lmite inferior del intervalo que contiene al cuartil
Fant: Frecuencia acumulada hasta el intervalo anterior al que contiene el
cuartil
f: Frecuencia absoluta del intervalo que contiene al cuartil
n: Nmero de observaciones
a: Amplitud del intervalo

Siguiendo los mismos criterios, podemos hallar los deciles y los percentiles.

Los Deciles

Son nueve valores que dividen al conjunto de datos, ordenado en forma


creciente o decreciente, en diez partes iguales, donde cada uno de ellos
concentra el 10% de los resultados.

La frmula de clculo es:

k.n
Fant
Dk Linf 10 a con k = 1, 2,,9
f

Los Percentiles

Son 99 valores que distribuyen al conjunto de datos, ordenado en forma


creciente o decreciente, en cien partes iguales, donde cada uno de ellos
concentra el 1% de los resultados.

La frmula de clculo es:


k.n
Fant
Pk Linf 100 a con k = 1, 2,, 99
f

Retomando el ejemplo de las estaturas de los integrantes de la representacin


deportiva, calculemos el cuartil Q1:

Primero debemos buscar el intervalo que contiene al primer cuartil. En este caso,
hacemos n/4, o sea, 30/4 = 7,5.
Observando las frecuencias acumuladas, vemos que este valor corresponde al
intervalo [1,30; 1,40). Su lmite inferior es LInf = 1,30

Reemplazando en la frmula anterior

19
Estadstica Descriptiva Mg. Diana Atar

30
7
Q 1,30 4 0,10 1,325
1 2

Entonces, Q1 = 1,325

Siguiendo el mismo procedimiento, obtenemos Q2 y Q3

Q2 = 1,50 y Q3 = 1,72

Podemos decir entonces, que:

el 25% de los integrantes de la representacin deportiva mide 1,325m o


menos,
el 50% de los integrantes de la representacin deportiva mide 1,50m o
menos y
el 75% de los integrantes de la representacin deportiva mide 1,72m o
menos.

Si buscamos el Decil 5 y el Percentil 50, veremos que estos valores coinciden


con la mediana.

4. Medidas de Dispersin

Hemos presentado en el punto anterior medidas que informan sobre los valores
de resumen de un conjunto de datos, es decir, las medidas de posicin: modo,
mediana y media aritmtica, y percentiles.

Aunque para algunos propsitos muy limitados, un promedio puede describir en


forma suficiente a una poblacin o muestra, generalmente se necesita mayor
informacin acerca del conjunto de observaciones en estudio.

Un promedio resume todos los valores observados en uno solo, que en


ocasiones los representa, pero en general es insuficiente para describir el
comportamiento de esa variable.

Analicemos la siguiente situacin:


Se toma un test psicotcnico a dos grupos de personas, A y B. Los puntajes
obtenidos en el grupo A son: 10, 20, 30, 40, 50 y 60 y los del grupo B son 10, 10,
10, 60, 60 y 60.

Cul es el puntaje promedio de cada uno de los grupos?


El promedio, tanto para el grupo A como para el B, es de 35 puntos; es decir, el
mismo en ambos casos. Sin embargo, los puntajes no son similares.

Necesitamos, entonces, una medida de variacin o dispersin que nos permita


saber en cul de los grupos, el puntaje promedio es o no es un buen
representante.
Veamos la nocin de representatividad.
20
Estadstica Descriptiva Mg. Diana Atar

Si los valores observados estn muy concentrados alrededor del promedio y muy
parecidos a ste, diremos que es muy representativo pero, si los valores estn
muy dispersos en relacin al mismo, la representatividad es limitada.

Como consecuencia, el significado de un promedio es mayor si viene


acompaado de una medida de la concentracin o dispersin de los valores
de variable respecto de l.

Para expresar la dispersin de una variable pueden usarse varias medidas:

4.1. Rango

Tambin llamado amplitud, es la diferencia entre el mayor y el menor valor que


toma la variable, por lo que su valor queda expresado en las mismas unidades
que la variable.

R = Xmayor - Xmenor

Cuanto mayor es el rango, mayor es el campo de variacin de la variable. Como


slo depende de los valores extremos, si stos estn muy alejados de los
restantes, puede conducir a una falsa impresin de la dispersin. Por otra parte,
es insuficiente ya que de todo el conjunto de datos slo utiliza dos: el ms grande
y el ms chico.

Veamos el siguiente ejemplo.


Una consultora de empresas contrat a cinco estudiantes de psicologa para el
departamento de seleccin de personal, con las siguientes remuneraciones
mensuales: $910; $800; $755; $665 y $620.

R = $910 - $620 = $290

4.2. Varianza

La varianza es una medida de la desviacin o dispersin promedio de los datos


respecto a su media aritmtica. Se calcula como el promedio de los desvos
cuadrticos respecto a la media aritmtica.

Veremos, a continuacin, cmo se calcula la varianza con datos poblacionales;


en primer lugar con datos no agrupados, y luego, con datos agrupados.

Varianza Poblacional para datos no agrupados.

Su frmula es: 2 x 2
N

Operando matemticamente con esta frmula, podemos llegar a la frmula


operativa o frmula de trabajo, ms sencilla para el clculo:

2 x2 2
N

21
Estadstica Descriptiva Mg. Diana Atar

Tomemos el ejemplo de las remuneraciones de los pasantes de Psicologa en la


consultora de personal.

Aplicando la frmula definicional, obtenemos:

( 910 750)2 ( 800 750)2 ( 755 750)2 ( 665 750)2 ( 620 750)2
2 =
5

= 10450 ($)2

Siguiendo la frmula de trabajo, tenemos:

9102 8002 7552 665)2 6202


2 ( 750)2 = 10450 ($)2
5

Como podemos observar, el resultado que obtenemos queda expresado en


pesos cuadrados, $.

La dificultad de trabajar con la varianza como medida descriptiva de la dispersin


de una distribucin, es que queda expresada en unidades de la variable al
cuadrado, tal como se seala en el ejemplo.

Para evitar este inconveniente, se utiliza como medida de dispersin la raz


cuadrada de la varianza, que se conoce con el nombre de desvo estndar.

4.3. Desvo Estndar

El desvo (o desviacin) estndar, que es la medida de dispersin ms utilizada,


se calcula como la raz cuadrada positiva de la varianza, por lo tanto, queda
expresado en las mismas unidades de la variable, lo que facilita su uso como
medida descriptiva de la dispersin de los datos.

Es un nmero mayor o igual a cero. Si es cero, significa que todos los valores
son iguales a la media aritmtica y por lo tanto, no hay dispersin. A medida que
los valores de la variable se apartan del promedio, la dispersin es mayor.

Su frmula es:


2
x
=
N

O bien,
x2 2
N

En nuestro ejemplo, entonces,

= $210450 = $102,22

22
Estadstica Descriptiva Mg. Diana Atar

Analicemos otras situaciones.


Supongamos que otra consultora de seleccin de personal contrat el mismo
nmero de pasantes de la carrera de psicologa y sus sueldos mensuales fueron
de: $752, $751, $750, $749 y $748.

El sueldo mensual promedio es = $750 y el desvo estndar = $1,4142

Si comparamos estos valores con los del caso anterior, observamos igual media
aritmtica, pero en este segundo caso, la dispersin es mucho menor, lo que
implica que el promedio es ms representativo.

Por ltimo, imaginemos una tercera empresa consultora de seleccin de


personal, que decidi pagar a todos los pasantes el mismo sueldo mensual, igual
a $750.

En este caso, la media es $750 y el desvo estndar es igual a cero. Es decir, no


hay dispersin.

4.4. Varianza y Desvo estndar poblacional para datos agrupados

Recordemos que datos agrupados significa que estamos trabajando con


distribuciones de frecuencia, por lo tanto, las frmulas se modifican.

2 x 2 .f
La varianza ser: 2
N

Y el desvo estndar: x2.f 2


N

Siendo
x.f
N

Volvamos al ejemplo de las estaturas de los integrantes de la representacin


deportiva de una institucin educativa; y utilizamos la distribucin de frecuencia
con los datos agrupados en intervalos. En este caso, la media aritmtica es igual
a 1,52m.
Al igual que en el clculo de la media aritmtica, calcularemos la varianza,
tomando como valor de x, el punto medio de cada intervalo, x.

Resulta entonces,

( 1,05 1,52 )2 1 ( 1,15 1,52 )2 3 ... ( 1,95 1,52 )2 3


2 = 0,064
30

Y el desvo estndar es = 0,25

A continuacin veremos cmo se calcula la varianza y el desvo estndar con


datos muestrales.
23
Estadstica Descriptiva Mg. Diana Atar

4.5. Varianza y desvo estndar muestral

Para el caso de una muestra, se utiliza:


S, como smbolo de desvo estndar muestral, en lugar de
X , la media muestral, en lugar de ,
(n -1) en lugar de N, siendo n = el tamao de la muestra.

Las frmulas de la varianza que resultan, para datos sin agrupar son:

Frmula conceptual: S2 =
Xi X 2

n 1

X 2 nX 2
Frmula operativa: S2 = i
n 1

Y para datos agrupados:

Frmula conceptual: S2 =
Xi X 2
f
n 1

X 2 f nX 2
Frmula operativa: S2 = i
n 1

En todos los casos, para obtener el desvo estndar, S, se calcula la raz


cuadrada positiva de la varianza, S2

Veamos un ejemplo.
Tomemos una muestra de tamao n =10 de los puntajes de un test de coeficiente
intelectual. Los datos obtenidos son:

115 - 120 - 110 - 140 - 100 - 90 - 125 - 95 - 105 - 130

En primer lugar, debemos hallar la media aritmtica: X = 113

Luego, calculamos el desvo estndar, aplicando la frmula de trabajo:

Xi2 nX 2
S=
n 1

Xi2 = 130.000 nX 2 = 127.690

Reemplazando en la frmula obtenemos:

130.000 127.690
S= = 16,02
9

24
Estadstica Descriptiva Mg. Diana Atar

5. Coeficiente de variacin

El coeficiente de variacin es un indicador de la dispersin de los datos respecto


a su promedio. Generalmente se expresa en porcentaje y no tiene unidad de
medida. Cuanto menor sea el coeficiente de variacin, menor ser la diferencia
entre los datos observados y mejor representados estarn por su promedio.

El coeficiente de variacin es til para comparar dispersiones a escalas distintas


pues es una medida invariante ante cambios de escala. Por otro lado, el
inconveniente que presenta, a diferencia de la desviacin estndar, este
coeficiente no es invariante ante cambios de origen, por tanto, slo se puede
calcular en el nivel de razn, en el que el origen es cero. Por ello es importante
que todos los valores sean positivos y su media de, por tanto, un valor positivo.

Al comparar la dispersin de dos distribuciones, puede ocurrir:

si las distribuciones se refieren a la misma variable, en la misma unidad de


medida y tienen la misma media, pueden compararse directamente sus
desvos estndar. Entonces, a mayor valor, mayor variabilidad.

si no se dan las condiciones anteriores, y el nivel de medicin es de razn,


se utiliza el coeficiente de variacin, que es el desvo estndar expresado
como un porcentaje de la media.

Se define como
S
Para una muestra es: CV 100
X


Para una poblacin es: CV 100

Obviamente, este parmetro pierde sentido si la media es cero o


aproximadamente cero.

Veamos un ejemplo.
Supongamos dos distribuciones con igual desvo estndar pero distinta media.
Los datos de la primera son: S= 2,4 y X = 5 y los de la segunda S= 2,4 y X = 7.
Obtenemos un CV = 48% para la primera distribucin y un CV = 34% para la
segunda.

Concluimos entonces que, la variacin relativa de la segunda es menor y esto


significa que la distribucin es ms homognea.

Mediante el coeficiente de variacin se puede analizar la variabilidad relativa,


an en el caso en que las variables sean inconmensurables, ya que el coeficiente
de variacin es un nmero puro, sin unidades de medida. As, entonces, se
puede comparar la dispersin relativa en una distribucin de estaturas de un
grupo de personas con la distribucin de sus pesos corporales, o, en el personal
de una empresa, comparar la antigedad laboral con el salario mensual, y
determinar, entonces, cul de las dos tiene mayor variabilidad.
25
Estadstica Descriptiva Mg. Diana Atar

Resumen

Hemos presentado metodologas que permiten efectuar una adecuada


exploracin de los datos, etapa fundamental en el comienzo de cualquier
anlisis estadstico.

Con la finalidad de inferir en conclusiones adecuadas de una poblacin, hemos


presentado las tcnicas de muestreo, que pueden ser por seleccin
probabilstica o no probabilstica.

Las variables pueden clasificarse por:


Su funcin
Independientes
Dependientes

Su naturaleza o definicin
Cualitativas
Cuantitativas: Discretas y Continuas

Su nivel de medicin
Nominal
Ordinal
Intervalos
De Razn

La estadstica provee diversas tcnicas para organizar los datos obtenidos de


una variable, con la finalidad de poder interpretar la informacin y sacar
conclusiones.

Ellas son:
Distribuciones de frecuencias
Los grficos
Medidas de posicin
Medidas de variabilidad

Entre las principales medidas de posicin encontramos:

Modo: es el valor de variable ms frecuente

Mediana: es el valor del conjunto de datos que se sita en el centro de la


muestra.

Media aritmtica: es el promedio del conjunto de datos.

Entre las principales medidas de variabilidad encontramos:

Varianza: es el promedio de los desvos cuadrticos respecto de la media


aritmtica.

Desvo estndar: la raz cuadrada positiva de la varianza.

26
Estadstica Descriptiva Mg. Diana Atar

Rango: la diferencia entre el valor mayor y menor de la variable

Coeficiente de variacin: medida de la dispersin relativa

27
UNIVERSIDAD DE BELGRANO
FACULTAD DE HUMANIDADES
CARRERA: LICENCIATURA EN PSICOLOGA
MATERIA: ESTADSTICA
PROFESORA: MG. DIANA ATAR

Gua de Ejercicios de Estadstica Descriptiva

1. Dada la siguiente distribucin de frecuencias,

x: 2 5 7 10
f: 16 12 8 14

Hallar: la media aritmtica


el desvo estndar
el tamao de la muestra
el modo
la mediana

Rta.: media aritmtica,X = 5,76


desvo estndar, S = 3,15
tamao de la muestra, n = 50
modo, Mo = 2
mediana, Me = 5

2. Dada la siguiente distribucin de frecuencias,

x: 82 86 90 70
f: 3 5 3 1

Hallar: la media aritmtica


el tamao de la muestra
el modo
la amplitud de la distribucin
la mediana

Rta.: media aritmtica,X = 84,66


tamao de la muestra, n = 12
modo, Mo = 86
amplitud de la distribucin, Amp = 20
mediana, Me = 86

3. La presente serie de datos muestra los resultados de un test de comprensin de


textos realizado a alumnos de 5to. Ao, de una escuela de enseanza media.

1, 2, 5, 4, 8, 1, 0, 5, 7, 7, 2, 4, 9, 10 ,8, 9, 6, 3, 8, 6, 7, 9

Se pide: a. Construir una distribucin de frecuencias.

1
b. Indicar tamao de la muestra, amplitud de la distribucin , campo de
variabilidad.
c. Calcular cantidad de alumnos que obtuvieron resultado menor a 6 y
porcentaje de alumnos con resultado mayor o igual a 6.
d. Hallar el modo, la mediana, la media aritmtica. Interprete los
resultados.
e. Hallar la variancia y el desvo estndar.

Rta.: a.
resultado f
0 1
1 2
2 2
3 1
4 2
5 2
6 2
7 3
8 3
9 3
10 1

b. n = 22; Amp = 10; Campo de variabilidad: de 0 a 10


c. F (frecuencia acumulada, x < 6) = 10; Porcentaje (x 6) = 55%
d. Mo = 7, 8 y 9 (distribucin trimodal), Me = 6, Media aritmtica, X = 5,5
e. Variancia = 8,6; Desvo estndar, S = 2,93

4. Con la siguiente serie de resultados de un examen de estadstica,

6, 5, 3, 8, 7, 6, 7, 10, 2, 2, 4, 5, 6, 2, 9

Calcular: el resultado medio


la desviacin estndar
el modo
la mediana

Rta.: media aritmtica, X = 5,47


desvo estndar, S = 2,44
modo, Mo = 2 y 6
mediana, Me = 6

5. La presente serie de datos muestra las edades de alumnos de una escuela rural.

3, 6, 6, 10, 12, 12, 13, 7, 8, 5, 4, 4, 9, 10, 5,6, 7, 7, 8, 3, 4, 7, 6, 4,10

Se pide: a. Construir una distribucin de frecuencias.


b. Indicar tamao de la muestra; amplitud de la distribucin; campo de
variabilidad.
c. calcular cantidad de alumnos de preescolar y porcentaje de alumnos
con 10 aos o ms.
d. las medidas de tendencia central.

2
e. la medida de variabilidad que considere apropiada. Justifique su
eleccin.

Rta.: b. n = 25, Amp = 10, Campo de variabilidad = de 3 a 13 aos


c. frec. acum.. (x<6) = 8; Porcentaje(x10) = 24%
d. Me = 7, Mo = 4, 6 y 7, Media aritmticaX = 7,04
e. S = 2,88

6. La siguiente es una distribucin de postulantes a un puesto de trabajo, segn el


puntaje de un test de aptitud, en una escala de 0 a 5:

X f
0 10
1 28
2 42
3 30
4 18
5 12

Resolver: a. Qu representa la X, y qu representa la f


b. Amplitud de la distribucin y tamao de la muestra
c. Modo, Mediana, Promedio de puntaje obtenido
d. Variancia y desvo estndar
e. Desvo cuartlico
f. Cuntos postulantes obtuvieron menos de 2 puntos?
g. Qu porcentaje de postulantes obtuvo 4 puntos o ms ?
h. Cmo graficara esta distribucin de frecuencias?

Rta.: a. X es la variable y representa el puntaje del test de aptitud; f es la


frecuencia y representa el nmero de postulantes por puntaje.
b. Amp. = 5; n = 140
c. Mo = 2, Me = 2, Promedio de viajes contratados,X = 2,39
d. S2 = 1,82; S = 1,35
e. Q1 = 1 , Q2 = Me = 2, Q3 = 3; entonces DC = 2
f. Frec acum. (x<2) = 38
g. Porcentaje (x4) = 21,43%
h. Grfico a bastones o un grfico de sectores (o circular)

7. La siguiente es una distribucin porcentual de pacientes de un Centro de asistencia


psicolgica, segn la edad.

Edad porcentaje
20-30 36,2
30-40 32,5
40-50 22,0
50-60 7,6
60-70 1,7

Indicar: a. Amplitud de la distribucin


b. Limite inferior de la segunda clase (o intervalo de clase)
c. Marca de clase (o punto medio) de la quinta clase

3
d. Qu porcentaje de pacientes tiene menos de 40 aos?
e. Graficar
f. Reproducir la tabla en frecuencias absolutas sabiendo que la muestra
es de 180 pacientes.

Rta.: a. Amp. = 50 aos


b. Lm. Inf. = 30 aos
c. Marca de clase, X = 65 aos
d. 68,7%
e. Histograma (o grfico de barras adyacentes)
f.
Edad frecuencia
20-30 65
30-40 58
40-50 40
50-60 14
60-70 3

8. La siguiente tabla presenta la distribucin de una muestra de hogares, segn la


cantidad de hijos por familia.

X f
1 15
2 32
3 43
4 28
5 19
6 13

Resolver: a. Cul es la variable y de qu tipo?


b. Amplitud de la distribucin y tamao de la muestra.
c. Modo, mediana, Promedio de hijos
d. Desvo estndar
e. Cuntos hogares tienen menos de 4 hijos?
f. Qu porcentaje de hogares tiene entre 5 y 6 hijos?

Rta.: a. La variable es cantidad de hijos por familia. Es cuantitativa discreta.


b. Amp. = 5 y n = 150
c. Mo = 3, Me = 3, X = 3,29
d. S = 1,42
e. Frec. acum. (x<4) = 90
f. 21,33

9. Un psicopedagogo obtuvo la siguiente muestra de puntajes de coeficiente intelectual


administrado a estudiantes de una escuela de enseanza media.

98 111 101 100 99


99 123 100 134 101
96 102 102 101 105

Indicar: a. Coeficiente intelectual promedio

4
b. Por debajo de qu coeficiente se encuentra el 50% de los
estudiantes?
c. Desvo estndar.
d. Cul es el coeficiente intelectual ms frecuente?
e. Cuartiles. Interpretar los resultados

Rta.: a. X = 105
b. Me = 101
c. S = 10,6
d. Mo = 101
e. Q1 = 99, Q2 = Me = 101, Q3 = 105

10. A un grupo de nios se le ha administrado dos evaluaciones, A y B. A


continuacin se muestran los resultados obtenidos en ambas pruebas (ambas
medidas en escalas de 1 a 5 puntos).

Puntaje A B
1 11 0
2 20 28
3 40 30
4 15 25
5 5 8

Resolver: a. Cul es la variable? Clasifquela e indique el nivel de medicin.


b. Indicar el puntaje promedio de cada una de las evaluaciones.
c. Cul de las dos evaluaciones produjo puntajes ms homogneos.
Justificar la respuesta.

Rta.: a. La variable es el punta de las evaluaciones. Es cuantitativa intervalar.


b. XA = 2,81 y XB = 3,14
c. La evaluacin B, porque CVA = 37% y CVB = 31%

11. La siguiente distribucin corresponde a las edades de los asistentes a un curso


sobre tcnicas de estudio.
X f
menos de 17 1
17 - 20 40
20 - 23 38
23 - 26 4
26 - 29 2
29 - 32 4
ms de 32 2

Resolver: a. Hallar la medida de tendencia central que considere apropiada.


Fundamentar su eleccin e interpretar el resultado.
b. Hallar la medida de dispersin que considere adecuada.
Fundamentar la eleccin
c. Si la edad mxima fuese 40, qu ocurrira con la mediana?
d. En qu intervalo se encuentra el modo de la distribucin?
e. Qu grfico utilizara para representar esta informacin?

Rta.: a. Me = 20,35

5
b. DC = 3,6 (siendo Q1 = 18,6 y Q3 = 22,15
c. No se modifica.
d. [17,20)
e. Histograma

12. Un reciente estudio llevado a cabo con mujeres casadas, arroj los siguientes
resultados en relacin a la satisfaccin matrimonial, que muestra la siguiente tabla.

Satisfaccin Matrimonial
Edad Mucha Media Poca
Menos de 30 aos 70 79 54
30 45 aos 45 75 77
Ms de 45 aos 35 51 14

Resolver: a. Cules son las variables y cmo se clasifican?


b. Cmo se compone la muestra?
c. Cuntas mujeres menores de 30 aos han sido encuestadas?
d. Qu porcentaje de mujeres manifiesta poca satisfaccin en su
matrimonio?
e. Dentro del grupo de mayor edad, qu porcentaje de mujeres
manifiesta mucha satisfaccin?
f. Cuntas mujeres mayores de 30 aos han sido encuestadas y qu
porcentaje representan?.
g. Qu porcentaje de mujeres manifiesta media o poca satisfaccin?

Rta.: a. Edad (cuantitativa, de razn); Satisfaccin matrimonial (cualitativa


ordinal)
b. 500 mujeres casadas
c. 203 mujeres
d. 29%
e. 35%
f. 297 mujeres, representan el 59,4%
g. 70%

13. Un terapeuta ocupacional realiza un estudio de habilidad psicotcnica entre los


operarios de una empresa A. Los resultados se muestran en la siguiente tabla:

Puntaje f
95 - 99 2
100 - 104 4
105 - 109 5
110 -114 9
115 - 119 5
120 - 124 6
125 - 129 2
130 - 134 1
135 - 139 1

Calcular: a. el puntaje de habilidad promedio


b. desvo estndar.
c. El mismo estudio se realiza en la empresa B, obteniendo un puntaje
de habilidad promedio de 110,5 y un desvo estndar de 10,2. Qu

6
empresa presenta un comportamiento ms homogneo con respecto a
la habilidad psicotcnica?

Rta.: a. XA = 113,82
b. SA = 9,31
c. La empresa A, porque CVA = 8,2% < CVB = 9,2% ,

7
FRMULAS ESTADSTICAS

MEDIDAS DE POSICIN

1. DE TENDENCIA CENTRAL

Media Aritmtica:

Para datos sin agrupar

x
Poblacional: (1)
N

x
Muestral: x (2)
n

Para datos agrupados

xf xf
Poblacional: (3)
f N

xf xf
Muestral: x x (4)
f n

Mediana:

Para datos sin agrupar

Es el valor de la variable que se ubica en el orden (n+1)/2

(Me) = (n+1)/2 ; entonces, Me = X

Para datos agrupados

n 2 Fant
Me L inf a (5)
f

2. OTRAS DE MEDIDAS DE POSICIN: FRACTILES

Para datos agrupados

Cuartiles:

n 4 Fant
Primer cuartil: Q1 L inf a (6)
f

8
2 n 4 Fant
Segundo cuartil: Q2 L inf a (7)
f

3 n 4 Fant
Tercer cuartil: Q3 L inf a (8)
f

k n 10 Fant
Deciles: Dk L inf a (9)
f

k n 100 Fant
Percentiles: Pk Linf a (10)
f

MEDIDAS DE VARIABILIDAD

Amplitud: A = Xmayor - Xmenor (11)

Desvo Cuartlico: DC = Q3 - Q1 (12)

Variancia:

Para datos sin agrupar:


Frmulas definicionales: Frmulas operativas:

(x )2
2 x22
Poblacional: Poblacional: 2 (13)
N N

Muestral: S2
(x x)2
Muestral: S2

x2 x n
2
(14)
n -1 n -1

Para datos agrupados:

Frmulas definicionales: Frmulas operativas:

(x ) 2 f x2 f
Poblacional: 2 Poblacional: 2 2 (15)
N N

9
Muestral: S2
(x x)2 f
Muestral: S2

x2 f x f n
2

(16)
n -1 n 1

Desvo Estndar:

Poblacional: 2 (17)

Muestral: S S2 (18)

10
UNIVERSIDAD DE BELGRANO
FACULTAD DE HUMANIDADES
CARRERA: LICENCIATURA EN PSICOLOGA
MATERIA: ESTADSTICA
PROFESORA: MG. DIANA ATAR

Gua de Ejercicios de Covariacin

1. Las variables X e Y representan los puntajes de un test de lectura y otro de redaccin,


realizados a 10 alumnos de 7mo. grado, respectivamente.

X: 2 4 4 5 6 7 7 8 9 10
Y: 4 4 3 7 6 6 8 10 10 7

Indicar el grado de correlacin de estas dos variables, y comentar el resultado.

Rta.: r = 0.78

2. La siguiente tabla presenta datos de 7 empleados de una empresa elegidos al azar,


donde la variable X es la antigedad en aos en la empresa y la variable Y es la
cantidad de das laborables que estuvo ausente.

X: 7 8 2 3 5 3 7
Y: 2 0 5 6 4 9 2

Hallar: a. La recta de regresin


b. Calcular el coeficiente de correlacin lineal. Interpretar el resultado.
c. Grafique los datos de la tabla

Rta.: a. y* = 9,44 - 1,09x


b. r = - 0.86
c. Grfico de dispersin (nube de puntos)

3. La siguiente tabla muestra datos para analizar la relacin entre la variable X (edad)
y la variable Y (puntaje de respuesta ante un estmulo determinado).

X: 6 6 8 8 10 10 12 12
Y: 4.5 5.5 6.0 7.5 8.0 7.5 9.0 8.5

Se pide: a. Representar los datos de la tabla.


b. Indicar el grado de correlacin entre ambas variables.
c. Calcular el coeficiente de determinacin. Interpretar el resultado.

Rta.: a. Grfica de dispersin.


b. r = 0.93
c. R2 = 0,86

11
4. Los siguientes datos representan las calificaciones promedio de 6 alumnos de primer
ao de una Universidad junto con sus puntajes de una prueba de inteligencia que se
les tom al ingresar a la misma. (Ambas escalas tienen un rango del 10 al 100)

Alumno Puntaje Calificacin


Prueba de inteligencia Promedio Primer ao
Juan 65 85
Manuel 50 74
Pablo 55 76
Lucas 65 90
Jos 55 85
Federico 70 87

Hallar: a. la recta de regresin


b. el coeficiente de correlacin lineal
c. el coeficiente de determinacin
d. Qu calificacin promedio se espera obtener de un alumno cuyo
puntaje de inteligencia es 80?

Rta.: a. y* = 42,83 +0,66x


b. r = 0,81
c. R2 = 66%
d. y*(x=80) = 96

5. Un psiclogo organizacional, llev adelante una investigacin para determinar si hay


relacin entre los aos de permanencia en un puesto de trabajo y el nivel de
eficiencia de los empleados, medida en una escala del 1 al 10. Los resultados de la
muestra fueron:

Empleado Aos de Nivel de


Nro. Permanencia Eficiencia
1 1 6
2 20 5
3 6 3
4 8 5
5 2 2
6 1 2
7 15 4
8 8 3

Hallar: a. la ecuacin de la recta


b. el coeficiente de correlacin lineal e interprete el resultado
c. el coeficiente de determinacin e interprete el resultado
d. Estime el nivel de eficiencia de un empleado que tiene 10 aos de
permanencia en su puesto de trabajo.

Rta.: a. y* = 3,17 + 0,08x


b. r = 0,35
c. R = 12,25%
d. y*(x=10) = 3,97

6. La ecuacin de regresin y* = 8 0.5x expresa la relacin de los errores cometidos

12
en funcin del nmero de ensayos en la lectura de un texto en idioma ingls.

Resolver: a. Si se efectan 16 ensayos, qu ocurre con los errores?


b. Cuntos errores disminuyen por cada ensayo?
c. Cuntos errores disminuyen por cada 2 ensayos.
d. Si no se efecta ningn ensayo, cuntos errores se espera
cometer?
e. Si r = 0.7 Qu porcentaje de la variacin de los errores es explicada
por el nmero de ensayos?

Rta.: a. Si x = 16, entonces, y* = 0


b. Por cada ensayo el nmero de errores disminuye en 0,5.
c. Cada 2 ensayos, se disminuye un error.
d. Si x = 0, entonces, y* = 8
e. R2 = 49%

7. Con un grupo de nios en edad escolar, se realiz una prueba para analizar la
relacin entre la variable X (edad) y la variable Y(tiempo de respuesta a un estmulo
determinado). Los resultados obtenidos son los siguientes:

X: 6 6 8 8 10 10 12 12
Y: 8.5 9.0 7.5 7.5 8.0 6.0 6.5 4,5

Se pide: a. Hallar la intensidad de la relacin e interpretar el resultado.


b. Hallar la ecuacin de regresin y explique los parmetros
encontrados.
c. Es pertinente definir una relacin de causalidad? Justifique su
respuesta.

Rta.: a. r = - 0,84
b. y* = 11,8 - 0.51x

8. La siguiente tabla muestra el nmero de horas de estudio (x) y las calificaciones


obtenidas en un examen (y)

X: 3 3 3 4 4 5 5 5 6 6 7 8
Y: 45 60 55 60 75 70 80 75 90 80 75 85

Se pide: a. representar grficamente estos datos.


b. encontrar la funcin de ajuste y graficarla.
c. estimar las calificaciones por haber estudiado 9 horas.
d. estimar las calificaciones por haber estudiado 2 horas.

Rta.: b. y* = 38,4 + 6,6x


c. y*(x=9) = 97,8
d. y*(x=2) = 51,6

FRMULAS ESTADSTICAS

13
COVARIACIN

Recta de Regresin: Y* = a + bX (19)

n xy x y
con: b = (20)
n x 2 ( x)2

a = y- bx (21)

Coeficiente de Correlacin Lineal:

Frmula definicional

xy
xy
r con: xy xy (22)
xy N

Frmula operativa

n xy x y
r = (23)
n x 2 ( x)2 * n y 2 ( y)2

UNIVERSIDAD DE BELGRANO

14
FACULTAD DE HUMANIDADES
CARRERA: LICENCIATURA EN PSICOLOGA
MATERIA: ESTADSTICA
PROFESORA: MG. DIANA ATAR

Gua de Ejercicios de Distribucin Normal

1. Calcular los puntajes Z correspondientes a los siguientes valores de una distribucin


normal con = 5 y = 2.

a. x = 7 b. x = 1 c. x = 9 d. x = 5,5

Rta.: a. z = 1 b. z = -2 c. z = 2 d. z = 0,25

2. En una distribucin normal con media = 165 y desvo estndar = 10, calcular los
valores de las variables correspondientes a los puntajes z que se dan a continuacin.

a. z = 0,5 b. z = -2 c. z = 1,2 d. z = -2,3

Rta.: a. x = 170 b. x = 145 c. x = 177 d. x = 142

3. Sea x una variable aleatoria normalmente distribuida con media = 4 y variancia = 25.
Calcular y graficar:

a. P( - 5 X 7)
b. P ( X > 4.5)
c. P ( X 3)
d. P ( X 4)

Rta.: a. 0,6898
b. 0,4602
c. 0,4207
d. 0,5

4. Utilizando la tabla de la distribucin normal estandarizada, establecer los puntajes z


que corresponden a:

a. el 90% central de los datos


b. el 90% inferior de los datos
c. el 90% superior de los datos
d. el 99% central de los datos
e. el 99% inferior de los datos
f. el 99% superior de los datos

(Para una mejor orientacin en la resolucin del ejercicio, se sugiere


graficar)

Rta.: a. los puntajes son z1 = -1,64 y z2 = +1,64


b. z = 1,28

15
c. z = - 1,28
d. z1 = - 2,57 y z2 = 2,57
e. z = 2,33
f. z = - 2,33

5. Utilizando la tabla de la distribucin normal estandarizada, hallar el porcentaje de


datos comprendido entre:

a. 0 y 3
b. -1 y 2
c. por debajo de -1,2
d. por debajo de 2,3
e. 0 y -2
f. por encima de 1,4
g. por encima de -0,8
h. por encima de -2 y por debajo de 1,2

(Para una mejor orientacin en la resolucin del ejercicio, se sugiere


graficar)

Rta.: a. 49,87%
b. 81,85%
f. 8,08%

6. En un test de habilidad tecnolgica cuyos puntajes se distribuyen normalmente con


media = 5 puntos y desvo estndar = 1,5. Cul es la probabilidad que un individuo
obtenga:

a. ms de 4 puntos.
b. entre 4 y 7 puntos.
c. De una poblacin de 5000 personas a las que se le administr el test,
cuntas personas obtuvieron un puntaje inferior a 4 puntos.

Rta.: a. 0,7486
b. 0,6568
c. 1257 personas

7. En una prueba de aptitud para la matemtica, administrado a 2000 aspirantes a


ingresar a una Universidad, se obtuvo una media de 5,9 puntos y un desvo de 1,6
puntos.

Calcular: a. el puntaje z que le corresponde a un alumno que obtuvo 7,5 puntos.


b. Qu nota de aptitud obtuvo un alumno al cual le corresponde un
puntaje z = -1,2?
c. Qu puntaje z le corresponde al 90% central del grupo?
d. Qu porcentaje de alumnos obtuvo entre 4,2 y 7,8 puntos?
e. Cuntos alumnos obtuvieron menos de 4 puntos?
f. Qu porcentaje de alumnos obtuvo una nota inferior al promedio?

Rta.: a. z = 1
b. x = 3,98

16
c. z1 = -1,64 y z2 = +1,64
d. 73,84%
e. 234 alumnos
f. 50%

8. Las puntuaciones de eficiencia de los empleados de una empresa se distribuye


normalmente con media igual a 400 puntos y un desvo estndar de 50 puntos.

Calcular: a. Cul es la probabilidad de que un empleado elegido al azar obtenga


una puntuacin por arriba del promedio.
b. Cul es la probabilidad de que un empleado tenga un puntuacin
entre 320 y 380?
c. Cul es la puntuacin mxima que corresponde al 25% de los
empleados que menor puntuacin obtienen?
d. Qu porcentaje de empleados obtuvo por arriba de los 500 puntos?

Rta.: a. 0.5 50%


b. 0,8904
c. 366,5 puntos
d. 2,28%

17
FRMULAS ESTADSTICAS

VARIABLES ALEATORIAS:

x
Normal estndar: z (24)

xx
Puntaje Z: z (25)
S

FRMULAS PARA TEST DE HIPTESIS

x
Normal: z= (26)
n

x
t- Student: t = (27)
S n

Chi-cuadrado: 2 = (fo - fe)2 (28)


fe

18
TABLA DE LA DISTRIBUCION NORMAL ESTANDARIZADA

Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,2 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,1 0,0179 0,0174 0,0170 0,0166 0,0160 0,0158 0,0154 0,0150 0,0146 0,0143
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,6 0,0548 0,0537 0,0526 0,5160 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0855 0,0869 0,0853 0,0838 0,0823
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1631 0,1611
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,7210 0,4681 0,4641
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
Universidad de Belgrano
Facultad: de Humanidades
Carrera: Licenciatura en Psicologa
Materia: Estadstica
Profesora: Mg. Diana Atar

Los siguiente matriz de datos corresponde a 35 registros tomados al azar, de las demandas de atencin
psicolgica en el ltimo bimestre, en un Centro de Salud de la ciudad, con el objeto de describir el perfil
del demandante.

Matriz de Datos de pacientes

Estado Nivel de Jefe de Relacin Cant. de Cant. de


Registro Sexo Edad civil educac. familia c/jefe flia. integrant menores

1 M 35 C P. C. S 5 3
2 M 42 C P. C. S 6 3
3 M 28 S S. I. N HIJO 6 2
4 F 20 S S. C. N HIJO 7 3
5 F 33 S Sin Inst. N HERM. 5 2
6 F 30 C S. C. N CNY. 4 2
7 F 40 C S. C. N CNY. 3 2
8 M 55 C P. C. S 8 4
9 F 50 V P. I N HERM. 7 2
10 M 30 C T. I. N YERNO 5
11 F 37 C S. C. N HERM. 5 2
12 M 42 C S. C. S 4 2
13 F 40 C T. I. N CNY. 5 2
14 M 35 S T. C. S 5 2
15 M 38 D Sin Inst. N HIJO 7 4
16 M 44 C P. I N HERM. 8 4
17 M 24 C T. I. N HIJO 5 1
18 M 28 S T. I. N HIJO 4
19 F 36 D P. C. S 4 2
20 F 23 S S. I. N HERM. 5 1
21 M 20 S P. I N HIJO 7 3
22 F 19 S S. C. N HIJO 5
23 F 35 D S. I. S 3 2
24 F 40 V P. C. S 4 1
25 M 26 C S. I. N YERNO 6 2
26 M 32 C P. C. N HERM. 5 2
27 M 42 C P. I S 7 3
28 F 30 C S. C. N HIJO 6 2
29 F 28 C P. C. N CNY. 8 4
30 F 24 S S. I. N HIJO 7 1
31 F 30 C S. C. N CNY. 4 2
32 F 36 D S. C. S 3 2
33 F 23 S S. I. N HERM. 6 2
34 M 52 C P. C. S 8 3
35 F 34 C P. C. N CNY. 7 4

Referencias:

Sexo: F: femenino
M: masculino

Estado Civil: C: casado/unido


S:soltero
D: divorc/separado
V: viudo
Nivel de Educac: P. I.: Primario Incompleto
P. C.: Primario Completo
S. I.: Secundario Incompleto
S. C.: Secundario Completo
T. I.: Terciario Incompleto
T. C.: Terciario Completo
Sin Inst.: Sin Instruccin

Jefe de Familia: S: s
N: no

Resolver
a. Cules son las variables consideradas. Clasificarlas e indicar el nivel de medicin.
b. Cul es la muestra, cul es la poblacin y cul es la unidad de anlisis
c. Para cada una de las variables, construir una distribucin de frecuencias segn su criterio.
d. Grafique cada distribucin, segn su criterio.
e. Cruce las variables sexo y estado civil. Luego cruce sexo y nivel de educacin.
f. Hallar todas las medidas de posicin para cada una de las variables, siempre que sea posible.
Primero con los datos sin agrupar; luego con los datos agrupados. Compare los resultados.
g. En relacin al punto anterior, calcule las medidas de variabilidad que considere adecuadas.
h Elabore un pequeo informe con los resultados obtenidos.

A continuacin se desarrolla todo el ejercicio, considerando solamente la submatriz femenina; es decir,


los registros correspondientes a las pacientes mujeres.
Queda sin resolver para la ejercitacin del alumno, la submatriz masculina y la matriz general.

Esta actividad sirve de autoevaluacin.


Mujeres (resuelto)

Estado Nivel de Jefe de Relacin Cant. de Cant. de


Registro Sexo Edad civil educac. familia c/jefe flia. integrant menores
4 F 20 S S. C. N HIJO 7 3
5 F 33 S Sin Inst. N HERM. 5 2
6 F 30 C S. C. N CNY. 4 2
7 F 40 C S. C. N CNY. 3 2
9 F 50 V P. I N HERM. 7 2
11 F 37 C S. C. N HERM. 5 2
13 F 40 C T. I. N CNY. 5 2
19 F 36 D P. C. S 4 2
20 F 23 S S. I. N HERM. 5 1
22 F 19 S S. C. N HIJO 5
23 F 35 D S. I. S 3 2
24 F 40 V P. C. S 4 1
28 F 30 C S. C. N HIJO 6 2
29 F 28 C P. C. N CNY. 8 4
30 F 24 S S. I. N HIJO 7 1
31 F 30 C S. C. N CNY. 4 2
32 F 36 D S. C. S 3 2
33 F 23 S S. I. N HERM. 6 2
35 F 34 C P. C. N CNY. 7 4

b. Cul es la muestra, cul es la poblacin y cul es la unidad de anlisis


La muestra est formada por 19 mujeres (54% del total de registros) de una poblacin de mujeres
demandantes de atencin psicolgica en un Centro de Salud de la ciudad.
La unidad de anlisis es cada mujer demandante de atencin psicolgica en el Centro de Salud.

c. y d. Para cada una de las variables, construir una distribucin segn su criterio. Grafique

Distribucin de mujeres por estado civil Grfico Circular

Estado Cant. de
civil mujeres % 10%
X f
C
C 8 42%
16% 42% S
S 6 32%
D
D 3 16%
32% V
V 2 10%
19 100%

Tambin puede graficarse con un grfico de barras simples.

Distribucin de mujeres segn sea o no jefe de familia

Jefe de cant. de
familia mujeres %
X f
NO 15 79%
SI 4 21%
19 100%
Distribucin de mujeres por nivel de educacin alcanzado

Nivel de Cant. de
Educac mujeres %
X f
P. I 1 5%
P. C. 4 21%
S. I. 4 21%
S. C. 8 42%
T. I. 1 5%
T. C. 0 0%
Sin Inst. 1 5%
19 100%

Distribucin de mujeres segn su relacin con el jefe de familia

relacin cant. de
c/jefe flia. mujeres %
X f
HIJO 4 27%
CONY. 6 40%
HERM. 5 33%
15 100%

Distribucin de mujeres segn cantidad de integrantes por familia

Cant. de cant. de
integrant. mujeres %
X f
3 3 16%
4 4 21%
5 5 26%
6 2 11%
7 4 21%
8 1 5%
19 100%

Distribucin de mujeres segn cantidad de menores por familia

Cant. de cant. de Grfico a bastones


menores mujeres %
X f
14
0 1 5%
12
1 3 16%
2 12 63% 10
frecuencia

3 1 5% 8
4 2 11% 6
19 100% 4
2
0
0 1 2 3 4
cantidad de menores
Distribucin de mujeres segn rango de edad

Alternativa 1 Alternativa 2
Rango cant. de Cant. de
etario mujeres % Rango etario mujeres %
X f X f
18-22 2 11% Menos de 20 1 5%
23-27 3 16% 20-29 5 26%
28-32 4 21% 30-39 9 47%
33-37 6 32% 40-49 3 16%
38-42 3 16% 50 y ms 1 5%
43-47 0 0% 19 100%
48-52 1 5%
19 100%

Se grafica con un histograma (grfico de barras adyacentes)

f. Hallar todas las medidas de posicin para cada una de las variables, siempre que sea posible.

Resuelto con datos no agrupados

Estado Jefe de Nivel Relacin Cant. Cant.


Edad Civil familia educat c/jefe Integr. Menores
n: 19 19 19 19 15 19 19
Media: 32 5,16 2
Mediana: 33 5 2
Modo: 30 Casado NO Sec. C Cony 5 2

Resuelto con datos agrupados

Todos los resultados son igujales, excepto para la variable Edad

Alternativa 1
Rango cant. de marca de Frec.
etario mujeres clase Acumul
X f X Xf F
18-22 2 20,5 41,0 2
23-27 3 25,5 76,5 5
28-32 4 30,5 122,0 9
33-37 6 35,5 213,0 15
38-42 3 40,5 121,5 18
43-47 0 45,5 0,0 18
48-52 1 50,5 50,5 19
19 624,5

Edad
n: 19
Media: 32,87
Mediana: 33,42
Modo: 33 - 37 intervalo modal
Otra posibilidad de clculo de la media aritmtica

Rango cant. de marca de Frec.


etario mujeres clase Acumul
X f X Xf F
18-22 2 20 40 2
23-27 3 25 75 5
28-32 4 30 120 9
33-37 6 35 210 15
38-42 3 40 120 18
43-47 0 45 0 18
48-52 1 50 50 19
19 615

Edad
n: 19
Media: 32,39
Mediana: 33,42
Modo: 33 - 37 intervalo modal

Es posible calcular la media en la alternativa 2? Justifique su respuesta

g. En relacin al punto anterior, calcule las medidas de variabilidad que considere adecuadas.

Resuelto con datos no agrupados

Estado Jefe de Nivel Relacin Cant. Cant.


Edad civil familia educat c/jefe Integr. Menores
Mnimo: 19 3 1
Mximo: 50 8 4
Rango: 31 5 3
Desviacin estndar: 8,01 1,54 0,83
Variancia: 64,11 2,36 0,69

Resuelto con datos agrupados


Todos los resultados son igujales, excepto para la variable Edad

Alternativa 1
Rango cant. de marca de
etario mujeres clase
X f X Xf X2 X2f
18-22 2 20,5 41,0 420,25 840,5
23-27 3 25,5 76,5 650,25 1950,75
28-32 4 30,5 122,0 930,25 3721
33-37 6 35,5 213,0 1260,25 7561,5
38-42 3 40,5 121,5 1640,25 4920,75
43-47 0 45,5 0,0 2070,25 0
48-52 1 50,5 50,5 2550,25 2550,25
19 624,5 21544,8

Edad
Mnimo: 19
Mximo: 50
Rango: 31
Desviacin estndar: 7,52
Variancia: 56,58
Hombres (para resolver)

Estado Nivel de Jefe de Relacin Cant. de Cant. de


Registro Sexo Edad civil educac. familia c/jefe flia. integrant menores
1 M 35 C P. C. S 5 3
2 M 42 C P. C. S 6 3
3 M 28 S S. I. N HIJO 6 2
8 M 55 C P. C. S 8 4
10 M 30 C T. I. N YERNO 5
12 M 42 C S. C. S 4 2
14 M 35 S T. C. S 5 2
15 M 38 D Sin Inst. N HIJO 7 4
16 M 44 C P. I N HERM. 8 4
17 M 24 C T. I. N HIJO 5 1
18 M 28 S T. I. N HIJO 4
21 M 20 S P. I N HIJO 7 3
25 M 26 C S. I. N YERNO 6 2
26 M 32 C P. C. N HERM. 5 2
27 M 42 C P. I S 7 3
34 M 52 C P. C. S 8 3
Universidad de Belgrano
Facultad: de Humanidades
Carrera: Licenciatura en Psicologa
Materia: Estadstica
Profesora: Mg. Diana Atar

Una consultora de Recursos Humanos organiza un curso terico-prctico de dos das consecutivos para
seleccionar personal de direccin de una empresa. Entre las actividades desarrolladas, los aspirantes
debieron realizar un test de motivacin antes y despus del curso.
A continuacin se presentan datos de los aspirantes a ingresar a la empresa.

Matriz de datos de los aspirantes

Nro. de Puntaje Puntaje


aspirante Edad Sexo Estado civil antes despus
1 38 M C 9 8
2 35 M C 8 8
3 42 M C 8 7
4 36 F S 7 7
5 46 F C 6 6
6 45 M C 7 7
7 40 F C 7 5
8 38 M S 7 6
9 35 F S 8 6
10 40 M S 6 5
11 42 M D 6 6
12 47 F C 9 8
13 40 M S 9 8
14 37 M C 6 6
15 44 F D 7 6

Referencias: Sexo M: masculino


F: femenino

Estado Civil C: casado


S: soltero
D: divorciado

Se pide que:
Mediante el agrupamiento de los datos, de acuerdo con su critero, de los grficos que considere adecuados,
y de las medidas descriptivas apropiadas, elabore una descripcin de los aspirantes.
(Se sugiere utilizar Excel para realizacin de los grficos)
UNIVERSIDAD DE BELGRANO
FACULTAD DE HUMANIDADES
CARRERA: LICENCIATURA EN PSICOLOGA
MATERIA: ESTADSTICA
PROFESORA: MG. DIANA ATAR

GLOSARIO ESTADSTICO

Amplitud de la Distancia entre el valor mayor y el valor menor de la variable.


distribucin:

Anlisis de correlacin: Conjunto de tcnicas utilizadas para medir la intensidad de la relacin


entre dos o ms variables.

Anlisis de regresin: Conjunto de tcnicas utilizadas para determinar la relacin entre dos
o ms variables.

Anlisis Descriptivo Ver Estadstica Descriptiva

Anlisis Inferencial Ver Estadstica Inferencial

Anlisis Multivariado Tipo de anlisis de datos, que estudia, interpreta y elabora el material
estadstico sobre la base de un conjunto de dos o ms variables, que
pueden ser de tipo cuantitativo, cualitativo o una mezcla de ambos.

Anlisis Univariado Tipo de anlisis que trata las variables por separado, sin establecer
relacin entre ellas.

Coeficiente de Medida que expresa el porcentaje de la variacin total de la variable


Determinacin: dependiente, que es explicada por la variacin de la variable
independiente.

Coeficiente de Medida de variabilidad. Es utilizada para expresar la dispersin


Variacin: relativa. Es el cociente entre el desvo estndar y la media aritmtica,
expresado en porcentaje.

Correlacin: Ver Anlisis de correlacin

Covariacin: Comportamiento ms o menos sincronizado entre dos o ms


variables.

Dato: Es el elemento bsico a partir del cual se elabora la informacin.


Tambin se lo denomina observacin.

Desviacin Estndar: Medida de variabilidad. Es la ms utilizada y se calcula como la raz


cuadrada positiva de la variancia. Ver Variancia

Diagrama de dispersin: Grfica de los pares ordenados (x,y), siendo stos los valores
observados de las variables X e Y.
Distribucin de Forma especfica de agrupamiento de los datos u observaciones. Ver
frecuencias: Frecuencia.

Ecuacin de regresin: Funcin matemtica que expresa la relacin entre dos o ms


variables.

Encuesta: Investigacin destinada a conocer caractersticas de una poblacin de


sujetos a travs de un conjunto de preguntas.

Estadstica: Conjunto de conceptos, mtodos y tcnicas que sirven para recolectar


datos, organizarlos, resumirlos, analizarlos e interpretarlos. Es la
ciencia que transforma los datos en informacin.

Estadstica Descriptiva: Mtodos estadsticos que se usan para organizar, resumir, presentar
datos, con el objetivo de describir el comportamiento de las variables
en estudio.

Estadstica Inferencial: Mtodos estadsticos que se utilizan para derivar a la poblacin, los
resultados obtenidos de una muestra.

Estadstico: Medida obtenida con los datos muestrales, que los resume.

Fractiles: Valores de variable por debajo de los cuales queda una determinada
fraccin de datos. Dentro de este conjunto estn: los percentiles,
deciles y cuartiles.

Frecuencia: Nmero de veces que se repite un valor o categora especfico de la


variable, dentro de una muestra o poblacin.

Grfico de barras: Representacin grfica de la distribucin de frecuencias, para la


variable cualitativa.

Histograma: Grfico de la distribucin de frecuencias, para la variable cuantitativa.

Intervalo de clase: Rango determinado de valores posibles de una variable. Est definido
por un lmite inferior y un lmite superior.

Marca de clase: Punto medio del intervalo de clase.

Media Aritmtica: Medida de tendencia central. Es la ms utilizada y se la calcula como


la suma de todos los valores de la variable dividida por el nmero total
de valores. Se la define como el promedio.

Mediana: Medida de posicin. Es la observacin (o valor de la variable) que se


ubica en el centro del conjunto de datos, ordenado de menor a mayor.

Medidas de Posicin: Expresan valores centrales o representativos del conjunto de


observaciones. Dentro de estas, se hallan las medidas de tendencia
central.
Medidas de Tendencia Expresan valores medios del conjunto de observaciones.
central:

Medidas de Variabilidad: Expresan el grado de concentracin o dispersin del conjunto de datos


con respecto a un valor medio. Tambin llamadas medidas de
dispersin.

Modelo lineal: Es aquel cuya expresin matemtica corresponde a una funcin lineal;
es decir, una recta.

Modelo no lineal: Es aquel cuya expresin matemtica corresponde a una funcin no


lineal; es decir, una curva.

Modo(a): Medida de posicin. Es el valor de la variable que aparece con mayor


frecuencia.

Mdulo: Diferencia entre los lmites superior e inferior del intervalo de clase.

Muestra: Subconjunto de una poblacin.

Nivel de Medicin de Tipo de medicin igual al nivel intervalar y que adems posee un cero
Razn: absoluto, esto es, el punto de la escala donde est ausente el atributo
medido.

Nivel de Medicin Tipo de medicin que clasifica a los elementos de una muestra o
Intervalar: poblacin de acuerdo con su magnitud en una relacin ordenada y
adems permite medir la distancia en unidades de intervalos iguales.

Nivel de Medicin Tipo de medicin donde los nmeros o letras asignados a los
Nominal: elementos de una muestra o poblacin sirven como rtulos para
identificar o clasificar.

Nivel de Medicin Tipo de medicin que clasifica a los elementos de una muestra o
Ordinal: poblacin de acuerdo con su magnitud en una relacin ordenada.
Permite establecer ranking, pero no medir las diferencias.

Parmetro: Medida poblacional que expresa una caracterstica particular de toda


la poblacin.

Poblacin: Conjunto de todos los datos u observaciones posibles de la variable


de inters.

Rango intercuartlico: Medida de variabilidad definida como la distancia entre el cuartil 3 y el


cuartil 1. Tambin se lo denomina desviacin cuartlica.

Regresin: Ver Anlisis de Regresin

Variabilidad: Ver Medidas de Variabilidad. Tambin llamadas medidas de


dispersin.

Variable: Caracterstica que vara y cuya variacin puede medirse.


Variable Cualitativa: Variable que expresa la presencia o ausencia de un atributo o
cualidad.

Variable Cuantitativa: Variable que se expresa numricamente y donde el nmero indica


cantidad.

Variable dependiente: Variable que se pretende explicar o pronosticar. Tambin llamada


variable explicada o respuesta.

Variable independiente: Variable que, se supone, influye sobre la variable dependiente.


Tambin llamada variable explicativa.

Variancia: Medida de variabilidad. Se calcula como el promedio de los desvos


cuadrticos con respecto a la media.
Facultad de Arquitectura
y Urbanismo
Arquitectura

Forma y
Comunicacin 1A

Ficha N 2
Ctedra:
Arq. Eduardo Garca Lettieri

Arq. Eduardo Garca Lettieri


Arq. Carlos Arrieta
Arq. Claudio Alberto Delbene
Arq. Raquel Arce
Arq. Roxana Di Risio
Arq. Juan Duarte
Lunes a viernes de 9 a 21 h.
Torre Universitaria, Zabala 1837, primer nivel inferior.
C1426DQG - CABA
Telfono: 4788-5400, internos 5002 y 2122.
Email: fasciculos@ub.edu.ar
www.ub.edu.ar

Вам также может понравиться