Академический Документы
Профессиональный Документы
Культура Документы
LICENCIATURA EN PEDAGOGIA
ESTADSTICA EDUCATIVA
CP y MA HUGO LEONEL CASTRO ROCA
INDICE
Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980, en Nuez,
Rafael, 2000) definen la estadstica como un valor resumido, calculado, como base en
una muestra de observaciones que generalmente, aunque no por necesidad, se considera
como una estimacin de parmetro de determinada poblacin; es decir, una funcin de
valores de muestra.
"La estadstica es una tcnica especial apta para el estudio cuantitativo de los fenmenos
de masa o colectivo, cuya mediacin requiere una sin nmero de observaciones de otros
fenmenos ms simples llamados individuales o particulares". (Gini, 1953.)
Murria R. Spiegel, (1991) dice: "La estadstica estudia los mtodos cientficos para
recoger, organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y
tomar decisiones razonables basadas en tal anlisis.
Poblacin
El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce
como tal. Una poblacin se precisa como un conjunto finito o infinito de personas u
objetos que presentan caractersticas comunes.
"Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca
de los cuales intentamos sacar conclusiones". Levin & Rubin (1996).
Ejemplo:
1
nmero de elementos, por ejemplo; el nmero de estudiante del Ncleo San Carlos de la
Universidad Nacional Experimental Simn Rodrguez.
Cuando la poblacin es muy grande, es obvio que la observacin de todos los elementos
se dificulte en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para
solucionar este inconveniente se utiliza una muestra estadstica.
Muestra
"Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla".
Murria R. Spiegel (1991).
"Una muestra debe ser definida en base de la poblacin determinada, y las conclusiones
que se obtengan de dicha muestra solo podrn referirse a la poblacin en referencia",
Cadenas (1974).
Ejemplo;
Los expertos en estadstica recogen datos de una muestra. Utilizan esta informacin
para hacer referencias sobre la poblacin que est representada por la muestra. En
consecuencia muestra y poblacin son conceptos relativos. Una poblacin es un todo y
una muestra es una fraccin o segmento de ese todo.
Muestreo
Esto no es ms que el procedimiento empleado para obtener una o ms muestras de una
poblacin; el muestreo es una tcnica que sirve para obtener una o ms muestras de
poblacin.
2
Al tomar varias muestras de una poblacin, las estadsticas que calculamos para cada
muestra no necesariamente seran iguales, y lo ms probable es que variaran de una
muestra a otra.
Ejemplo;
Consideremos como una poblacin a los estudiantes de educacin del Ncleo San
Carlos de la UNESR, determinando por lo menos dos caracteres ser estudiados en dicha
poblacin; Religin de los estudiantes, Sexo.
Tipos de muestreo
Existen dos mtodos para seleccionar muestras de poblaciones; el muestreo no aleatorio
o de juicio y el muestreo aleatorio o de probabilidad. En este ltimo todos los elementos
de la poblacin tienen la oportunidad de ser escogidos en la muestra. Una muestra
seleccionada por muestreo de juicio se basa en la experiencia de alguien con la
poblacin. Algunas veces una muestra de juicio se usa como gua o muestra tentativa
para decidir como tomar una muestra aleatoria ms adelante. Las muestras de juicio
evitan los anlisis estadsticos necesarios para hacer muestras de probabilidad.
Variables y Atributos
Las variables, tambin suelen ser llamados caracteres cuantitativos, son aquellos que
pueden ser expresados mediante nmeros. Son caracteres susceptibles de medicin.
Como por ejemplo, la estatura, el peso, el salario, la edad, etc.
Segn, Murray R. Spiegel, (1992) "una variable es un smbolo, tal como X, Y, Hx, que
puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado dominio
de la variable. Si la variable puede tomar solamente un valor, se llama constante."
Todos los elementos de la poblacin poseen los mismos tipos de caracteres, pero como
estos en general no suelen representarse con la misma intensidad, es obvio que las
variables toman distintos valores. Por lo tanto estos distintos nmeros o medidas que
toman los caracteres son los "valores de la variable". Todos ellos juntos constituyen una
variable.
Los atributos tambin llamados caracteres cualitativos, son aquellos que no son
susceptibles de medicin, es decir que no se pueden expresar mediante un nmero.
La forma de expresar los atributos es mediante palabras, por ejemplo; profesin, estado
civil, sexo, nacionalidad, etc. Puede notar que los atributos no se presentan en la misma
forma en todos los elementos. Estas distintas formas en que se presentan los atributos
reciben el nombre de "modalidades".
3
Ejemplo;
El estado civil de cada uno de los estudiantes del curso de estadsticas I, no se presenta
en la misma modalidad en todos.
Observacin directa
Es aquella donde se tienen un contacto directo con los elementos o caracteres en los
cuales se presenta el fenmeno que se pretende investigar, y los resultados obtenidos se
consideran datos estadsticos originales. Para Ernesto Rivas Gonzlez (1997)
"Investigacin directa, es aquella en que el investigador observa directamente los casos
o individuos en los cuales se produce el fenmeno, entrando en contacto con ellos; sus
resultados se consideran datos estadsticos originales, por esto se llama tambin a esta
investigacin primaria".
Observacin Indirecta
Es aquella donde la persona que investiga hace uso de datos estadsticos ya conocidos
en una investigacin anterior, o de datos observados por un tercero (persona o entidad).
Con el fin de deducir otros hechos o fenmenos.
Observacin continua
Como su nombre lo indica es aquella que se lleva acabo de un modo permanente.
4
Observacin peridica
Es aqulla que se lleva a cabo a travs de perodos de tiempo constantes. Estos perodos
de tiempos pueden ser semanas, trimestres, semestres, aos, etc. Lo que debemos
destacar es que los perodos de tiempo tomados como unidad deben tomarse constantes
en lo posible.
Observacin circunstancial
Es aquella que se efecta en forma ocasional o espordica, esta observacin hecha ms
por una necesidad momentnea, que de carcter regular o permanente.
Observacin Exhaustiva
Cuando la observacin es efectuada sobre la totalidad de los elementos de la poblacin
se habla de una observacin exhaustiva.
Observacin Parcial
Dados que las poblaciones en general son grandes, la observacin de todos sus
elementos se ve imposibilitada. La solucin para superar este inconveniente es observar
una parte de esta poblacin.
Observacin Mixta
En este tipo de observacin se combinan adecuadamente la observacin exhaustiva con
la observacin parcial. Por lo general, este tipo de observaciones se lleva a cabo de tal
manera que los caracteres que se consideran bsicos se observan exhaustivamente y los
otros mediante una muestra; o bien cuando la poblacin es muy grande, parte de ella se
observa parcialmente.
Censo
Se entiende por censo aquella numeracin que se efecta a todos y cada uno de los
caracteres componentes de una poblacin.
Para Levin & Rubin (1996) "Algunas veces es posible y prctico examinar a cada
persona o elemento de la poblacin que deseamos describir. A esto lo llamamos una
numeracin completa o censo. Utilizamos el muestre cuando no es posible contar o
medir todos los elementos de la poblacin.
5
Si es posible listar (o enumerar) y observar cada elemento de la poblacin, los censos se
utilizan rara vez porque a menudo su compilacin es bastante difcil, consume mucho
tiempo por lo que resulta demasiado costoso.
Encuesta
Se entiende por encuesta las observaciones realizadas por muestreo, es decir son
observaciones parciales.
Estadstica Descriptiva
Tienen por objeto fundamental describir y analizar las caractersticas de un conjunto de
datos, obtenindose de esa manera conclusiones sobre las caractersticas de dicho
conjunto y sobre las relaciones existentes con otras poblaciones, a fin de compararlas.
No obstante puede no solo referirse a la observacin de todos los elementos de una
poblacin (observacin exhaustiva) sino tambin a la descripcin de los elementos de
una muestra (observacin parcial).
Estadstica Inductiva:
Est fundamentada en los resultados obtenidos del anlisis de una muestra de poblacin,
con el fin de inducir o inferir el comportamiento o caracterstica de la poblacin, de
donde procede, por lo que recibe tambin el nombre de Inferencia estadstica.
6
En relacin a la estadstica descriptiva y la inferencial, Levin & Rubin (1996) citan los
siguientes ejemplos para ayudar a entender la diferencia entre las dos.
Los estadsticos se refieren a esta rama como inferencia estadstica, esta implica
generalizaciones y afirmaciones con respecto a la probabilidad de su validez.
Medicin
Existen diversas definiciones del trmino "medicin", pero estas dependen de los
diferentes puntos de vista que se puedan tener al abordar el problema de la
cuantificacin y el proceso mismo de la construccin de una escala o instrumento de
medicin.
7
II Niveles o Escalas de mediciones
Escala Nominal
La escala de medida nominal, puede considerarse la escala de nivel ms bajo, y consiste
en la asignacin, puramente arbitraria de nmeros o smbolos a cada una de las
diferentes categoras en las cuales podemos dividir el carcter que observamos, sin que
puedan establecerse relaciones entre dichas categoras, a no ser el de que cada elemento
pueda pertenecer a una y solo una de estas categoras.
Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma
sean equivalentes respecto del atributo o propiedad en estudio, despus de lo cual se
asignan nombres a tales clases, y el hecho de que a veces, en lugar de denominaciones,
se le atribuyan nmeros, puede ser una de las razones por las cuales se le conoce como
"medidas nominales".
Se ha de tener presente que los nmeros asignados a cada categora sirven nica y
exclusivamente para identificar la categora y no poseen propiedades cuantitativas.
Escala Ordinal
En caso de que puedan detectarse diversos grados de un atributo o propiedad de un
objeto, la medida ordinal es la indicada, puesto que entonces puede recurrirse a la
propiedad de "orden" de los nmeros asignndolo a los objetos en estudio de modo que,
si la cifra asignada al objeto A es mayor que la de B, puede inferirse que A posee un
mayor grado de atributo que B.
La asignacin de nmeros a las distintas categoras no puede ser completamente
arbitraria, debe hacerse atendiendo al orden existente entre stas.
Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo de
poder ordenar todas sus categoras, el clculo de las medidas estadsticas de posicin,
como por ejemplo la mediana.
Ejemplo:
Al asignar un nmero a los pacientes de una consulta mdica, segn el orden de llegada,
estamos llevando una escala ordinal, es decir que al primero en llegar ordinal, es decir
que al primeo en llegar le asignamos el n 1, al siguiente el n 2 y as sucesivamente, de
esta forma, cada nmero representar una categora en general, con un solo elemento y
se puede establecer relaciones entre ellas, ya que los nmeros asignados guardan la
misma relacin que el orden de llegada a la consulta.
8
Escalas de intervalos iguales
La escala de intervalos iguales, est caracterizada por una unidad de medida comn y
constante que asigna un nmero igual al nmero de unidades equivalentes a la de la
magnitud que posea el elemento observado. Es importante destacar que el punto cero en
las escalas de intervalos iguales es arbitrario, y no refleja en ningn momento ausencia
de la magnitud que estamos midiendo.
Esta escala, adems de poseer las caractersticas de la escala ordinal, encontramos que
la asignacin de los nmeros a los elemento es tan precisa que podemos determinar la
magnitud de los intervalos (distancia) entre todos los elementos de la escala. Sin lugar a
dudas, podemos decir que la escala de intervalos es la primera escala verdaderamente
cuantitativa y a los caracteres que posean esta escala de medida pueden calculrsele
todas las medidas estadsticas a excepcin del coeficiente de variacin.
Ejemplo:
El lapso transcurrido entre 1998-1999 es igual al que transcurri entre 2000-2001.
Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observ que hay familias que
no tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas
que tienen 3 hijos.
Las variables, tambin llamadas caracteres cuantitativos, son aquellas cuyas variaciones
son susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar
numricamente la magnitud de dichas variaciones. Por intuicin y por experiencia
sabemos que pueden distinguirse dos tipos de variables; las continuas y las discretas.
Las variables continuas se caracterizan por el hecho de que para todo para de valores
siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo
empleado para realizar un trabajo, etc.)
9
Una variable es continua, cuando puede tomar infinitos valores intermedios dentro de
dos valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura.
Las variables discretas sern aquellas que pueden tomar solo un nmero limitado de
valores separados y no continuos; son aquellas que solo toman un determinado nmeros
de valores, porque entre dos valores consecutivos no pueden tomar ningn otro; por
ejemplo el nmero de estudiantes de una clase es una variable discreta ya que solo
tomar los valores 1, 2, 3, 4... Ntese que no encontramos valor como 1,5 estudiantes.
Datos Estadsticos
Los datos estadsticos no son otra cosa que el producto de las observaciones efectuadas
en las personas y objetos en los cuales se produce el fenmeno que queremos estudiar.
Dicho en otras palabras, son los antecedentes (en cifras) necesarios para llegar al
conocimiento de un hecho o para reducir las consecuencias de este.
Los datos estadsticos se pueden encontrar de forma no ordenada, por lo que es muy
difcil en general, obtener conclusiones de los datos presentados de esta manera. Para
poder obtener una precisa y rpida informacin con propsitos de descripcin o anlisis,
estos deben organizarse de una manera sistemtica; es decir, se requiere que los datos
sean clasificados. Esta clasificacin u organizacin puede muy bien hacerse antes de la
recopilacin de los datos.
Ejemplo:
Si se quiere conocer las caractersticas de los estudiantes del Ncleo San Carlos de la
UNESR, que solicitan prstamo a la biblioteca de dicha Universidad, la recoleccin de
la informacin debe clasificar a cada estudiante sobre la base de: Carrera que estudia,
edad, semestre de estudios, etc. Vemos pues que la clasificacin marca la pauta de la
clase de datos que debe ser obtenido.
Datos Cualitativos: cuando los datos son cuantitativos, la diferencia entre ellos es de
clase y no de cantidad.
Ejemplo:
Si deseamos clasificar los estudiantes que cursan la materia de estadstica I por su
estado civil, observamos que pueden existir solteros, casados, divorciados, viudos.
Datos cuantitativos: cuando los valores de los datos representan diferentes magnitudes,
decimos que son datos cuantitativos.
Ejemplo:
Se clasifican los estudiantes del Ncleo San Carlos de la UNESR de acuerdo a sus
notas, observamos que los valores (nota) representan diferentes magnitudes.
10
Datos cronolgicos: cuando los valores de los datos varan en diferentes instantes o
perodos de tiempo, los datos son reconocidos como cronolgicos.
Ejemplo:
Al registrar los promedios de notas de los Alumnos del Ncleo San Carlos de la
UNESR en los diferentes semestres.
Datos geogrficos: cuando los datos estn referidos a una localidad geogrfica se dicen
que son datos geogrficos.
Ejemplo
El nmero de estudiantes de educacin superior en las distintas regiones del pas.
Fuentes secundarias: son las publicaciones y trabajos hechos por personas o entidades
que no han recolectado directamente la informacin.
Las fuentes primarias ms confiables, son las efectuadas por oficinas gubernamentales
encargadas de tal fin.
Cuando un investigador quiere obtener datos estadsticos relativo a un estudio que desea
efectuar, puede elegir entre una fuente primaria o en su defecto, una secundaria. O
recopilar los datos por s mismo. La posibilidad mencionada en ltimo trmino podr
deberse bien a la inexistencia de los datos o bien a que esto no se encuentran
discriminados en la forma requerida.
Ejemplo:
Si un investigador quiere conocer el nmero de alumnos repitientes en educacin media,
clasificados por ciclos, para los ltimos diez aos, el investigador puede usar una fuente
primaria, tal como la memoria y cuenta el Ministerio de Educacin cada ao.
11
III Estadstica descriptiva e inferencia estadstica.
Estadstica descriptiva
Inferencia Estadstica
El entrenador del equipo de bisbol al que nos referamos, necesita an ms
informacin, puesto que quisiera conocer la probabilidad de que un determinado
jugador bateara de hit o se robara una base .Desde luego, no slo necesita conocer
lo anterior en promedio sino que quisiera obtener esta informacin segn los equipos
contrarios y los jugadores que stos alinean. Estos ejemplos de las necesidades del
entrenador muestran ejemplos de la Estadstica Analtica .un concepto que determina
la observacin minuciosa y la recoleccin de datos as como en anlisis, la planeacin y
la toma de decisiones subsecuentes.
Distribucin De Frecuencias
Distribucin de frecuencias es como se denomina en estadstica a la agrupacin de
datos en categoras mutuamente excluyentes que indican el nmero de observaciones en
cada categora. Esto significa una de las cosas ms importantes de la matemtica, su
estadstica con la agrupacin de datos. La distribucin de frecuencias presenta las
observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase.
Tipos de variables
Los tipos de variables fundamentales, por lo menos para este tema, sern los siguientes:
12
Variable Cuantitativa Discretas: son aquellas cuyo conjunto de valores es a lo sumo
numerable. Sus valores pueden representarse siempre por X1, X2, , Xn.; y slo se
pueden asociar a un nmero entero, es decir, aquellas que por su naturaleza no admiten
un fraccionamiento de la unidad
Ejemplos:
Nmero de hijos en el hogar, Pginas de un libro
Variable Cuantitativa Continua: son aquellas que pueden tomar todos los valores de
un intervalo de nmeros reales, o sea que no se pueden expresar mediante un nmero
entero, es decir, aquellas que por su naturaleza admiten que entre dos valores cualquier
la variable puede tomar cualquier valor intermedio.
Ordenables: aquellas que sugieren una ordenacin, por ejemplo la graduacin militar,
el nivel de estudios, etc.
Escalas de medicin
Es una escala en que se establece un nmero determinado de clases o categoras de tal
modo que cada elemento de la poblacin pertenece a una y slo una clase.
Matemticamente se dice que se ha establecido una relacin de equivalencia entre los
elementos de la poblacin. Si slo existen dos clases se denomina escala dicotmica. La
nica operacin matemtica que se puede realizar con las clases de cualquier escala
nominal es determinar las cantidades de elementos que les corresponden determinar sus
frecuencias.
Por ejemplo:
Sexo: las clases son masculinas o femeninas.
Especialidad: las diferentes especialidades (carreras) del CRUSAM.
Nmero de cedula de identidad personal.
Escala Nominal
13
los elementos de la poblacin. Si slo existen dos clases se denomina escala dicotmica.
La nica operacin matemtica que se puede realizar con las clases de cualquier escala
nominal es determinar las cantidades de elementos que les corresponden determinar sus
frecuencias.
Por ejemplo:
Sexo: las clases son masculinas o femeninas.
Especialidad: las diferentes especialidades (carreras) del CRUSAM.
Nmero de cedula de identidad personal.
Temperatura de una persona: sanguneo, flemtico, melanclico, colrico.
Nmero de placa de automviles del pas.
Escala Ordinal
Corresponde a la Situacin 2. Es una escala nominal entre cuyas clases est definido un
orden, de modo que cualquiera que sean dos de ellas, una ser mayor o superior, en
algn sentido, que la otra.
Por ejemplo:
Evaluaciones en un examen: 5, 4, 3 y 2.
Escala de Intervalos
Corresponde a la situacin 3 y no es ms que una escala ordinal con una distancia, una
unidad de medida entre sus clases de modo tal que dado dos puntajes cualesquiera se
pueden saber cuan distante est uno del otro. La unidad de medida es arbitraria, pero
comn y el punto de inicio (cero) es tambin arbitrario.
Cuando se tiene una escala de intervalo se pueden realizar las operaciones de adicin y
sustraccin, pero no necesariamente la multiplicacin y divisin dentro de la escala.
Por ejemplo:
La temperatura del aire. (Caluroso, fresco, agradable, etc.)
Escala de Razones
En las escalas de razones es posible realizar todas las operaciones aritmticas con los
puntajes.
14
Por ejemplo:
Estatura de los alumnos: la estatura en metros es proporcional a la estatura en pulgadas.
Frecuencias
Cuando se rene gran cantidad de datos primarios es til distribuirlos en clases y
categoras y determinar las frecuencias de las clases, o sea, el nmero de elementos que
pertenecen a una clase. El ordenamiento tabular de los datos por clases conjuntamente
con las frecuencias de clases se denomina distribucin de frecuencias
Este valor N ser denominado como frecuencia total, mientras que la frecuencia de cada
dato recibir el nombre de frecuencia absoluta o simplemente frecuencia (fi). La
frecuencia absoluta nos habla del nmero de veces que un dato aparece en un colectivo,
ms ello no nos dice demasiado en orden al establecimiento de comparaciones sobre la
importancia de este dato. Para obtener una idea de la importancia que un dato posee en
el seno de un colectivo, puesto que no es suficiente concepto de frecuencia, se utiliza el
concepto frecuencia relativa, que se definir como: el coeficiente entre la frecuencia
absoluta del dato considerado y la frecuencia total (fr=fi/Xi).
Frecuencias absoluta acumulada: para poder calcular este tipo de frecuencias hay que
tener en cuenta que la variable estadstica ha de ser cuantitativa o cualitativa
Ordenables. En otro caso no tiene mucho sentido el clculo de esta frecuencia. La
frecuencia absoluta acumulada de un valor de la variable, es el nmero de veces que ha
aparecido en la muestra un valor menor o igual que el de la variable y lo
15
representaremos por fa, se puede acumular, en la tabla estadstica) en orden ascendente
(fa) o descendente (fa).
1) RANGO.
Es una medida de dispersin que se obtiene como la diferencia entre el nmero mayor y
el nmero menor de los datos.
R = N_max - N_min
Ejemplo.
Dados los nmeros: 5, 10, 12, 8, 13, 9, 15
R= 15- 5
2) AMPLITUD TOTAL.
3) LAS CLASES.
Estn formadas por dos extremos. El menor se llama lmite inferior el mayor se llama
lmite superior. Hay distintos tipos de clases.
Ej. Notas (20-26) Edades (20-26.5) Salarios (20-26.99)
4) EL NMERO DE CLASES.
La estadstica es una disciplina que nos ensea a organizar los datos recogidos para
poder analizar sus caractersticas y posteriormente inferir, a partir de las muestras
tomadas, las caractersticas de la poblacin investigada.
16
Los cuadros o tablas corresponden a arreglos sistemticos de los datos por filas y
columnas y son un buen complemento del texto en los informes.
El primer procedimiento estadstico consiste en tabular los datos segn el tipo de escala
de medicin utilizada. La tabulacin de los datos conlleva a representar la informacin a
travs de tablas que de forma general contiene las siguientes partes fundamentales:
Ttulo: es la descripcin que precede al cuadro, la cul deber estar redactada en forma
breve y clara, de tal manera que exprese su contenido, siguiendo el ordenamiento del
mismo. Es necesario abarcar las caractersticas: Qu, Dnde, Cmo y Cundo.
Histogramas de frecuencias
Un histograma es un grfico que sirve para representar una distribucin de frecuencias.
Este grfico est formado por un conjunto de rectngulos (caso de variables continuas)
que tienen como base un eje horizontal (generalmente el eje de las abscisas o de las X),
y como centro los puntos medios de las clases. Los anchos de las clases y las reas de
los rectngulos son proporcionales a las frecuencias de las clases. En el caso de las
variables discretas el grfico consiste de un conjunto de barras verticales en lugar de
rectngulos, hallndose cada barra sobre la observacin respectiva y con una altura
proporcional a la frecuencia de la observacin
17
Polgono de frecuencias
El polgono de frecuencias es un grfico formado por lneas quebradas, que tiene los
centros de las clases representadas en un eje horizontal (eje de las X) y las frecuencias
de las clases en un eje vertical (eje de las Y). La frecuencia correspondiente a cada
centro de clase se seala mediante un punto y luego los puntos consecutivos se unen por
lneas rectas. Del correspondiente histograma se puede lograr el polgono de frecuencia
uniendo los puntos medios de las bases superiores de cada rectngulo mediante lneas
rectas.
18
Ojivas
Las ojivas se refieren a los grficos que se construyen utilizando una distribucin
acumulativa de frecuencias, el orden de acumulacin se aplica al cuadro de distribucin
de frecuencia y puede ser descendente (fa, fra) o ascendente (fa, fra). La figura que
se forma al unir los puntos del polgono de frecuencias acumulativas es lo contrario del
orden anunciado (por ejemplo si se utiliz el orden descendente en la acumulacin de
los datos en el cuadro, la ojiva resulta ser ascendente.
19
III.5 Casos Prcticos:
(Resolver y entregar en grupos de tres estudiantes, equivalen a nota de un parcial)
Problema #1: Variable Continua.
En la siguiente tabla se presentan los pesos de 40 estudiantes de la Universidad de
Panam, con una aproximacin de una libra.
14 2 3 5 3 53 3 5
11 2 1 4 1 21 4 1
21 1 2 1 2 32 3 3
31 3 4 1 1 35 4 2
25 1 4 2 3 12 5 1
Problema #3:
808 641 628 731 641 446 342 545 910 568
335 459 727 848 229 347 309 649 575 757
20
La compaa piensa que una tienda realmente no puede esperar alcanzar
financieramente el punto de equilibrio con menos de 456 servicios prestados
mensualmente. Adems su poltica es dar un bono financiero al gerente que genere
ms de 683 servicios al mes. Disponga los datos en un arreglo e indique cuntas
sucursales no estn consiguiendo el punto de equilibrio y cuntas ganan el bono.
Problema #4:
Una agencia de viajes ofrece precios especiales en ciertas travesas por el Caribe.
Planea ofrecer varios de estos paseos durante la prxima temporada invernal en el
hemisferio norte y desea enviar folletos a posibles clientes. A fin de obtener el
mayor provecho por cada unidad monetaria gastada en publicidad, necesita la
distribucin de las edades de los pasajeros de travesas anteriores. Se consider
que si participaban pocas personas de un grupo de edad en los paseos no sera
econmico enviar un gran nmero de folletos a personas de ese grupo de edad. La
agencia seleccion una muestra de 40 clientes anteriores de sus archivos y se
registr sus edades, como sigue:
77 18 63 84 38 54 50 59
54 56 36 50 50 34 44 41
58 58 53 62 62 43 52 53
63 62 62 61 61 52 60 60
45 66 83 63 63 58 61 71
21
IV.- Medidas De Tendencia Central
Antes de pasar a este captulo debemos de tener claro que es la desviacin estndar;
Desviacin Estndar
La desviacin estndar o desviacin tpica es una medida de centralizacin o dispersin
para variables de razn (ratio o cociente) y de intervalo, de gran utilidad en la estadstica
descriptiva. Junto a la varianza -con la que est estrechamente relacionada-, es una
medida (cuadrtica) que informa de la media de distancias que tienen los datos respecto
de su media aritmtica, expresada en las mismas unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer tambin la desviacin que representan
los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con
objeto de tener una visin de los mismos ms acorde con la realidad a la hora de
describirlos e interpretarlos para la toma de decisiones.
2. Ahora, por cada nmero resta la media y eleva el resultado al cuadrado (la diferencia
elevada al cuadrado).
Ejemplo
22
Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Calcula la media, la varianza y la desviacin estndar.
Respuesta:
600 + 470 + 170 + 430 + 300 1970
Media = = = 394
5 5
As que la altura media es 394 mm. Vamos a dibujar esto en el grfico: Ahora
calculamos la diferencia de cada altura con la media:
Para calcular la varianza, toma cada diferencia, elvala al cuadrado, y haz la media:
2
2062 + 762 + (-224)2 + 362 + (-94)2 108,520
Varianza: = = = 21,704
5 5
As que la varianza es 21,704.
23
As lo bueno de la desviacin estndar es que es til: ahora veremos qu alturas estn a
distancia menos de la desviacin estndar (147mm) de la media:
La Moda
Para obtener la moda, simplemente buscamos el puntaje o categora que ocurre ms
frecuentemente en una distribucin, La moda puede encontrarse fcilmente por
inspeccin ms que por clculo.
2 2
6 3
5 4
Mo 4 5
3 4
2 3
1 2
Total 23
24
La Mediana
Cuando los puntajes ordinales o por intervalos, se organizan por orden de tamao,
resulta posible localizar la mediana (mdn), el punto ms cercano al medio en una
distribucin. Por lo tanto, se considera la mediana como la medida de tendencia central
que corta la distribucin en dos partes iguales.
Si tenemos un nmero impar de casos, entonces la mediana ser el caso que cae
exactamente en la mitad de la distribucin. La posicin del valor de la mediana puede
localizarse por inspeccin o por formula.
Posicin de la mediana= N+ 1 /2
3 4 9
2 3 5
1 2 2
Total 23
25
La Media
X = ZX / N
Donde
x= X X
Donde
26
TABLA 4.4. X x
Desviaciones de un
Conjunto de puntajes no 9 +3 +5
Procesados 8 +2
6 0 X= 6
4 - 2 -5
3 -3
Como se indica en la Tabla 4.4. este resulta ser el caso ,ya que la suma de las
desviaciones por debajo de X(-5) es igual a la suma de las desviaciones por encima de
X(+5)
X= Zfx/N
En que
X= la media
X = el valor de un puntaje no procesado en la distribucin
FX= un puntaje multiplicado por su frecuencia de ocurrencia
ZfX= la suma de los FXs
N= el nmero total de puntajes
27
TABLA 4.5. X f fX
Tabla de frecuencia
Simple 8 2 16
7 3 21
6 5 30
5 6 30 X= ZfX/N
4 4 16 = 132/28
3 4 12 = 4.71
2 3 6
1 1 1
N= 28 ZfX = 132
1. El nivel de medicin.
2. La forma de distribucin de sus puntajes, y
3. el objetivo de la investigacin
Nivel de medicin
Como la moda requiere slo de un conteo de frecuencia, puede aplicarse a cualquier
conjunto de datos en el nivel de medicin nominal, ordinal o por intervalos .por
ejemplo, podramos determinar que la categora modal en una medicin de nivel
nominal de afiliaciones religiosas (protestante, catlica y juda) es protestante, ya
que el mayor numero de nuestros entrevistados se identifican como tales. Del mismo
modo, podramos saber que el mayor numero de estudiantes que asisten a una
universidad privada tiene un promedio de 2.5 (Mo = 2.5).
28
Inapropiado calcular una media para datos que pueden categorizarse pero no
puntuarse.
Forma de distribucin
La forma de un a distribucin es otro factor que puede influir en la eleccin de la
medida de tendencia central que haga el investigador .En una distribucin unimodal
perfectamente simtrica, la moda, la mediana y la media sern idnticas, ya que el
punto de mxima frecuencia (Mo) es tambin el puntaje ms cercano a la mediana
(Mdn), as como el centro de gravedad (X). Como se muestra en la figura
4.2, las medidas de tendencia central coincidirn en el punto ms central, en el pico
de la distribucin simtrica.
FIGURA 4.2. Una distribucin Simtrica, unimodal, que demuestra que la moda, la
mediana y la Media asumen valores idnticos
Mientras que la media est muy influida por los puntajes extremos en ambas
direcciones, los cambios en los valores extremos modifican poco o nada la mediana.
Esto se debe a que la media considera todos los puntajes en una distribucin. Mientras
que, por definicin, la mediana se entiende solo con el valor numrico de puntaje que
cae en la posicin mas cercana al medio de la distribucin .Como se ilustra mas
adelante, el cambio del valor de un puntaje extremo de 10, en la distribucin A, a 95 en
la distribucin B no modifica en absoluto el valor de la mediana (Mdn = 7.5), en tanto
que la media varia de 7.63 a 18.25:
29
En una distribucin sesgada, la mediana cae siempre en algn punto entre la media y
la moda. Es esta caracterstica la que convierte a la mediana en la medida de tendencia
central ms deseable para describir una distribucin de puntajes sesgada. Para ilustrar
esta ventaja de la mediana volvamos a la tabla 4.6. Y examinemos el salario anual
promedio entre los empleados de una pequea corporacin.
30
A cada entrevistado se le pregunt: suponga que usted puede decidir exactamente que
tan grande debe ser su familia Cuantas personas le gustara ver en su familia ideal,
incluyendo a todos los nios y adultos? Como se muestra en la Tabla 4.7.
Los resultados de este estudio indicaron una amplia gama de preferencias en cuanto al
tamao de la familia, desde vivir solo( 1) hasta vivir con muchas personas (10) Usando
la media o la mediana, podramos concluir que la familia ideal de los entrevistados
constaba de seis miembros (X = 5.58, Mdn = 6=).Sin embargo, sabiendo que la
distribucin es bimodal, vemos que estaban representadas, en realidad, dos
concepciones ideales sobre el tamao de la familia dentro del grupo de entrevistados:
una con nmero bastante grande de personas (Mo = 8) , y la otra con solo una cuan tas
personas (Mo.= 3).
El objetivo de la Investigacin
Hasta este punto, hemos estudiado la eleccin de una medida de tendencia central en
trminos del nivel de medicin y de la forma de una distribucin de los puntajes.
Preguntamos ahora: Qu espera hacer el investigador social con su medida de
tendencia central? Si busca una medicin rpida, sencilla, pero crudamente descriptiva
o si esta trabajando con una distribucin bimodal, empleara generalmente la moda.
Sin embargo, en la mayora de las situaciones que enfrenta el investigador, la moda
solo tiene utilidad como un indicador preliminar de la tendencia central que puede
obtenerse rpidamente mediante una breve exploracin de los puntajes. Si busca una
medicin precisa de la tendencia central, La decisin esta generalmente entre la
mediana y la media.
Para una medida precisa de las distribuciones simtricas se tiende a preferir la media
sobre la mediana, ya que la media puede usarse fcilmente en el anlisis estadstico
ms avanzado, como el que se introduce en los captulos subsiguientes del texto. Es
ms, la media es ms estable que la mediana, ya que vara menos a travs de las
distintas muestras tomadas de cualquier poblacin dada. Esta ventaja de la media-
aunque quizs no haya sido entendido o apreciada por el estudiante se har mas
manifiesta en el subsiguiente estudio de la funcin de toma de decisiones de la
estadstica.
31
TABLA 4.7. Concepciones Tamao ideal de la familia f
Ideales sobre el tamao de
La familia entre 26 entre 10 1
Visitados de bajos ingresos: 9 2
Una distribucin bimodal. 8 6
7 3
6 2
5 1
4 2
3 6
2 2
1 1
N= 26
Intervalos De Confianza
Se llama intervalo de confianza en estadstica a un par de nmeros entre los cuales se
estima que estar cierto valor desconocido con una determinada probabilidad de
acierto. Formalmente, estos nmeros determinan un intervalo, que se calcula a partir de
datos de una muestra, y el valor desconocido es un parmetro poblacional. La
probabilidad de xito en la estimacin se representa por 1 - y se denomina nivel de
confianza. En estas circunstancias, es el llamado error aleatorio o nivel de
significacin, esto es, una medida de las posibilidades de fallar en la estimacin
mediante tal intervalo.[1]
32
En un estudio Caso-Control o uno de Cohorte, es posible (y frecuentemente deseable)
construir intervalos de confianza para Odds Ratios y Riesgos Relativos.
En una distribucin Z ~ N(0, 1) puede calcularse fcilmente un intervalo dentro del cual
"caigan" un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y
z2 tales que P[z1 z z1] = 1 - , donde (1 - )100 es el porcentaje deseado (vase el
uso de las tablas en una distribucin normal).
33
Dicho punto es el nmero tal que:
34
Intervalo de confianza para una proporcin
El intervalo de confianza para estimar una proporcin p, conocida una proporcin
muestral pn de una muestra de tamao n, a un nivel de confianza del (1-)100% es:
Casos Prcticos.
X = X
N
2. Determine el salario medio por hora pagado a carpinteros que obtuvieron los
siguiente pagos de salario por hora (en dlares)
15.40,20.10,18.75,22.76,30.67,18.00, respectivamente.
MEDIA PONDERADA
Xw = (W *
X)
w
35
3. Un establecimiento vende refrescos de cola de tres tamaos: pequeo, mediano
y grande. El pequeo cuesta $0.50 (dlares); el mediano, $0.75; y el grande $1.00.
X = Fx
N
70 fx 3275
36
MEDIANA CON DATOS AGRUPADOS
N - AF
2
MEDIANA = L + (i)
f
DONDE:
7. Calcular la mediana con los datos del ejercicio anterior y cul es el valor
modal?
20-29 7 7
30-39 12 19
40-49 21 40
50-59 18 58
60-69 12 70
37
V.- MUESTRAS Y POBLACIONES
Concepto de muestreo.
Terminologa:
Hasta este punto, hemos estado suponiendo que el investigador social investiga la
totalidad del grupo que intenta comprender. Este grupo conocido como poblacin o
universo, consiste en un conjunto de individuos que comparten por lo menos una
caracterstica, sea una ciudadana comn, la calidad de ser miembros de una
asociacin voluntaria o de una raza, la matricula de una misma universidad o similares.
38
descubrir que una pequea muestra de nuestros compaeros ha ganado dinero de una
manera similar.
Mtodos De Muestreo
Los mtodos de muestreo del investigador social son generalmente ms cuidadosos y
sistemticos que los de la vida diaria .Su preocupacin central es asegurarse de que los
miembros de su muestra sean lo suficientemente representativos de la poblacin entera
como para permitir hacer generalizaciones precisas acerca de ella. Para hacer tales
inferencias, el investigador escoge un mtodo de muestreo apropiado para ver si todos
y cada uno de los miembros de la muestra tiene igual oportunidad de ser integrados en
ella. Si a cada miembro de la poblacin se le da igual oportunidad de ser escogido para
la muestra, se est utilizando un mtodo aleatorio; de no ser as el mtodo empleado
viene a ser no aleatorio.
Muestras no aleatorias
El mtodo de muestreo no aleatorio ms usual es le muestreo por accidente y es el que
menos difiere con nuestros procedimientos diarios de muestreo, ya que se basa
exclusivamente en lo que es conveniente para el investigador. Es decir, el investigador
simplemente incluye los casos ms convenientes en su muestra y excluye de ella los
casos inconvenientes.
Muestras aleatorias
Como se anot anteriormente, el muestreo aleatorio le da a todos y cada uno de los
miembros de la poblacin igual oportunidad de ser seleccionados para la muestra. Esta
caracterstica del muestreo aleatorio indica que cada miembro de la poblacin debe ser
identificado antes de obtener dicha muestra aleatoria, requisito que generalmente se
llena obteniendo una lista que incluye a todos y cada uno de los miembros de la
poblacin.
Una tabla de nmeros aleatorios se construye en forma tal que genere series de
nmeros sin ningn patrn u orden determinado. Como resultado, el proceso de usar
una tabla de nmeros aleatorios produce una muestra imparcial semejante a aqulla que
se logra poniendo pedazos de papel en un sombrero y sacando nombres con los ojos
vendados.
Muestreo probabilstico
El mtodo otorga una probabilidad conocida de integrar la muestra a cada elemento de
la poblacin, y dicha probabilidad no es nula para ningn elemento.
39
(En algunas circunstancias los mtodos estadsticos y epidemiolgicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabilstica, por ejemplo los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la poblacin.)
Sistemtico
Conseguir un listado de los N elem entos de la Fcil de aplicar. Si la constante de muestreo est
poblacin asociada con el fenmeno de inters,
No siempre es necesario tener un listado de las estimaciones obtenidas a partir de
Determinar tam ao muestral n. toda la poblacin. la muestra pueden contener sesgo de
seleccin
Definir un intervalo k=N/n. Cuando la poblacin est ordenada
siguiendo una tendencia conocida, asegura
Elegir un nmero aleatorio, r, entre 1 y k una cobertura de unidades de todos los
(r=arranque aleatorio). tipos.
Conglomerad
os Se realizan varias fases de muestreo sucesivas Es muy eficiente cuando la poblacin es El error estndar es mayor que en el
(polietpico) muy grande y dispersa. muestreo aleatorio simple o
estratificado.
La necesidad de listados de las unidades de una No es preciso tener un listado de toda la
etapa se limita a aquellas unidades de muestreo poblacin, slo de las unidades prim arias de El clculo del error estndar es
seleccionadas en la etapa anterior. muestreo. complejo.
40
Clculo del tamao muestral
Cada estudio tiene un tamao muestral idneo, que permite comprobar lo que se
pretende con la seguridad y precisin fijadas por el investigador.
Variabilidad del parmetro a estimar: Datos previos, estudios piloto o usar 50%
como peor estimacin
Precisin: Amplitud del intervalo de confianza. Si se estima prevalencia su formato
ser %
Nivel de confianza (1-a): habitualmente 95% o 99%. Probabilidad complementaria
al error admitido a
Muestreo Estratificado
Para obtener una muestra aleatoria estratificada, primero se divide la poblacin en
grupos, llamados estratos, que son ms homogneos que la poblacin como un todo.
Los elementos de la muestra son entonces seleccionados al azar o por un mtodo
sistemtico de cada estrato. Las estimaciones de la poblacin, basadas en la muestra
estratificada, usualmente tienen mayor precisin (o menor error muestral) que si la
poblacin entera muestreada mediante muestreo aleatorio simple. El nmero de
elementos seleccionado de cada estrato puede ser proporcional o desproporcional al
tamao del estrato en relacin con la poblacin.
Error De Muestreo
A travs del resto del texto seremos cuidadosos en distinguir entre las caractersticas de
las muestras que estudiamos realmente y las poblaciones a las cuales esperamos
generalizar. Para hacer esta distincin, en nuestros procedimientos estadsticos, no
podemos, por tanto, seguir usando los mismos smbolos para representar la media y la
desviacin estndar tanto de la muestra como de la poblacin.
41
brevemente en el Captulo 1, siempre podemos esperar, por mera casualidad, que haya
alguna diferencia entre una muestra, aleatoria o de otro tipo, y la poblacin de la que se
ha extrado. X casi nunca ser exactamente igual a o. Esta diferencia, conocida como
error de muestreo, resulta sin importar qu tan bien se haya diseado y realizado el plan
de muestreo con las mejores intenciones del investigador y donde no ocurre ningn
fraude ni se han cometido errores.
Significa que nuestro investigador social es levemente excntrico y tiene una notable
inclinacin a extraer muestras de poblaciones. Es tan intenso su entusiasmo por el
muestreo que contina extrayendo muchas muestras adicionales de 500 residentes
cada una y calculando el tiempo de audicin de radio de los miembros de cada muestra.
Este procedimiento contina hasta que nuestro excntrico investigador ha extrado 98
muestras de 500 residentes cada una. En el proceso de extraer 98 muestras aleatorias
estudia, de hecho a 49000 entrevistados (500 x 98= 49000).
Supongamos que las muestras tomadas por nuestro excntrico investigador social
producen medias que van desde 89 hasta 111 minutos. De acuerdo con nuestro estudio
previo, esto podra suceder fcilmente, simplemente con base en el error de muestreo.
Intervalos De Confianza
Para explorar el procedimiento que se sigue para encontrar un intervalo de confianza,
ampliemos un ejemplo anterior. Supongamos que la muestra aleatoria (de un
investigador) de 100 exalumnos de cierta universidad marca un ingreso anual medio de
$14,000.Como sus datos provienen solamente de una muestra aleatoria, y no de la
poblacin total de exalumnos, no podemos estar seguros de que el ingreso medio
reportado sea realmente un reflejo de esta poblacin de exalumnos universitarios. Como
ya hemos visto, el error de muestreo es, despus de todo, el producto inevitable de sacar
muestras de poblaciones.
42
Casos Prcticos
I.- Una cadena de tiendas de artculos para deportes, que busca especializarse en
servicios para esquiadores principiantes, planea efectuar un estudio acerca de cunto
gasta una persona esquiadora principiante en la compra inicial de equipo y suministros.
Con base a estas cifras, desea explorar las posibilidades de ofrecer combinaciones
como un par de botas o un par de esqus- a fin de inducir a los clientes a comprar ms.
Una muestra de sus ingresos registrados de compras al contado indic las siguientes
compras iniciales.
a) Desarrollar un intervalo de clase a seguir. Utilice cinco clases. Sea $80 (dlares)
l lmite inferior de la primera clase.
Peso en Nmero de
onzas mazorcas
16 - 17 12
18 - 19 36
20 - 21 14
22 - 23 8
24 - 25 4
26 - 27 1
43
a) Presente los pesos en un histograma.
b) Presente los pesos en un polgono de frecuencia.
c) Con base en los diagramas, interprete la distribucin de los pesos.
III.- Una encuesta reciente mostr que el propietario tpico de auto en Estados Unidos
destina $ 2 950 (dlares) al ao en gastos de operacin. A continuacin se muestra una
clasificacin de los diversos conceptos de gastos. Trace un diagrama apropiado para
presentar datos.
a) Coloque los datos en una distribucin de frecuencias usando 100 (dlares) como
intervalo de clase, y 0 como el punto partida.
b) Trace un polgono de frecuencias acumuladas menos de.
c) El banco considera como cliente preferido a un estudiante con un saldo final
de $400 dlares o ms en su cuenta. Estime el porcentaje de clientes preferidos.
d) Ese banco tambin est considerando un cargo por servicio al 10% ms bajo de
los saldos finales. Qu recomendara usted como un punto de corte entre los
que tienen que pagar un cargo por servicio y los que no estn en tal caso?
44
BIBLIOGRAFA.
45