Вы находитесь на странице: 1из 25

DEFINICIN DEESTADSTICA

El termino estadstica proviene del latn statisticum collegium (consejo de


Estado) y de su derivado italiano statista (hombre de Estado o poltico).
En 1749, el alemn Gottfried Achenwall comenz a utilizar la palabra
alemana statistik para designar el anlisis de datos estatales. Por lo tanto, los
orgenes de la estadstica estn relacionados con el gobierno y sus cuerpos
administrativos.

Hoy puede decirse que la recopilacin y la interpretacin de los


datos obtenidos en un estudio es tarea de la estadstica, considerada como una
rama de la matemtica. Las estadsticas (el resultado de la aplicacin de un
algoritmo estadstico a un grupo de datos) permiten la toma de decisiones
dentro del mbito gubernamental, pero tambin en el mundo de los negocios y
el comercio.

Adems de todo lo expuesto hemos de dejar patente que para que esta rama
de las Matemticas tenga lugar y desarrolle sus trabajos deben contar con una
serie de instrumentos que se han convertido en fundamentales. En concreto,
nos referimos a los llamados niveles de medicin (intervalo, nominal, razn y
ordinal), los estudios observacionales y tambin las tcnicas de anlisis
estadstico.

En este ltimo grupo de herramientas habra que incluir algunas tan conocidas
e importantes como la frecuencia estadstica, el anlisis de varianza, la grfica
estadstica, el anlisis de regresin, la prueba t de Student o el anlisis factorial
confirmatorio.

La estadstica aplicada puede ser dividida en dos ramas: la estadstica


descriptiva (refiere a los mtodos de recoleccin, descripcin, visualizacin y
resumen de los datos, que pueden ser presentados en forma numrica o
grfica) y la inferencia estadstica (la generacin de los modelos y predicciones
relacionadas a los fenmenos estudiados, teniendo en cuenta el aspecto
aleatorio y la incertidumbre en las observaciones).

Adems de la estadstica aplicada, tambin existe una disciplina


denominada estadstica matemtica, que abarca las bases tericas de la
materia.

Estadstica descriptiva. Realiza el estudio sobre la poblacin completa,


observando una caracterstica de la misma y calculando unos parmetros que
den informacin global de toda la poblacin.
Estadstica inferencial. Realiza el estudio descriptivo sobre un subconjunto de la
poblacin llamado muestra y, posteriormente, extiende los resultados
obtenidos a toda la poblacin.

Veamos dos ejemplos que nos aclaren estos dos tipos de Estadstica:

Ejemplo 1. Cuando van a llegar cualquier tipo de elecciones, por ejemplo, las
elecciones generales, es muy frecuente que los medios de comunicacin, nos
adelanten los resultados de encuestas o sondeos en los que se nos indica el
resultado final de dichas elecciones con una precisin y con un error
determinados. Estos sondeos son realizados por distintas tcnicas sobre un
grupo (muestra) ms o menos numeroso de personas. Naturalmente, cunto
mayor sea el nmero de espaoles con derecho a voto encuestados, mayor
ser la fiabilidad de la encuesta, pero tambin mayor ser el coste del sondeo.
El estudio de esta muestra se hara mediante estadstica descriptiva, pero lo
que nos interesa no es el resultado de este estudio reducido sino el resultado
final de las elecciones. El paso de generalizar los resultados de la muestra a
toda la poblacin, se hace mediante tcnicas de Estadstica inferencial. La
eleccin de la muestra debe hacerse mediante mtodos de muestreo para que
el estudio resulte lo ms fiable posible.

Ejemplo 2. Supongamos que estamos en un instituto con un nmero muy


elevado de alumnos y alumnas, por ejemplo 500, y queremos hacer un estudio
estadstico sobre su altura.

Un mtodo sera pasar clase por clase y medirlos a todos, esto nos podra
llevar un tiempo considerable pero sera la forma ms exacta de hacer dicho
estudio, aunque es fcil encontrarnos con ausencias y tendramos que volver
varios das y pasar lista para conseguir la estatura de todo el alumnado. Una
vez que tengamos todos los datos en nuestro poder los resultados los
obtendramos mediante Estadstica descriptiva.

Otra posibilidad podra ser pasar clase por clase, decirle a los alumnos y
alumnas que anoten su estatura en un papel y recogerlos todos. Tambin as
tendramos un estudio de Estadstica descriptiva, aunque seguramente menos
fiable que con el mtodo anterior, pues casi con toda seguridad, y lo digo por
experiencia, algunos alumnos escriban su estatura a clculo y otros, con ganas
de bromas, muy por encima o muy por debajo de la realidad.

Y otra posibilidad sera escoger una muestra, es decir un grupo de por ejemplo
50 personas, hacer el estudio descriptivo sobre ellas y despus generalizarlo a
todo el instituto con Estadstica inferencial. En este caso, comprobaramos por
una parte que cunto mayor sea la muestra ms trabajo tendremos, pero ms
fiable ser el resultado final y por otra, que la eleccin de la muestra debe
hacerse de manera que permita tambin fiarnos del resultado obtenido. Si
estamos en segundo de bachillerato, podramos coger como muestra los 50
alumnos de este curso? Por qu? Qu forma de elegir la muestra se te
ocurre?

En cualquiera de los dos ejemplos, cules seran los resultados ms fiables?

Conceptos bsicos. Ya hemos hablado de ellos en los ejemplos anteriores, en


cualquier estudio estadstico aparecern los conceptos: individuo, cada uno de
los elementos, personas u objetos que se van a estudiar; poblacin, que es el
conjunto formado por todos los elementos a los que les vamos a hacer el
estudio; muestra, el subconjunto de la poblacin que elegimos para hacer mas
reducido

Muestra estadstica

En estadstica, una muestra es un subconjunto de casos o individuos de


una poblacin estadstica. En diversas aplicaciones interesa que una muestra
sea una muestra representativa y para ello debe escogerse una tcnica de
muestreo adecuada que produzca una muestra aleatoria adecuada
(contrariamente se obtiene una muestra sesgada cuyo inters y utilidad es ms
limitado dependiendo del grado de sesgo que presente). La muestra es por lo
tanto el grupo al que se le aplican las pruebas.

ndice

[ocultar]

1Introduccin

2Otras definiciones relacionadas

2.1Espacio muestral

2.2Parmetro o Estadstico muestral

2.3Estimacin

2.4Nivel de confianza

2.5Ejemplo

3Ventajas de la eleccin de una muestra

4Descripcin matemtica de una muestra aleatoria

5Referencias

Introduccin[editar]
Las muestras se obtienen con la intencin de inferir propiedades de la totalidad
de la poblacin, para lo cual deben ser representativas de la misma (una
muestra representativa se denomina tcnicamente muestra aleatoria). Para
cumplir esta caracterstica la inclusin de sujetos en la muestra debe seguir
una tcnica de muestreo. En tales casos, puede obtenerse una informacin
similar a la de un estudio exhaustivo con mayor rapidez y menor coste (vanse
las ventajas de la eleccin de una muestra, ms abajo).

Por otra parte, en ocasiones, el muestreo puede ser ms exacto que el estudio
de toda la poblacin porque el manejo de un menor nmero de datos provoca
tambin menos errores en su manipulacin. En cualquier caso, el conjunto de
individuos de la muestra son los sujetos realmente estudiados.

El nmero de sujetos que componen la muestra suele ser bastante inferior a la


poblacin total, aunque suficiente grande como para que la estimacin de los
parmetros determinados tenga un nivel de confianza adecuado. Para que
el tamao de la muestra sea idneo es preciso recurrir a su clculo.

Otras definiciones relacionadas[editar]

Espacio muestral[editar]

El espacio muestral del que se toma una muestra concreta est formado por el
conjunto de todas las posibles muestras que se pueden extraer de una
poblacin mediante una determinada tcnica de muestreo.

Para una poblacin finita de n individuos el espacio muestral est formado


por subconjuntos posibles. En la prctica a veces se usan espacios
muestrales idealizados con nmero infinito de puntos indexados por un
conjunto variables reales.

Parmetro o Estadstico muestral[editar]

Un parmetro estadstico o simplemente un estadstico muestral es cualquier


valor calculado a partir de la muestra, como por ejemplo lamedia, varianza o
una proporcin, que describe a una poblacin y puede ser estimado a partir de
una muestra. Un estadstico muestral es un tipo de variable aleatoria, y que
como tal, tiene una distribucin de probabilidad concreta, frecuentemente
caracterizada por un conjunto finito de parmetros.

Estimacin[editar]

Una estimacin estadstica es cualquier tcnica para conocer un valor


aproximado de un parmetro referido a la poblacin, a partir de los estadsticos
muestrales calculados a partir de los elementos de la muestra. Si se estima el
suficiente nmero de parmetros puede aproximarse de manera razonable la
distribucin de probabilidad de la poblacin para ciertas variables aleatorias.
Nivel de confianza[editar]

El nivel de confianza de una aseveracin basada en la inferencia estadstica es


una medida de la bondad de la estimacin realizada a partir de estadsticos
muestrales. Usualmente se usan niveles de confianza para intervalos de
confianza o bien p-valores que miden la probabilidad deerrores de tipo
I (probabilidad de rechazar una cierta hiptesis siendo que esta era correcta)

Ejemplo[editar]

Se tiene una poblacin de 222.222 habitantes y se quiere conocer cuantos de


ellos son hombres y cuantos de ellos son mujeres. Se conjetura que cerca del
50% son mujeres y el resto hombres, pero se quiere seleccionar una muestra
para determinar cuantos hombres y mujeres hay en la muestra y a partir de ah
inferior el porcentaje exacto de hombres y mujeres en la poblacin total. La
descripcin de una muestra, y los resultados obtenidos sobre ella, puede ser
del tipo mostrado en el siguiente ejemplo:

Dimensin de la poblacin: 222.222 habitantes

Probabilidad del evento: Hombre o Mujer 50%

Nivel de confianza: 90%

Desviacin tolerada: 5%

Resultado 196

Tamao de la muestra: 270

La interpretacin de esos datos sera la siguiente:

La poblacin a investigar tiene 222.222 habitantes y queremos saber cuntos


son hombres o mujeres.

Estimamos en un 50% para cada sexo y para el propsito del estudio es


suficiente un 90% de seguridad con un nivel entre 90 - 5 y 90 + 5.

Generamos una tabla de 280 nmeros al azar entre 1 y 222.222 y en un censo


numerado comprobamos el gnero para los seleccionados.

Ventajas de la eleccin de una muestra[editar]

El estudio de muestras es preferible, en la mayora de los casos, por las


siguientes razones:
Si la poblacin es muy grande (en ocasiones, infinita, como ocurre en
determinados experimentos aleatorios) y, por tanto, imposible de analizar en
su totalidad.

Las caractersticas de la poblacin varan si el estudio se prolonga demasiado


tiempo.

Reduccin de costos: al estudiar una pequea parte de la poblacin, los gastos


de recogida y tratamiento de los datos sern menores que si los obtenemos del
total de la poblacin.

Rapidez: al reducir el tiempo de recogida y tratamiento de los datos, se


consigue mayor rapidez.

Viabilidad: la eleccin de una muestra permite la realizacin de estudios que


seran imposible hacerlo sobre el total de la poblacin.

La poblacin es suficientemente homognea respecto a la caracterstica


medida, con lo cual resultara intil malgastar recursos en un anlisis
exhaustivo (por ejemplo, muestras sanguneas).

El proceso de estudio es destructivo o es necesario consumir un artculo para


extraer la muestra (ejemplos: vida media de una bombilla, carga soportada por
una cuerda, precisin de un proyectil, etc.).

Poblacin Finita: es el conjunto compuesto por una cantidad limitada de


elementos, como el nmero de especies, el numero de estudiantes, el nmero
de obreros.}

Poblacin Finita e Infinita

Poblacin FINITA: La que tiene unas dimensiones contables, definidas.

Poblacin INFINITA: La que tiene un elemento incontable de elementos.

Segn la estadstica:

P. FINITAS son aquellas de tamao conocido, desde un punto de vista conocido.

P. INFINITAS son aquellas de tamao desconocido.

Si una poblacin es finita pero muy grande, desde un punto de vista estadstico
da igual considerarla infinita.

FINITO: Algo posible de medir


Ejemplos: Poblacion de una ciudad, poblacion de aves, Nios en una escuela...
etc, Estos son posibles de medir puesto que apesar de que puedan ser
millones, cientos o miles se sabe que son un numero variable pero medible al
fin y al cabo

RECOLECCIN DE DATOS CUALITATIVOS

Los datos cualitativos consisten en la descripcin detallada de situaciones,


eventos, personas, comportamientos observables, citas textuales de la gente
sobre sus experiencias,actitudes, creencias y pensamientos.

Estos datos cualitativos pueden recogerse utilizando instrumentos como:


grabacin de entrevistas individuales, videos de observaciones de eventos
particulares, testimonios escritos de las personas con respecto al tema a
investigar, fotografas, historias de vida, documentos escritos como: actas,
recortes de prensa.

Cuando se realiza una investigacin cualitativa ,se exige la participacin del


grupo, se definir el problema a investigar, y el investigador principal debe ser
un buen coordinador, mediador y facilitador para que genere un proceso de
comunicacin con el grupo.

Una vez determinado el equipo de investigacin y la planificacin del trabajo


de campo, el investigador principal debe tener en claro los objetivos, las
etapas, y las actividades a realizar en cada salida de campo.

Ante todo el investigador debe visualizar y prever con anticipacin las


situaciones que se puedan presentar durante su estada en la comunidad.

Luego se recomienda una elaboracin de guas de trabajo de campo, sin


descuidar los objetivos principales.

Para garantizar el cumplimiento de estos planes de actividades, el equipo


investigador debe reunirse al final de cada jornada para evaluar las tareas
realizadas y programar las siguientes.

Los instrumentos que mas se utilizan en los datos cualitativos son:

Entrevistas individuales: se define como una conversacin, verbal, cara a cara


y tiene como propsito conocer lo que piensa o siente una persona con
respecto un tema en particular.

Esta clase de entrevista permite preguntar sobre cuestiones mas complejas


con mayor detenimiento, produce por parte del entrevistado mayor
participacin.

Entrevistas a grupos focales: Es rpida, oportuna, vlida y poco costosa,


tambin constituye una fuente importante de informacin para comprender las
actitudes y creencias, saber cultural, y las percepciones de una comunidad.
Esta entrevista es un medio para recolectar en poco tiempo informacin
cualitativa, por lo general con grupos de 6 a 12 personas, y se divide en 2
componentes esenciales.

El contenido de la informacin ( lo que se dice).

El proceso de la comunicacin (como se dice ).

Para realizar una entrevistas focales, el responsable debe manejar entrevistas


individuales y saber tcnicas para la dinmica en grupo.

Observacin: Constituye un conjunto de tcnicas que permiten al investigador


adquirir conocimientos por medio de la observacin directa y el registro de
fenmenos.

En la observacin ser necesario tener en cuenta dos aspectos importante que


pueden influir en el resultado obtenido tras la misma, es el ocultamiento y la
intervencin. En el ocultamiento el individuo observado puede percatarse de la
presencia del observador y distorsionar la conducta. La intervencin denota el
grado en que el investigador, a diferencia de un observador pasivo, estructura
el mbito de observacin en respuesta a las necesidades del estudio.

Los mtodos de observacin varan segn su estructura, as tenemos la


observacin no estructurada que emplea el procedimiento de la observacin
participante en la que el investigador acta como observador y se familiariza
con el lugar para posteriormente volverse participante activo.

Los mtodos de observacin estructurada imponen una serie de limitantes al


observador, con el propsito de incrementar su precisin y objetividad, a fin de
obtener una representacin adecuada del fenmeno de inters.

El papel del entrevistador es muy importante, porque l es un facilitador del


proceso de comunicacin entre dos personas, su papel es inducir profundidad y
detalle en las opiniones del entrevistado, debe inspirar confianza, escuchar
activamente y atender el comportamiento verbal y no verbal de la persona que
habla.

Segn Patton: la entrevista cualitativa puede tomar las siguientes formas:

Entrevista informalconversacional, entrevista estructurada con una gua y


entrevista estandarizada.

La entrevista informal conversacional : las preguntas se formulan en torno a un


asunto que se explora ampliamente sin utilizar un gua que delimite el proceso.
La entrevista estructurada con un gua: procura un marco de referencia a partir
del cual se plantean los temas pertinentes al estudio y posibilita un proceso de
recoleccin, y facilita un mejor manejo de la informacin.

La entrevista estandarizada: Organiza y formaliza el proceso de recoleccin,


este tipo de entrevistas es pertinente cuando hay ms de una persona
responsable de recolectar informacin.

Una vez definida la modalidad de pregunta el investigador debe tomar una


decisin para relacionar el tipo de pregunta, la secuencia, el nivel de detalles, y
la duracin de la entrevista.

Los tipos de preguntas pueden ser:

Preguntas sobre experiencias o comportamientos: lo que hacen o ha hecho una


persona.

Pregunta sobre sentimientos: respuestas emocionales de las personas.

Preguntas sobre opinin: lo que ellos piensan.

Preguntas sobre conocimientos: lo que las personas saben especficamente.

Preguntas sobre sensaciones: lo que ven, oyen, tocan.

Preguntas de carcter histrico: caractersticas del informante.

Es recomendable comenzar las entrevistas con preguntas descriptivas, sobre


comportamientos, actividades, o experiencias, temas que requieran poca
memoria, e interpretacin y sean fciles de contestar.

Se recomienda plantear preguntas abiertas para que la persona entrevistadas


responda en sus propios trminos y seleccione sus propias categoras.

Tambin se debe evitar hacer preguntas dictomas, porque inducen respuestas


de si o no.

Al realizar la entrevista de debe iniciar con la presentacin del investigador y


explicar el objetivo de la misma, dar a conocer los temas a tratar en la
entrevista.

La calidad de los datos de una entrevista depende estrechamente de las


aptitudes de relacin interpersonal del entrevistador, quien debe procurar crear
un clima tranquilo para la entrevista y entablar con los informantes un nivel
satisfactorio de comunicacin.

INTRODUCCIN
El presente ensayo se presenta reflexiones sistemticas y crticas sobre el
abordaje cualitativo, y se da a conocer los instrumentos ms frecuentes
empleados en la recoleccin de datos cualitativos que son:

Entrevistas individuales; que son el instrumento mas adecuado cuando se ha


identificado personas claves dentro de la comunidad.

Entrevistas a grupos focales; este instrumento permite obtener informacin


gil.

La observacin: focaliza la atencin de manera intencional sobre algunos


segmentos de la realidad que se estudia.

Una variable discreta es una variable que solo puede tomar algunos valores
dentro de un mnimo conjunto numerable, es decir, no acepta cualquier valor,
nicamente aquellos que pertenecen al conjunto. Estas variables se dan de
modo coherente separaciones entre valores observables sucesivos. Dicho con
ms rigor, se define una variable discreta como la variable que hay entre dos
valores observables (potencialmente), hay por lo menos un valor no observable
(potencialmente). Como ejemplo, el nmero de animales en una granja (0, 1, 2,
3...).

En lgica matemtica, una variable proposicional (tambin llamada variable


sentencial o letra sentencial) es una variable discreta que puede
ser verdadera o falsa. Las variables proposicionales son los bloques de
construccin bsicos de las frmulas proposicionales, usadas en lgica
proposicional y en lgicas superiores.

Una variable continua puede tomar un valor fijo dentro de un intervalo


determinado. Y siempre entre dos valores observables va a existir un tercer
valor intermedio que tambin podra tomar la variable continua. Una variable
continua toma valores a lo largo de un continuo, esto es, en todo
un intervalo de valores. Un atributo esencial de una variable continua es que, a
diferencia de una variable discreta, nunca puede ser medida con exactitud; el
valor observado depende en gran medida de la precisin de los instrumentos
de medicin. Con una variable continua hay inevitablemente un error de
medida. Como ejemplo, la estatura de una persona

Las variables discretas son aquellas cuyas observaciones se agrupan


inherentemente o naturalmente en categoras, porque dichas variable por su
naturaleza slo pueden tomar ciertos valores muy especficos. El gnero de
un sujeto es un buen ejemplo de una variable discreta: los seres humanos
pueden ser mujeres u hombres, se ajustan a una u otra categora y no hay
continuidad ni puntos intermedios entre ellas. Los pases o regiones del mundo
tambin son buenos ejemplos de variables discretas. Otro ejemplo son las
calificaciones o educacin de los maestros. Podemos crear las siguientes
categoras para describir esta ltima variable: (a) educacin primaria completa,
(b) educacin secundaria completa, (c) educacin superior incompleta, (d)
educacin superior completa y (e) educacin de postgrado.

Sin embargo, existe otra clase de variables, conocidas como variables


continuas, que no son tan fciles de categorizar como las variables discretas.
A diferencia de las variables discretas, las variables continuas, como su nombre
lo indica, slo se pueden agrupar en forma arbitraria en categoras, porque por
su naturaleza pueden tomar cualquier valor a lo largo de un continuo (o de una
escala numrica continua). La estatura de los habitantes de un pas es un
ejemplo de variable continua, as como el ingreso de las familias en dicho pas.
Un buen ejemplo en el rea de la educacin son las calificaciones de
pruebas, que slo se pueden agrupar arbitrariamente creando intervalos
artificiales, como por ejemplo 1-20, 21-40, etc. Note que los intervalos tambin
podran ser 1-10, 11-20, 21-30, etc, o cualquier otro intervalo que se prefiera,
ya que la variable no se ajusta naturalmente a categoras predeterminadas
como en el caso de las variables discretas.

La distincin entre variables discretas y continuas es de gran aplicabilidad en la


estadstica. Pero su importancia slo queda clara despus de comprender el
concepto estadstico fundamental de distribucin o distribucin de
frecuencias. (Los estadsticos por lo general usan la primera versin, la ms
corta, para referirse a la distribucin de frecuencias.)

Distribucin de frecuencias

En estadstica, se le llama distribucin de frecuencias a la agrupacin de datos


en categoras mutuamente excluyentes que indican el nmero de
observaciones en cada categora.1 Esto proporciona un valor aadido a la
agrupacin de datos. La distribucin de frecuencias presenta las observaciones
clasificadas de modo que se pueda ver el nmero existente en cada clase.

ndice

[ocultar]

1Tipos de frecuencias

1.1Frecuencia absoluta

1.2Frecuencia relativa

1.3Frecuencia acumulada
1.4Frecuencia relativa acumulada

1.5Distribucin de frecuencias agrupadas

2Referencias

Tipos de frecuencias[editar]

Vase tambin: Frecuencia estadstica

Frecuencia absoluta[editar]

La frecuencia absoluta es el nmero de veces que aparece un determinado


valor en un estudio estadstico. Se representa por fi. La suma de las
frecuencias absolutas es igual al nmero total de datos, que se representa por
N. Para indicar resumidamente estas sumas se utiliza la letra griega (sigma
mayscula) que se lee suma o sumatoria.

Frecuencia relativa[editar]

Se dice que La frecuencia relativa es el cociente entre la frecuencia absoluta de


un determinado valor y el nmero total de datos. Se puede expresar en tantos
por ciento y se representa por fi. La suma de las frecuencias relativas es igual a
1, siempre y cuando no sea igual que 7 o por debajo de los 7 primeros nmeros
sucesivos.

Frecuencia relativa (fi), es el cociente entre la frecuencia absoluta y el tamao


de la muestra (N). Es decir:

siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos


en una distribucin de frecuencias.

Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o


tanto por ciento (pi)

Frecuencia acumulada[editar]

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los


valores inferiores o iguales al valor considerado. La frecuencia acumulada es la
frecuencia estadstica F(XXr) con que el valor de un variable aleatoria (X) es
menor que o igual a un valor de referencia (Xr). La frecuencia acumulada
relativa se deja escribir como Fc(XXr), o en breveFc(Xr), y se calcula de:

Fc (Hr) = HXr / N
donde MXr es el nmero de datos X con un valor menor que o igual a Xr, y N es
nmero total de los datos. En breve se escribe:

Fc = M / N

Cuando Xr=Xmin, donde Xmin es el valor mnimo observado, se ve que


Fc=1/N, porque M=1. Por otro lado, cuando Xr=Xmax, donde Xmax es el valor
mximo observado, se ve que Fc=1, porque M=N.

En porcentaje la ecuacin es:

Fc(%) = 100 M / N

Frecuencia relativa acumulada[editar]

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada


de un determinado valor y el nmero total de datos. Se puede expresar en
tantos por ciento. Ejemplo:

Durante el mes de julio, en una ciudad se han registrado las siguientes


temperaturas mximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27

Distribucin de frecuencias agrupadas[editar]

La distribucin de frecuencias agrupadas o tabla con datos agrupados se


emplea si las variables toman un nmero grande de valores o la variable es
continua. Se agrupan los valores en intervalos que tengan la misma amplitud
denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Lmites de la clase. Cada clase est delimitada por el lmite inferior de la clase
y el lmite superior de la clase.

La amplitud de la clase es la diferencia entre el lmite superior e inferior de la


clase. La marca de clase es el punto medio de cada intervalo y es el valor que
representa a todo el intervalo para el clculo de algunos parmetros.

Construccin de una tabla de datos agrupados:

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31,
26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

Se localizan los valores menor y mayor de la distribucin. En este caso son 3 y


48.

Se restan y se busca un nmero entero un poco mayor que la diferencia y que


sea divisible por el nmero de intervalos que queramos establecer.

Es conveniente que el nmero de intervalos oscile entre 6 y 15.


En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10
intervalos.

Se forman los intervalos teniendo presente que el lmite inferior de una clase
pertenece al intervalo, pero el lmite superior no pertenece al intervalo, se
cuenta en el siguiente intervalo.

Intervalo ci ni Ni fi Fi

[0, 5) 2.5 1 1 0.025 0.025

[5, 10) 7.5 1 2 0.025 0.050

[10, 15) 12.5 3 5 0.075 0.125

[15, 20) 17.5 3 8 0.075 0.200

[20, 25) 22.5 3 11 0.075 0.275

[25, 30) 27.5 6 17 0.150 0.425

[30, 35) 32.5 7 24 0.175 0.600

[35, 40) 37.5 10 34 0.250 0.850

[40, 45) 42.5 4 38 0.100 0.950

[45, 50) 47.5 2 40 0.050 1

Total: 40 1

Distribucin de frecuencias

Las distribuciones de frecuencias son tablas en que se dispone las modalidades


de la variable por filas. En las columnas se dispone el nmero de ocurrencias
por cada valor, porcentajes, etc. La finalidad de las agrupaciones en
frecuencias es facilitar la obtencin de la informacin que contienen los datos.

Ejemplo: Quieren conocer si un grupo de individuos est a favor o en contra de


la exhibicin de imgenes violentas por televisin, para lo cual han recogido los
siguientes datos:
La inspeccin de los datos originales no permite responder fcilmente a
cuestiones como cul es la actitud mayoritaria del grupo, y resulta bastante
ms difcil determinar la magnitud de la diferencia de actitud entre hombres y
mujeres.

Podemos hacernos mejor idea si disponemos en una tabla los valores de la


variable acompaados del nmero de veces (la frecuencia) que aparece cada
valor:

X: Smbolo genrico de la variable.

f: Frecuencia (tambin se simboliza como ni).

La distribucin de frecuencias de los datos del ejemplo muestra que la actitud


mayoritaria de los individuos del grupo estudiado es indiferente.

La interpretacin de los datos ha sido facilitada porque se ha reducido el


nmero de nmeros a examinar (en vez de los 20 datos originales, la tabla
contiene 5 valores de la variable y 5 frecuencias).

Generalmente las tablas incluyen varas columnas con las frecuencias relativas
(son el nmero de ocurrencias dividido por el total de datos, y se simbolizan
"fr" o "pi"), frecuencias acumuladas (la frecuencia acumulada es el total de
frecuencias de los valores iguales o inferiores al de referencia, y se simbolizan
"fa" o "na". No obstante la frecuencia acumulada tambin es definida
incluyendo al valor de referencia), frecuencias acumuladas relativas (la
frecuencia acumulada relativa es el total de frecuencias relativas de los valores
iguales o inferiores al de referencia, y se simbolizan "fr" o "pa")

Ejemplo: Consideremos el siguiente grupo de datos:


La distribucin de freciemcias es:

La reduccin de datos mediante el agrupamiento en frecuencias no facilita su


interpretacin: La tabla es demasiado grande. Para reducir el tamao de la
tabla agrupamos los valores en intervalos, y las frecuencias son las de los
conjuntos de valores incluidos en los intervalos:
Ahora es ms sencillo interpretar los datos. Por ejemplo, podemos apreciar
inmediatamente que el intervalo con mayor nmero de datos es el 34-39, o
que el 75% de los datos tiene valor inferior a 46.

Este tipo de tabla es denominado "tabla de datos agrupados en intervalos".

Elementos bsicos de las tablas de intervalos:

Intervalo: Cada uno de los grupos de valores de la variable que ocupan una fila
en una distribucin de frecuencias

Lmites aparentes: Valores mayor y menor del intervalo que son observados en
la tabla. Dependen de la precisin del instrumento de medida. En el ejemplo,
los lmites aparentes del intervalo con mayor nmero de frecuencias son 34 y
39.

Lmites exactos: Valores mximo y mnimo del intervalo que podran medirse si
se contara con un instrumento de precisin perfecta. En el intervalo 34-39,
estos lmites son 33.5 y 39.5

Punto medio del intervalo (Mco Marca de clase): Suma de los lmites dividido
por dos. Mc del intervalo del ejemplo= 36.5

Amplitud del intervalo: Diferencia entre el lmite exacto superior y el lmite


exacto inferior. En el ejemplo es igual a 6.

C) TRATAMIENTO PARA DATOS AGRUPADOS.


Cuando la muestra consta de 30 o ms datos, lo aconsejable es agrupar los
datos en clases y a partir de estas determinar las caractersticas de la muestra
y por consiguiente las de la poblacin de donde fue tomada.

Antes de pasar a definir cul es la manera de determinar las caractersticas de


inters (media, mediana, moda, etc.) cuando se han agrupado en clases los
datos de la muestra, es necesario que sepamos como se agrupan los datos.

Pasos para agrupar datos.

Determinar el rango o recorrido de los datos.

Rango = Valor mayor Valor menor

Establecer el nmero de clases (k)en que se van a agrupar los datos tomando
como base para esto la siguiente tabla.

Tamao de muestra o No. De Nmero de


datos clases

Menos de 50 5a7

50 a 99 6 a 10

100 a 250 7 a 12

250 en adelante 10 a 20

El uso de esta tabla es uno de los criterios que se puede tomar en cuenta para
establecer el nmero de clases en las que se van a agrupar los datos, existen
otros para hacerlo.

Determinar la amplitud de clase para agrupar (C).


d. Formar clases y agrupar datos.

Para formar la primera clase, se pone como lmite inferior de la primera clase
un valor un poco menor que el dato menor encontrado en la muestra y
posteriormente se suma a este valor C, obteniendo de esta manera el lmite
superior de la primera clase, luego se procede a obtener los lmites de la clase
siguiente y as sucesivamente.

Ejemplo:

Los siguientes datos se refieren al dimetro en pulgadas de un engrane.

6.75 7.00 7.00 6.75 6.50 6.50 7.15 7.00

6.50 6.50 6.50 6.25 6.25 6.50 6.65 7.00

7.25 6.70 6.00 6.75 6.00 6.75 6.75 7.10

7.00 6.70 6.50 6.75 6.25 6.65 6.75 7.10

7.25 6.75 6.25 6.25 7.00 6.75 7.00 7.15

a) Agrupe datos, considere k=6.

b) Obtenga: Histograma, polgono de frecuencias, ojiva y distribucin de


probabilidad.

c) Obtenga: media, mediana, moda y desviacin estndar.

Solucin:

a) Agrupando datos;

1. R= VM - Vm = 7.25 6.00 = 1.25


2. k=6

3.

4.Formando clases.

Para formar la primera clase se toma un valor un poco menor que el valor
menor encontrado en la muestra; luego,

LI LS Frecuenci Marca de Lmite Lmite Frecuenci Frecuenci


a clase real real a relativa a Relativa
inferior superior acumulad
a

5.97 2 6.075 5.965 6.185 2/40 = 0.05


6.18 0.05

6.19 5 6.295 6.185 6.405 5/40=0.1 0.175


6.40 25

6.41 7 6.515 6.405 6.625 0.175 0.350


6.62

6.63 13 6.735 6.625 6.845 0.325 0.675


6.84

6.85 7 6.955 6.845 7.065 0.175 0.850


7.06

7.07 6 7.175 7.065 7.285 0.15 1.000


7.28

Total 40 1.000

b) Grficas:
a) Media ( ).

=
Donde:

k = nmero de clases

xi = marca de clase i

fi = frecuencia de la clase i

n= nmero de datos en la muestra

b) Mediana (Xmed).

Donde:

Li = lmite real inferior de la clase que contiene a la mediana

Fme-1 = sumatoria de las frecuencias anteriores a la clase en donde se


encuentra la mediana

fme = frecuencia de la clase en donde se encuentra la mediana

A = amplitud real de la clase en donde se encuentra la mediana

A = LRS-LRI

LRS = lmite real superior de la clase que contiene a la mediana

LRI = lmite real inferior de la clase que contiene a la mediana

N = nmero de datos en la muestra

f) Moda (Xmod).
Donde:

Li = lmite real inferior de la clase que contiene a la moda

d1 = =

d2 = =

fmo = frecuencia de la clase que contiene a la moda

fmo-1= frecuencia de la clase anterior a la que contiene a la moda

fmo+1= frecuencia de la clase posterior a la que contiene a la moda

A = amplitud real de la clase que contiene a la moda

A = LRS LRI

LRS = lmite real superior de la clase que contiene a la moda

LRI = lmite real inferior de la clase que contiene a la moda

g) Desviacin estndar (S).


=

Donde:

xi = marca de clase i

= media aritmtica

fi = frecuencia de la clase i

= nmero total de datos en la muestra

Вам также может понравиться