Академический Документы
Профессиональный Документы
Культура Документы
APUNTES DE
ESTADÍSTICA DESCRIPTIVA
MC Raúl Adalberto Morelos
Centro de Estudios Superiores del Estado de Sonora
Unidad Académica de San Luis Río Colorado, Sonora México.
Septiembre 2010
1
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
Índice
Tema Página
Unidad 1
Conceptos Básicos ¿Qué es la estadística? ------------------------- 3
Datos estadísticos ----------------------------------------------------------- 4
Importancia Actual de la estadística ------------------------------------ 4
Clases de estadística ------------------------------------------------------- 5
Estadística Descriptiva ------------------------------------------------------ 6
Estadística Inferencial ------------------------------------------------------- 6
Definición del concepto de estadística ---------------------------------- 7
Ejercicio 1.1 -------------------------------------------------------------------- 9
Ejercicio 1.2 -------------------------------------------------------------------- 9
Unidad 2
Métodos estadísticos ------------------------------------------------------- 10
Recopilación de datos ------------------------------------------------------ 11
Organización de datos ----------------------------------------------------- 12
Organización de datos usando arreglos ------------------------------- 15
Organización de datos usando una distribución de
frecuencias -------------------------------------------------------------------- 15
Número de clases o intervalos ------------------------------------------- 16
Amplitud de clases ---------------------------------------------------------- 17
Tabla de frecuencias -------------------------------------------------------- 18
Datos fundamentales de una tabla de frecuencia ------------------- 18
Otros métodos de presentación de datos ----------------------------- 19
Partes principales de una tabla ------------------------------------------ 20
Gráficas estadísticas -------------- ---------------------------------------- 21
Representación gráfica de una tabla de frecuencia ---------------- 22
Ejercicio 2.1 ------------------------------------------------------------------- 24
Medidas de tendencia central para datos NO agrupados --------- 26
Medidas de tendencia central para datos agrupados -------------- 27
Medidas de dispersión para datos No agrupados ------------------ 28
Medidas de dispersión para datos agrupados ----------------------- 29
Bibliografía --------------------------------------------------------------------- 29
2
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
ESTADÍSTICA GENERAL.
CONCEPTOS BÁSICOS
¿QUE ES LA ESTADÍSTICA?
Con el fin de estudiar inteligentemente el tema de la estadística debemos, en primer lugar, comprender
lo que él termino significa en la actualidad así como conocer algo de su origen.
Como en la mayoría de los vocablos, la palabra “estadística” tiene diversos significados para diferentes
personas. Cuando la mayoría de la gente escucha el término lo relaciona con cuadros o tablas llenas de
cifras sobre nacimientos, muertes, matrimonios, divorcios, accidente de automóviles, etc., que ofrecen,
por ejemplo, en los almanaques anuales, y que indudablemente usan el término con toda corrección. A
decir verdad, el término en cuestión fue inicialmente usado para tabular las funciones del Estado en lo
que respecta a los datos necesarios para una planeación idónea, reglamentaciones y recaudación de
impuestos. Los cobradores de impuestos y los encargados de hacer este tipo de análisis eran llamados
“estadísticos” por su dedicación a compaginar datos e informes requeridos por el Estado.
En la actualidad, desde luego, la palabra “estadística” se aplica en este primer sentido para casi todo
relacionado con los informes basados en hechos y consignados en base a números, lo que
comúnmente se denomina: “Hechos y cifras”. Los anunciadores de radio y televisión nos informan que
“en unos cuantos minutos darán la estadística del juego ...”y los periódicos con frecuencia publican
artículos a cerca de concursos de belleza en los cuales brindan las “estadísticas” de las concursantes.
Sin embargo, el término tiene otros significados y la gente que no esta familiarizada con la materia los
desconoce. La estadística es una rama del conocimiento el campo de las matemáticas aplicadas, que
utiliza sus propios símbolos, términos, contenido, teoremas y técnicas. Cuando se estudia la
“estadística” normalmente se pretende dominar algunas de estas técnicas.
Para todos aquellos ya iniciados en los misterios de campo de las estadísticas, el vocablo tiene una
segunda aceptación; las estadísticas son cantidades que han sido calculadas con datos de muestreo:
una sola cantidad así calculada se denomina “estadística”. Por ejemplo, la media de la muestra es una
estadística, así como también lo son la mediana de la muestra y el modo. La varianza de la muestra es
una estadística, como también lo es la gama de la muestra. El coeficiente de correlación de la muestra
es asimismo una estadística.
La estadística está desarrollada para tratar con datos numéricos o información cuantitativa. La palabra
"estadística", por lo tanto ha sido ampliamente referida ya sea a la información cuantitativa misma como
a los métodos que tratan con la información. Los estadísticos prefieren llamar a la información
cuantitativa Datos Estadísticos y a los métodos que tratan con la información los Métodos
Estadísticos.
Por ESTADÍSTICA debemos entender que son los métodos por medio de los cuales podemos
recolectar, organizar, presentar y analizar datos numéricos de un conjunto de individuos permitiéndonos
extraer conclusiones válidas y efectuar decisiones lógicas basadas en dicho análisis.
Los DATOS son agrupaciones de cualquier número de observaciones relacionadas. Para que los datos
sean útiles, las observaciones deben estar organizadas en tal forma que se puedan identificar
tendencias y llegar a conclusiones lógicas.
3
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
DATOS ESTADÍSTICOS
La información cuantitativa apropiada para el análisis estadístico debe ser un conjunto (o conjuntos) de
números que muestren relaciones significativas. En otras palabras, los datos Estadísticos son números
que pueden ser comparados, analizados e interpretados.
Un número aislado que no se compara o que no muestra relación significativa con otro número no es
dato estadístico. Por ejemplo: Las edades de 1000 estudiantes son datos estadísticos, puesto que las
edades pueden ser comparadas y analizadas, y los resultados de los análisis pueden ser interpretados.
El área de la cual los datos estadísticos son recopilados, se le conoce como población o universo.
La estadística también es empleada por los gobiernos. La información económica es objeto de estudio
y afecta la política del gobierno en lo que respecta a los impuestos y a partidas asignables a obras
públicas (tales como caminos, presas, etc.), a fondos para la asistencia pública, y otros. La estadística
4
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
del desempleo influye incrementando los esfuerzos para disminuir el porcentaje correspondiente. Los
métodos estadísticos se aprovechan para evaluar el funcionamiento de todo tipo de equipo militar,
desde las balas para las pistolas hasta enormes proyectiles dirigidos. La teoría de las probabilidades y
la estadística (especialmente un nuevo campo llamado teoría estadística de la toma de decisiones) se
usan como ayuda para tomar decisiones sumamente importantes en los altos niveles.
En cuanto a la industria privada, el empleo de las estadísticas es casi tan importante en sus efectos
como en el sector gubernamental. Se usa las técnicas estadísticas para el control de calidad de los
productos en proceso y para evaluar la aceptación de los nuevos productos que se van a lanzar al
mercado. La estadística se emplea en el mercado, en las decisiones para la ampliación de los negocios,
en el análisis de la eficacia de la publicidad, etc. Las compañías de seguros se basan en las
estadísticas para fijar sus tarifas a un nivel realista. La lista sería interminable. La estadística se emplea
en la geología, biología, psicología, sociología; en todo sector en el que las decisiones deben de
hacerse a base de los datos o informes incompletos. Se usan también en pruebas educacionales, para
medidas de seguridad en la ingeniería. La meteorología, la ciencia de la predicción del tiempo, también
esta usando la estadística actualmente.
Aún hay sectores aparentemente heterogéneos que las emplean. ¿Quién habría supuesto que las
estadísticas ayudaran a un erudito o a un investigador histórico a determinar quien es el autor de obras
en disputa? En este particular, creemos que el ejemplo mas conocido es el del empleo de las
estadísticas para establecer la prolongada controversia sobre quien fue el autor de los ensayos literarios
en los “Federalist Papers”.
En planos menores, se han hecho estudios estadísticos sobre el efecto que la luna llena tiene la pesca
de las truchas; sobre cual sería el tipo más adecuado del vaso para el agua de los restaurantes; así
como la estrategia óptima para juegos de destreza y azar, tales como el bridge, los solitarios, el
veintiuno, el béisbol, etc.
No cabe la menor duda de la importancia de los efectos de las técnicas estadísticas en todo y en cada
uno de nosotros. Los resultados de los estudios estadísticos se pueden ver, aunque quizás no se
comprendan, al recibir nuestros sueldos, en los pagos de pensiones, del seguro social, los premios de
las primas de seguros, en nuestra satisfacción al consumir diversos productos y en nuestra propia
salud.
CLASES DE ESTADÍSTICA
Como complemento a las breves consideraciones de los elementos básicos de la probabilidad, hay dos
clases de estadísticas tratadas en este libro. El nombre que naturalmente mas se ajusta a este tipo de
estadística es el de estadística descriptiva. La clasificación de datos; el trazo de los histogramas que
corresponden a las distribuciones a una población; la representación de los datos por medio de otras
clases de gráficas, tales como las lineales, las gráficas en barras, los pictogramas; él cómputo de
medidas muestrales, medianas y modos; él cómputo de varianzas, las medidas de las desviaciones
absolutas y de la gama; todas estas operaciones se refieren a la estadística descriptiva. La labor
estadística ejecutada en el siglo XIX y principios de este siglo, fue en su mayor parte la estadística
descriptiva.
5
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
ESTADÍSTICA DESCRIPTIVA
Significado de Estadística
La estadística descriptiva es la parte de la estadística que agrupa las técnicas apropiadas para la
organización, representación y descripción de un conjunto de datos con el propósito de resaltar sus
rasgos más importantes y extraer la información esencial que contiene. En nuestros términos, diremos
que la estadística descriptiva permite tener una visión “a vuelo de pájaro” de la variable que miden los
datos para adelantar conclusiones acerca de ella o preparar un estudio mas fino de la misma para la
toma de alguna decisión.
En pocas palabras, la Estadística Descriptiva permite tener una visión “a vuelo de pájaro”, de la variable
que miden los datos para adelantar conclusiones acerca de ella o preparar un estudio más fino de la
misma, para la toma de alguna decisión.
Ejemplo 1.1 : Supóngase que un profesor que calcula un promedio para una clase de Historia. Como él
está usando estadística para describir el comportamiento de esa clase y no para
hacer una generalización acerca de varias clases, se puede decir que él está usando
estadística descriptiva. Los gráficos, las tablas y mapas que muestren datos en tal forma
que sean más fáciles de entender son ejemplos de estadística descriptiva.
ESTADÍSTICA INFERENCIAL
Y su significado
Sobre la base de un muestreo al azar, inferimos ciertos datos acerca de la población. La inferencia que
hacemos acerca de la población sobre bases de este tipo de muestreo se conoce como inferencia
estadística. En otras palabras, la inferencia estadística es el empleo de la técnica de muestreo para
llegar a determinadas conclusiones acerca de la población de la cual se han obtenido las muestras.
6
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
Si una muestra es representativa de una población, se puede deducir importantes conclusiones acerca
de ésta, a partir del análisis e interpretación de la misma.
Ejemplo 1.2: Supóngase ahora que el profesor de Historia decide usar las notas
promedios en una de la clase de Historia para estimar la nota promedio obtenida en los
diez grupos del mismo curso de Historia. El proceso para estimar esta nota será un
problema de inferencia estadística. Obviamente, cualquier conclusión que realice el
profesor acerca de los diez grupos del curso estará basada en una generalización que va
más allá de los datos originalmente obtenidos en el curso de Historia. La generalización
del profesor puede no ser completamente válida y él debe establecer cuanto tiene de
cierto.
Al efectuar una investigación o experimento, es necesario definir qué datos se pretenden obtener de la
POBLACIÓN en estudio.
Ejemplos 1.3:
• El número de automóviles vendidos en un mes.
• El número de clientes esperando servicio en la caja de un supermercado.
• El número de tubos electrónicos de T.V. producidos en una hora determinada.
7
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
VARIABLE ALEATORIA CONTINUA: Es aquella que puede tomar cualquier valor de entre todos los
contenidos en un intervalo de recta.
Ejemplo 1.4:
• La cantidad de energía eléctrica producida en una planta hidroeléctrica en un día.
• El tiempo necesario para completar el ensamblaje de un artículo en una planta.
• La cantidad de petróleo bombeado cada hora en un pozo.
La estadística está desempeñando un importante papel ascendente en casi todas las facetas del
progreso humano. Anteriormente solo era aplicada a los asuntos del Estado, ahora su influencia se
extiende a la agricultura, biología, negocios, química, comunicaciones, economía, educación,
electrónica, medicina, física, ciencias políticas, psicología, sociología, y otros campos de la ciencia. Este
desarrollo de la estadística está ligada a los métodos científicos en la toma, organización, presentación
y análisis de los datos, tanto para la deducción de conclusiones como para tomar decisiones razonables
de acuerdo con tales análisis.
No cabe la menor duda de la importancia de los efectos de las técnicas estadísticas en todos y cada
uno de nosotros. Los resultados estadísticos se pueden ver, aunque quizás no se comprendan, al recibir
nuestro salario, en los pagos de pensiones, los premios de las primas de seguro, en nuestra
satisfacción al consumir diversos productos y en nuestra propia salud.
8
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
1.- En una prueba de aptitudes, tres trabajadores recibieron calificaciones de 90, 85 y 80. Tres
trabajadoras recibieron calificaciones de 89, 86 y 92. De las siguientes declaraciones realizadas
con base en estas calificaciones identifíquense aquellas que se derivan de métodos descriptivos
y aquellos que se derivan de inferencia estadística.
a) La calificación promedio de los tres trabajadores es 85, y la calificación promedio de las tres
trabajadoras es 89.
b) La aptitud promedio de todas las trabajadoras es probablemente mayor que la de los
trabajadores.
c) En las siguientes pruebas de aptitudes, probablemente los trabajadores reciben calificaciones
mas bajas que las trabajadoras.
2.- Tres bombillas de marca A dejaron de funcionar después de 1100, 900 y 1000 hrs. de uso
continuo. Cuatro bombillas de la marca B dejaron de funcionar después de 1050, 960, 1070 y
840 hrs. de uso continuo. Se llega a las siguientes conclusiones, ¿Cuáles de ellas provienen de
la estadística descriptiva y cuáles de la inferencial?
a) La duración promedio de las tres bombillas marca A es de 1000 hrs mientras que la duración
promedio de las cuatro bombillas marca B es de 980 hrs.
b) La duración promedio de todas las bombillas marca A es mayor que todas las bombillas de la
marca B.
c) La diferencia entre los dos promedio es de 20.
d) La diferencia entre los dos promedio es demasiado pequeña para llegar a la conclusión de que
las bombillas marca A son mejores que la marca B.
e) Si se selecciona y prueba otra bombilla de marca A, probablemente durará más que el promedio
de las bombillas marca B.
f) Usted decide comprar bombillas marca A en vez de bombillas marca B.
9
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
Cuando los datos están organizados en una forma compactada y fácil de utilizar, se puede obtener
información del medio digna de confianza y utilizarla para decisiones inteligentes
MÉTODOS ESTADÍSTICOS
En un estudio estadístico los métodos estadísticos son divididos en cinco pasos básicos.
a) Recopilación. d) Análisis.
b) Organización. e) Interpretación.
c) Presentación.
Estrictamente hablando, no hay línea de división definitiva que separe los cinco pasos básicos. Algunos
de los métodos pueden ser usados en más de un paso.
a) RECOPILACIÓN DE DATOS
De acuerdo a la localización de la información los datos estadísticos pueden se clasificados en
datos Internos y datos Externos.
1).- Obtención de datos publicados. Los datos publicados pueden ser obtenidos fácilmente si las
fuentes de datos son conocidas por el lector.
En relación con esto, es importante conocer las clases de fuentes de datos y las fuentes de datos
publicados.
Las fuentes de datos publicados pueden ser clasificadas en dos clases primarias y secundarias.
Una fuente de datos se denomina primaria cuando los datos obtenido de la publicación EDITADA por el
recopilador original de los datos.
La fuente llamada secundaria cuando los datos son obtenidos de una reimpresión, la cual es publicada
por una organización distinta del recopilador original.
10
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
El trabajo de elaborar una encuesta esta usualmente limitado por los factores del tiempo, dinero y mano
de obra disponible para el estudio.
En vez de recopilar información completa relacionada con el estudio, una muestra consistente de un
grupo de elementos representativos es ordinariamente sacada de la fuente de información (población)
en una encuesta.
Los métodos más comunes de recopilación de datos a través de muestras son: Observación Directa y
Formulación de Preguntas.
OBSERVACIÓN DIRECTA
El método de observación directa puede dar información exacta y es usualmente preferida, ya que
puede ser empleado efectiva y económicamente. Sin embargo, está limitado a unos pocos tipos de
estudio y es a menudo demasiado inconveniente en observaciones reales de ciertas operaciones.
Ejemplos:
a).- Si un investigador desea conocer los precios de menudeo de los alimentos de una ciudad
puede ir a un grupo seleccionado de tiendas para observar los precios marcados en los mismos.
b).- Si deseamos conocer el ingreso recibido en una semana por un grupo de taxistas sería muy
inconveniente observarlos a ellos. Sería más práctico y fácil obtener los resultados haciéndoles
ciertas preguntas.
FORMULACIÓN DE PREGUNTAS
11
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
1.- Facilitar la memoria: No debe preguntarse sobre hechos ocurridos hace mucho tiempo; las
preguntas deben limitarse al pasado inmediato (un mes máximo)
2.- No deben usarse más palabras de las que sean necesarias (máximo 20 por pregunta).
3.- Las palabras empleadas deben ser simples, fáciles de pronunciar y de ser posible de uso común.
4.- Deben evitarse al máximo emplear términos comerciales o de negocios y palabras cargadas o
insinuantes.
6.- No debe forzarse a la persona a que realice cálculos, complicados porque ésta, tenderá a cansar
rápidamente al entrevistado.
7.- Cuando se tenga que realizar una pregunta que por su naturaleza sea embarazosa o difícil de
contestar, es necesario planear cuidadosamente su redacción, para evitar una gran cantidad de
contestaciones falsas.
8.- Al realizar preguntas referidas a tiempos es necesario fijar intervalos adecuados a las posibles
contestaciones y la pregunta debe referirse de preferencia a una fecha concreta.
9.- Cuando tratan de medirse aspectos relacionados con la calidad de un producto, o bien su sabor, su
aroma, su aspecto y otras características similares, es recomendable el uso de respuestas
preformuladas, utilizando escalas de conceptos o de valores o una combinación de ambas.
Ej.
Excelente 3
Muy Bueno 2
Bueno 1
Regular 0
Malo -1
Muy Malo -2
Pésimo -3
10.- Evitar motivos emocionales o estereotipados, ciertos nombres, expresiones o hechos que son
susceptibles de provocar reacciones de tipo Psicológico positivo o negativos y alterar la respuesta.
12
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
11.- Por último es conveniente destacar los siguientes puntos que influyen en forma determinante en la
redacción de un buen cuestionario:
Reporte: Es una breve introducción al tema, objetivo de la encuesta se usa para crear confianza y
cooperación en el encuestado.
Consigna: Es la indicación de como contesta a determinada pregunta, debe ser muy explícita al
diseñarse y haber un número máximo e igual de las preguntas.
Por ej. Ponga una cruz en la respuesta que crea, enumere del 1 al 4 etc.
Pregunta introductoria: Deben ser fáciles de contestar, están antes del tema principal y sirven para
introducirlo.
Preguntas Básicas: Es el elemento clave del cuestionario aquel están traducida las observaciones de la
investigación y deben ser lo suficientemente extensas para que cubra los mismos.
Escala de Sinceridad: Son trampas que se le ponen al encuestado para ver si este dice la verdad, como
cuando en el cuestionario se repiten las preguntas y, si estas son cortas deben redactarse de diferente
manera la misma pregunta.
Pregunta de Clasificación: Tara de la información sobre el individuo, edad sexo domicilio, no. de hijos,
nacionalidad etc., son preguntas de identificación al final del cuestionario por que podrían influir en la
respuesta si fueran al principio.
1).- Crítica y corrección de datos recopilados. Un corrector puede encontrar una o varias de las
siguientes cosas que deberían ser corregidas y tratadas.
a).- Las respuestas son inconsistentes
b).- La escritura no es determinable
c).- Las respuestas son incompletas
d).- Se necesitan cálculos
2).- Clasificación de datos corregidos. Hay muchas formas de clasificar datos estadísticos en general las
clasificaciones pueden ser determinadas de acuerdo a 4 bases:
Tiempo, lugar, cantidad y cualidad.
13
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
CUALITATIVA.- En esta clasificación la distinción es mas bien de clases que de cantidad. Por ejemplo,
cuando los empleados se clasifican en sindicalizados y no sindicalizados, tenemos una diferencia
cualitativa. Los agricultores pueden clasificarse en propietario, parcialmente propietarios,
administradores y arrendatarios. En hule puede clasificarse en cultivo o silvestre, de acuerdo con su
origen.
CUANTITATIVA.- Cuando los valores se modifican con respecto a una característica mensurable,
conviene una clasificación cuantitativa. Por ejemplo, las familias pueden clasificarse de acuerdo con él
numero de hijos, las empresas industriales, según él número de obreros empleados y también
desacuerdo con el valor de los artículos producidos. La mayoría de las distribuciones cuantitativas son
distribuciones de frecuencia, que son la forma básica de organización de los datos para sus análisis
estadísticos. Los datos clasificados cualitativamente a veces pueden clasificarse de nuevo sobre bases
cuantitativas, mediante cambios muy ligeros.
CRONOLÓGICA.- Los datos cronológicos o las series cronológicas contienen cifras relativas a un
fenómeno determinados en diversos periodos de tiempo especificados. Por ejemplo, se puede mostrar
la cotización diaria de cierre de ciertas acciones durante un periodo de meses o años, puede registrarse
el coeficiente anual de natalidad de varios años, puede indicarse la producción mensual de carbón
durante un lapso dado de años. Las series cronológicas tiene un cierto modo algún parentesco con las
distribuciones cuantitativas, por el hecho de que cada año o mes sucesivo de una serie esta un año o
un mes alejado del punto de referencia anterior. Sin embargo, los periodos de tiempo o más bien los
acontecimientos, que ocurren dentro de estos periodos difieren cualitativamente entre sí.
Ocasionalmente una serie cronológica puede convertirse en una distribución de frecuencias.
3).- Tabulación de datos clasificados. Después de que se han decidido las clasificaciones adecuadas o
deseadas el siguiente paso en la organización de los datos es arreglar la masa de hechos cuantitativos
en una forma resumida basadas en las clasificaciones.
14
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
El ARREGLO de datos es una de las formas más simples de organizar la información, se organizan del
valor menor al mayor (en orden ascendente), o del mayor al menor (en orden descendente).
Los arreglos de datos ofrecen varias ventajas sobre los datos en bruto.
A pesar de éstas ventajas, algunas veces el arreglo de datos no es de mucha utilidad. Cuando sea
necesario mostrar una gran cantidad de ellos, esto se tornará engorroso, porque se debe hacer la lista
de todas las observaciones. Para estos casos se necesita condensar la información y estar en
capacidad de usarla para tomar decisiones e interpretarla.
Una manera de simplificar los datos es usar una tabla de frecuencia o distribución de frecuencia. Como
se verá, la organización de los datos en una tabla de frecuencia muestra el comportamiento de la
distribución de manera más significativa.
La construcción de una tabla de frecuencia se realiza de una serie de datos, los cuales primeramente
son recopilados y posteriormente organizados. La primera forma de organizarlos es dándoles un orden
ascendente o descendente. Los datos constituidos de esta manera están en un ARREGLO. Este
arreglo puede ser construido mediante el uso de marcas, y el número de veces que un valor está
repetido se le llama FRECUENCIA.
= RECOPILACION =
68, 84, 75, 82, 68, 90, 62, 88.3, 76, 93, 73, 79, 88, 73, 60, 93, 72, 53, 85, 75
53, 65.5, 75, 87, 74, 62, 95, 78, 62, 72, 66, 78, 82, 75, 94, 77, 69, 74, 68, 60
96, 78, 89, 60, 75, 95, 60, 79, 83, 72.6, 79, 60, 67, 97, 78, 85, 76, 65, 71, 75
65, 80, 73, 53, 88, 78, 63, 76, 53, 74, 86, 67, 73, 81, 72, 63, 76, 75, 85, 77.8
= ORGANIZACION =
53, 53, 53, 53, 60, 60, 60, 60, 60, 62, 62, 62, 63, 63, 65, 65, 65.5, 66, 67, 67
68, 68, 68, 69, 72, 72, 72, 72, 72, 72.6, 73, 73, 73, 74, 74, 74, 75, 75, 75, 75
75, 75, 75, 76, 76, 76, 76, 77, 77.8, 78, 78, 78, 78, 78, 79, 79, 79, 80, 81, 82
82, 83, 84, 85, 85, 85, 86, 87, 88, 88, 88.3, 89, 90, 93, 93, 94, 95, 95, 96, 97
15
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
En la tabla la segunda columna es sólo auxiliar. En la tercera se presenta la Frecuencia de cada dato
posible (fi = al número de veces que ocurre la i-ésima observación posible).
En el ejempo 2.1 encontramos 80 valores diferentes, distribuídos entre el dato menor (Dm) = 53 y el dato
mayor (DM) = 97, como puede verse en la ordenación (organización). Para el tratamiento adecuado,
procedemos a agrupar los datos por intervalos de clase de igual longitud, para lo cual necesitaremos
saber o calcular el número de intervalos que tendrá nuestra tabla.
No hay un criterio establecido para el número de agrupación de datos (intervalo de clase) a utilizar. El
primer paso para construir una tabla de frecuencia consiste en decidir cuantas CLASES o
INTERVALOS DE CLASE se van a utilizar. El número de clases depende del número de datos y del
rango de los mismos y de la información que el investigador desea obtener. Entre mayor sea el número
de datos, o más amplio el rango de los datos, mayor número de clases se necesitará para dividirlos. Por
supuesto, si se tiene sólo 10 datos, deja de tener sentido el hacer 10 clases. Como una norma, los
estadísticos usan entre 5 y 20 clases. Menos de 5 clases pueden concentrar la información y más de 20
clases pueden dispersar la información.
Hay muchos libros de texto que recomiendan un sínnumero de formas para determinar el
número adecuado de intervalos. Para nosotros debe ser claro que a mayor número de datos resulta
adecuado un mayor número de intervalos de clase, por lo que utilizaremos un criterio preciso, (aunque
personal), basado en la Regla de Sturges, que consiste en elegir k como el entero impar más
cercano a:
Podemos agregar que la experiencia y el uso a que esté destinado el agrupamiento, son criterios
determinantes en algunos casos.
La recomendación de elegir un número impar de intervalos es con el fin de mantener la posible simetría
de una distribución de datos.
16
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
k = 1 + 3.3 Log (80) = 7.28 » 7 CLASES (Entero impar más cercano), entonces:
k=7
AMPLITUD DE CLASES.
Debido a que se necesita tener los intervalos de clase de igual tamaño, el número de clases
determinará la amplitud ( i ) de cada clase. Para encontrar la amplitud de cada intervalo de clase se
utilizan las siguientes ecuaciones:
Si observamos el ejemplo anterior, podemos tomar a 6.2857 pero, resultaría engorroso el trabajar con
cuatro dígitos después del punto decimal, por lo que tomaremos la aproximación de 6.3 con ancho del
intervalo. Aquí debemos tomar en cuenta que tipo de variable estamos utilizando, o sea, si nuestros
datos son discretos o continuos. Pues si fueran datos discretos tomaríamos i = 7, ya que si tomamos el
valor 6, no concordaría con el número de intervalos que previamente se habían calculado, (esto lo
podemos calcular con un pequeño despeje de i = R/k, lo cual tendríamos k = R/i ), y tendríamos que
utilizar un intervalo más para poder “meter” los valores más altos.
Al fijar los limites de clase, es necesario tomar en cuenta que el valor mínimo de los datos debe quedar
incluido en el primer intervalo de clase y el valor máximo en el último. Para que el valor mínimo de los
datos quede incluido en el primer intervalo de clase, el primer límite inferior de clase deberá escogerse
en tal forma que sea igual o menor que él. De la misma manera, para que el valor máximo de los datos
quede incluido en el último intervalo de clase, el último límite superior de clase deberá ser igual o mayor
que él.
I1 I2 I3 I4 I5 I6 I7
17
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
( a, b ) a este intervalo pertenecen todas las observaciones que son estrictamente mayores que
a; “a mayor que” y estrictamente menores que b; “b menor que”.
( a, b ] a este intervalo pertenecen todas las observaciones que son estrictamente mayores que
a; “a mayor que” y estrictamente menores o iguales que b; “b menor o igual que”.
[ a, b ] a este intervalo pertenecen todas las observaciones que son estrictamente mayores o
iguales que a; “a mayor o igual que” y estrictamente menores o iguales que b; “b menor o
igual que”.
[ a, b ) a este intervalo pertenecen todas las observaciones que son estrictamente mayores o
iguales que a; “a mayor o igual que” y estrictamente menores que b; “b menor que”.
LÍMITES DE CLASE: Son los valores localizados en los extremos de una clase.
TAMAÑO DE CLASE (i):: Es el recorrido de valores que pueden tomar los elementos de la
frecuencia de una clase determinada. Se calcula restando los limites
reales.
Li + Ls 53 .0 − 59 .3
Marca ⋅ Clase = = = 56 .15
2 2
18
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
FRECUENCIA RELATIVA: Es la frecuencia de la clase dividida por la frecuencia total de todas las
clases y se expresa generalmente en porcentaje.
La combinación de cifras y texto no es un sistema muy eficaz ya que es necesario leer, o por lo
menos registrar, todo el parrafo antes de que se pueda comprender el significado de todo el
conjunto de cifras. Para la mayoría de las personas les resulta difícil aislar las cifras individuales
que se presentan. Sin embargo, hay la ventaja de que el autor puede dirigir la atención hacia
determinada cifra, haciéndola resaltar, y también puede llamar la atención sobre las
comparaciones de importancia.
TABLAS ESTADÍSTICAS .
Las tablas estadísticas pueden ser agrupadas en dos tipos de acuerdo con sus propósitos para
los cuales nos sirven:
19
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
NOTA DE Son usualmente escritas justamente arriba de los encabezados y abajo del titulo.
ENCABEZADO: Son usadas para explicar ciertos puntos relacionados con la tabla completa que
no han sido incluidos en el titulo o en el encabezado ni en los conceptos. Por
ejemplo la unidad de los datos es frecuentemente escrita como una nota de
encabezado, tal como "En miles" .
CONCEPTOS O Son las descripciones en hileras o filas de las tablas, son colocados al lado
COLUMNA izquierdo de la tabla. Usualmente representan las clasificaciones de las cifras
MATRIZ: incluidas en el cuerpo de la tabla. La naturaleza de las clasificaciones es indicada
por los encabezados de la columna.
NOTA DE PIE: Son usualmente colocadas abajo de los conceptos. Son usadas para clarificar
algunas partes incluidas en la tabla que no son explicadas en otras partes.
20
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
GRÁFICAS ESTADÍSTICAS
Hay una gran variedad de gráficas usadas para representar datos estadísticos, los tipos más comunes
de gráficas son:
1).- Gráfica de línea
2).- Gráfica de barras
3).- Gráficas de partes componentes
4).- Gráfica de dimensiones
5).- Pictogramas
6).- Mapas estadísticos.
GRÁFICAS DE LÍNEAS
Las curvas o gráfica de línea se usan a menudo para representar las series cronológicas, así como las
distribuciones de frecuencia. Los datos clasificados cualitativa y geográficamente raras a veces se
presentan por medio de líneas; en su lugar se usan gráficas de barras.
La Línea o líneas que representan los datos deberán resaltar claramente sobre el fondo de la gráfica.
La línea deberá, pues, dibujarse con un trazo mas grueso que las coordenadas de línea.
Cuando se trazan varias líneas en el mismo cuadrante, es esencial que cada línea se destaque con
claridad. Para ello se pueden usar tanto líneas continuas, de puntos y de guiones, como líneas gruesas
y delgadas. Cuando en una gráfica aparecen dos o más curva, deben distinguirse unas de otras. Esto
puede lograrse, de preferencia, rotulando las líneas. De ordinario es conveniente evitar el uso de mas
de dos o tres líneas en una gráfica. Especialmente si se cruzan, es muy probable que se produzca
alguna confusión.
GRÁFICAS DE BARRAS
Cuando se espera que la gráfica de simplemente una impresión muy general pueden hacerse gráficas
de barras simples, sin escalas. Cuando se desea dar una impresión menos vaga, se utilizara la escala y
si los intervalos de tiempo son diferentes, los espacios entre barra y barra también lo serán de acuerdo
a la magnitud de dichos intervalos.
Las gráficas de barras se usan para hacer representaciones de datos clasificados cronológicamente,
arreglando las barras en forma vertical para datos clasificados en forma cuantitativa. Cuando se realizan
comparaciones de datos clasificados cualitativa o geográficamente, se usan, por lo general, barras
horizontales.
Aun cuando no hay reglas establecidas para dibujar las gráficas de barras, son útiles ciertas
consideraciones:
1.- Las barras no deben ser ni excesivamente cortas y anchas, ni demasiadas largas o angostas.
2.- Entre barra y barra deberá dejarse un espacio que no sea menos, aproximadamente, que la mitad
del ancho de una barra, ni mayor que el ancho de la misma.
3.- La escala es generalmente útil. La distancia a la que se colocara no deberá exceder de la mitad de
una barra a partir de la más alta, cuando son horizontales, o de la izquierda, cuando son verticales.
4.- Las líneas que sirven como guía ayudan a leer la gráfica.
21
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
Para representar gráficamente una serie cronológica pueden usarse una gráfica de barras o de líneas.
Si la serie abarca muchos años, por lo general, no es adecuada una gráfica de barras, que es difícil de
construir. Una gráfica lineal facilita el estudio de la variación general que ha experimentado la serie;
mientras que una gráfica de barras permite comparar determinados años con mayor facilidad.
HISTOGRAMA:
Es un diagrama formado con rectángulos o barras cada uno de ellos pertenecientes a una clase. Cada
rectángulo tiene de ancho el tamaño de clase.
En el eje "Y" se grafica la frecuencia, y en el eje "X" los límites reales de clase. En el centro de su base
se señala la marca de clase.
HISTOGRAMA
30
F
r 25
e 20
c
15
u
e 10
n 5
c 0
i Intervalos de clase
a
s
POLÍGONO DE FRECUENCIA:
Es la poligonal que une los puntos cuya abscisa es la marca de clase y cuya ordenada es la
frecuencia del intervalo. Es un diagrama de líneas que se forma uniendo los centros (marca de clase) de
la parte superior de los rectángulos de un histograma mediante segmentos rectos.
22
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
F POLIGONO DE FRECUENCIAS
r 35
e 30
c
25
u
e 20
n 15
c 10
i
5
a
s 0
Intervalos de clase
OJIVA:
Es una poligonal que une los puntos cuya abscisa es el extremo superior de cada intervalo y
cuya ordenada es la frecuencia acumulada correspondiente al intervalo, con la convención de que antes
del primer intervalo considerado, la frecuencia acumulada es cero y después del último es el total de
datos (N).
OJIVA
F 90
r A
c 80
e
c u
70
u m
u 60
e
n l
50
c a
d 40
i
a a
30
s s
20
10
0
Intervalos de Clase
Durante los últimos 5 años los costos fueron de 100, 200, 300, 350 y 400 en el departamento de
damas; de 120, 180, 310, 380 y 390 en el departamento de caballeros; y de 80, 100, 160, 290, 430 en el
departamento de niños.
Los ingresos correspondientes obtenidos en este periodo fueron de 260, 390, 425, 560 y 730 en
el departamento de damas; de 300, 320, 480, 560 y 700 en el departamento de caballeros; y de 145,
210, 300, 410 y 625 en el departamento de niños.
23
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
Para lo cual sus utilidades respectivas en el departamento de damas fueron de 160, 190, 125, 210 y
310; en el departamento de caballeros fueron de 180, 140, 170, 180 y 310; y en el departamento de
niños fueron de 65, 110, 140, 120 y 195.
M.S. 5* 5
FUENTE: Revista Journal, Enero de 1996, Pag. 13.
* La manufactura fue muy poca debido a que en los meses de
Abril-Juniohubo huelga por parte del sindicato de trabajadores.
Una máquina vendedora de proporciona 16 oz. de café si se insertan monedas adecuadas. Para
probar si la máquina esta operando adecuadamente se tomaron 30 vasos de café y se midieron.
15.7 15.9 15.2 16.0 16.2 16.4 15.7 15.9 15.4 16.0 16.3 16.6
15.8 15.9 15.6 16.0 16.3 16.8 15.8 15.9 15.6 16.1 16.3 16.8
15.8 16.0 15.6 16.2 16.4 16.9
GRÁFICAS CIRCULARES
Se emplean para demostrar la relación existente entre los componentes de una clase. Cada uno de los
sectores del círculo representa una parte de un agregado de un total.
Para dividir la circunferencia en sectores se emplean proporciones, en las que se hace el total igual a
los 360 grados, o bien, cuando se trata de porcentajes, a 100%.
24
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
Para evitar los cálculos resulta muy conveniente emplear un transportador de porcentajes que tiene
graduados los grados y los porcentajes, A falta de ese transportados de porcentajes, podemos
simplificar el procedimiento si partimos del siguiente razonamiento: si 1% equivale a 3.6 grados, basta
multiplicar el porcentaje por este factor y el producto así obtenido equivale a los grados que le
corresponde en la circunferencia.
PICTOGRAMAS
Las gráficas de volumen al presentar dibujos que se relacionan directamente con la naturaleza de los
datos que representan son más atractivas; sin embargo; como ya se señalo presentan mayores
dificultades, tanto para su elaboración como para su adecuada interpretación.
Este valor pictórico, puede conservarse usando varios dibujos pequeños que representen una cantidad
fija de los datos, del mismo tamaño, y arreglándolos de manera que se forme una gráfica de barras. A la
gráfica resultante se le llama pictograma.
Aunque este diagrama es esencialmente una gráfica de barras es más atractivo y, por lo tanto, hay
mayor probabilidad de que lo examine el lector. En los pictogramas las barras, aun cuando representen
series cronológicas, se arreglan en forma horizontal, porque aparece más adecuado poner los dibujos
(cosas o personas) uno al lado del otro y no uno encima del otro.
MAPAS ESTADÍSTICOS
Los mapas estadísticos son artificios gráficos que muestran la información cuantitativa sobre una base
geográfica. Los tipos más comunes son los mapas sombreados o rayados, los mapas punteados y los
mapas de alfileres.
25
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
Una vez que los datos han sido obtenidos y organizados, el investigador esta listo para realizar un
análisis descriptivo. En el tratamiento de los datos, es útil resumir sus características principales. Para
ello, se plantean las siguientes cuestiones: ¿Cuál es el dato de mayor frecuencia? ¿Cuál es el valor
central de la distribución? ¿Qué tan separados se encuentran los datos? Las respuestas a estas
interrogantes es por medio de las medidas descriptivas conocidas como de Tendencia Central, de
dispersión, de sesgo y kurtosis.
MEDIA ARITMÉTICA ( X )
∑x
I =1
i
x =
N
VENTAJAS:
DESVENTAJAS:
Puede afectarse por los valores extremos que no son representativos del resto de los valores.
MEDIANA ( Md )
La mediana es el valor único de un conjunto de datos que mide al elemento central de los datos.
Para encontrar la mediana de un conjunto de datos, primero se ordenan los datos de menor a mayor. Si
el conjunto de datos tiene un número impar de elementos, el elemento de la mitad del arreglo es la
mediana { (N+1)/2 }. Si hay un número par de elementos, la mediana es el promedio de los dos
elementos de la mitad { N/2 }.
VENTAJAS:
Los valores extremos no afectan la mediana tan fuertemente como lo hacen con la
media.
Se puede encontrar la mediana aún cuando los datos sean descripciones cualitativas
como el color o la claridad.
26
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
DESVENTAJAS:
MODA ( Mo )
VENTAJAS:
Se puede usar como una medida de localización central tanto para datos cualitativos
como cuantitativos.
La moda no esta afectada por los valores extremos.
DESVENTAJAS:
Muy a menudo no hay un valor modal porque el conjunto de datos no contiene valores
que se repiten más de una vez.
Otras veces, cada valor es la moda porque cada valor aparece el mismo número de
veces.
Cuando el conjunto de datos tiene dos, tres o más modas, éstas son difíciles de
interpretar y comparar.
N x i = Marca de clase
∑f i x i ∑f = N = Total de datos
x = i =1
f = Frecuencia
N
Se divide N/2 para encontrar la clase mediana para datos pares, (N+1)/2 para datos impares.
d1 + d2
frecuencia de la clase anterior.
MEDIDAS DE DISPERSIÓN:
Indican el grado de esparcimiento de los datos con respecto al valor central. Las medidas de
dispersión se usan para poder verificar si el promedio es representativo o no de la muestra y como base
de control de la variación misma.
Una dispersión pequeña indica un alto grado de uniformidad. Las medidas de dispersión son:
desviación estándar, varianza y rango.
N S2 =Varianza.
∑ ( xi − x) 2
xi = Dato individual o
marca de clase.
S2 = i =1 x = Media Aritmética.
N = Total de datos.
N
Para la varianza, sin embargo, las unidades son el cuadrado de las unidades de los datos, por ejemplo,
"dólares al cuadrado" o "dólares cuadrados", no son expresiones intuitivas claras de interpretar. Por
esta razón, debe efectuarse un cambio significativo en la varianza para calcular una medida de
desviación útil, una que no presente problemas con las unidades de medidas y sea menos confusa.
Este parámetro es llamado la DESVIACIÓN ESTÁNDAR y es la raíz cuadrada de la varianza.
DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS
28
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos
La desviación estándar permite determinar, con cierto grado de certeza dónde están localizados los
valores de una distribución de frecuencia con relación a la media.
∑ f (x i i − X )2 X = Media Aritmética.
S =i i =1 N = Total de datos.
f = frecuencia del intervalo.
N
2 S = Desviación Estándar.
n
n
∑ f i ⋅ d i2 ∑ f i ⋅ d i xi = Dato individual.
di = Desviación en unidades
s=i i =1
− i =1 de intervalo.
N N N = Total de datos.
f = frecuencia del intervalo.
i = Amplitud de la clase.
Bibliografía.
Anderson, D. (2007) Estadística para Administración y Economía. México: Pearson
Berenson, M., Levine, D. (1996) Estadística Básica en Administración, Conceptos y Aplicaciones. (6aEd.). México :Prentice Hall Hispanoamericana
Hildebrand, D. (1998). Estadística Aplicada a la Administración. México: Pearson
Levin, R. I., (2004). Estadística para Administración y Economía. México: Pearson
Levine, D., Krehbiel, T., Berenson, M. (2006). Estadística para Administración. (4ta. Ed.). México.:Printece Hall
Webster, A. (2005). Estadística Aplicada a los Negocios y la Economía. (3ra Ed. ). México: Prentice Hall.
Stephen, P. Shao (1970) Estadística para economistas y administradores de empresas. (6aEd.). México: Trillas
29