Вы находитесь на странице: 1из 29

Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

APUNTES DE
ESTADÍSTICA DESCRIPTIVA
MC Raúl Adalberto Morelos
Centro de Estudios Superiores del Estado de Sonora
Unidad Académica de San Luis Río Colorado, Sonora México.

Septiembre 2010

1
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

Índice
Tema Página

Unidad 1
Conceptos Básicos ¿Qué es la estadística? ------------------------- 3
Datos estadísticos ----------------------------------------------------------- 4
Importancia Actual de la estadística ------------------------------------ 4
Clases de estadística ------------------------------------------------------- 5
Estadística Descriptiva ------------------------------------------------------ 6
Estadística Inferencial ------------------------------------------------------- 6
Definición del concepto de estadística ---------------------------------- 7
Ejercicio 1.1 -------------------------------------------------------------------- 9
Ejercicio 1.2 -------------------------------------------------------------------- 9

Unidad 2
Métodos estadísticos ------------------------------------------------------- 10
Recopilación de datos ------------------------------------------------------ 11
Organización de datos ----------------------------------------------------- 12
Organización de datos usando arreglos ------------------------------- 15
Organización de datos usando una distribución de
frecuencias -------------------------------------------------------------------- 15
Número de clases o intervalos ------------------------------------------- 16
Amplitud de clases ---------------------------------------------------------- 17
Tabla de frecuencias -------------------------------------------------------- 18
Datos fundamentales de una tabla de frecuencia ------------------- 18
Otros métodos de presentación de datos ----------------------------- 19
Partes principales de una tabla ------------------------------------------ 20
Gráficas estadísticas -------------- ---------------------------------------- 21
Representación gráfica de una tabla de frecuencia ---------------- 22
Ejercicio 2.1 ------------------------------------------------------------------- 24
Medidas de tendencia central para datos NO agrupados --------- 26
Medidas de tendencia central para datos agrupados -------------- 27
Medidas de dispersión para datos No agrupados ------------------ 28
Medidas de dispersión para datos agrupados ----------------------- 29
Bibliografía --------------------------------------------------------------------- 29

2
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

ESTADÍSTICA GENERAL.
CONCEPTOS BÁSICOS

¿QUE ES LA ESTADÍSTICA?

Con el fin de estudiar inteligentemente el tema de la estadística debemos, en primer lugar, comprender
lo que él termino significa en la actualidad así como conocer algo de su origen.

Como en la mayoría de los vocablos, la palabra “estadística” tiene diversos significados para diferentes
personas. Cuando la mayoría de la gente escucha el término lo relaciona con cuadros o tablas llenas de
cifras sobre nacimientos, muertes, matrimonios, divorcios, accidente de automóviles, etc., que ofrecen,
por ejemplo, en los almanaques anuales, y que indudablemente usan el término con toda corrección. A
decir verdad, el término en cuestión fue inicialmente usado para tabular las funciones del Estado en lo
que respecta a los datos necesarios para una planeación idónea, reglamentaciones y recaudación de
impuestos. Los cobradores de impuestos y los encargados de hacer este tipo de análisis eran llamados
“estadísticos” por su dedicación a compaginar datos e informes requeridos por el Estado.

En la actualidad, desde luego, la palabra “estadística” se aplica en este primer sentido para casi todo
relacionado con los informes basados en hechos y consignados en base a números, lo que
comúnmente se denomina: “Hechos y cifras”. Los anunciadores de radio y televisión nos informan que
“en unos cuantos minutos darán la estadística del juego ...”y los periódicos con frecuencia publican
artículos a cerca de concursos de belleza en los cuales brindan las “estadísticas” de las concursantes.

Sin embargo, el término tiene otros significados y la gente que no esta familiarizada con la materia los
desconoce. La estadística es una rama del conocimiento el campo de las matemáticas aplicadas, que
utiliza sus propios símbolos, términos, contenido, teoremas y técnicas. Cuando se estudia la
“estadística” normalmente se pretende dominar algunas de estas técnicas.

Para todos aquellos ya iniciados en los misterios de campo de las estadísticas, el vocablo tiene una
segunda aceptación; las estadísticas son cantidades que han sido calculadas con datos de muestreo:
una sola cantidad así calculada se denomina “estadística”. Por ejemplo, la media de la muestra es una
estadística, así como también lo son la mediana de la muestra y el modo. La varianza de la muestra es
una estadística, como también lo es la gama de la muestra. El coeficiente de correlación de la muestra
es asimismo una estadística.

La estadística está desarrollada para tratar con datos numéricos o información cuantitativa. La palabra
"estadística", por lo tanto ha sido ampliamente referida ya sea a la información cuantitativa misma como
a los métodos que tratan con la información. Los estadísticos prefieren llamar a la información
cuantitativa Datos Estadísticos y a los métodos que tratan con la información los Métodos
Estadísticos.

Por ESTADÍSTICA debemos entender que son los métodos por medio de los cuales podemos
recolectar, organizar, presentar y analizar datos numéricos de un conjunto de individuos permitiéndonos
extraer conclusiones válidas y efectuar decisiones lógicas basadas en dicho análisis.

Los DATOS son agrupaciones de cualquier número de observaciones relacionadas. Para que los datos
sean útiles, las observaciones deben estar organizadas en tal forma que se puedan identificar
tendencias y llegar a conclusiones lógicas.

3
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

DATOS ESTADÍSTICOS

La información cuantitativa apropiada para el análisis estadístico debe ser un conjunto (o conjuntos) de
números que muestren relaciones significativas. En otras palabras, los datos Estadísticos son números
que pueden ser comparados, analizados e interpretados.

Un número aislado que no se compara o que no muestra relación significativa con otro número no es
dato estadístico. Por ejemplo: Las edades de 1000 estudiantes son datos estadísticos, puesto que las
edades pueden ser comparadas y analizadas, y los resultados de los análisis pueden ser interpretados.

El área de la cual los datos estadísticos son recopilados, se le conoce como población o universo.

Si deseamos tener las edades de 25 estudiantes en la clase de Biometría, podemos simplemente


preguntar a cada estudiante su edad: así tenemos un conjunto completo de datos. Sin embargo
recopilar tales datos de una población finita pero grande es algunas veces imposible o impráctico. A fin
de evitar la tarea imposible o impráctica, usualmente se extrae una muestra de elementos
representativos de la población. La muestra entonces, utilizada para el estudio estadístico y los
resultados de la muestra son usados como las bases para describir, estimar o predecir las
características de la población.

Podemos resumir los significados del término “Estadística” como sigue:


1. La acepción publica de cifras y hechos, gráficas y mapas. El término en este sentido se usa en
plural.
2. La materia propiamente dicha, con su terminología, metodología y conocimientos particulares.
Bajo este concepto el término se usa en singular.
3. Cantidades calculadas sobre datos de muestreo, en cuyo caso el término se usa en plural.

IMPORTANCIA ACTUAL DE LA ESTADÍSTICA

La aplicación de las técnicas estadísticas se ha extendido tanto, y la influencia de la estadística en


nuestra vida es tan grande, que difícilmente podemos ponderarla lo bastante.

Nuestra abundancia agrícola actual se puede explicar parcialmente gracias a la aplicación de la


estadística a los planos y a los análisis de los experimentos agrícolas. Este es un campo en el cual la
técnica estadística se utilizó relativamente al principio. Algunas de las preguntas que los métodos de la
estadística ayudan a contestar son: ¿Qué clase de maíz da los mejores rendimientos? ¿Qué clase de
mezcla alimenticia se debe dar a las gallinas para que obtengan el mayor peso? ¿Qué clase de mezcla
de semillas de pasto da mayor número de toneladas de forraje por hectárea? Todas estas preguntas y
cientos mas nos afectan a todos en forma directa a través del mercado domestico.

La metodología de la estadística también se usa constantemente en la investigación médica y


farmacéutica. La eficacia de nuevos medicamentos se determina por medio de experimentos realizados
primero en animales y, posteriormente, en seres humanos. Los adelantos de la investigación médicas y
las nuevas drogas nos afectan casi a todos.

La estadística también es empleada por los gobiernos. La información económica es objeto de estudio
y afecta la política del gobierno en lo que respecta a los impuestos y a partidas asignables a obras
públicas (tales como caminos, presas, etc.), a fondos para la asistencia pública, y otros. La estadística

4
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

del desempleo influye incrementando los esfuerzos para disminuir el porcentaje correspondiente. Los
métodos estadísticos se aprovechan para evaluar el funcionamiento de todo tipo de equipo militar,
desde las balas para las pistolas hasta enormes proyectiles dirigidos. La teoría de las probabilidades y
la estadística (especialmente un nuevo campo llamado teoría estadística de la toma de decisiones) se
usan como ayuda para tomar decisiones sumamente importantes en los altos niveles.

En cuanto a la industria privada, el empleo de las estadísticas es casi tan importante en sus efectos
como en el sector gubernamental. Se usa las técnicas estadísticas para el control de calidad de los
productos en proceso y para evaluar la aceptación de los nuevos productos que se van a lanzar al
mercado. La estadística se emplea en el mercado, en las decisiones para la ampliación de los negocios,
en el análisis de la eficacia de la publicidad, etc. Las compañías de seguros se basan en las
estadísticas para fijar sus tarifas a un nivel realista. La lista sería interminable. La estadística se emplea
en la geología, biología, psicología, sociología; en todo sector en el que las decisiones deben de
hacerse a base de los datos o informes incompletos. Se usan también en pruebas educacionales, para
medidas de seguridad en la ingeniería. La meteorología, la ciencia de la predicción del tiempo, también
esta usando la estadística actualmente.

Aún hay sectores aparentemente heterogéneos que las emplean. ¿Quién habría supuesto que las
estadísticas ayudaran a un erudito o a un investigador histórico a determinar quien es el autor de obras
en disputa? En este particular, creemos que el ejemplo mas conocido es el del empleo de las
estadísticas para establecer la prolongada controversia sobre quien fue el autor de los ensayos literarios
en los “Federalist Papers”.

En planos menores, se han hecho estudios estadísticos sobre el efecto que la luna llena tiene la pesca
de las truchas; sobre cual sería el tipo más adecuado del vaso para el agua de los restaurantes; así
como la estrategia óptima para juegos de destreza y azar, tales como el bridge, los solitarios, el
veintiuno, el béisbol, etc.

No cabe la menor duda de la importancia de los efectos de las técnicas estadísticas en todo y en cada
uno de nosotros. Los resultados de los estudios estadísticos se pueden ver, aunque quizás no se
comprendan, al recibir nuestros sueldos, en los pagos de pensiones, del seguro social, los premios de
las primas de seguros, en nuestra satisfacción al consumir diversos productos y en nuestra propia
salud.

CLASES DE ESTADÍSTICA

La estadística normalmente se divide en dos grandes categorías: La estadística DESCRIPTIVA y la


estadística INFERENCIAL.

Como complemento a las breves consideraciones de los elementos básicos de la probabilidad, hay dos
clases de estadísticas tratadas en este libro. El nombre que naturalmente mas se ajusta a este tipo de
estadística es el de estadística descriptiva. La clasificación de datos; el trazo de los histogramas que
corresponden a las distribuciones a una población; la representación de los datos por medio de otras
clases de gráficas, tales como las lineales, las gráficas en barras, los pictogramas; él cómputo de
medidas muestrales, medianas y modos; él cómputo de varianzas, las medidas de las desviaciones
absolutas y de la gama; todas estas operaciones se refieren a la estadística descriptiva. La labor
estadística ejecutada en el siglo XIX y principios de este siglo, fue en su mayor parte la estadística
descriptiva.

5
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

ESTADÍSTICA DESCRIPTIVA
Significado de Estadística

La palabra “Estadística” ha sido frecuentemente referida a la información cuantitativa o numérica.


También ha sido referida ampliamente a los métodos que se tratan con la información. Sin embargo
esto debería aclararse y llamar a la información, datos estadísticos y a los métodos, métodos
estadísticos.

La estadística descriptiva es la parte de la estadística que agrupa las técnicas apropiadas para la
organización, representación y descripción de un conjunto de datos con el propósito de resaltar sus
rasgos más importantes y extraer la información esencial que contiene. En nuestros términos, diremos
que la estadística descriptiva permite tener una visión “a vuelo de pájaro” de la variable que miden los
datos para adelantar conclusiones acerca de ella o preparar un estudio mas fino de la misma para la
toma de alguna decisión.

En pocas palabras, la Estadística Descriptiva permite tener una visión “a vuelo de pájaro”, de la variable
que miden los datos para adelantar conclusiones acerca de ella o preparar un estudio más fino de la
misma, para la toma de alguna decisión.

Ejemplo 1.1 : Supóngase que un profesor que calcula un promedio para una clase de Historia. Como él
está usando estadística para describir el comportamiento de esa clase y no para
hacer una generalización acerca de varias clases, se puede decir que él está usando
estadística descriptiva. Los gráficos, las tablas y mapas que muestren datos en tal forma
que sean más fáciles de entender son ejemplos de estadística descriptiva.

ESTADÍSTICA INFERENCIAL
Y su significado

La segunda parte importante de la estadística se refiere a la Estadística Inferencial. Antes definimos a


la estadística como la ciencia para tomar decisiones ante alguna incertidumbre; esto es, llegar a la
mejor resolución sobre bases de una información incompleta. Con el fin de llegar a una decisión sobre
una población, se toma una muestra (generalmente de unos cuantos de los miembros) de esa
población. Dicha selección se hace, generalmente, al azar, a pesar de que existen varios medios de
muestreo. En este libro nos circunscribimos al uso del muestreo al azar. Por lo que dicho término
implica, se puede apreciar que se trata de un método de muestreo en los que los elementos que lo
integran son seleccionados bajo un proceso que no esta bajo el control del investigador. Se conocen
varias definiciones de matemáticas del muestreo del azar, pero nosotros lo aceptaremos como un
muestreo en el que cada elemento escogido de la población tiene la misma oportunidad de ser
seleccionado, y en el que la selección de cualquier elemento no afecta que se pueda seleccionar
cualquier otro.

Sobre la base de un muestreo al azar, inferimos ciertos datos acerca de la población. La inferencia que
hacemos acerca de la población sobre bases de este tipo de muestreo se conoce como inferencia
estadística. En otras palabras, la inferencia estadística es el empleo de la técnica de muestreo para
llegar a determinadas conclusiones acerca de la población de la cual se han obtenido las muestras.

De manera general, la Estadística Inferencial es: la Estadística mediante la cual se obtienen


generalizaciones o se toman decisiones en base a una información parcial o incompleta obtenida
mediante técnicas descriptivas. Los datos se analizan de una manera más detallada, se interpretan y se
infieren.

6
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

Si una muestra es representativa de una población, se puede deducir importantes conclusiones acerca
de ésta, a partir del análisis e interpretación de la misma.

Ejemplo 1.2: Supóngase ahora que el profesor de Historia decide usar las notas
promedios en una de la clase de Historia para estimar la nota promedio obtenida en los
diez grupos del mismo curso de Historia. El proceso para estimar esta nota será un
problema de inferencia estadística. Obviamente, cualquier conclusión que realice el
profesor acerca de los diez grupos del curso estará basada en una generalización que va
más allá de los datos originalmente obtenidos en el curso de Historia. La generalización
del profesor puede no ser completamente válida y él debe establecer cuanto tiene de
cierto.

Al efectuar una investigación o experimento, es necesario definir qué datos se pretenden obtener de la
POBLACIÓN en estudio.

Para ello debemos definir los siguientes conceptos:


POBLACIÓN: Es una agrupación de todos los elementos que se están estudiando y de los cuales se
está tratando de obtener conclusiones. Se debe definir esta población para precisar si un elemento que
pertenece a la población.
POBLACIÓN FINITA: Cuando una población consta de un número limitado (finito) de elementos. Por
ejemplo, si se desea obtener información acerca de la capacidad didáctica de los 40 profesores de una
universidad, se obtendrán datos de una población finita.
POBLACIÓN INFINITA: Cuando una población consta de un número ilimitado de elementos. Por
ejemplo, la población formada por todos los posibles sucesos (cara, sol) en tiradas sucesivas de una
moneda es infinita, puesto que hipotéticamente la moneda puede lanzarse un número infinito de veces.
MUESTRA: Una muestra es una agrupación de algunos elementos de la población, pero no todos. La
mayoría de las veces no es posible o práctico observar todos los elementos de la población, en todo
caso se toma solo una parte de ella.
PARÁMETRO: Cuando una medida se calcula a partir de los datos de una población.
ESTADÍSTICO: Cuando una medida se calcula a partir de los datos de una muestra.

MEDIDA ESTADÍSTICO (MUESTRA) PARAMETR0 (POBLACIÓN )


Media aritmética (Promedio) µ
x
Desviación Estándar S σ
Número de datos o elementos n N
VARIABLE: Es una característica que toma valores diferentes en personas, lugares y cosas diferentes.
VARIABLE ALEATORIA: Son variables cuyos valores son el resultados de factores fortuitos.
VARIABLE ALEATORIA DISCRETA: Se caracteriza por saltos o interrupciones en los valores que esta
puede obtener (estos valores se asocian a cualquier valor entero).

Ejemplos 1.3:
• El número de automóviles vendidos en un mes.
• El número de clientes esperando servicio en la caja de un supermercado.
• El número de tubos electrónicos de T.V. producidos en una hora determinada.

7
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

VARIABLE ALEATORIA CONTINUA: Es aquella que puede tomar cualquier valor de entre todos los
contenidos en un intervalo de recta.

Ejemplo 1.4:
• La cantidad de energía eléctrica producida en una planta hidroeléctrica en un día.
• El tiempo necesario para completar el ensamblaje de un artículo en una planta.
• La cantidad de petróleo bombeado cada hora en un pozo.

La estadística está desempeñando un importante papel ascendente en casi todas las facetas del
progreso humano. Anteriormente solo era aplicada a los asuntos del Estado, ahora su influencia se
extiende a la agricultura, biología, negocios, química, comunicaciones, economía, educación,
electrónica, medicina, física, ciencias políticas, psicología, sociología, y otros campos de la ciencia. Este
desarrollo de la estadística está ligada a los métodos científicos en la toma, organización, presentación
y análisis de los datos, tanto para la deducción de conclusiones como para tomar decisiones razonables
de acuerdo con tales análisis.

No cabe la menor duda de la importancia de los efectos de las técnicas estadísticas en todos y cada
uno de nosotros. Los resultados estadísticos se pueden ver, aunque quizás no se comprendan, al recibir
nuestro salario, en los pagos de pensiones, los premios de las primas de seguro, en nuestra
satisfacción al consumir diversos productos y en nuestra propia salud.

8
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

EJERCICIOS 1.1: ESTADÍSTICA GENERAL.

1) Identifique las variables aleatorias siguientes como discretas o continuas.

a) El número de transistores defectuosos en un embarque de 10,000 transistores.


b) El número de robos ocurridos en un almacén en un período de tiempo.
c) La cantidad de gasolina consumida por un vehículo en una prueba de 100 km.
d) Las ventas brutas de un supermercado en un día determinado.
e) El número de pólizas vendidas en una determinada semana por un agente de seguros.
f) La demanda diaria de energía eléctrica en una determinada ciudad.
g) La duración de una bombilla eléctrica observada en un experimento.

EJERCICIOS 1.2: ESTADÍSTICA DESCRIPTIVA E INFERENCIAL


Identifique, en dónde se está utilizando la estadística descriptiva y dónde la inferencial.

1.- En una prueba de aptitudes, tres trabajadores recibieron calificaciones de 90, 85 y 80. Tres
trabajadoras recibieron calificaciones de 89, 86 y 92. De las siguientes declaraciones realizadas
con base en estas calificaciones identifíquense aquellas que se derivan de métodos descriptivos
y aquellos que se derivan de inferencia estadística.

a) La calificación promedio de los tres trabajadores es 85, y la calificación promedio de las tres
trabajadoras es 89.
b) La aptitud promedio de todas las trabajadoras es probablemente mayor que la de los
trabajadores.
c) En las siguientes pruebas de aptitudes, probablemente los trabajadores reciben calificaciones
mas bajas que las trabajadoras.

2.- Tres bombillas de marca A dejaron de funcionar después de 1100, 900 y 1000 hrs. de uso
continuo. Cuatro bombillas de la marca B dejaron de funcionar después de 1050, 960, 1070 y
840 hrs. de uso continuo. Se llega a las siguientes conclusiones, ¿Cuáles de ellas provienen de
la estadística descriptiva y cuáles de la inferencial?

a) La duración promedio de las tres bombillas marca A es de 1000 hrs mientras que la duración
promedio de las cuatro bombillas marca B es de 980 hrs.
b) La duración promedio de todas las bombillas marca A es mayor que todas las bombillas de la
marca B.
c) La diferencia entre los dos promedio es de 20.
d) La diferencia entre los dos promedio es demasiado pequeña para llegar a la conclusión de que
las bombillas marca A son mejores que la marca B.
e) Si se selecciona y prueba otra bombilla de marca A, probablemente durará más que el promedio
de las bombillas marca B.
f) Usted decide comprar bombillas marca A en vez de bombillas marca B.

9
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

Unidad 2:DESCRIPCIÓN DE LOS DATOS.

Cuando los datos están organizados en una forma compactada y fácil de utilizar, se puede obtener
información del medio digna de confianza y utilizarla para decisiones inteligentes

MÉTODOS ESTADÍSTICOS

En un estudio estadístico los métodos estadísticos son divididos en cinco pasos básicos.
a) Recopilación. d) Análisis.
b) Organización. e) Interpretación.
c) Presentación.

Estrictamente hablando, no hay línea de división definitiva que separe los cinco pasos básicos. Algunos
de los métodos pueden ser usados en más de un paso.

a) RECOPILACIÓN DE DATOS
De acuerdo a la localización de la información los datos estadísticos pueden se clasificados en
datos Internos y datos Externos.

DATOS INTERNOS: Es cuando la información cuantitativa es obtenida dentro de la organización


que hace el estudio estadístico; Tal como los sueldos de empleados de una lista de pagos,
recibos de caja de la oficina de contabilidad de la organización.

DATOS EXTERNOS: Es cuando la información es obtenida fuera de la organización. Los datos


externos son usualmente obtenidos de dos maneras:

- Datos publicados: (revistas, periódicos, instituciones de investigación,


universidades, publicaciones editadas por gobierno federal,
editores privados, etc...)

- Encuestas de datos originales (encuestas, entrevistas, etc..)

1).- Obtención de datos publicados. Los datos publicados pueden ser obtenidos fácilmente si las
fuentes de datos son conocidas por el lector.

En relación con esto, es importante conocer las clases de fuentes de datos y las fuentes de datos
publicados.

1.1) FUENTE PRIMARIA Y SECUNDARIA

Las fuentes de datos publicados pueden ser clasificadas en dos clases primarias y secundarias.
Una fuente de datos se denomina primaria cuando los datos obtenido de la publicación EDITADA por el
recopilador original de los datos.

La fuente llamada secundaria cuando los datos son obtenidos de una reimpresión, la cual es publicada
por una organización distinta del recopilador original.

FUENTES DE DATOS PUBLICADOS


Los siguientes siete grupos son las fuentes más importantes de datos publicados con relación a las
actividades de los negocios y económicos, aunque de ninguna manera puede considerarse como una
lista completa de fuentes.

10
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

a).- Agencias gubernamentales


b).- Asociaciones empresariales
c).- Revistas y publicaciones periódicas de empresas
d).- Periódicos y almanaques
e).- Organizaciones privadas de servicio de estadística
f).- Organizaciones internacionales
g).- Otras organizaciones de negocios y educativas

ELABORACIÓN DE UNA ENCUESTA

El trabajo de elaborar una encuesta esta usualmente limitado por los factores del tiempo, dinero y mano
de obra disponible para el estudio.

En vez de recopilar información completa relacionada con el estudio, una muestra consistente de un
grupo de elementos representativos es ordinariamente sacada de la fuente de información (población)
en una encuesta.

Los métodos más comunes de recopilación de datos a través de muestras son: Observación Directa y
Formulación de Preguntas.

OBSERVACIÓN DIRECTA

El método de observación directa puede dar información exacta y es usualmente preferida, ya que
puede ser empleado efectiva y económicamente. Sin embargo, está limitado a unos pocos tipos de
estudio y es a menudo demasiado inconveniente en observaciones reales de ciertas operaciones.

Ejemplos:
a).- Si un investigador desea conocer los precios de menudeo de los alimentos de una ciudad
puede ir a un grupo seleccionado de tiendas para observar los precios marcados en los mismos.

b).- Si deseamos conocer el ingreso recibido en una semana por un grupo de taxistas sería muy
inconveniente observarlos a ellos. Sería más práctico y fácil obtener los resultados haciéndoles
ciertas preguntas.

FORMULACIÓN DE PREGUNTAS

Hay 3 formas de hacer preguntas a fín, de recopilar datos originales.


a).- Entrevistas personales
b).- Por teléfono
c).- Cuestionario por correo

Al diseñar un cuestionario debemos de tener presente los siguientes puntos:

1).- El número de preguntas deberá ser conservado en un mínimo


2).- Las preguntas deberán ser breves y claras
3).- Preguntas ofensivas deberán ser evitadas
4).- Preguntas que induzcan a una respuesta no deberán ser usadas
5).- Las preguntas deberán ser fáciles de contestar
6).- Las preguntas deberán requerir contestaciones simples.

11
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

Reglas de Redacción y contenido de las Preguntas:

1.- Facilitar la memoria: No debe preguntarse sobre hechos ocurridos hace mucho tiempo; las
preguntas deben limitarse al pasado inmediato (un mes máximo)
2.- No deben usarse más palabras de las que sean necesarias (máximo 20 por pregunta).
3.- Las palabras empleadas deben ser simples, fáciles de pronunciar y de ser posible de uso común.
4.- Deben evitarse al máximo emplear términos comerciales o de negocios y palabras cargadas o
insinuantes.

Ej. ¿Verdad que la Compañía X es la mejor de su ramo?

5.- Asimismo al elaborar la pregunta debe tenerse cuidado en no dar la respuesta.

Ej. ¿Asiste usted al cine por lo menos una vez a la semana?

6.- No debe forzarse a la persona a que realice cálculos, complicados porque ésta, tenderá a cansar
rápidamente al entrevistado.

Ej. ¿Cuántos Kgrs. de azúcar se consumen en su hogar?

7.- Cuando se tenga que realizar una pregunta que por su naturaleza sea embarazosa o difícil de
contestar, es necesario planear cuidadosamente su redacción, para evitar una gran cantidad de
contestaciones falsas.

Ej. ¿Cada cuántos días se baña usted?

8.- Al realizar preguntas referidas a tiempos es necesario fijar intervalos adecuados a las posibles
contestaciones y la pregunta debe referirse de preferencia a una fecha concreta.

Ej. ¿Cuándo fue la última vez que asistió usted al cine?

9.- Cuando tratan de medirse aspectos relacionados con la calidad de un producto, o bien su sabor, su
aroma, su aspecto y otras características similares, es recomendable el uso de respuestas
preformuladas, utilizando escalas de conceptos o de valores o una combinación de ambas.

Ej.
Excelente 3
Muy Bueno 2
Bueno 1
Regular 0
Malo -1
Muy Malo -2
Pésimo -3

10.- Evitar motivos emocionales o estereotipados, ciertos nombres, expresiones o hechos que son
susceptibles de provocar reacciones de tipo Psicológico positivo o negativos y alterar la respuesta.

Ej. El Presidente de la República mencionó en su discurso. ¿Usted qué Opina?


En este caso el presidente eclipsa el asunto que se discutía.

12
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

11.- Por último es conveniente destacar los siguientes puntos que influyen en forma determinante en la
redacción de un buen cuestionario:

• No abrumar con palabras altisonantes.


• Construir las preguntas gramaticalmente breves
• No usar vulgarismos
• No someter a negativas dobles.
• Evitar dobles significados.
• Evitar preguntas capciosas.
• Mencionar lo que antecede, siempre que exista la posibilidad de olvido o confusión.

Elementos del Cuestionario.

Reporte: Es una breve introducción al tema, objetivo de la encuesta se usa para crear confianza y
cooperación en el encuestado.

Consigna: Es la indicación de como contesta a determinada pregunta, debe ser muy explícita al
diseñarse y haber un número máximo e igual de las preguntas.

Por ej. Ponga una cruz en la respuesta que crea, enumere del 1 al 4 etc.

Pregunta introductoria: Deben ser fáciles de contestar, están antes del tema principal y sirven para
introducirlo.

Preguntas Básicas: Es el elemento clave del cuestionario aquel están traducida las observaciones de la
investigación y deben ser lo suficientemente extensas para que cubra los mismos.

Escala de Sinceridad: Son trampas que se le ponen al encuestado para ver si este dice la verdad, como
cuando en el cuestionario se repiten las preguntas y, si estas son cortas deben redactarse de diferente
manera la misma pregunta.

Pregunta de Clasificación: Tara de la información sobre el individuo, edad sexo domicilio, no. de hijos,
nacionalidad etc., son preguntas de identificación al final del cuestionario por que podrían influir en la
respuesta si fueran al principio.

ORGANIZACIÓN DE DATOS ESTADÍSTICOS

Dentro de una organización de datos estadísticos debemos tomar en cuenta:

1).- Crítica y corrección de datos recopilados. Un corrector puede encontrar una o varias de las
siguientes cosas que deberían ser corregidas y tratadas.
a).- Las respuestas son inconsistentes
b).- La escritura no es determinable
c).- Las respuestas son incompletas
d).- Se necesitan cálculos

2).- Clasificación de datos corregidos. Hay muchas formas de clasificar datos estadísticos en general las
clasificaciones pueden ser determinadas de acuerdo a 4 bases:
Tiempo, lugar, cantidad y cualidad.

13
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

CUALITATIVA.- En esta clasificación la distinción es mas bien de clases que de cantidad. Por ejemplo,
cuando los empleados se clasifican en sindicalizados y no sindicalizados, tenemos una diferencia
cualitativa. Los agricultores pueden clasificarse en propietario, parcialmente propietarios,
administradores y arrendatarios. En hule puede clasificarse en cultivo o silvestre, de acuerdo con su
origen.

CUANTITATIVA.- Cuando los valores se modifican con respecto a una característica mensurable,
conviene una clasificación cuantitativa. Por ejemplo, las familias pueden clasificarse de acuerdo con él
numero de hijos, las empresas industriales, según él número de obreros empleados y también
desacuerdo con el valor de los artículos producidos. La mayoría de las distribuciones cuantitativas son
distribuciones de frecuencia, que son la forma básica de organización de los datos para sus análisis
estadísticos. Los datos clasificados cualitativamente a veces pueden clasificarse de nuevo sobre bases
cuantitativas, mediante cambios muy ligeros.

CRONOLÓGICA.- Los datos cronológicos o las series cronológicas contienen cifras relativas a un
fenómeno determinados en diversos periodos de tiempo especificados. Por ejemplo, se puede mostrar
la cotización diaria de cierre de ciertas acciones durante un periodo de meses o años, puede registrarse
el coeficiente anual de natalidad de varios años, puede indicarse la producción mensual de carbón
durante un lapso dado de años. Las series cronológicas tiene un cierto modo algún parentesco con las
distribuciones cuantitativas, por el hecho de que cada año o mes sucesivo de una serie esta un año o
un mes alejado del punto de referencia anterior. Sin embargo, los periodos de tiempo o más bien los
acontecimientos, que ocurren dentro de estos periodos difieren cualitativamente entre sí.
Ocasionalmente una serie cronológica puede convertirse en una distribución de frecuencias.

GEOGRÁFICA.- La distribución geográfica es esencialmente un tipo de distribución cualitativa, pero en


general se considera como una clasificación especial. Por ejemplo, cuando se muestra la población de
cada unos de los estados, tenemos datos clasificados geográficamente. Aun cuando existe una
diferencia cualitativa entre dos estados cualesquiera, la distinción que se establece no es de clase sino
de situación. A veces es posible esperar una distribución geográfica en forma de distribución de
frecuencias.

3).- Tabulación de datos clasificados. Después de que se han decidido las clasificaciones adecuadas o
deseadas el siguiente paso en la organización de los datos es arreglar la masa de hechos cuantitativos
en una forma resumida basadas en las clasificaciones.

Este proceso se llama tabulación son:

1).- Tarjetas de escritura manual


2).- Hojas de registro
3).- Tarjetas de perforación manual
4).- Tarjetas perforadas
5).- Procesamiento electrónico de datos

14
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

ORGANIZACIÓN DE LOS DATOS USANDO EL ARREGLO.

El ARREGLO de datos es una de las formas más simples de organizar la información, se organizan del
valor menor al mayor (en orden ascendente), o del mayor al menor (en orden descendente).

Los arreglos de datos ofrecen varias ventajas sobre los datos en bruto.

- Rápidamente se pueden apreciar los valores menor y mayor en los datos.


- Fácilmente se puede dividir los datos en secciones.
- Se puede ver si algún valor aparece más de una vez en el arreglo.
- Se puede observar la distancia entre valores sucesivos de datos.

A pesar de éstas ventajas, algunas veces el arreglo de datos no es de mucha utilidad. Cuando sea
necesario mostrar una gran cantidad de ellos, esto se tornará engorroso, porque se debe hacer la lista
de todas las observaciones. Para estos casos se necesita condensar la información y estar en
capacidad de usarla para tomar decisiones e interpretarla.

ORGANIZACIÓN DE LOS DATOS USANDO DISTRIBUCIÓN DE FRECUENCIAS

Una manera de simplificar los datos es usar una tabla de frecuencia o distribución de frecuencia. Como
se verá, la organización de los datos en una tabla de frecuencia muestra el comportamiento de la
distribución de manera más significativa.

La organización de los datos generalmente implica el arreglo de las observaciones en CLASES o


INTERVALOS. Al arreglo de los datos para expresar la frecuencia de ocurrencia de las observaciones
en cada una de estas clases se conoce como DISTRIBUCIÓN DE FRECUENCIA.

La construcción de una tabla de frecuencia se realiza de una serie de datos, los cuales primeramente
son recopilados y posteriormente organizados. La primera forma de organizarlos es dándoles un orden
ascendente o descendente. Los datos constituidos de esta manera están en un ARREGLO. Este
arreglo puede ser construido mediante el uso de marcas, y el número de veces que un valor está
repetido se le llama FRECUENCIA.

Ejemplo 2.1: Calificación final de Estadística de 80 Estudiantes de la carrera de LSCA.

= RECOPILACION =

68, 84, 75, 82, 68, 90, 62, 88.3, 76, 93, 73, 79, 88, 73, 60, 93, 72, 53, 85, 75
53, 65.5, 75, 87, 74, 62, 95, 78, 62, 72, 66, 78, 82, 75, 94, 77, 69, 74, 68, 60
96, 78, 89, 60, 75, 95, 60, 79, 83, 72.6, 79, 60, 67, 97, 78, 85, 76, 65, 71, 75
65, 80, 73, 53, 88, 78, 63, 76, 53, 74, 86, 67, 73, 81, 72, 63, 76, 75, 85, 77.8

= ORGANIZACION =

53, 53, 53, 53, 60, 60, 60, 60, 60, 62, 62, 62, 63, 63, 65, 65, 65.5, 66, 67, 67
68, 68, 68, 69, 72, 72, 72, 72, 72, 72.6, 73, 73, 73, 74, 74, 74, 75, 75, 75, 75
75, 75, 75, 76, 76, 76, 76, 77, 77.8, 78, 78, 78, 78, 78, 79, 79, 79, 80, 81, 82
82, 83, 84, 85, 85, 85, 86, 87, 88, 88, 88.3, 89, 90, 93, 93, 94, 95, 95, 96, 97

15
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

TABLA DE FRECUENCIAS, ARREGO DE FRECUENCIAS


Valor Marca Frecuencia (f)
53 llll 4
60 llll 5
62 lll 3
63 ll 2
... ... ...

En la tabla la segunda columna es sólo auxiliar. En la tercera se presenta la Frecuencia de cada dato
posible (fi = al número de veces que ocurre la i-ésima observación posible).

La información contenida en la tabla puede ser representada gráficamente en varias formas:


gráfica de barras, de líneas, por sectores, etc. El inconveniente de graficar cada dato contenido en la
gráfica anterior, es que si el número de datos diferentes es muy grande, se diluye la información.
Imagínese un gráfico de 25 o 50 barras. Este inconveniente es superado, al utilizar otras técnicas
apropiadas para el tratamiento de datos provenientes de una variable continua.

En el ejempo 2.1 encontramos 80 valores diferentes, distribuídos entre el dato menor (Dm) = 53 y el dato
mayor (DM) = 97, como puede verse en la ordenación (organización). Para el tratamiento adecuado,
procedemos a agrupar los datos por intervalos de clase de igual longitud, para lo cual necesitaremos
saber o calcular el número de intervalos que tendrá nuestra tabla.

NUMERO DE CLASES ó INTERVALOS (k)

No hay un criterio establecido para el número de agrupación de datos (intervalo de clase) a utilizar. El
primer paso para construir una tabla de frecuencia consiste en decidir cuantas CLASES o
INTERVALOS DE CLASE se van a utilizar. El número de clases depende del número de datos y del
rango de los mismos y de la información que el investigador desea obtener. Entre mayor sea el número
de datos, o más amplio el rango de los datos, mayor número de clases se necesitará para dividirlos. Por
supuesto, si se tiene sólo 10 datos, deja de tener sentido el hacer 10 clases. Como una norma, los
estadísticos usan entre 5 y 20 clases. Menos de 5 clases pueden concentrar la información y más de 20
clases pueden dispersar la información.

Hay muchos libros de texto que recomiendan un sínnumero de formas para determinar el
número adecuado de intervalos. Para nosotros debe ser claro que a mayor número de datos resulta
adecuado un mayor número de intervalos de clase, por lo que utilizaremos un criterio preciso, (aunque
personal), basado en la Regla de Sturges, que consiste en elegir k como el entero impar más
cercano a:

k = 1 + 3.3 ⋅ Log( N ) k = Número de clases.


N = Número de datos.

Podemos agregar que la experiencia y el uso a que esté destinado el agrupamiento, son criterios
determinantes en algunos casos.

La recomendación de elegir un número impar de intervalos es con el fin de mantener la posible simetría
de una distribución de datos.

Ejemplo 2.2: Para el problema de los 80 estudiantes de estadística Ejemplo 2.1.

16
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

k = 1 + 3.3 Log (80) = 7.28 » 7 CLASES (Entero impar más cercano), entonces:
k=7

AMPLITUD DE CLASES.

Debido a que se necesita tener los intervalos de clase de igual tamaño, el número de clases
determinará la amplitud ( i ) de cada clase. Para encontrar la amplitud de cada intervalo de clase se
utilizan las siguientes ecuaciones:

Rango (R) = DM - Dm = Dato mayor - Dato menor

R Dato ⋅ Mayor − Dato ⋅ Menor


i= =
k Numero ⋅ Intervalos

Para el ejemplo 2.1 tendremos:

R = 97 - 53 = 44 i = 44/ 7 = 6.2857 ~= 6.3 (para datos continuos)


i = 7 (para datos discretos)

Si observamos el ejemplo anterior, podemos tomar a 6.2857 pero, resultaría engorroso el trabajar con
cuatro dígitos después del punto decimal, por lo que tomaremos la aproximación de 6.3 con ancho del
intervalo. Aquí debemos tomar en cuenta que tipo de variable estamos utilizando, o sea, si nuestros
datos son discretos o continuos. Pues si fueran datos discretos tomaríamos i = 7, ya que si tomamos el
valor 6, no concordaría con el número de intervalos que previamente se habían calculado, (esto lo
podemos calcular con un pequeño despeje de i = R/k, lo cual tendríamos k = R/i ), y tendríamos que
utilizar un intervalo más para poder “meter” los valores más altos.

Al fijar los limites de clase, es necesario tomar en cuenta que el valor mínimo de los datos debe quedar
incluido en el primer intervalo de clase y el valor máximo en el último. Para que el valor mínimo de los
datos quede incluido en el primer intervalo de clase, el primer límite inferior de clase deberá escogerse
en tal forma que sea igual o menor que él. De la misma manera, para que el valor máximo de los datos
quede incluido en el último intervalo de clase, el último límite superior de clase deberá ser igual o mayor
que él.

Los intervalos quedarían así:

I1 I2 I3 I4 I5 I6 I7

53.0 59.3 65.6 71.9 78.3 84.6 90.0 97.2


a , b

para introducir los datos en los intervalos tomaremos el criterio siguiente:

17
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

( a, b ) a este intervalo pertenecen todas las observaciones que son estrictamente mayores que
a; “a mayor que” y estrictamente menores que b; “b menor que”.

( a, b ] a este intervalo pertenecen todas las observaciones que son estrictamente mayores que
a; “a mayor que” y estrictamente menores o iguales que b; “b menor o igual que”.

[ a, b ] a este intervalo pertenecen todas las observaciones que son estrictamente mayores o
iguales que a; “a mayor o igual que” y estrictamente menores o iguales que b; “b menor o
igual que”.

[ a, b ) a este intervalo pertenecen todas las observaciones que son estrictamente mayores o
iguales que a; “a mayor o igual que” y estrictamente menores que b; “b menor que”.

CONSTRUCCIÓN DE UNA TABLA DE FRECUENCIAS.


CLASES MARCA FRECUENCIA FRECUENCIAS FRECUENCIA
ACUMULADA
DE CLASE RELATIVAS
xi fr C
Li - Ls f
53.0 - 59.3 56.15 4 4/80 = 0.05 4
59.3 - 65.6 62.45 13 13/80 = 0.1625 17
65.6 - 71.9 68.75 7 7/80 = 0.0875 24
71.9 - 78.2 75.05 30 30/80 = 0.375 54
78.2 - 84.5 81.35 9 9/80 = 0.1125 63
84.5 - 90.8 87.65 10 10/80 = 0.125 73
90.8 - 97.1 93.95 7 7/80 = 0.0875 80
Suma de frecuencias = ∑f = 80 ∑ fr = 1.0000

DATOS FUNDAMENTALES DE LA TABLA DE FRECUENCIA.

LÍMITES DE CLASE: Son los valores localizados en los extremos de una clase.

LÍMITE INFERIOR ó LÍMITE REAL INFERIOR (Li) = 53.0

LÍMITE SUPERIOR ó LÍMITE REAL SUPERIOR (Ls) = 59.3

TAMAÑO DE CLASE (i):: Es el recorrido de valores que pueden tomar los elementos de la
frecuencia de una clase determinada. Se calcula restando los limites
reales.

i = TAMAÑO DE CLASE= Ls - Li = 59.3 -53.0 = 6.3

MARCA DE CLASE (xi) : Es el valor representativo de los elementos de la frecuencia. Se obtiene


promediando el límite inferior y superior de una clase.

Li + Ls 53 .0 − 59 .3
Marca ⋅ Clase = = = 56 .15
2 2

18
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

FRECUENCIA RELATIVA: Es la frecuencia de la clase dividida por la frecuencia total de todas las
clases y se expresa generalmente en porcentaje.

fr = FRECUENCIA RELATIVA= 13/80 = 0.1625= 16.25%

FRECUENCIA ACUMULADA: Es la suma de las frecuencias de clase del intervalo en consideración y


de los intervalos anteriores.

Ejercicios 2.1: Resolver las siguientes cuestiones:

1.- Si la calificación mínima aprobatoria es de 70, ¿Cuántos alumnos acreditaron?


2.- ¿Cuántos alumnos acreditaron con menos de 80 ?
3.- Porcentaje de alumnos reprobados.
4.- Entre que rango de valores encontramos más calificaciones.
5.- Porcentaje de alumnos que obtuvieron 90 o más de calificación.
6.- Número de alumnos que obtuvieron una calificación menos de 90.
7.- ¿Puede determinarse en la distribución de frecuencia el número de calificaciones con 95.

c) OTROS MÉTODOS DE PRESENTACIÓN DE DATOS:

REPRESENTACIÓN DE DATOS ESTADÍSTICOS

En general hay 3 formas para presentar datos organizados:

a).- Presentación con palabras


b).- Tablas estadísticas
c).- Gráficas estadísticas

PRESENTACION CON PALABRAS .

La combinación de cifras y texto no es un sistema muy eficaz ya que es necesario leer, o por lo
menos registrar, todo el parrafo antes de que se pueda comprender el significado de todo el
conjunto de cifras. Para la mayoría de las personas les resulta difícil aislar las cifras individuales
que se presentan. Sin embargo, hay la ventaja de que el autor puede dirigir la atención hacia
determinada cifra, haciéndola resaltar, y también puede llamar la atención sobre las
comparaciones de importancia.

TABLAS ESTADÍSTICAS .

Las tablas estadísticas pueden ser agrupadas en dos tipos de acuerdo con sus propósitos para
los cuales nos sirven:

TABLAS PARA PROPÓSITOS GENERALES:


Proporcionan información para referencia o uso general. No se construyen para una exposición
específica. En otras palabras, las tablas nos sirven como un depósito de información. Por
ejemplo se tiene una tabla titulada "Empleo y Población" que muestra el número de empleados

19
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

en manufactura, minería, construcción, transporte, comercio al mayoreo y menudeo, gobierno y


otras áreas del país. Esta tabla es de propósitos generales, puesto que solamente dice hechos
que no son para una discusión particular. Cuando las tablas de propósitos generales son
utilizadas por un investigador, son usualmente colocadas en el apéndice del informe para fácil
referencia.

TABLAS PARA PROPÓSITOS ESPECIALES.


Proporcionan información para una exposición particular. Una tabla para propósitos especiales
debería ser diseñada de tal forma que un lector pueda dirigirse fácilmente a la tabla para
comparación, análisis o énfasis concerniente a la exposición particular. La tabla debe ser
construida de una manera breve y simple.

PARTES PRINCIPALES DE UNA TABLA


TÍTULO: Es una descripción del contenido de la tabla. Debe ser compacto y completo. Un
título usualmente indica: ¿Qué son los datos incluidos? ¿Dónde está el área
representada por los datos? ¿Cómo están los datos clasificados? ¿Cuándo
ocurrieron los datos?
ENCABEZADO: Es el titulo de la parte superior de una columna o columnas. La tabla más simple
tiene solamente dos columnas y dos encabezados: uno para los conceptos y otro
para los datos. Sin embargo, muchas tablas tiene mas de dos encabezados y
algunas veces tienen encabezados principales y subencabezados.

NOTA DE Son usualmente escritas justamente arriba de los encabezados y abajo del titulo.
ENCABEZADO: Son usadas para explicar ciertos puntos relacionados con la tabla completa que
no han sido incluidos en el titulo o en el encabezado ni en los conceptos. Por
ejemplo la unidad de los datos es frecuentemente escrita como una nota de
encabezado, tal como "En miles" .

CONCEPTOS O Son las descripciones en hileras o filas de las tablas, son colocados al lado
COLUMNA izquierdo de la tabla. Usualmente representan las clasificaciones de las cifras
MATRIZ: incluidas en el cuerpo de la tabla. La naturaleza de las clasificaciones es indicada
por los encabezados de la columna.

CUERPO: Es el contenido de los datos estadísticos. Los datos presentados en el cuerpo


son arreglados de acuerdo con las clasificaciones de los encabezados y
conceptos. Por lo tanto la presentación efectiva de los datos en la tabla depende
de los arreglos columnas y filas.

NOTA DE PIE: Son usualmente colocadas abajo de los conceptos. Son usadas para clarificar
algunas partes incluidas en la tabla que no son explicadas en otras partes.

FUENTE: Es el origen de donde se obtuvo la información. Es usualmente escrita abajo de


las notas de pie. Si los datos fueron recopilados por la misma persona, es
costumbre no establecer la fuente de la tabla. Sin embargo, si los datos fueron
tomados de otras fuentes, las fuentes de los datos deberán ser declaradas en la
tabla. La declaración permitirá al lector comprobar o evaluar los datos, u obtener
información adicional de la fuente original.

20
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

GRÁFICAS ESTADÍSTICAS
Hay una gran variedad de gráficas usadas para representar datos estadísticos, los tipos más comunes
de gráficas son:
1).- Gráfica de línea
2).- Gráfica de barras
3).- Gráficas de partes componentes
4).- Gráfica de dimensiones
5).- Pictogramas
6).- Mapas estadísticos.

GRÁFICAS DE LÍNEAS
Las curvas o gráfica de línea se usan a menudo para representar las series cronológicas, así como las
distribuciones de frecuencia. Los datos clasificados cualitativa y geográficamente raras a veces se
presentan por medio de líneas; en su lugar se usan gráficas de barras.

La Línea o líneas que representan los datos deberán resaltar claramente sobre el fondo de la gráfica.
La línea deberá, pues, dibujarse con un trazo mas grueso que las coordenadas de línea.
Cuando se trazan varias líneas en el mismo cuadrante, es esencial que cada línea se destaque con
claridad. Para ello se pueden usar tanto líneas continuas, de puntos y de guiones, como líneas gruesas
y delgadas. Cuando en una gráfica aparecen dos o más curva, deben distinguirse unas de otras. Esto
puede lograrse, de preferencia, rotulando las líneas. De ordinario es conveniente evitar el uso de mas
de dos o tres líneas en una gráfica. Especialmente si se cruzan, es muy probable que se produzca
alguna confusión.

GRÁFICAS DE BARRAS

Cuando se espera que la gráfica de simplemente una impresión muy general pueden hacerse gráficas
de barras simples, sin escalas. Cuando se desea dar una impresión menos vaga, se utilizara la escala y
si los intervalos de tiempo son diferentes, los espacios entre barra y barra también lo serán de acuerdo
a la magnitud de dichos intervalos.

Las gráficas de barras se usan para hacer representaciones de datos clasificados cronológicamente,
arreglando las barras en forma vertical para datos clasificados en forma cuantitativa. Cuando se realizan
comparaciones de datos clasificados cualitativa o geográficamente, se usan, por lo general, barras
horizontales.

Aun cuando no hay reglas establecidas para dibujar las gráficas de barras, son útiles ciertas
consideraciones:

1.- Las barras no deben ser ni excesivamente cortas y anchas, ni demasiadas largas o angostas.
2.- Entre barra y barra deberá dejarse un espacio que no sea menos, aproximadamente, que la mitad
del ancho de una barra, ni mayor que el ancho de la misma.
3.- La escala es generalmente útil. La distancia a la que se colocara no deberá exceder de la mitad de
una barra a partir de la más alta, cuando son horizontales, o de la izquierda, cuando son verticales.
4.- Las líneas que sirven como guía ayudan a leer la gráfica.

21
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

Para representar gráficamente una serie cronológica pueden usarse una gráfica de barras o de líneas.
Si la serie abarca muchos años, por lo general, no es adecuada una gráfica de barras, que es difícil de
construir. Una gráfica lineal facilita el estudio de la variación general que ha experimentado la serie;
mientras que una gráfica de barras permite comparar determinados años con mayor facilidad.

REPRESENTACIÓN GRÁFICA DE UNA TABLA DE FRECUENCIA.


Los gráficos de distribuciones de frecuencias son útiles porque enfatizan y clasifican las tendencias que
no se perciben fácilmente en las tablas. Los gráficos también ayudan a resolver problemas relacionados
con las distribuciones de frecuencia. Permiten estimar algunos valores de un vistazo y proveen un
chequeo visual de lo correcto de las soluciones.

HISTOGRAMA:

Es un diagrama formado con rectángulos o barras cada uno de ellos pertenecientes a una clase. Cada
rectángulo tiene de ancho el tamaño de clase.

En el eje "Y" se grafica la frecuencia, y en el eje "X" los límites reales de clase. En el centro de su base
se señala la marca de clase.

Las ventajas de los histogramas son:

- El rectángulo muestra claramente cada clase separada en la distribución.


- El área de cada rectángulo, referida a todos los otros rectángulos, muestra la proporción del
número total de observaciones que ocurren en cada clase.

HISTOGRAMA
30
F
r 25
e 20
c
15
u
e 10
n 5
c 0
i Intervalos de clase
a
s
POLÍGONO DE FRECUENCIA:

Es la poligonal que une los puntos cuya abscisa es la marca de clase y cuya ordenada es la
frecuencia del intervalo. Es un diagrama de líneas que se forma uniendo los centros (marca de clase) de
la parte superior de los rectángulos de un histograma mediante segmentos rectos.

La ventaja de los polígonos de frecuencia son:

- El polígono de frecuencia es mucho más simple que el histograma.


- Esboza una idea del comportamiento de los datos más claramente.
- El polígono se va aplanando y curveando en la medida en que se aumenta el número de clase y
el número de observaciones.

22
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

F POLIGONO DE FRECUENCIAS
r 35
e 30
c
25
u
e 20
n 15
c 10
i
5
a
s 0
Intervalos de clase

OJIVA:

Es una poligonal que une los puntos cuya abscisa es el extremo superior de cada intervalo y
cuya ordenada es la frecuencia acumulada correspondiente al intervalo, con la convención de que antes
del primer intervalo considerado, la frecuencia acumulada es cero y después del último es el total de
datos (N).

OJIVA
F 90
r A
c 80
e
c u
70
u m
u 60
e
n l
50
c a
d 40
i
a a
30
s s
20

10

0
Intervalos de Clase

EJEMPLOS 2.2: PRESENTACIÓN ESCRITA DE DATOS ESTADÍSTICOS.

Se presentan los Costos, Ingresos y utilidades ( en miles de pesos) durante 1991-1995 de la


compañía XXX en sus diferentes departamentos: Damas, caballeros y niños.

Durante los últimos 5 años los costos fueron de 100, 200, 300, 350 y 400 en el departamento de
damas; de 120, 180, 310, 380 y 390 en el departamento de caballeros; y de 80, 100, 160, 290, 430 en el
departamento de niños.

Los ingresos correspondientes obtenidos en este periodo fueron de 260, 390, 425, 560 y 730 en
el departamento de damas; de 300, 320, 480, 560 y 700 en el departamento de caballeros; y de 145,
210, 300, 410 y 625 en el departamento de niños.

23
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

Para lo cual sus utilidades respectivas en el departamento de damas fueron de 160, 190, 125, 210 y
310; en el departamento de caballeros fueron de 180, 140, 170, 180 y 310; y en el departamento de
niños fueron de 65, 110, 140, 120 y 195.

EJEMPLOS: TABLAS ESTADÍSTICAS.

NÚMERO DE AUTOS MANUFACTURADOS Y VENDIDOS POR


Título
G.M., K.W. Y M.S. COMPANY EN 1995
( MILES DE AUTOS )
Nota de Encabezado
Compañía Manufactu- Vendidos
Encabezado rados
G.M. 10 9.2

Conceptos K.W. 14 12.8 Cuerpo

M.S. 5* 5
FUENTE: Revista Journal, Enero de 1996, Pag. 13.
* La manufactura fue muy poca debido a que en los meses de
Abril-Juniohubo huelga por parte del sindicato de trabajadores.

EJERCICIOS 21: DISTRIBUCIÓN DE FRECUENCIA

Una máquina vendedora de proporciona 16 oz. de café si se insertan monedas adecuadas. Para
probar si la máquina esta operando adecuadamente se tomaron 30 vasos de café y se midieron.

15.7 15.9 15.2 16.0 16.2 16.4 15.7 15.9 15.4 16.0 16.3 16.6
15.8 15.9 15.6 16.0 16.3 16.8 15.8 15.9 15.6 16.1 16.3 16.8
15.8 16.0 15.6 16.2 16.4 16.9

a) Realizar un arreglo de los datos de menor a mayor.


b) Realizar una distribución de frecuencia.
c) Cuando la máquina tiene un margen de ± 0.2 oz se dice que trabaja correctamente, no
importando las onzas que proporcione después de 16 oz. ¿En qué porcentaje la máquina
funciona adecuadamente?
d) ¿En qué porcentaje la máquina no trabaja adecuadamente?
e) ¿En qué porcentaje la máquina proporciona más de 16 oz de café?
f) ¿Cuál es la probabilidad de una persona al usar la máquina le proporcione más de 16 oz de
café?

GRÁFICAS CIRCULARES

Se emplean para demostrar la relación existente entre los componentes de una clase. Cada uno de los
sectores del círculo representa una parte de un agregado de un total.

Para dividir la circunferencia en sectores se emplean proporciones, en las que se hace el total igual a
los 360 grados, o bien, cuando se trata de porcentajes, a 100%.

24
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

Para evitar los cálculos resulta muy conveniente emplear un transportador de porcentajes que tiene
graduados los grados y los porcentajes, A falta de ese transportados de porcentajes, podemos
simplificar el procedimiento si partimos del siguiente razonamiento: si 1% equivale a 3.6 grados, basta
multiplicar el porcentaje por este factor y el producto así obtenido equivale a los grados que le
corresponde en la circunferencia.

Si se trata de valores absolutos, y no de porcentajes o valores relativos, ese factor se obtendrá


dividiendo 360 entre el total, ya que la circunferencia se ha hecho igual a él.

PICTOGRAMAS

Las gráficas de volumen al presentar dibujos que se relacionan directamente con la naturaleza de los
datos que representan son más atractivas; sin embargo; como ya se señalo presentan mayores
dificultades, tanto para su elaboración como para su adecuada interpretación.
Este valor pictórico, puede conservarse usando varios dibujos pequeños que representen una cantidad
fija de los datos, del mismo tamaño, y arreglándolos de manera que se forme una gráfica de barras. A la
gráfica resultante se le llama pictograma.

Aunque este diagrama es esencialmente una gráfica de barras es más atractivo y, por lo tanto, hay
mayor probabilidad de que lo examine el lector. En los pictogramas las barras, aun cuando representen
series cronológicas, se arreglan en forma horizontal, porque aparece más adecuado poner los dibujos
(cosas o personas) uno al lado del otro y no uno encima del otro.

Las reglas fundamentales para la construcción de pictogramas estadísticos son:

1.- Los símbolos deben explicarse por sí mismo


2.- Las cantidades mayores se indican por un número mayor de símbolos y no por símbolos más
grandes
3.- Estos diagramas compran cantidades aproximadas y no detalles minuciosos
4.- Los pictogramas sólo deben utilizarse para hacer comparaciones y no afirmaciones aisladas

MAPAS ESTADÍSTICOS

Los mapas estadísticos son artificios gráficos que muestran la información cuantitativa sobre una base
geográfica. Los tipos más comunes son los mapas sombreados o rayados, los mapas punteados y los
mapas de alfileres.

25
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS (Descriptivas)

Una vez que los datos han sido obtenidos y organizados, el investigador esta listo para realizar un
análisis descriptivo. En el tratamiento de los datos, es útil resumir sus características principales. Para
ello, se plantean las siguientes cuestiones: ¿Cuál es el dato de mayor frecuencia? ¿Cuál es el valor
central de la distribución? ¿Qué tan separados se encuentran los datos? Las respuestas a estas
interrogantes es por medio de las medidas descriptivas conocidas como de Tendencia Central, de
dispersión, de sesgo y kurtosis.

La medida de tendencia central son los promedios o valores típicos representativos de un


conjunto de datos que tienden a situarse en el centro de dichos datos. Las tres medidas de tendencia
central más comunes son la media (X), mediana (Md) y moda (Mo).

MEDIA ARITMÉTICA ( X )

Es la suma de las observaciones o datos entre el número de observaciones totales. Es una de


las medidas digna de confianza porque se determina con mayor certeza que otras medidas.
N

∑x
I =1
i
x =
N
VENTAJAS:

 Es familiar a la mayoría de la gente y muy sencilla de calcular.


 En ellas se reflejan todos los valores del conjunto de datos.
 Un conjunto de datos solo tiene una sola media.

DESVENTAJAS:

Puede afectarse por los valores extremos que no son representativos del resto de los valores.

MEDIANA ( Md )

La mediana es el valor único de un conjunto de datos que mide al elemento central de los datos.

Para encontrar la mediana de un conjunto de datos, primero se ordenan los datos de menor a mayor. Si
el conjunto de datos tiene un número impar de elementos, el elemento de la mitad del arreglo es la
mediana { (N+1)/2 }. Si hay un número par de elementos, la mediana es el promedio de los dos
elementos de la mitad { N/2 }.

VENTAJAS:

 Los valores extremos no afectan la mediana tan fuertemente como lo hacen con la
media.
 Se puede encontrar la mediana aún cuando los datos sean descripciones cualitativas
como el color o la claridad.

26
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

DESVENTAJAS:

 Debido a que la media es un promedio de posición, se deben de organizar los datos


antes de realizar cualquier tipo de cálculo. Esto consume tiempo para un conjunto de
datos muy grande.

MODA ( Mo )

La moda es aquel valor que se repite más en un conjunto de datos.

VENTAJAS:

 Se puede usar como una medida de localización central tanto para datos cualitativos
como cuantitativos.
 La moda no esta afectada por los valores extremos.

DESVENTAJAS:

 Muy a menudo no hay un valor modal porque el conjunto de datos no contiene valores
que se repiten más de una vez.
 Otras veces, cada valor es la moda porque cada valor aparece el mismo número de
veces.
 Cuando el conjunto de datos tiene dos, tres o más modas, éstas son difíciles de
interpretar y comparar.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

MEDIA ARITMETICA PARA DATOS AGRUPADOS

N x i = Marca de clase
∑f i x i ∑f = N = Total de datos
x = i =1
f = Frecuencia
N

Método corto para el cálculo de la Media Aritmética:


A = Media supuesta
N (marca de clase del intervalo central)
∑ f i ⋅ di di = Desviación en unidades de intervalo
i = Amplitud del intervalo
x= A+ i =1
⋅i
N

MEDIANA PARA DATOS AGRUPADOS Linf = Límite inferior


N = Total de datos
N +1
− C ant i = Amplitud del intervalo
Md = L inf + 2
⋅i fMd = Frec. de la clase mediana
27
f Md C = Frecuencia acumulada hasta antes
de la clase mediana.
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

Se divide N/2 para encontrar la clase mediana para datos pares, (N+1)/2 para datos impares.

MODA PARA DATOS AGRUPADOS:


d1 = Frec. de la clase modal menos la
 d1  frecuencia de la clase anterior.
Mo = L inf +  ⋅i
d2 = Frec. de la clase modal menos la

 d1 + d2 
frecuencia de la clase anterior.

MEDIDAS DE DISPERSIÓN:

Indican el grado de esparcimiento de los datos con respecto al valor central. Las medidas de
dispersión se usan para poder verificar si el promedio es representativo o no de la muestra y como base
de control de la variación misma.

Una dispersión pequeña indica un alto grado de uniformidad. Las medidas de dispersión son:
desviación estándar, varianza y rango.

VARIANZA: La varianza es la suma de la distancia al cuadrado de la media y cada elemento de la


población entre el número total de elementos de la población.

La fórmula para datos no agrupados es:

N S2 =Varianza.

∑ ( xi − x) 2
xi = Dato individual o
marca de clase.

S2 = i =1 x = Media Aritmética.
N = Total de datos.
N

Para la varianza, sin embargo, las unidades son el cuadrado de las unidades de los datos, por ejemplo,
"dólares al cuadrado" o "dólares cuadrados", no son expresiones intuitivas claras de interpretar. Por
esta razón, debe efectuarse un cambio significativo en la varianza para calcular una medida de
desviación útil, una que no presente problemas con las unidades de medidas y sea menos confusa.
Este parámetro es llamado la DESVIACIÓN ESTÁNDAR y es la raíz cuadrada de la varianza.
DESVIACIÓN ESTÁNDAR PARA DATOS AGRUPADOS

28
Estadística Descriptiva _____________ _____________ __________MC Raúl Adalberto_Morelos

La desviación estándar permite determinar, con cierto grado de certeza dónde están localizados los
valores de una distribución de frecuencia con relación a la media.

Desviación estándar para datos agrupados:


S = Desviación Estándar.
xi = Dato individual o marca
N de clase.

∑ f (x i i − X )2 X = Media Aritmética.

S =i i =1 N = Total de datos.
f = frecuencia del intervalo.
N

Método corto para el cálculo de la desviación estándar:

2 S = Desviación Estándar.
n
 n 
∑ f i ⋅ d i2  ∑ f i ⋅ d i  xi = Dato individual.
di = Desviación en unidades
s=i i =1
−  i =1  de intervalo.
N  N  N = Total de datos.
f = frecuencia del intervalo.
  i = Amplitud de la clase.

Bibliografía.
Anderson, D. (2007) Estadística para Administración y Economía. México: Pearson
Berenson, M., Levine, D. (1996) Estadística Básica en Administración, Conceptos y Aplicaciones. (6aEd.). México :Prentice Hall Hispanoamericana
Hildebrand, D. (1998). Estadística Aplicada a la Administración. México: Pearson
Levin, R. I., (2004). Estadística para Administración y Economía. México: Pearson
Levine, D., Krehbiel, T., Berenson, M. (2006). Estadística para Administración. (4ta. Ed.). México.:Printece Hall
Webster, A. (2005). Estadística Aplicada a los Negocios y la Economía. (3ra Ed. ). México: Prentice Hall.
Stephen, P. Shao (1970) Estadística para economistas y administradores de empresas. (6aEd.). México: Trillas

29

Вам также может понравиться