Вы находитесь на странице: 1из 42

2018

Estadística I

José Luis Eche Calderón


Universidad Alas Peruanas.
Estadística I

ESTADÍSTICA
Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para recoger,
organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones
razonables basadas en tal análisis".

"La estadística es la ciencia que trata de la recolección, clasificación y presentación de los hechos
sujetos a una apreciación numérica como base a la explicación, descripción y comparación de los
fenómenos". (Yale y Kendal, 1954).

Cualquiera sea el punto de vista, lo fundamental es la importancia científica que tiene la


estadística, debido al gran campo de aplicación que posee.

POBLACIÓN

 Una población se precisa como un conjunto finito o infinito de personas u objetos que
presentan características comunes.

 "Una población es un conjunto de todos los elementos que estamos estudiando, acerca de
los cuales intentamos sacar conclusiones". Levin y Rubin (1996).

El tamaño que tiene una población es un factor de suma importancia en el proceso de


investigación estadística, y este tamaño vienen dado por el número de elementos que constituyen
la población, según el número de elementos la población puede ser finita o infinita. Una población
infinita, por ejemplo; el conjunto de todos los números positivos. Una población finita es aquella
que está formada por un limitado número de elementos, por ejemplo; número de estudiantes de
Estadística de la UAP-EP Administración y Negocios Internacionales.

Cuando la población es muy grande, es obvio que la observación de todos los elementos se
dificulte en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este
inconveniente se utiliza una muestra estadística.

MUESTRA

 "Se llama muestra a una parte de la población a estudiar que sirve para representarla".
Murria R. Spiegel (1991).

 "Una muestra es una colección de algunos elementos de la población, pero no de todos".


Levin y Rubin (1996).

MUESTREO

 Esto no es más que el procedimiento empleado para obtener una o más muestras de una
población; el muestreo es una técnica que sirve para obtener una o más muestras de
población.

Lic. José Luis Eche Calderón 2


Estadística I

Este se realiza una vez que se ha establecido un marco muestral representativo de la población, se
procede a la selección de los elementos de la muestra, aunque hay muchos diseños de la muestra.

El método del muestreo se basa en ciertas leyes que le otorgan su fundamento científico, las
cuales son:

LEY DE REGULARIDAD ESTADÍSTICA: Unidades tomadas al azar de un conjunto (muestra), es casi


seguro que tenga las características del grupo más grande (población).

LEY DE LA INERCIA DE LOS GRANDES NÚMEROS: Se refiere al hecho de que en la mayoría de los
fenómenos; cuando una parte varía en una dirección, es posible que una parte igual del mismo
grupo varíe en dirección opuesta.

LEY DE LA PERMANENCIA DE LOS NÚMEROS PEQUEÑOS: Si una muestra suficientemente grande


es representativa de la población, una segunda muestra de igual magnitud deberá ser semejante a
la primera; si en la primera muestra se encuentran pocos individuos con características raras, es de
esperar encontrar igual proporción en la segunda muestra.

TIPOS DE MUESTREO

Existen dos métodos para seleccionar muestras de poblaciones; el muestreo no aleatorio o de


juicio y el muestreo aleatorio o de probabilidad. En este último todos los elementos de la
población tienen la oportunidad de ser escogidos en la muestra. Una muestra seleccionada por
muestreo de juicio se basa en la experiencia de alguien con la población.

MUESTREO ALEATORIO: Es cuando la muestra se obtiene al azar. La elección de los elementos para
la muestra es de forma aleatoria.

TIPOS DE MUESTREO NO ALEATORIO:

MUESTREO ESTRATIFICADO: Se divide a la población en grupos y se seleccionan pequeñas


muestras del grupo para sacar un resultado. Por ejemplo, la división del Perú por departamentos.

MUESTREO SISTEMÁTICO: Se selecciona a los mejores elementos. Por ejemplo, para un juego de
básquet se selecciona a los chicos con talla adecuada y un buen físico.

MUESTREO POR CÚMULOS: Se divide la población en grupos y luego se escoge al azar a los
miembros de un solo grupo y se trabaja totalmente con ese grupo.

MUESTREO POR CONVENIENCIA: Son los resultados disponibles para una causa justa ó injusta.
Ejemplo cuando el estado anuncia cambios en las escuelas y las ganancias de popularidad son
utilizadas para su conveniencia.

MUESTREO POR CUOTAS: Se divide a la población por categorías.

Lic. José Luis Eche Calderón 3


Estadística I

A
B
C
D
E

Por ejemplo, la categorización socioeconómica en el Perú.

MUESTREO INTENCIONADO: Se exige un conocimiento previo de la población. Ejemplo los cambios


en las tecnologías, uso de un determinado lápiz labial o el uso de IPod.

MUESTREO MIXTO: Se combina los tipos de muestreos antes mencionados con el fin de obtener
mejores resultados.

MUESTREO TIPO: Se extraerá la muestra definitiva conforme a la necesidad específica de cada


investigación.

VARIABLES Y ATRIBUTOS

 Las variables, también suelen ser llamados caracteres cuantitativos, son aquellos que
pueden ser expresados mediante números. Son caracteres susceptibles de medición.
Como, por ejemplo, la estatura, el peso, el salario, la edad, etc.

 Los atributos también llamados caracteres cualitativos, son aquellos que no son
susceptibles de medición, es decir que no se pueden expresar mediante un número.

Las variables y su medición:

Una variable es un símbolo, tal como X, Y, H, x ó B, que pueden tomar un conjunto prefijado de
valores, llamado dominio de esa variable.

Las variables, también llamadas caracteres cuantitativos, son aquellas cuyas variaciones son
susceptibles de ser medidas cuantitativamente, es decir, que pueden expresar numéricamente la
magnitud de dichas variaciones.

 Las variables contínuas se caracterizan por el hecho de que para todo par de valores
siempre se puede encontrar en valor intermedio, (el peso, la estatura, el tiempo empleado
para realizar un trabajo, etc.)

Una variable es contínua, cuando puede tomar infinitos valores intermedios dentro de dos
valores consecutivos. Por ejemplo, la estatura, el peso, la temperatura.

 Las variables discretas serán aquellas que pueden tomar solo un número limitado de
valores separados y no contínuos; son aquellas que solo toman un determinado número

Lic. José Luis Eche Calderón 4


Estadística I

de valores, porque entre dos valores consecutivos no pueden tomar ningún otro; por
ejemplo, el número de estudiantes de una clase es una variable discreta ya que solo
tomará los valores 1, 2, 3, 4... nótese que no encontramos valor como 1,5 estudiantes.

FORMAS DE OBSERVAR UNA POBLACIÓN

1.-Atendiendo a la fuente se clasifican en directa o indirecta.

 Observación directa: es aquella donde se tienen un contacto directo con los elementos o
caracteres en los cuales se presenta el fenómeno que se pretende investigar, y los
resultados obtenidos se consideran datos estadísticos originales.

Ejemplo; el seguimiento de la población agrícola por año, llevado en una determinada


granja.

 Observación Indirecta: es aquella donde la persona que investiga hace uso de datos
estadísticos ya conocidos en una investigación anterior, o de datos observados por un
tercero (persona o entidad). Con el fin de deducir otros hechos o fenómenos.

Ejemplo; si un investigador pretende estudiar la producción por años de una granja


avícola, en sus últimos cinco años de producción, tendría que hacer un seguimiento, a tal
fin recurriría a las observaciones que posee la oficina administrativa de la granja durante
estos cinco años, o dirigirse a la oficina de estadística, llevada en el ministerio de
producción y comercio (M.P.C) de la localidad donde está registrada dicha granja. Es de
notar que el investigador se vale de observaciones realizadas por terceros.

Lic. José Luis Eche Calderón 5


Estadística I

2.- Atendiendo a la periodicidad, puede ser contínua, periódica o circunstancial.

 Una observación contínua: como su nombre lo indica es aquella que se lleva acabo de un
modo permanente.

Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras


operaciones que se van registrando a medida que van produciéndose.

 Una observación periódica: es aquélla que se lleva a cabo a través de períodos de tiempo
constantes. Estos períodos de tiempos pueden ser semanas, trimestres, semestres, años,
etc. Lo que debemos destacar es que los períodos de tiempo tomados como unidad deben
tomarse constantes en lo posible.

Ejemplo; el registro llevado por la Oficinas de Admisión de la UAP- Piura, en cuanto a la


inscripción de los estudiantes por semestre.

 La observación circunstancial: es aquella que se efectúa en forma ocasional o esporádica,


esta observación hecha más por una necesidad momentánea, que de carácter regular o
permanente.

Ejemplo; la obtención de números de aulas utilizadas y no utilizadas en los colegios


pertenecientes a la Provincia de Piura.

3.- Atendiendo a la cobertura; pueden ser exhaustiva, parcial o mixta.

 Observación Exhaustiva: Cuando la observación es efectuada sobre la totalidad de los


elementos de la población se habla de una observación exhaustiva.

 Observación Parcial: Las poblaciones en general son grandes, la observación de todos sus
elementos se ve imposibilitada. La solución para superar este inconveniente es observar
una parte de esta población.

 Observación Mixta: En este tipo de observación se combinan adecuadamente la


observación exhaustiva con la observación parcial. Este tipo de observación se lleva a cabo
de tal manera que los caracteres que se consideran básicos se observan exhaustivamente
y los otros mediante una muestra.

Lic. José Luis Eche Calderón 6


Estadística I

CENSO

Se entiende por censo aquella numeración que se efectúa a todos y cada uno de los caracteres
componentes de una población.

Si es posible listar (o enumerar) y observar cada elemento de la población, los censos se utilizan
rara vez porque a menudo su compilación es bastante difícil, consume mucho tiempo por lo que
resulta demasiado costoso.

ENCUESTA

Se entiende por ENCUESTA a las observaciones realizadas por muestreo, es decir son
observaciones parciales.

La encuesta, es un método mediante el cual se quiere averiguar. Se efectúa a través de


cuestionarios verbales o escritos que son aplicados a un gran número de personas.

USOS Y ABUSOS DE LA ESTADÍSTICA


USOS DE LA ESTADÍSTICA

Las aplicaciones de la Estadística han crecido a tal grado que prácticamente todos los campos de
estudio se benefician de una manera u otra por el uso de los métodos estadísticos. Los fabricantes
proporcionan ahora mejores productos a un costo más bajo gracias al uso de técnicas estadísticas
de control de calidad. Las enfermedades se controlan mediante análisis diseñados para anticipar
epidemias. Especies de peces y otros animales silvestres en peligro de extinción se protegen
mediante reglamentos y leyes que reaccionan a estimaciones estadísticas de cambios en los
tamaños de las poblaciones.

Algunos estudiantes se inscriben en un curso de Estadística porque es obligatorio, pero números


cada vez mayores de estudiantes lo hacen voluntariamente, porque se dan cuenta de su valor y su
aplicación a cualquier campo en el que deseen desarrollarse. El estudio de la Estadística puede
ayudar al estudiante a ser más crítico en su análisis de la información y menos susceptible a
afirmaciones engañosas o capciosas, como las que suelen estar asociadas a encuestas, gráficas y
promedios. Como miembro educado y responsable de la sociedad usted debe agudizar su
capacidad para reconocer datos estadísticos distorsionados; además, debe aprender a interpretar
de manera inteligente los datos no distorsionados.

Lic. José Luis Eche Calderón 7


Estadística I

ABUSOS DE LA ESTADÍSTICA

Los abusos de la Estadística no son nada nuevo. El estadista Benjamín Disraeli pronunció la famosa
frase: “Hay tres clases de mentiras: mentiras, viles mentiras y estadísticas”. También se ha dicho
que “las cifras no mienten; los mentirosos calculan cifras” y que “si torturamos los datos
suficientes, admitirán cualquier cosa”. El historiador Andrew Lang dijo que algunas personas
utilizan los datos estadísticos “como un borracho utiliza los postes de alumbrado público: como
apoyo más que como iluminación”.

Estas afirmaciones se refieren a abusos de la estadística en los que los datos se presentan de tal
manera que pueden ser engañosos. Algunos que abusan de la estadística son simplemente
ignorantes o descuidados, mientras que otros tienen objetivos personales y están dispuestos a
suprimir datos desfavorables al tiempo que destacan datos que apoyan sus fines. A continuación,
presentamos unos cuantos ejemplos de las muchas formas en que es posible distorsionar los
datos.

MUESTRAS PEQUEÑAS: Las muestras pequeñas no necesariamente son algo malo, pero los
resultados de muestras pequeñas a veces se utilizan como una forma de “mentir”
estadísticamente. Ejemplo: Las preferencias en cuanto a dentífricos de sólo 10 dentistas no deben
usarse como base para una afirmación generalizada como “el dentífrico Colgate es el
recomendado por nueve de cada diez dentistas”. Aún si una muestra es grande, ésta debe ser
representativa de la población de la cual proviene.

NÚMEROS PRECISOS: En ocasiones los números mismos pueden ser engañosos. Una cifra muy
precisa como un salario anual de $ 37,735.29 dólares, podría utilizarse para dar la impresión de
precisión e infundir un alto grado de confianza en su exactitud. La cifra $ 37,700 no comunica esa
misma sensación de precisión y exactitud. No obstante, un dato estadístico muy preciso con
muchas cifras decimales no necesariamente es exacto. Ejemplo: Oferta en un polo de $ 19.99 o
una colonia de $ 99.90.

ESTIMACIONES POR CONJETURA: Otra fuente de engaños estadísticos son las estimaciones que
en realidad son conjeturas y por consiguiente pueden tener un error sustancial. Debemos
considerar el origen de la estimación y la forma en que se obtuvo. Cuando un político hizo un mitin
en un determinado lugar, ciertos funcionarios estimaron que el tamaño de la multitud era de
20,000 personas, pero el comité de organización local estimó una cifra más exacta de 12,000
personas.

PORCENTAJES DISTORSIONADOS: A veces, se usan porcentajes engañosos o poco claros.


Continental Airlines publicó anuncios de una página completa alardeando que su servicio había
mejorado. Al referirse al equipaje perdido, los anuncios aseguraban que se trataba de “un área en
la que hemos mejorado en un 100% en los últimos seis meses”. En un editorial que criticaba ese
dato estadístico, un diario local interpretó correctamente que la cifra de mejoría del 100%

Lic. José Luis Eche Calderón 8


Estadística I

implicaría que ya no se está perdiendo equipaje, logro que todavía no ha alcanzado Continental
Airlines.

GRÁFICAS ENGAÑOSAS: Muchas ayudas visuales, como las gráficas de barras y de pastel, pueden
servir para exagerar o disfrazar la verdadera naturaleza de los datos.

6 $520.00
4 $750.00

0
Hombres Mujeres

Ingreso mensual de trabajadores profesionales a tiempo completo.

PICTOGRAMAS: Los dibujos de objetos, llamados pictogramas, también pueden ser engañosos.
Objetos que se usan para representar datos son las bolsas de dinero, pilas de monedas, tanques
militares, vacas, barriles y casas; entre otros, los cuales los artistas pueden crear impresiones
falsas que distorsionen las diferencias.

“Nuestra empresa se constituyó en el año 2,000... Hoy tú nos conoces”

Lic. José Luis Eche Calderón 9


Estadística I

PRESIÓN DEL ENCUESTADOR: Cuando se hacen preguntas a los sujetos de una población, éstos a
menudo proporcionan respuestas que son favorables a su autoimagen. Por ejemplo, a la pregunta
¿se lava las manos después de ir al baño? La respuesta es SIEMPRE. Aunque a veces no es así.

Estas sólo son algunas de las muchas formas en que es posible distorsionar los datos.

COMPONENTES DE UNA INVESTIGACIÓN ESTADÍSTICA


En la conducción de una investigación estadística, la primera tarea es identificar la población,
muestra, la unidad de observación y la medición por realizarse.

Llámese población a cualquier colección de unidades que puedan interesar en un estudio. Esta
colección debe estar bien definida, de tal forma que se puedan distinguir entre los miembros que
son y los que no son del grupo.

Muestra viene a ser cualquier subconjunto de la población que estudiamos.

Unidad de observación es un solo miembro de la población que estudiamos.

Medición: Cualitativa y cuantitativa. Una medida es un número o denominación que podemos


asignar a la unidad de observación. Las mediciones cualitativas son aquellas sobre características,
atributos, actitudes, etc. Ejemplo: la raza, religión, filiación política, opiniones, procedencia, lugar
de nacimiento, clasificación de mercancías defectuosas o no defectuosas, gustos y preferencias,
entre otros. Las mediciones cuantitativas son de dimensión o capacidad. Por ejemplo, estatura,
peso, profundidad, volumen, tiempo, longitud, etc.

Una Inferencia estadística es una conclusión obtenida acerca de una población completa, desde
la información tomada de una muestra.

Después de identificar a la población, definimos la unidad de observación, seleccionamos una


muestra, tomamos medidas, y llegamos al final, al paso más importante en la investigación:
interpretar los datos para poder formular una inferencia estadística. Este es un proceso por el cual
se atribuyen a la población completa las características más significativas que se observaron y
midieron en la muestra. Obviamente, dicho proceso no es infalible, pero en la mayoría de los
casos, podemos predecir un margen de error y asignar toda la validez al estudio. Una cuidadosa
conducción de la investigación estadística produce generalmente una muy confiable información.
Ésta puede ser extremadamente útil para personas que necesitan tomar decisiones que implican
responsabilidad.

Ejemplos prácticos:

En los siguientes ejemplos identifique la población, muestra, la unidad de observación, la medición


efectuada y si la medición es cuantitativa o cualitativa.

Lic. José Luis Eche Calderón 10


Estadística I

1) En el siguiente enunciado identifique: población, muestra, unidad elemental, variable(s), tipo


de variable(s), parámetro(s) y valor(es) estadístico y un ejemplo de observación.
“Con la finalidad de conocer en qué medida los propietarios de viviendas del distrito de Jesús
María pagan el impuesto predial, la Municipalidad correspondiente realizó un estudio.

De una muestra de 500 propietarios se obtuvo los siguientes resultados preliminares.

- El ingreso promedio mensual por propietario es de S/. 425.50


- El número de pisos promedio por propiedad es de 1.5
- Solo el 63% opina que puede pagar el impuesto predial.
- El número de viviendas promedio por manzana es de 15.5 casas/manzana
- El 49% opina que la atención en el municipio para pagar el impuesto predial es regular.

2) En el siguiente enunciado identifique: población, muestra, unidad elemental, variable(s), tipo


de variable(s), parámetro(s) y valor(es) estadístico y un ejemplo de observación.
El día 12/12/2009 en el aeropuerto Jorge Chávez se hizo un estudio en el cual se encuestaron a
150 personas obteniéndose los siguientes resultados:

- El 20% de pasajeros es limeño.


- La edad promedio de los pasajeros es de 29.3 años.
- El 20% dijo que el servicio en el aeropuerto era malo.
- En promedio cada pasajero llevaba 1.5 maletas.
- El costo promedio de un pasaje en avión es $56.50.
- El tiempo de espera promedio antes de subir al avión es de 1.8 horas

Lic. José Luis Eche Calderón 11


Estadística I

ORGANIZACIÓN Y PRESENTACIÓN DE DATOS.


Generalmente cuando se ha recabado una serie de datos, estos se presentan en el orden en que
fueron seleccionados. Esto provoca que ante nosotros tengamos un montón de datos de los cuales
no podremos sacar nada en claro; para ilustrar dicha situación se considerará el siguiente ejemplo.

Ejemplo 1:

Al observar las mediciones obtenidas de los diámetros de tuercas (cm) en una fábrica
como se muestra a continuación en la tabla No. 1

Tabla No. 1. Diámetros de las tuercas.

4.2 3.8 3.9 3.6


4.0 3.3 3.5 4.1
4.1 3.8 4.2 4.2
3.5 4.2 3.5 3.2
4.3 4.0 4.0 3.6
3.8 3.9 5.0 4.4
4.0 4.0 4.0 3.8
4.0 3.6 3.5 4.0
4.2 3.8 3.8 4.3
3.9 4.4 3.9 3.4

¿Qué conclusiones podría sacar a simple vista el lector? . . . Creemos que difícilmente
habrá podido sacar al menos una información precisa.

Por lo anterior se juzga conveniente el uso de técnicas y procedimientos que nos permitan
organizar, presentar y resumir tales datos. Para ello dentro de la Estadística existen varias
de tales técnicas y procedimientos. Sin embargo, debe tomarse en cuenta que las técnicas
y procedimientos que se presentarán en este capítulo y los siguientes no dependen de la
forma como fueron obtenidos dichos datos.

Los métodos principales para organizar datos estadísticos comprenden el ordenamiento


de los datos en subconjuntos que presenten cualidades semejantes. Los datos agrupados
se pueden presentar gráficamente o en tablas y mediante el uso de medidas numéricas se
pueden resumir.

Lic. José Luis Eche Calderón 12


Estadística I

ARREGLO DE DATOS:

El arreglo de datos es una de las formas más simples de presentar los datos. Se organiza la
información yendo del valor menor al mayor en orden ascendente, o del mayor al menor
en forma descendente.

Ejemplo 2. A continuación se proporcionan las taras de 10 camiones que acudieron a una


báscula pública después de haber cargado carbón mineral, se presentan en la tabla No.2

Tabla No.2 Tara de camiones que cargan carbón mineral.


Camión Tara (toneladas)

1 10.3
2 11.0
3 9.8
4 11.6
5 10.3
6 10.8
7 10.3
8 10.1
9 11.6
10 9.0

Se pide organizar los datos en un arreglo de menor a mayor. Dicho arreglo quedaría como
se muestra a continuación en la tabla No.3.

Tabla No.3. Arreglo de datos de menor a mayor, de la tara de camiones que cargan
carbón mineral.

Camión Tara (toneladas)

1 9.0
2 9.8
3 10.1
4 10.3
5 10.3
6 10.3
7 10.8
8 11.0
9 11.6
10 11.6

Lic. José Luis Eche Calderón 13


Estadística I

Los arreglos de datos ofrecen varias ventajas sobre los datos en bruto, como a
continuación se mencionan:

- Rápidamente se pueden apreciar los valores menor y mayor en el conjunto de


datos.
- Se puede observar si algún valor aparece más de una vez en el arreglo. Los valores
iguales aparecerán juntos.
- Se puede observar la distancia entre valores sucesivos de datos.
- Se pueden dividir los datos en secciones.

A pesar de estas ventajas, algunas veces el arreglo de datos no es de mucha utilidad.


Cuando sea necesario mostrar una gran cantidad de ellos, esto se tornará engorroso,
porque se debe hacer la lista de todas las observaciones. Se necesita condensar la
información y aún estar en capacidad para usarla en su análisis e interpretación.

LA DISTRIBUCIÓN DE FRECUENCIAS:
Una mejor manera de simplificar los datos es usando una tabla de frecuencias o una
distribución de frecuencias. Una distribución de frecuencias es un agrupamiento de datos
en clases, que muestra el número o porcentaje de observaciones de cada una de ellas.
Una distribución de frecuencias se puede presentar tanto en forma tabular como en
forma gráfica.

El procedimiento para elaborar una distribución de frecuencias para un determinado


conjunto de datos, depende del tipo de ellos, como a continuación se describe.

ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS CONTÍNUOS:

En esta sección se darán los pasos a seguir en la elaboración de una distribución de


frecuencias para datos continuos y al mismo tiempo se irán ilustrando con los datos del
ejemplo No. 1 para su mejor comprensión.

Paso No. 1.

Determinar la amplitud de variación de los datos. Para este ejemplo el mayor diámetro de
las tuercas es de 5.0 y el menor es de 3.2, por lo que la amplitud es de 5.0 - 3.2 = 1.8 Esta
amplitud es denominada rango (r).

Lic. José Luis Eche Calderón 14


Estadística I

Paso No. 2.

Decidir el número de clases que se vaya a utilizar. Generalmente se recomienda usar entre
5 y 15 clases; esta elección es un balance entre el grado de resumen y la información que
se pierde. Una regla empírica es calcular la raíz cuadrada de n (número de datos) y
adaptarla, si es necesario, a los límites 5 y 15. Para nuestro ejemplo tenemos que k = 40
= 6.3245, el cual se debe redondear a 6.

Paso No. 3.

Dividir la amplitud de variación (r) entre k, que es el número de clases, para obtener una
amplitud de clase (a). Por lo regular se recomienda formar intervalos de igual amplitud
debido a que los intervalos desiguales tienden a distorsionar las comparaciones. Para
nuestro ejemplo tenemos que la amplitud de clase es a = r  k = 1.8  6 = 0.3

Paso No. 4.

Establecer los intervalos preliminares. Para nuestro ejemplo empezaremos a partir del
menor valor; así la primera clase es:

Límite inferior = 3.2

Límite superior = Límite inferior + amplitud

Límite superior = 3.2 + 0.3 = 3.5

La segunda clase es:

Límite inferior = límite superior del intervalo anterior = 3.5

Límite superior = 3.5 + 0.3 = 3.8

La tercera va de 3.8 a 4.1, la cuarta de 4.1 a 4.4, la quinta de 4.4 a 4.7 y la sexta de 4.7 a 5.

Paso No. 5.
Una vez que se haya establecido las clases cada dato se debe asignar a la clase
correspondiente, contando las frecuencias de clase. A continuación en la tabla No.4, se
muestran las frecuencias asignadas para nuestro ejemplo:

Lic. José Luis Eche Calderón 15


Estadística I

Tabla No. 4. Distribución de frecuencias de los diámetros de tuercas.

Clase Observaciones Frecuencia

1a. 3.2 a 3.5  7

2a. 3.5 a 3.8  9

3a. 3.8 a 4.1  14

4a. 4.1 a 4.4  9



5a. 4.4 a 4.7 0

6a. 4.7 a 5.0 1

Total 40

La misma distribución puede ser presentada en función del porcentaje de datos que caen
en cada intervalo, esto recibe el nombre de frecuencia relativa de clase y se obtiene
dividiendo para cada intervalo el número de observaciones de ese intervalo (llamado
frecuencia de clase) entre el número total de observaciones, que para nuestro ejemplo es
40; dicha frecuencia relativa de clase puede expresarse en términos de fracciones o
porcentajes como se puede observar en la tabla No.5.

Tabla No.5. Distribución de frecuencias relativas de los diámetros de tuercas.

Clase Frecuencia Frecuencia Relativa

1a. 3.2 a 3.5 7 7/40 = 0.175 = 17.5%

2a. 3.5 a 3.8 9 9/40 = 0.225 = 22.5 %

3a. 3.8 a 4.1 14 14/40 = 0.35 = 35.0 %

4a. 4.1 a 4.4 9 9/40 = 0.225 = 22.5 %

5a. 4.4 a 4.7 0 0/40 = 0.000 = 0.00 %

6a. 4.7 a 5.0 1 1/40 = 0.025 = 2.5 %

Total 40 40/40 = 1.000 = 100 %

Lic. José Luis Eche Calderón 16


Estadística I

ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS DISCRETOS:

Al elaborar una distribución de frecuencias para datos continuos, se pierde información


debido a que los valores individuales pierden su identidad cuando se agrupan en clases.
Esto puede o no suceder en el caso de datos discretos, dependiendo de la naturaleza de
los mismos y de los objetivos del analista. Considérese el siguiente ejemplo:

Ejemplo No.3. Se recolectaron datos de los accidentes diarios de trabajo producidos en


una fábrica de plásticos, durante 35 días. Dichos datos se presentan en la tabla No.6.

Tabla No.6. Número de accidentes de trabajo durante 35 días.

3 4 4 6 5
5 6 3 5 5
3 2 6 7 4
6 7 1 3 3
7 4 3 3 6
1 5 5 2 5
4 2 3 1 4
Se puede observar que los datos constan de valores enteros que van del 1 al 7.

Puede elaborarse una distribución de frecuencias sin que haya pérdida de valores
originales, utilizando como clases números enteros que van del 1 al 7, como se muestra en
la tabla No.7.

Tabla No.7. Distribución de frecuencias de accidentes de trabajo durante 35 días.

Clase Frecuencia Frecuencia Relativa

1a. 1 3 8.57 %

2a. 2 3 8.57 %

3a. 3 8 22.86 %

4a. 4 6 17.14 %

5a. 5 7 20.00 %

6a. 6 5 14.29 %

7a. 7 3 8.57 %

Total 35 100.00 %

Lic. José Luis Eche Calderón 17


Estadística I

Se dice que no hay perdida de información ya que a partir de la tabla No.7. es evidente
que los datos originales contienen 3 días en los que se presentaron 1 accidente, tres días
en los que se presentaron 2 accidentes, 8 días en los que se presentaron 3 accidentes, 6
días en los que se presentaron 4 accidentes, etc. Por lo tanto, podría ser posible volver a
crear los datos originales a partir de la distribución de frecuencias.

Elaboración de una distribución de frecuencias acumuladas.

Una distribución de frecuencias acumuladas está diseñada para indicar el número o


porcentaje de elementos que son menores o iguales a un determinado valor. Se puede
elaborar distribuciones acumulativas tanto para datos discretos como para datos
continuos. Para ilustrar esto se realizará la distribución de frecuencias acumuladas para el
ejemplo 3, cuya distribución de frecuencias relativas se encuentran en la tabla No.7.
Partiendo de las frecuencias relativas se obtienen sus acumuladas correspondientes, tal
como se muestra en la tabla 8.

Tabla No.8. Distribución de frecuencias acumuladas de los accidentes de trabajo durante


35 días.

Clase Frecuencia Relativa Frecuencia Relativa


Acumulada

1a. 1 8.57 % 8.57 %

2a. 2 8.57 % 17.14 %

3a. 3 22.86 % 40.00 %

4a. 4 17.14 % 57.14 %

5a. 5 20.00 % 77.14 %

6a. 6 14.29 % 91.43 %

7a. 7 8.57 % 100.00 %

100.00 %

Lic. José Luis Eche Calderón 18


Estadística I

LAS GRÁFICAS ESTADÍSTICAS:


Las gráficas tienen por objeto representar (de una manera más objetiva) las
características esenciales de los resultados obtenidos en la tabulación y cálculo de los
datos. Existen diversas gráficas en la Estadística. De hecho, los maestros, ingenieros y
administradores pueden idear formas nuevas para causar mayor impacto en la
presentación de su información. En la actualidad, Excel es una herramienta muy
importante para generar y presentar estos tipos de gráficas. En esta sección solo se
describirán los tipos más usuales, pero se experimentará gráficas de muchos resultados
estadísticos presentados en Excel. Entre los más usados están las gráficas de barras
(histogramas), gráficas de líneas (polígonos), curvas suavizadas, gráficas de sector o
circulares, ajustes lineales, de dispersión, entre otros.

EL HISTOGRAMA:

El histograma es la representación gráfica de una distribución de frecuencias


representada a través de un diagrama de barras. La forma de construir un histograma es
relativamente simple, como a continuación se muestra:

Se deben construir dos ejes coordenados, uno vertical y otro horizontal.

En el eje horizontal se señalarán los límites de cada clase.

En el eje vertical se señalarán las frecuencias de cada clase.

Se dibujará una barra (vertical) para cada clase cuyo ancho (eje horizontal) corresponderá
a los límites de dicha clase y su altura (eje vertical) corresponderá a su frecuencia.

Para ilustrar cómo se construye un histograma se retomará nuevamente los datos de la


tabla No. 4; que a continuación se presentan la Fig. 1.

Lic. José Luis Eche Calderón 19


Estadística I

Fig. 1. Histograma de los diámetros de tuercas (datos contínuos).

Frecuencia

1. 1
1
6
3

10

3.2 - 3.5 3.5 - 3.8 3.8 - 4.1 4.1 - 4.4 4.4 - 4.7 4.7 - 5.0

Diámetro
Algunas aclaraciones que se pueden hacer para la construcción de un histograma son:

- Los ejes horizontal y vertical pueden tener diferente escala.


- Tanto los límites de clase como las frecuencias pueden partir del cero, pero si se
considera necesario pueden iniciar teniendo como origen cualquier otro valor.
- El histograma puede tomar en cuenta frecuencias reales o frecuencias relativas.
- Si los datos son discretos y cada clase representa un solo valor, es siempre
preferible construir las barras separadas (ver fig. No.2.) para que a simple vista
pueda observarse que se trata de una variable discreta.

Por último Richard I. Levin señala las siguientes ventajas de los histogramas:

1.- El rectángulo (barra) muestra claramente cada clase separada en la distribución.


2.- El área de cada rectángulo, referida a todos los otros rectángulos, muestra la
proporción del número total de observaciones que ocurre en cada clase.

Lic. José Luis Eche Calderón 20


Estadística I

Fig.2 Histograma de los accidentes de trabajo diarios en una fábrica de plástico (datos discretos).

Frecuencia
8

1 2 3 4 5 6 7

Accidentes
POLÍGONO DE FRECUENCIAS:

El polígono de frecuencias es la gráfica formada al unir con rectas los puntos medios de los
intervalos del histograma, por lo que su construcción puede partir de la de los
histogramas. En la Fig.3 se muestra el polígono de frecuencias para tabla No. 4.

Fig. 3 Polígono de frecuencias del diámetro de tuercas.

Frecuencia

14

3.2 - 3.5 3.5 - 3.8 3.8 - 4.1 4.1 - 4.4 4.4 - 4.7 4.7 - 5.0

Diámetro

Lic. José Luis Eche Calderón 21


Estadística I

Es importante aclarar que este polígono es cerrado y por ello se supone que hay una clase
“antes” de la primera y “después” de la última cuya amplitud es la misma que para las
demás clases pero con frecuencia igual a cero.

Richard I. Levin, señala que los polígonos de frecuencia poseen sus ventajas:

1. El polígono de frecuencias es mucho más simple que el histograma.


2. Esboza una idea más clara del comportamiento de los datos.
3. El polígono se va aplanando y curvando (suavizando) en la medida en que se
aumenta el número de clases y el número de observaciones (datos).

LA OJIVA:

La ojiva es la gráfica que se construye a partir de una distribución de frecuencias


acumuladas. Es interesante hacer la siguiente observación acerca de las distribuciones de
frecuencia acumuladas, pues estas nos permiten observar cuantos datos quedan por
encima o por debajo de ciertos valores, en lugar de un nuevo recuento de elementos
dentro de los intervalos.

Se pueden emplear dos tipos de ojivas como señala Richard I. Levin, las de “menor que” y
de las de “mayor que”, como veremos en el ejemplo siguiente.

Ejemplo 4.

Los ingenieros de una compañía constructora, realizaron una serie de pruebas para medir
el flujo de agua que pasaba por la localización propuesta para la construcción de una
represa. Los resultados de las pruebas fueron utilizados para construir la siguiente
distribución de frecuencia, que a continuación se presentan en la tabla 10.

Tabla 10. Distribución de frecuencia del flujo de agua por el río.


Flujo de agua por el río Frecuencia
(miles de galones por minuto)
1.001 - 1.050 9
1.050 - 1.099 20
1.099 - 1.148 31
1.148 - 1.197 45
1.197 - 1.246 53
1.246 - 1.295 39
1.295 - 1.344 27
1.344 - 1.393 13
Total 237

Lic. José Luis Eche Calderón 22


Estadística I

a) Se pide construir una tabla de distribución de frecuencia acumulada “mayor


que” y su ojiva correspondiente.
b) Usando los datos de la tabla No. 10. construya una distribución de frecuencia
acumulada “menor que” y su ojiva.

Solución:

a) Para construir una distribución de frecuencias acumuladas “mayor que”, se toma el


límite inferior de la clase No. 1 y se le asigna el total de los datos, como siguiente paso se
anotan los limites superiores de las clases siguientes y se va restando cada una de las
frecuencias de clase, comenzando con el de la primera, como se indica en la tabla No. 11.

Tabla No. 11 Distribución de frecuencias acumuladas “mayor que”, del flujo de agua.

Flujo de agua por el río Frecuencia Acumulada

(miles de galones por minuto)

Mayor que 1.001 237


Mayor que 1.050 228
Mayor que 1.099 208
Mayor que 1.148 177
Mayor que 1.197 132
Mayor que 1.246 79
Mayor que 1.295 40
Mayor que 1.344 13
Mayor que 1.393 0

La ojiva para la distribución acumulada de la tabla No.10 se muestra en la fig. No. 4; los
puntos dibujados representan el flujo del agua en el río, que tienen más galones por
minuto que se muestra en el eje horizontal.

Obsérvese que el límite superior de las clases en la tabla se convierte en el límite inferior
de la distribución acumulativa de la ojiva.

Lic. José Luis Eche Calderón 23


Estadística I

Fig. No.4 Ojiva “Mayor que”, del flujo de agua en el río.

Ojiva "Mayor que".

250
Número acumulado de las

200
observaciones.

150
Observaciones.
100

50

0
1,001 1,099 1,197 1,295 1,393

Flujo en miles de galones por minuto.

b) De igual forma como se construyó la ojiva “mayor que”, se construye la de “menor que”
solo que en este caso en la clase uno la frecuencia acumulada es de cero y va aumentando
progresivamente en siguientes clases, como se muestra en la tabla No. 12

Tabla No. 12 Distribución de frecuencias acumuladas “menor que”, del flujo de agua.

Flujo de agua por el río Frecuencia Acumulada

(miles de galones por minuto)

Menor que 1.001 0


Menor que 1.050 9
Menor que 1.099 29
Menor que 1.148 60
Menor que 1.197 105
Menor que 1.246 158
Menor que 1.295 197
Menor que 1.344 224
Mayor que 1.393 237

Lic. José Luis Eche Calderón 24


Estadística I

Fig. No. 5. Ojiva “Menor que”, del flujo de agua en el río.

Ojiva "menor que"

250
Número acumulado de las

200
observasiones

150
Observaciones
100

50

0
1,05
1,001

1,099

1,148

1,197

1,246

1,295

1,344

1,393
Flujo de agua en el río
(en miles de galones por minuto)

Se puede construir ojivas de distribución de frecuencias relativas en la misma forma como


se construyeron las ojivas de las distribuciones absolutas, solo que en este caso habrá un
cambio en la escala vertical, en esta se deberá indicar la fracción del número de
observaciones que caen en cada clase.

Se construirá una ojiva del tipo “menor que”, para ilustrar este caso, para lo cual
usaremos los datos del ejemplo No. 4, como se muestra en la tabla No. 13 y en la fig. No. 6
que a continuación se presentan:

Tabla No. 13 Distribución de frecuencias acumuladas “menor que”, del flujo de agua.

Flujo de agua por el río Frecuencia Acumulada Frecuencia Relativa Acumulada


(miles de galones por minuto)
Menor que 1.001 0 0.000
Menor que 1.050 9 0.038
Menor que 1.099 29 0.122
Menor que 1.148 60 0.253
Menor que 1.197 105 0.443
Menor que 1.246 158 0.666
Menor que 1.295 197 0.831
Menor que 1.344 224 0.945
Mayor que 1.393 237 1.000

Lic. José Luis Eche Calderón 25


Estadística I

Fig. No. 6 Ojiva “Menor que” de frecuencia relativa, del flujo de agua en el río.

Ojiva de Frecuencia relativa "menor que"

1
0,9
Frecuencia relativa acumulada.

0,8
0,7
0,6
0,5

0,4
0,3
0,2

0,1
0
1,05
1,001

1,099

1,148

1,197

1,246

1,295

1,344

1,393
Serie1

Flujo de agua en el río (en miles de galones por minuto)

GRÁFICAS CIRCULARES (DE SECTORES O PASTEL):

Las gráficas de pastel se forman asignando en un círculo el área para cada clase en
proporción a su frecuencia relativa (%). Como se muestra en el ejemplo siguiente:

Ejemplo 5: En un estudio sobre el cambio organizacional y de nuevas formas de


capacitación en la industria electrónica, llevado a cabo por una Universidad, se observó
que el uso del justo a tiempo en las maquiladoras mexicanas se comportaba como se
muestra en la tabla No. 14.

Constrúyase una gráfica de pastel.

Tabla No.14 Estructura de los productos con justo a tiempo, en las maquiladoras mexicanas.

Frecuencia Frecuencia relativa (%)

Muy bajo 75 32.9


Bajo 7 3.1
Alto 26 11.4
Muy alto 120 52.6
Total 228 100.0

Lic. José Luis Eche Calderón 26


Estadística I

Solución: Una vez que se tiene la frecuencia relativa, los datos se pueden llevar al
ordenador y usar Excel para aplicar la gráfica correspondiente, como aparece en la fig. 7.

Fig. No.7 Gráfica de pastel del uso del justo a tiempo en las maquiladoras mexicanas.

32,90%
Muy bajo
52,60%
Bajo
Alto
11,40% Muy alto
3,15%

Ejercicios: Organización de Datos

1) Para analizar el contenido de nicotina de una nueva variedad de tabaco que una fábrica desea
comercializar se extrajo una muestra de 32 bolsas de 250 gr. De la que se obtuvo los siguientes
resultados (contenido de nicotina en mg /250 gr. De tabaco)
23.1 23.9 24.3 24.4 24.7 24.9 25.1 25.5

23.5 24.0 24.3 24.5 24.7 24.9 25.2 25.6

23.6 24.2 24.4 24.6 24.8 25.0 25.3 25.9

23.8 24.2 24.4 24.6 24.8 25.0 25.3 26.0

a) Construya la tabla de frecuencias.

2) Con el objeto de determinar el número de horas diarias que las amas de casa se dedican a ver
televisión, se llevó a cabo una encuesta en 35 hogares en Lima Metropolitana, obteniéndose
los siguientes resultados en horas:

Lic. José Luis Eche Calderón 27


Estadística I

2.8 3.3 3.4 3.5 3.5 4.1 4.2

4.2 4.4 4.5 4.8 4.8 4.9 4.9

4.9 5.2 5.6 5.6 5.7 5.8 5.9

6.0 6.1 6.5 6.6 6.9 7.1 7.1

7.1 7.2 7.3 7.4 7.5 7.5 7.5

a) Construya la tabla de distribución de frecuencias

3) Para realizar un estudio de la cantidad de arroz vendido por semana en una tienda, se tomó
una muestra de 40 semanas del año 2009, obteniéndose los siguientes resultados (en cientos
de kg.)
2.20 2.21 2.25 2.25 2.25 2.25 2.29 2.32 2.33 2.36

2.37 2.39 2.39 2.40 2.40 2.41 2.42 2.42 2.43 2.45

2.45 2.52 2.52 2.54 2.56 2.57 2.60 2.60 2.63 2.67

2.69 2.70 2.70 2.72 2.72 2.81 2.84 2.84 2.90 2.90

a) Construya la tabla de distribución de frecuencias

Lic. José Luis Eche Calderón 28


Estadística I

ESTADÍSTICA DESCRIPTIVA

Lic. José Luis Eche Calderón 29


Estadística I

Lic. José Luis Eche Calderón 30


Estadística I

Lic. José Luis Eche Calderón 31


Estadística I

Lic. José Luis Eche Calderón 32


Estadística I

Lic. José Luis Eche Calderón 33


Estadística I

Lic. José Luis Eche Calderón 34


Estadística I

Lic. José Luis Eche Calderón 35


Estadística I

Lic. José Luis Eche Calderón 36


Estadística I

Lic. José Luis Eche Calderón 37


Estadística I

Lic. José Luis Eche Calderón 38


Estadística I

Lic. José Luis Eche Calderón 39


Estadística I

Lic. José Luis Eche Calderón 40


Estadística I

REGRESIÓN LINEAL SIMPLE:

Dada una muestra de “n” datos (x1,y1), (x2,y2),…,(xn,yn) observados de la variable


bidimensional (X,Y). La regresión lineal simple de la variable dependiente Y con respecto a
la variable independiente X, consiste en obtener la ecuación de la recta Y = a + bX, que
mejor se ajuste a los valores de la muestra, con el fin de poder predecir o pronosticar los
valores de Y dado X.

y Valores dispersos y recta ajustada.


4,5 y=a + bx
4
3,5
3
2,5
2 1
1,5
1
0,5
0 x
0 2 4 6 8 10

EL MÉTODO DE LOS MÍNIMOS CUADRADOS:

Consiste en encontrar la curva ajustada y = a + bx, para el cual los valores asociados se
calculan mediante:

𝑛. ∑𝑛𝑖=1 𝑥𝑖 . 𝑦𝑖 − ∑𝑛𝑖=1 𝑥𝑖 . ∑𝑛𝑖=1 𝑦𝑖


𝑏=
𝑛. ∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑛𝑖=1 𝑥𝑖 )2

Además: 𝑎 = 𝑦̅ − 𝑏. 𝑥̅

∑𝑛
𝑖=1 𝑦𝑖 ∑𝑛
𝑖=1 𝑥𝑖
Donde: 𝑦̅ = 𝑥̅ =
𝑛 𝑛

NOTA: Si b>0, entonces la tendencia lineal es creciente.

Si b<0, entonces la tendencia lineal es decreciente.

Lic. José Luis Eche Calderón 41


Estadística I

∑𝑛
𝑖=1 𝑥𝑖 .𝑦𝑖
LA COVARIANZA: 𝐶𝑜𝑣 𝑥𝑦 = − 𝑋̅. 𝑌̅
𝑛

Mide el nivel de variabilidad (dispersión) conjunta de los datos de las variables en pareja (X,Y) con
respecto a sus medias respectivas (𝑋̅, 𝑌̅).

COEFICIENTE O ÍNDICE DE CORRELACIÓN:

𝐶𝑜𝑣 𝑥𝑦
𝑟=
𝑆𝑥 . 𝑆𝑦

Si r=1, se dice que hay una correlación lineal perfecta positiva.

Si r= -1, se dice que hay una correlación lineal perfecta negativa.

Si r=0, se dice que no hay una correlación entre las dos variables.

𝐶𝑜𝑣 𝑥𝑦
NOTA: En el método de los mínimos cuadrados: 𝑏=
𝑆𝑥 ²

En la variable bidimensional (X, Y): Cuando una de las variables es el tiempo (en días, meses, años)
la regresión se denomina serie de tiempo.

Recomendación: Realizar los ejercicios propuestos de las páginas 103, 108 - 113 del libro
“Estadística Descriptiva e Inferencial - Aplicaciones” de Manuel Córdova Zamora.
Pontificia Universidad Católica del Perú. (5° Edición).

Lic. José Luis Eche Calderón 42

Вам также может понравиться