Вы находитесь на странице: 1из 66

Educación Superior

Abierta y a Distancia

Ingeniería en Tecnología Ambiental

Asignatura

Estadística Básica

Primer Trimestre

Alumno
xxxxxxx
xxxxxxxxxxxxx

Ingeniería en Tecnología Ambiental


1
Educación Superior Abierta y a Distancia
UNIDAD 1: FUNDAMENTOS DE LA ESTADÍSTICA 3

ACTIVIDAD 2: DETERMINACIÓN DE MUESTRAS 3


ACTIVIDAD 3: PROBLEMAS: CIERRE DE LA UNIDAD 5
ACTIVIDAD 4. FORO: LA IMPORTANCIA DE LA ESTADÍSTICA 7
EVIDENCIA DE APRENDIZAJE 1 8
AUTORREFLEXIONES: UNIDAD 1. 9
AUTOEVALUACIÓN: UNIDAD 1 10

UNIDAD 2: REPRESENTACIÓN NUMÉRICA Y GRÁFICA DE DATOS 14

ACTIVIDAD 1: DATOS AGRUPADOS Y NO AGRUPADOS 14


ACTIVIDAD 2: FRECUENCIAS 16
ACTIVIDAD 3: INTERVALOS 18
ACTIVIDAD 4: GRÁFICAS 19
ACTIVIDAD 5: FORO USO COTIDIANO DE LA ESTADÍSTICA DESCRIPTIVA 24
EVIDENCIA DE APRENDIZAJE 2: REPRESENTACIÓN DE DATOS 25
AUTOEVALUACIÓN UNIDAD 2 27
AUTORREFLEXIONES: UNIDAD 2 30

UNIDAD 3: MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN 31

ACTIVIDAD 1: MEDIDAS DE TENDENCIA CENTRAL 31


ACTIVIDAD 2: MEDIDAS DE DISPERSIÓN 34
ACTIVIDAD 3: PROBLEMAS CON MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN 37
EVIDENCIA DE APRENDIZAJE 3: MEDIDAS DE DISPERSIÓN Y TENDENCIA CENTRAL 41
AUTORREFLEXIONES: UNIDAD 3 58

EXAMEN FINAL 62

LITERATURA CONSULTADA 63

Ingeniería en Tecnología Ambiental


2
Educación Superior Abierta y a Distancia
Unidad 1: Fundamentos de la Estadística
Actividad 2: Determinación de Muestras

Determina el tamaño de la muestra para cada uno de los ejemplos, tomando en cuenta
que el valor de Z para el porcentaje de confianza del 95% es igual a 1.96. Explica tu
procedimiento de sustitución de datos e incluye la fórmula que usaste para cada caso.

1. En una fábrica de alimentos para animales se producen diariamente 58500 sacos de


alimento de 5 kg. Para garantizar que el peso del contenido sea correcto, se toma
aleatoriamente algunos sacos y se pesan.
Se sabe que la variabilidad positiva es de p=0.7. Si se quiere garantizar un nivel de
confianza de 95% y un porcentaje de error de 5%, ¿cuántos sacos se debe pesar?
Fórmula para cuando se conoce la población: se coloca el índice de confianza en 1.96,
ya que me están dando variabilidad positiva y negativa se sustituyen en la fórmula 0.7
y 0.3, la población es conocida por lo que hay que usar la cantidad 58500.
n= (1.96*1.96)*(0.7*0.3)*58500 .
58500*(0.05*0.05)+ (1.96*1.96)*(0.7*0.3)
n= (3.8416)*12285 .
146.25+ 0.806736
n= 47194.056
147.056726
n=320 sacos de alimento
2. Se desea realizar un estudio sobre la incidencia de complicaciones postoperatorias en
mujeres. El estudio no tiene antecedentes, pero se desea garantizar un nivel de
confianza de 95% y un porcentaje de error máximo de 10%, ¿cuál debe ser el tamaño
de la muestra?
Fórmula para cuando NO se conoce la población: En este caso no se conoce la
población por lo que hay que usar la formula correspondiente, se utiliza variabilidad
negativa y positiva de 0.5 ya que no me fueron proporcionadas en el texto del
ejercicio.
n=(1.96*1.96)*(0.5*0.5)
(0.1*0.1)
n=(3.8416)*(0.25)
(0.01)
n=96 mujeres

Ingeniería en Tecnología Ambiental


3
Educación Superior Abierta y a Distancia
3. Un estudio pretende estimar la cantidad de niños(as) que no tiene un nivel de
nutrición adecuado, en determinada zona rural. Se sabe que hay 480 niños(as) en la
zona.
Calcula el tamaño de la muestra para garantizar un nivel de confianza del 95%, y un
porcentaje de error de 4%.
Fórmula para cuando se conoce la población: La población es conocida en 480
individuos por lo que se usa la formula correspondiente, no se proporciona
variabilidad negativa y positiva por lo que se usa 0.5 para cada caso
n= (1.96*1.96)*(0.5*0.5)*480 .
480*(0.04*0.04)+(1.96*1.96)*(0.5*0.5)
n= (3.8416)*(0.25)*480 .
480*(0.0016)+ (3.8416)*(0.25)
n= 460.992
1.7284
n=266 niños

Ingeniería en Tecnología Ambiental


4
Educación Superior Abierta y a Distancia
Actividad 3: Problemas: Cierre de la unidad

1. Un lingüista quiere estudiar cuáles son las vocales más usadas dentro de las palabras
en un texto de alrededor de tres mil palabras. Contar palabra por palabra sería
demasiado trabajo. Por lo que se analizará un subconjunto representativo.

Resuelve las siguientes cuestiones:

a) ¿Cuál es la población de estudio? Las tres mil palabras


b) ¿Cuáles son los individuos de esa población? Cada una de las tres mil palabras
c) ¿De cuántos individuos consta la población? Numéralos comenzando por el 00: la
población consta de 3000 palabras del 0001 al 3000.
d) ¿Cuál es la variable o cuáles son las variables a estudiar? Las vocales más usadas
e) ¿Cuál debe ser el número de elementos necesarios para tomar una muestra
aleatoria simple tal que los resultados del estudio tengan un porcentaje de error
de 5% y un porcentaje de confianza de 95%? Para calcularlo, considera que Z= 1.96
y que la variabilidad positiva es igual a la negativa.

n=((1.96*1.96)*(0.5*0.5)*3000) / (3000*(0.05*0.5))+( (1.96*1.96)* (0.5*0.5))


n=((3.8416)*(0.25*3000)) / ((3000*0.0025)+( 3.8416*0.25))
n=2881.2 / 8.4604
n=340.55127
n=340 palabras

f) Con el resultado anterior:


 Obtén la muestra a partir de una tabla de números aleatorios.
 Elabora una lista de los datos obtenidos de la muestra de acuerdo con las
variables que señalaste en el inciso d. Resultados en la hoja de cálculo anexa,
(doble clic en el icono para abrirla)

Ingeniería en Tecnología Ambiental


5
Educación Superior Abierta y a Distancia
Hoja de cálculo
binaria de Microsoft Office Excel

Ingeniería en Tecnología Ambiental


6
Educación Superior Abierta y a Distancia
2. Determina los elementos necesarios para saber cuál es el color que se presenta con
mayor frecuencia en los carros de tu colonia.
a) ¿Cuál es la población de tu estudio? Todos los carros de mi colonia
b) ¿Cuáles son los individuos de esa población? Cada uno de los carros
c) ¿Puedes determinar de cuántos individuos consta la población? Si es posible,
numéralos comenzando por 00. Si no es posible, explica por qué. Si es posible, si
contamos cada carro de la colonia lo cual es complicado y costoso en tiempo y
esfuerzo, ya que no está dado el valor de la población se puede manejar como
valor desconocido. Otra forma es hacer una estimación, por ejemplo, en mi colonia
las casas son de constructora, por lo que cada manzana tiene exactamente 40
casas y son 7.5 manzanas, si estimamos que en cada hogar tienen un vehículo
tendremos aproximadamente 300 vehículos en la colonia
d) ¿Cuál es la variable o cuáles son las variables a estudiar? El color de los carros
e) Obtén el número de elementos necesarios para tomar una muestra aleatoria
simple tal que los resultados del estudio tengan un porcentaje de error de 5% y un
porcentaje de confianza de 95%? Para calcularlo, considera que Z= 1.96 y que la
variabilidad positiva es igual a la negativa.

n=((3.8416)*(0.25)*(300)) / ((300*.0025)+(3.8416*0.25))
n=288.12 / 1.7104
n=168.451
n=168 carros
f) Con el resultado anterior:
 Obtén la muestra a partir de una tabla de números aleatorios.
 Elabora una lista de los datos obtenidos de la muestra de acuerdo con las
variables que señalaste en el inciso d.
 Organiza los datos obtenidos en orden ascendente. Resultados en la hoja de
cálculo anexa, (doble clic en el icono para abrirla)

Hoja de cálculo
binaria de Microsoft Office Excel

Ingeniería en Tecnología Ambiental


7
Educación Superior Abierta y a Distancia
Actividad 4. Foro: La importancia de la estadística

El foro La importancia de la estadística tiene como propósito que reflexiones acerca de la


percepción que tienes sobre la estadística y su utilidad, y la compartas con tus
compañeros(as) de grupo y el (la) Facilitador(a). Responde las siguientes preguntas en el
foro:

¿Qué importancia tiene el uso de la estadística? La estadística es una ciencia de suma


importancia (y en muchas ocasiones considerada poco útil), ya que esta nos permite
conocer patrones de comportamiento de fenómenos tanto naturales como sociales. Así
como establecer reglas dentro de procesos importantes o críticos, por medio de la
estadística se pueden establecer cuáles son los valores para considerar que un proceso ha
alcanzado ciertas características consideradas críticas y en base a ello tomar acciones que
lo estabilicen a los valores considerados óptimos.

¿Quién usa la estadística y para qué la usa? La estadística tiene un amplio uso en todas
las ramas de la ciencia. En el campo de la salud, establece los parámetros que determinan
las condiciones óptimas de salubridad en la población, también establece los parámetros
considerados de alto riesgo en una situación de alerta sanitaria. En las disciplinas de
humanidades establece los rasgos de comportamiento de la población, aporta nuevos
parámetros y actualiza los ya existentes, todo esto con el fin de conocer de mejor manera
la distribución de las características más importantes de un grupo humano.

¿Qué utilidad le encuentras a esta asignatura? Específicamente para la carrera que he


seleccionado, Ingeniería en Tecnologías Ambientales, aporta herramientas sumamente
útiles, ya que en esta disciplina se deben hacer estudios relacionados con la calidad del
medio ambiente, estos estudios se realizan analizando variables que son de alto impacto
para la vida, tales como contaminación del aire, el agua y el suelo y los elementos que
forman esa contaminación. La estadística aporta el conocimiento necesario para
establecer valores a dichas variables, tales valores nos indican en qué momento las
condiciones son las más óptimas y en qué momento están fuera de las normas
establecidas.

Ingeniería en Tecnología Ambiental


8
Educación Superior Abierta y a Distancia
Evidencia de Aprendizaje 1

Descarga la base de datos Preferencias por carrera, disponible en la pestaña Material de


apoyo. En este documento encontrarás los resultados de la encuesta en que participaste
en la Actividad 1. Los resultados presentados son de todos los (las) alumnos(as) que
respondieron.

Determina lo siguiente:

 ¿Cuál es la población de estudio?: Todos los alumnos de ESAD de primer


cuatrimestre
 ¿Cuáles son los individuos de esa población? Las edades y las carreras de los
alumnos inscritos en el primer cuatrimestre
 ¿De cuántos individuos consta la población? Nombra el rango que abarca la
población (numéralos comenzando por el 1 y ocupa la cantidad de ceros necesaria
para completar los dígitos del número total de la población, por ejemplo del 0001
al 1845). 0001 al 5329
 Obtén el número de elementos necesarios para seleccionar una muestra aleatoria
simple tal que los resultados del estudio tengan un porcentaje de error del 5% y un
porcentaje de confianza del 95%. Para ello considera que Z = 1.96 y que la
variabilidad positiva es igual a la negativa.
n=((1.96*1.96)*(0.5*0.5)*5329) / (5329*(0.05*0.05)+ (1.96*1.96)*( 0.5*0.5))
n=((3.8416*0.25)*5329) / ((5329*0.0025)+( 3.8416*0.25))
n=5117.9716 / 13.3225+.9604
n=5117.9716 / 14.2829
n=358.3286
n=358 alumnos
 ¿Cuál es la variable o cuáles son las variables a estudiar en esa muestra? La edad
de los alumnos
 Obtén la muestra con base en la tabla de números aleatorios que tienes (no
olvides indicar el renglón que elegiste para comenzar a seleccionar los individuos
de la muestra) (ver archivo de Excel anexo, doble clic en el icono)

Hoja de cálculo
binaria de Microsoft Office Excel

Ingeniería en Tecnología Ambiental


9
Educación Superior Abierta y a Distancia
Autorreflexiones: Unidad 1.

1) ¿Cómo defines a la estadística? La estadística es la ciencia que nos sirve para analizar
conjuntos o poblaciones desde un punto de vista matemático, esto con el fin de conocer
sus características y particularidades de los individuos que la conforman, así como
clasificar de diferentes formas dicha población.

2) ¿Qué es una población? La población es un conjunto de individuos o elementos que


pueden ser analizados, clasificados y divididos en subgrupos o muestras que nos permiten
conocerlos mejor.

3) ¿Cuál es la diferencia entre variable e individuos en una población? Los individuos son
los elementos que conforman una población mientras que las variables son características
ya sea de los individuos o de la misma población, cuando se toma una muestra se
muestrean los individuos pero con el objetivo de analizar las variables o características
que estos tienen respecto a la población que conforman.

4) ¿Cuáles son los pasos para obtener una muestra aleatoria simple? Primero, conocer
que tan grande es la población de donde sacaremos la muestra. Segundo, debemos
determinar un grado de error en la muestra. Tercero, determinar el grado de confianza
que requerimos evitando con esto analizar la totalidad de la población. Cuarto,
determinar la variabilidad positiva y negativa. En base a todo esto aplicar la fórmula
correspondiente para determinar cuántos individuos debemos considerar en nuestra
muestra.

5) ¿En qué consiste el porcentaje de confianza (Z) en una muestra? Representa la


posibilidad de generalizar la muestra, es decir, que la muestra que tomaremos de una
población determinada es representativa de la misma por lo que no es necesario analizar
la población total (lo cual es muy costoso).

Ingeniería en Tecnología Ambiental


10
Educación Superior Abierta y a Distancia
Autoevaluación: Unidad 1

Comenzado el domingo, 26 de junio de 2011, 13:57

Completado el domingo, 26 de junio de 2011, 14:00

Tiempo empleado 2 minutos 29 segundos

Calificación 10 de un máximo de 10 (100%)

Comentario - Has concluido la autoevaluación, para obtener el máximo


aprovechamiento de esta actividad te sugerimos prestar
especial atención a la retroalimentación que recibiste, ya
que te ofrece información que orienta tu proceso de
aprendizaje. Continúa esforzándote.
Question1
Puntos: 1

Muestreo en el que todos los elementos tienen la misma probabilidad de ser elegidos y se eligen al
azar:

Seleccione una respuesta.

a. Muestreo aleatorio simple  ¡Correcto! El muestreo aleatorio simple


es aquél en el que todos los elementos
tienen las mismas posibilidades de ser
elegidos.

b. Muestreo por selección intencionada

c. Muestreo sistemático

d. Muestreo estratificado
Correcto
Puntos para este envío: 1/1.

Question2
Puntos: 1

Número de hijos(as) en una familia, edad de los alumnos(as), peso y estatura son ejemplos de
variables:

Seleccione una respuesta.

Ingeniería en Tecnología Ambiental


11
Educación Superior Abierta y a Distancia
a. Discretas 

b. Nominales 

c. Cualitativas

d. Cuantitativas ¡Correcto! Son ejemplos de


variables cuantitativas porque se
expresan mediante números.

Correcto
Puntos para este envío: 1/1.

Question3
Puntos: 1

Característica que se desea estudiar y se observa en una población o muestra:

Seleccione una respuesta.

a.Estadístico

b.Parámetro

c. Dato 

d. Variable ¡Correcto! Las variables son las


características que se desean estudiar de
una determinada población o muestra.
Pueden ser de cuatro tipos: nominales,
ordinales, continuas y discretas.

Correcto
Puntos para este envío: 1/1.

Question4
Puntos: 1

Consiste en la presentación de datos en forma de tablas y gráficas:

Seleccione una respuesta.

a. Estadística inferencial

b. Estadística descriptiva ¡Correcto! La estadística descriptiva se


define como los métodos de recopilación,
caracterización y presentación de un
conjunto de datos con el fin de describir

Ingeniería en Tecnología Ambiental


12
Educación Superior Abierta y a Distancia
algunas de sus características.

c. Muestreo

d. Muestra aleatoria simple 


Correcto
Puntos para este envío: 1/1.

Question5
Puntos: 1

Conjunto de todos los elementos que presentan una característica común:

Seleccione una respuesta.

a. Datos

b.Población ¡Correcto! La población es un conjunto de


todos los elementos que presentan una
característica común determinada,
observable y medible.

c.Variable

d.Muestra
Correcto
Puntos para este envío: 1/1.

Question6
Puntos: 1

Estado civil, sexo, nivel educativo, calidad de la atención son tipos de variables:

Seleccione una respuesta.

a. Ordinales

b.Cualitativas ¡Correcto! Son ejemplo de


variables cualitativas porque
expresan cualidades que no son
numéricas, pueden ser nominales
u ordinales.

c.Cuantitativas

d. Continuas
Correcto

Ingeniería en Tecnología Ambiental


13
Educación Superior Abierta y a Distancia
Puntos para este envío: 1/1.
Question7
Puntos: 2
Se van a estudiar las preferencias, en cuanto a carreras, de los (las) estudiantes que ingresaron al Curso
Propedéutico de la ESAD para determinar cuáles carreras necesitan un mayor número de
facilitadores(as). Para determinar el tamaño de la muestra utilizarías:

Seleccione una respuesta.

¡Correcto! La ESAD sabe con


exactitud cuántos alumnos(as)
a. La fórmula  ingresaron al Curso Propedéutico,
esta fórmula se utiliza para obtener
el número de la muestra cuando se
conoce con exactitud la población
de estudio.

b. Un método de muestreo no probabilístico 

c. La fórmula  

d. Un método de muestreo probabilístico 


Correcto
Puntos para este envío: 2/2.
Question8
Puntos: 2
Un ecologista desea estudiar el promedio de vida de los delfines, en una zona en la cual se están
aplicando con mayor rigor las normas de pesca desde hace aproximadamente 10 años, y comparar este
promedio con el promedio de vida en una zona donde dichas reglas han sido aplicadas de una forma
menos estricta. Para encontrar el tamaño de la muestra el ecologista debe aplicar en su investigación:
Seleccione una respuesta.

a. La fórmula

b. Un método de muestreo no probabilístico 

¡Correcto! En este caso, el


investigador desconoce cuál es el
c. La fórmula    tamaño exacto de la población de
delfines y esta fórmula se utiliza para
determinar el tamaño de la muestra
cuando no se conoce con exactitud
el tamaño de la población.

Ingeniería en Tecnología Ambiental


14
Educación Superior Abierta y a Distancia
d. Un método de muestreo probabilístico 
Correcto
Puntos para este envío: 2/2.

Ingeniería en Tecnología Ambiental


15
Educación Superior Abierta y a Distancia
Unidad 2: Representación numérica y gráfica de datos
Actividad 1: Datos agrupados y no agrupados

1. Datos Agrupados: Son aquellos datos que forman parte de una muestra y que han sido
contados, ordenas, clasificados. Por lo que se pueden representar por medio de grupos o
rangos. Una característica de estos datos es que presentan una frecuencia o número de
veces que un mismo dato se repite en la muestra.

Ejemplo 1: un grupo de 310 alumnos presentó examen de admisión para una universidad.
El encargado de selección de alumnos presenta a la dirección de la universidad una
tabulación o que contiene los totales obtenidos por alumnos representados en rangos:

Puntaje No. de alumnos En este ejemplo los datos que se están


0-5 30 presentando ya han sido previamente
6 30 contados, ordenados, clasificados, agrupados
7 150 y divididos en rangos por lo que presentan
8 50 una frecuencia representada por la columna
9 40
No. de alumnos.
10 10
Ejemplo 2: Una persona quiere saber las
calificaciones que obtuvo durante sus estudios universitarios, para esto obtiene de su
Kardex las frecuencias de las mismas: 88; 88; 86; 100; 80; 87; 92; 97; 100; 93; 92; 98; 81;
90; 98; 89; 97; 81; 80; 100; 90; 100; 98; 90; 100; 85; 100; 100; 89; 95; 74; 81; 88; 87; 93;
76; 95; 82; 86; 86; 90; 74; 73; 93;

Calificación Frecuencia
73 1
74 2
76 1
80 2
81 3 En este ejemplo se mencionan 44 calificaciones
82 1
correspondientes a 44 materias cursadas. Pero al agruparse por
85 1
86 3 frecuencias se forman 18 renglones donde se representan las
87 2
frecuencias en que las calificaciones se obtuvieron a lo largo de
88 3
89 2 los estudios, siendo el 100 la calificación que se presentó con
90 4
mayor frecuencia.
92 2
93 3
95 2
97 2
98 3
100 7

Ingeniería en Tecnología Ambiental


16
Educación Superior Abierta y a Distancia
2. Datos no Agrupados: Son aquellos que aún no han sido clasificados o contados, los
datos no agrupados si bien pueden presentar un ordenamiento, no presentan una
frecuencia por lo que no pueden ser agrupados o representados en rangos hasta que sean
contados y clasificados. Los datos no agrupados son aquellos que resultan del muestreo
aleatorio inicial, a los cuales todavía no se les ha aplicado ningún formato, ordenamiento,
agrupación o tabulación.

Ejemplo 1: Una persona quiere saber los promedios que obtuvo durante sus estudios
universitarios, para esto obtiene de su Kardex las calificaciones, las cuales están
ordenadas por nombre de materia, el resultado es:

88; 88; 86; 100; 80; 87; 92; 97; 100; 93; 92; 98; 81; 90; 98; 89; 97; 81; 80; 100; 90; 100;
98; 90; 100; 85; 100; 100; 89; 95; 74; 81; 88; 87; 93; 76; 95; 82; 86; 86; 90; 74; 73; 93;

En este caso, las calificaciones no están ordenadas numéricamente y no presentan una


frecuencia aun cuando hay calificaciones repetidas, por lo que se considera que este
conjunto de datos no está agrupado.

Ejemplo 2: Un consultorio geriátrico guarda el peso de sus pacientes diario, la muestra


obtenida en un día determinado fue la sig.:

60; 66; 77; 70; 66; 68; 57; 70; 66; 52; 75; 65; 69; 71; 58; 66; 67; 74; 61; 63; 69; 80; 59; 66;
70; 67; 78; 75; 64; 71; 81; 62; 64; 69; 68; 72; 83; 56; 65; 74;

En la muestra se encuentra el peso de 40 personas, en este caso, los pesos no están


clasificados por sexo o edad, ni ordenados, tampoco presentan una frecuencia, por lo que
se considera que los datos no están agrupados.

Ingeniería en Tecnología Ambiental


17
Educación Superior Abierta y a Distancia
 Actividad 2: Frecuencias

 En una gasolinera quieren saber cuántos empleados más deben contratar y para
qué turnos, para ello, registraron durante dos días la cantidad de litros de diesel
que se vende por hora en la gasolinera, el registro que obtuvieron fue el siguiente:
816 810 856 888 833 839 853 837 881 873 889 836 815 860 830 888 830 844 830
831 840 844 840 858 810 888 883 835 884 849 856 888 833 869 835 835 884 849
844 840 858 853 837 881 873 889 836 815
 Elabora una tabla de frecuencias con los datos. Incluye, en la misma tabla, la
frecuencia absoluta, la frecuencia acumulada, la frecuencia relativa y la frecuencia
relativa acumulada.

(tabla en la sig. página)

Ingeniería en Tecnología Ambiental


18
Educación Superior Abierta y a Distancia
Frecuencia Frecuencia Frecuencia Frecuencia Relativa
Valores
Absoluta Acumulada Relativa Acumulada
810 2 2 0.04166 0.04166
815 2 4 0.04166 0.08333
816 1 5 0.02083 0.10416
830 3 8 0.06250 0.16666
831 1 9 0.02083 0.18750
833 2 11 0.04166 0.22916
835 3 14 0.06250 0.29166
836 2 16 0.04166 0.33333
837 2 18 0.04166 0.37500
839 1 19 0.02083 0.39583
840 3 22 0.06250 0.45833
844 3 25 0.06250 0.52083
849 2 27 0.04166 0.56250
853 2 29 0.04166 0.60416
856 2 31 0.04166 0.64583
858 2 33 0.04166 0.68750
860 1 34 0.02083 0.70833
869 1 35 0.02083 0.72916
873 2 37 0.04166 0.77083
881 2 39 0.04166 0.81250
883 1 40 0.02083 0.83333
884 2 42 0.04166 0.87500
889 6 48 0.12500 1.00000
48

Ingeniería en Tecnología Ambiental


19
Educación Superior Abierta y a Distancia
Actividad 3: Intervalos

 En una gasolinera quieren saber cuántos empleados nuevos deben contratar y


para qué turnos; para ello registraron durante dos días la cantidad de litros de
diesel que se venden por hora en la gasolinera. Dicho registro fue el siguiente:
816 810 856 888 833 839 853 837 881 873 889 836 815 860 830 888 830 844 830
831 840 844 840 858 810 888 883 835 884 849 856 888 833 869 835 835 884 849
844 840 858 853 837 881 873 889 836 815
 Construye 10 intervalos de clase con los datos proporcionados y elabora la tabla de
frecuencias correspondiente. Incluye en la misma tabla la frecuencia absoluta la
frecuencia acumulada la frecuencia relativa y la frecuencia relativa acumulada.

Xn=810
X1=889
R=889-810
R=79
k=10
Amplitud=79/10
Amplitud=7.9

Frecuencia Frecuencia Frecuencia Frecuencia Relativa


Intervalos
Absoluta Acumulada Relativa Acumulada
810-817 5 5 0.10416 0.10416
818-825 0 5 0 0.10416
826-833 6 11 0.125 0.22916
834-841 11 22 0.22916 0.45833
842-849 5 27 0.10416 0.5625
850-857 4 31 0.08333 0.64583
858-865 3 34 0.0625 0.70833
866-873 3 37 0.0625 0.77083
874-881 2 39 0.04166 0.8125
882-889 9 48 0.1875 1
48

Ingeniería en Tecnología Ambiental


20
Educación Superior Abierta y a Distancia
Actividad 4: Gráficas

Los parámetros que has visto hasta aquí, la organización numérica de los datos en tablas y
las representaciones gráficas de éstas, pueden ser realizados de forma manual, pero
existen programas informáticos como Excel, software libre y programas especializados
para estadística, que permiten realizar todos estos trabajos. Realiza la siguiente actividad:

1. Retoma los problemas que realizaste en la Actividad 2: Frecuencias, con los datos


de la tabla elabora las gráficas que revisaste en este tema e inclúyelas en el mismo
documento.
2. Comparte con tus compañeros(as) el procedimiento que seguiste para graficar los
datos del problema, si utilizaste algún software comenta cuál. Agrega una
conclusión sobre la utilidad de la representación gráfica de datos.

Procedimiento para crear las gráficas

Para hacer las gráficas utilicé Excel 2007. El procedimiento consistió en copiar la tabla
donde tengo los valores de las frecuencias desde Word a Excel, después en la pestaña
Insertar, seleccione el tipo de gráfica que deseo utilizar y fui seleccionando una por una
los cuatro tipos de gráfica. Para dar valores se debe utilizar la pestaña Diseño y allí el
botón Seleccionar Datos, allí se seleccionan los valores horizontales y verticales. Este
procedimiento se debe repetir por cada una de las gráficas que tengamos. Finalmente
copié y pegué cada gráfica desde Excel a Word utilizando la opción Pegar como Imagen
JPG, de esta forma ya no es posible modificar la gráfica en Word.

Ingeniería en Tecnología Ambiental


21
Educación Superior Abierta y a Distancia
Valore Frecuencia Absoluta Frecuencia Frecuencia Relativa Frecuencia Relativa Acumulada
s810 2 Acumulada 2 0.04166 0.04166
815 2 4 0.04166 0.08333
816 1 5 0.02083 0.10416
830 3 8 0.06250 0.16666
831 1 9 0.02083 0.18750
833 2 11 0.04166 0.22916
835 3 14 0.06250 0.29166
836 2 16 0.04166 0.33333
837 2 18 0.04166 0.37500
839 1 19 0.02083 0.39583
840 3 22 0.06250 0.45833
844 3 25 0.06250 0.52083
849 2 27 0.04166 0.56250
853 2 29 0.04166 0.60416
856 2 31 0.04166 0.64583
858 2 33 0.04166 0.68750
860 1 34 0.02083 0.70833
869 1 35 0.02083 0.72916
873 2 37 0.04166 0.77083
881 2 39 0.04166 0.81250
883 1 40 0.02083 0.83333
884 2 42 0.04166 0.87500
889 6 48 0.12500 1.00000
48 1
Valores y Frecuencias

Ingeniería en Tecnología Ambiental


22
Educación Superior Abierta y a Distancia
Histograma

Gráfica de Líneas

Ingeniería en Tecnología Ambiental


23
Educación Superior Abierta y a Distancia
Gráfica de Barras

Gráfica de Áreas

Ingeniería en Tecnología Ambiental


24
Educación Superior Abierta y a Distancia
Conclusiones

El uso de gráficas para representar la información estadística obtenida por medio del
muestreo es sumamente útil ya que ayuda a que las personas que verán e interpretaran
los datos obtenidos como rangos y frecuencias tengan una mejor comprensión de la
información.

Ingeniería en Tecnología Ambiental


25
Educación Superior Abierta y a Distancia
Actividad 5: Foro Uso Cotidiano de la Estadística Descriptiva

¿En qué casos de la cotidianeidad se utiliza la estadística descriptiva? La estadística en la


vida diaria la usamos muchas veces sin darnos cuenta, por ejemplo, en mi casa mis padres
saben en base a la propia experiencia cuanto tiempo dura el tanque de gas, cuanto es lo
que llega cada mes (aproximadamente) de electricidad, esto, en base a los datos que han
visto en los recibos durante varios años, el hecho de que por varios años el
comportamiento de estos servicios sea estable ha hecho que sin darse cuenta hagan uso
de la estadística, y con la información que ya tienen en la mente, cada mes hagan un
cálculo aproximado de lo que gastarán en servicios del hogar.

¿Has utilizado la estadística descriptiva? ¿Cómo? La he utilizado principalmente en el


ambiente laboral, al desarrollar software se tiene que llevar un control estadístico de los
errores detectados en los programas, durante el proceso de pruebas un programador
debe detectar la cantidad de errores de un programa y relacionarlo con la cantidad de
líneas totales del sistema en cuestión, permitiéndose como máximo 4 errores por cada mil
líneas de código de programa. Los errores tienen clasificaciones y en base a estas
cantidades y clasificaciones son las acciones que se toman para mejorar los sistemas.

¿Cuál es la utilidad de las técnicas de representación numérica y gráfica de datos en la


vida cotidiana? Los usos son muy variados, ya que se pueden utilizar tanto en la vida
laboral (que forma parte de la vida cotidiana de cada persona), como en los quehaceres
diarios. Retomando el ejemplo que di en la pregunta uno, en base a la estadística es
posible tener una previsión de los pagos que debemos hacer mes con mes de los servicios
del hogar, ya que el comportamiento de estos servicios es siempre estable, salvo en
situaciones de emergencia o “atípicas”. Por lo que también es posible graficar el
comportamiento de estos servicios mes por mes y hacerlo anualizado.

Ingeniería en Tecnología Ambiental


26
Educación Superior Abierta y a Distancia
Evidencia de Aprendizaje 2: Representación de Datos

Representación de datos
Para generar la evidencia de aprendizaje de esta unidad realiza lo
siguiente:
Retoma los datos de la muestra que obtuviste y organízalos en tablas de
la siguiente manera:
• Elabora una tabla de frecuencias por intervalos con la variable edad
para toda la muestra.
• Para la variable carrera, elabora una tabla de frecuencias simple para
cada una de las carreras.
• Elabora las gráficas correspondientes a cada una de las variables.

Organiza tu trabajo de la siguiente manera:


• Incluye una presentación donde describas de dónde se obtuvieron los
datos y la finalidad del análisis de los mismos.
• El procedimiento que seguiste para obtener la muestra.
• Las tablas con una descripción.
• Las gráficas con su respectiva descripción.

Tabla de frecuencias por edades


Edad Frecuencia
Representación
N/A

17-26
3

89 de datos
27-36 161

37-46 74

47-56 27

57 o más 4

Total 358
Gráfica por Edades
Para obtener los intervalos dese
excel donde tengo la muestra
copié la columna de edades a una
hoja nueva y la ordene de menor
a mayor, luego hice el conteo de
los intervalos haciendo la tabla
que ven en la esquina superior
izquierda de esta diapositiva. Para
terminar inserte una gráfica de
barras y tomé los datos de la
tabla que había creado
previamente.

Ingeniería en Tecnología Ambiental


27
Educación Superior Abierta y a Distancia
Tabla de frecuencias por carreras

Representación
Carrera Frecuencia
Administración de empresas
turísticas 58

de datos Desarrollo comunitario


Desarrollo de software
Gestión y administración de
31
1

PYME 144
Matemáticas 1
Mercadotecnia internacional 57
Seguridad pública 64
N/A 2
Gráfica por Carreras Total 358

Para obtener los intervalos dese


excel donde tengo la muestra
copié la columna de edades a una
hoja nueva y la ordene de
alfabéticamente, luego hice el
conteo de los intervalos haciendo
la tabla que ven en la esquina
superior derecha de esta
diapositiva. Para terminar inserte
una gráfica de barras y tomé los
datos de la tabla que había
creado previamente.

Ingeniería en Tecnología Ambiental


28
Educación Superior Abierta y a Distancia
Autoevaluación Unidad 2

Comenzado el sábado, 30 de julio de 2011, 15:44


Completado el sábado, 30 de julio de 2011, 15:46
Tiempo 1 minutos 39 segundos
empleado
Puntos 5/8
Calificación 6 de un máximo de 10 (63%)
Comentario - Has concluido la autoevaluación, para obtener el máximo
aprovechamiento de esta actividad te sugerimos prestar
especial atención a la retroalimentación que recibiste, ya que
ofrece información que orienta tu proceso de aprendizaje.
Continúa esforzándote.
Question 1
Puntos: 1
Conjunto de datos comprendidos entre dos números conocidos como límites
Seleccione una respuesta.

a. Intervalo
b. Marca de clase
c. Rango
d. Frontera de clase
Revisa nuevamente la definición de intervalo y los conceptos asociados a ella. El
intervalo es el conjunto de números que se encuentran delimitados por otros dos
números dados.
Incorrecto
Puntos para este envío: 0/1.

Question 2
Puntos: 1
Es la diferencia entre el límite superior y el límite inferior del intervalo.
Seleccione una respuesta.

a. Marca de clase
b. Amplitud del intervalo
c. Frontera de clase
d. Intervalo de clase
¡Correcto! La amplitud del intervalo se obtiene al restar el límite superior (Ls-Li).
Correcto
Puntos para este envío: 1/1.

Question 3
Puntos: 1
Este dato se obtiene cuando divides la frecuencia absoluta entre el número total
del datos (N).
Seleccione una respuesta.

Ingeniería en Tecnología Ambiental


29
Educación Superior Abierta y a Distancia
a. Frecuencia relativa
b. Frecuencia relativa acumulada
c. Intervalo
d. Frecuencia acumulada
Revisa nuevamente las definiciones de frecuencias. La frecuencia relativa se
obtiene cuando divides la frecuencia absoluta entre N. También se puede presentar
en términos de porcentaje.
Incorrecto
Puntos para este envío: 0/1.

Question 4
Puntos: 1
Es la suma de las frecuencias hasta el renglón i.
Seleccione una respuesta.

a. Frecuencia relativa acumulada


b. Intervalo
c. Frecuencia acumulada
d. Amplitud del intervalo
¡Correcto! La frecuencia acumulada es la que se obtiene cuando sumas las
frecuencias absolutas hasta el renglón i, esto es, cuando sumas la frecuencia
absoluta del segundo renglón con la del primero. Esto se puede apreciar mejor en
las tablas de datos.
Correcto
Puntos para este envío: 1/1.

Question 5
Puntos: 1
Es la diferencia entre un histograma y una gráfica de barras:
Seleccione una respuesta.

a. Las variables que representan

b. Separación entre las barras


c. Los datos que se grafican
d. El ancho de las barras
¡Correcto! El histograma y la gráfica de barras difieren en que, el primero no
presenta separación entre las barras y la segunda sí.
Correcto
Puntos para este envío: 1/1.

Question 6
Puntos: 1
Son las tablas en las que se pueden representar los datos relacionados con más de
una variable.

Ingeniería en Tecnología Ambiental


30
Educación Superior Abierta y a Distancia
Seleccione una respuesta.

a. Tablas de doble entrada


b. Tablas de intervalos
c. Tablas de frecuencia
d. Tablas de datos
Revisa nuevamente los diferentes tipos de tablas.
Incorrecto
Puntos para este envío: 0/1.

Question 7
Puntos: 1
Es el número de veces que se repite un dato.
Seleccione una respuesta.

a. Frecuencia absoluta
b. Frecuencia acumulada
c. Intervalo
d. Frecuencia relativa
¡Correcto! El número de veces que se repite un dato, dentro de una serie, se llama
frecuencia o frecuencia absoluta.
Correcto
Puntos para este envío: 1/1.

Question 8
Puntos: 1
¿De qué depende la formación de intervalos?
Seleccione una respuesta.

a. Del tamaño de la población


b. De la magnitud de las frecuencias absolutas
c. Del tipo de población que se analiza
d. De la decisión de quienes están analizando los datos

¡Correcto! La formación de intervalos depende del tamaño o rango de la población.


El número de intervalos que se formarán para analizar los datos lo determinan
quienes trabajan esos datos.
Correcto
Puntos para este envío: 1/1.

Ingeniería en Tecnología Ambiental


31
Educación Superior Abierta y a Distancia
Autorreflexiones: Unidad 2

Contesta las siguientes preguntas, guárdalas en el archivo correspondiente y envíalo a


través de la herramienta autorreflexiones situada al final de las actividades de la unidad 2.

1.- Describe 2 métodos para recolectar información.

 Encuesta: realizar un cuestionario a número determinado de individuos en una


población, teniendo todos los individuos de la misma posibilidad de ser
seleccionados para la encuesta.

 Muestra Aleatoria: se determina el tamaño de la muestra y de manera aleatoria


son seleccionados los individuos a analizar, en este caso también todos los
individuos de una población tienen la misma posibilidad de ser seleccionados para
su análisis.

2.- ¿En qué consiste la amplitud de un intervalo y cómo se determina dicha amplitud?

La amplitud se obtiene dividiendo el Recorrido de la muestra entre el número de


intervalos que se deben tener. Es el dato que nos permite generar un rango para el
análisis de los datos obtenidos en la muestra.

3.- ¿Qué es una frecuencia absoluta?

Es las veces que un dato se presentó en una muestra o población

4.- ¿Cuál es la diferencia entre datos agrupados y datos no agrupados?

Los datos agrupados presentan un ordenamiento así como una frecuencia de cuantas
veces fueron identificados en la muestra o población, mientras que los datos no
agrupados aunque pueden estar ordenados no presentan frecuencias

5.- ¿Cuál es la utilidad de las tablas de datos?

Una tabla de datos muestra los intervalos y frecuencias de una muestra o población, es
muy útil para poder deducir el comportamiento de una población ya que los datos
agrupados son una generalización de dicho comportamiento.

Ingeniería en Tecnología Ambiental


32
Educación Superior Abierta y a Distancia
Unidad 3: Medidas de Tendencia Central y Dispersión
Actividad 1: Medidas de Tendencia Central

Frecuencia Frecuencia Relativa


NI Valores Frecuencia Absoluta Frecuencia Relativa
Acumulada Acumulada

1 810 2 2 0.04166 0.04166


2 815 2 4 0.04166 0.08333
3 816 1 5 0.02083 0.10416
4 830 3 8 0.0625 0.16666
5 831 1 9 0.02083 0.1875
6 833 2 11 0.04166 0.22916
7 835 3 14 0.0625 0.29166
8 836 2 16 0.04166 0.33333
9 837 2 18 0.04166 0.375
10 839 1 19 0.02083 0.39583
11 840 3 22 0.0625 0.45833
12 844 3 25 0.0625 0.52083
13 849 2 27 0.04166 0.5625
14 853 2 29 0.04166 0.60416
15 856 2 31 0.04166 0.64583
16 858 2 33 0.04166 0.6875
17 860 1 34 0.02083 0.70833
18 869 1 35 0.02083 0.72916
19 873 2 37 0.04166 0.77083
20 881 2 39 0.04166 0.8125
21 883 1 40 0.02083 0.83333
22 884 2 42 0.04166 0.875
23 886 4 46 0.08333 0.95833
24 889 2 48 0.125 1
    48      

816 810 856 888 833 839 853 837 881 873 889 836 815 860 830 888 830 844 830 831 840
844 840 858 810 888 883 835 884 849 856 888 833 869 835 835 884 849 844 840 858 853
837 881 873 889 836 815
(ejercicios en la sig. página)

Ingeniería en Tecnología Ambiental


33
Educación Superior Abierta y a Distancia
Ingeniería en Tecnología Ambiental
34
Educación Superior Abierta y a Distancia
Fórmula para calcular la Media de datos agrupados en frecuencias

µ=816+810+856+888+833+839+853+837+881+873+889+836+815+860+830+888+830+844+
830+831+840+844+840+858+810+888+883+835+884+849+856+888+833+869+835+835+
884+849+844+840+858+853+837+881+873+889+836+815 .
48
µ=40845/48
µ=850.9

Fórmula para calcular la Mediana de datos agrupados en frecuencias

Frecuencia Frecuencia
NI Intervalos
Absoluta Acumulada
1 809-817 5 5
2 818-826 0 5
3 827-835 9 14
4 836-844 11 25
5 845-853 4 29
6 854-862 5 34
7 863-871 1 35
8 872-880 2 37
9 881-889 11 48
10 890-898 0 48
    48 48

N/2=48/2=24 el intervalo es el número 4 ya que suma 25 e incluye el 24


Li = 836
Fi-1 = 14
fi = 11
ai = 8
Sustitución de valores:
Me=836+24-14(8)= 836+10(8)= 836+80=836+7.2=843.2
11 11 11

Me=843.2

Ingeniería en Tecnología Ambiental


35
Educación Superior Abierta y a Distancia
Fórmula para calcular la Moda de datos agrupados en frecuencias

Frecuencia Frecuencia
NI Intervalos
Absoluta Acumulada
1 809-817 5 5
2 818-826 0 5
3 827-835 9 14
4 836-844 11 25
5 845-853 4 29
6 854-862 5 34
7 863-871 1 35
8 872-880 2 37
9 881-889 11 48
10 890-898 0 48
    48 48

Intervalo con mayor frecuencia absoluta 4 y 9, es un conjunto bimodal


Primera moda
Li = 836
fi = 11
Fi-1 = 9
Fi+1 = 4
ai = 8
Sustitución de valores
Mo1=836+ 11- 9 (8)=836+ 2 (8)= 836+ 2 (8)= 836+(0.22(8))= 836+1.77=837.77
(11-9)+(11-4) 2+7 9
Mo1=837.77

Segunda moda
Li = 881
fi = 11
Fi-1 = 2
Fi+1 = 0
ai = 8
Sustitución de valores
Mo2=881+ 11- 2 (8)=881+ 9 (8)= 881+ 9 (8)= 881+(0.45(8))= 881+3.6=884.6
(11-2)+(11-0) 9+11 20
Mo2=884.6

Ingeniería en Tecnología Ambiental


36
Educación Superior Abierta y a Distancia
Actividad 2: Medidas de Dispersión

Frecuencia Frecuencia Relativa


NI Valores Frecuencia Absoluta Frecuencia Relativa
Acumulada Acumulada

1 810 2 2 0.04166 0.04166


2 815 2 4 0.04166 0.08333
3 816 1 5 0.02083 0.10416
4 830 3 8 0.0625 0.16666
5 831 1 9 0.02083 0.1875
6 833 2 11 0.04166 0.22916
7 835 3 14 0.0625 0.29166
8 836 2 16 0.04166 0.33333
9 837 2 18 0.04166 0.375
10 839 1 19 0.02083 0.39583
11 840 3 22 0.0625 0.45833
12 844 3 25 0.0625 0.52083
13 849 2 27 0.04166 0.5625
14 853 2 29 0.04166 0.60416
15 856 2 31 0.04166 0.64583
16 858 2 33 0.04166 0.6875
17 860 1 34 0.02083 0.70833
18 869 1 35 0.02083 0.72916
19 873 2 37 0.04166 0.77083
20 881 2 39 0.04166 0.8125
21 883 1 40 0.02083 0.83333
22 884 2 42 0.04166 0.875
23 886 4 46 0.08333 0.95833
24 889 2 48 0.125 1
    48      

816 810 856 888 833 839 853 837 881 873 889 836 815 860 830 888 830 844 830 831 840
844 840 858 810 888 883 835 884 849 856 888 833 869 835 835 884 849 844 840 858 853
837 881 873 889 836 815

(ejercicios en la sig. página)

Ingeniería en Tecnología Ambiental


37
Educación Superior Abierta y a Distancia
Fórmula para calcular el Recorrido en un conjunto de datos

Re=889-810=79
Re=79

Fórmula para calcular la Varianza de datos no agrupados

Varianza Media

µ=816+810+856+888+833+839+853+837+881+873+889+836+815+860+830+888+830+844+
830+831+840+844+840+858+810+888+883+835+884+849+856+888+833+869+835+835+
884+849+844+840+858+853+837+881+873+889+836+815 .
48
µ=40845/48
µ=850.9

=(816-850.9)^2+(810-850.9)^2+(856-850.9)^2+(888-850.9)^2+(833-850.9)^2+(839-850.9)^2+
(853-850.9)^2+(837-850.9)^2+(881-850.9)^2+(873-850.9)^2+(889-850.9)^2+(836-850.9)^2+
(815-850.9)^2+(860-850.9)^2+(830-850.9)^2+(888-850.9)^2+(830-850.9)^2+(844-850.9)^2+
(830-850.9)^2+(831-850.9)^2+(840-850.9)^2+(844-850.9)^2+(840-850.9)^2+(858-850.9)^2+
(810-850.9)^2+(888-850.9)^2+(883-850.9)^2+(835-850.9)^2+(884-850.9)^2+(849-850.9)^2+
(856-850.9)^2+(888-850.9)^2+(833-850.9)^2+(869-850.9)^2+(835-850.9)^2+(835-850.9)^2+
(884-850.9)^2+(849-850.9)^2+(844-850.9)^2+(840-850.9)^2+(858-850.9)^2+(853-850.9)^2+
(837-850.9)^2+(881-850.9)^2+(873-850.9)^2+(889-850.9)^2+(836-850.9)^2+(815-850.9) .
48

=1672.81+1672.81+1288.81+1288.81+1218.01+436.81+436.81+436.81+396.01+320.41+
320.41+252.81+252.81+252.81+222.01+222.01+193.21+193.21+141.61+118.81+118.81+
118.81+47.61+47.61+47.61+3.61+3.61+4.41+4.41+26.01+26.01+50.41+50.41+82.81+
327.61+488.41+488.41+906.01+906.01+1030.41+1095.61+1095.61+1376.41+1376.41+
1376.41+1376.41+1451.61+1451.61 .
48
= 26716.88/48

=556.60

Ingeniería en Tecnología Ambiental


38
Educación Superior Abierta y a Distancia
Fórmula para calcular la Desviación Estándar en un conjunto de datos

Media
µ=850.9

Varianza

=556.60

Desviación Estándar

=sqrt(556.60)
=23.69

Ingeniería en Tecnología Ambiental


39
Educación Superior Abierta y a Distancia
Actividad 3: Problemas con Medidas de Tendencia Central y Dispersión

Instrucción: Realiza lo siguiente para cada problema.

 Elabora las tablas de frecuencias correspondientes para obtener las medidas de


tendencia central y dispersión.
 Medias de tendencia central y dispersión por frecuencias simples, para el problema 1.
 Medidas de tendencia central y dispersión por intervalos para el problema 2.

1. Un profesor de educación física desea hacer un estudio sobre el desempeño de sus


alumnos(as) en la prueba de atletismo de 100 metros planos. Seleccionó una muestra de
20 alumnos(as) y registró los tiempos que éstos marcaron. Los tiempos, en segundos,
registrados fueron:

18.71, 21.41, 20.72, 28.1, 19.29, 22.43, 20.17, 23.71, 19.44, 20.55, 18.92, 20.33, 23.00,
22.85, 19.25, 21.77, 22.11, 19.77, 18.04, 21.12.

Medidas de Tendencia Central:

Media
µ= 18.71+21.41+20.72+28.1+19.29+22.43+20.17+23.71+19.44+20.55+
18.92+20.33+23.00, 22.85+19.25+21.77+22.11+19.77+18.04+21.12
20
µ= 421.69 / 20
µ= 21.0845

Mediana
Cantidad de datos par en el conjunto=20, los valores que separan en dos el conjunto son
20.55 y 20.72, suman 41.27, la mediana es 20.64
Me=20.64

Moda
El conjunto no tiene datos repetidos por lo que la frecuencia de cada uno de sus
elementos es 1, se trata de un conjunto amodal.
Mo=amodal

Ingeniería en Tecnología Ambiental


40
Educación Superior Abierta y a Distancia
Medidas de Dispersión
Recorrido

Re=28.1-18.04
Re=10.06

Varianza
= (18.04-21.0845) ^2+(18.71-21.0845) ^2+(18.92-21.0845) ^2+(19.25-21.0845) ^2+
(19.29- 21.0845) ^2+ (19.44-21.0845) ^2+(19.77-21.0845) ^2+(20.17-21.0845) ^2+
(20.33-21.0845) ^2+(20.55-21.0845) ^2+(20.72-21.0845) ^2+(21.12-21.0845) ^2+
(21.41-21.0845) ^2+(21.77-21.0845) ^2+(22.11-21.0845) ^2+ (22.43-21.0845) ^2+
(22.85-21.0845) ^2+(23-21.0845) ^2+(23.71-21.0845) ^2+(28.1-21.0845) ^2
19
=(-3.0445) ^2+(-2.3745) ^2+(-2.1645) ^2+(-1.8345) ^2+(-1.7945) ^2+(-1.6445) ^2+
(-1.3145) ^2+(-0.9145) ^2+(-0.7545) ^2+(-0.5345) ^2+(-0.3645) ^2+(0.0355) ^2+
(0.3255) ^2+(0.6855) ^2+(1.0255) ^2+(1.3455) ^2+(1.7655) ^2+(1.9155) ^2+
(2.6255) ^2+(7.0155) ^2 .
19
=9.26898025+5.63825025+4.68506025+3.36539025+3.22023025+2.70438025+
1.72791025+0.83631025+0.56927025+0.28569025+0.13286025+0.00126025+
0.10595025+0.46991025+1.05165025+1.81037025+3.11699025+3.66914025+
6.89325025+49.21724025 .
19
=98.770095/19
=5.1984

Desviación Estándar
=sqrt(5.1984)
=2.28

Ingeniería en Tecnología Ambiental


41
Educación Superior Abierta y a Distancia
2. Un ambientalista está haciendo una investigación sobre la cantidad de basura que se
genera en su colonia. Para ello registró cuántos kilos de basura recolectó el camión
durante veinte días consecutivos en su calle. Los resultados fueron:

227, 122, 172, 228, 217, 225, 182, 216, 229, 221, 192, 142, 152, 211, 192, 182, 203, 205,
187, 195.

Xn = 122
X1 = 229
R = 229-122
R = 107
K = 5
Amplitud = 107/5
Amplitud = 21.4 = 21

Frecuencia Frecuencia Marca de


Intervalos
Absoluta Acumulada Clase
122-143 2 2 132.5 7584.1928

144-165 1 3 154.5 1566.5764

166-187 4 7 176.5 1236.2256

188-209 5 12 198.5 97.682

210-231 8 20 220.5 5584.1312

20 20 16068.808

Medidas de Tendencia Central:

Media
µ=(132.5*2)+(154.5*1)+(176.5*4)+(198.5*5)+(220.5*8)
20
µ=265+154.1+706+992.5+1764
20
µ=3881.6/20
µ=194.08

Ingeniería en Tecnología Ambiental


42
Educación Superior Abierta y a Distancia
Mediana
N/2=20/2=10 el intervalo es el número 4 ya que este tiene frecuencia 12 que incluye el
número 10
Li = 188
Fi-1 = 22
fi = 5
ai = 21
Sustitución de valores:
Me=188+10-22(21)=188+(-12) (21)=188+(-2.4)(21)=188-50.4=137.6
5 5
Me=137.6
Moda
Intervalo con mayor frecuencia absoluta 5 con frecuencia 8
Li = 210
fi = 8
Fi-1 = 5
Fi+1 = 0
ai = 21
Sustitución de valores
Mo=210+ 8-5 (21)=210+ 3 (21)=210+5.72=215.72
(8-5)+(8-0) 11
Mo=215.72
Medidas de Tendencia Central
Recorrido

Re=229-121
Re=107
Varianza
µ=194.08
= 16068.808/20
= 803.44
Desviación Estándar
=sqrt(803.44)
=28.35

Ingeniería en Tecnología Ambiental


43
Educación Superior Abierta y a Distancia
Evidencia de Aprendizaje 3: Medidas de Dispersión y Tendencia Central

Para elaborar la evidencia de esta unidad, realiza lo siguiente:

 Retoma el trabajo que entregaste como evidencia en la Unidad 2. Para la variable


edad y la variable carrera, obtén las medidas de tendencia central y dispersión.
Para la variable carrera, debes obtener las medidas por carrera, del mismo modo
como elaboraste las tablas de frecuencias.
 Describe brevemente qué significa cada una de las medidas.

Al final de tu trabajo incluye, a manera de conclusión, una reflexión sobre lo siguiente:

 ¿Qué tipo de información obtuviste con el análisis de los datos?


 Si fueras director del campus virtual ¿para qué podrías utilizar esta información?
Describe, de manera breve, algunos ejemplos.
 ¿Cuál es la utilidad de la estadística en tu formación académica, tus actividades
profesionales y tu vida personal?

Entrega tu trabajo organizado del mismo modo que lo entregaste en la Unidad 2, es decir:

 Incluye una presentación donde describas de dónde se obtuvieron los datos y la


finalidad del análisis de los mismos.
 El procedimiento que seguiste para obtener la muestra.
 Las tablas, las gráficas, las medidas de tendencia central y dispersión con una
descripción.
 Agrega tu conclusión.

Ingeniería en Tecnología Ambiental


44
Educación Superior Abierta y a Distancia
Edades FA FR MC Carreras

17-26 94 94 21.5 Administración de empresas turísticas 63

27-36 152 246 31.5 Desarrollo comunitario 27

37-46 86 332 41.5 Gestión y administración de PYME 147

47-56 23 355 51.5 Mercadotecnia internacional 59

57-66 3 358 61.5 Seguridad pública 62

358 358 358

Debido a que se tiene que manejar por intervalos, en las edades, el último de ellos de
57 o más se le agrego el número 66 para poder obtener una marca de clase

EB_U3_EA_JOSA.ppt
x
Archivo de la presentación

Ingeniería en Tecnología Ambiental


45
Educación Superior Abierta y a Distancia
Cálculo de Datos por Edades

Edades FA FR MC

17-26 94 94 21.5

27-36 152 246 31.5

37-46 86 332 41.5

47-56 23 355 51.5

57-66 3 358 61.5

358 358

Medidas de Tendencia Central

Media

µ=((21.5*94)+(31.5*152)+(41.5*86)+(51.5*23)+(61.5*3))/358
µ=(2021+4788+3569+1184.5+184.5)/358
µ=11747/358
µ=32.81 años

Mediana

N/2=358/2=179 el intervalo es el número 2


Li = 27
Fi-1 = 84
fi = 152
ai = 10
Sustitución de valores:
Me=27+179-94(10) = 27+(85)(10) = 27+(0.56)*10 = 27+5.6=32.6
152 152
Me=32.6

Ingeniería en Tecnología Ambiental


46
Educación Superior Abierta y a Distancia
Moda

El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 152 repeticiones.


Li = 27
fi = 152
Fi-1 = 94
Fi+1 = 86
ai = 10
Sustitución de valores
Mo=27+ 152-94 (10)= 27+ 58 (10)=27+(0.464*10)=27+4.64=31.64
(152-94)+(152-86) 58+66
Mo=31.64 años

Edades

Medidas de Dispersión

Recorrido

Re=66-18
Re=48

Varianza

= (32.8-21.5)^2+(32.8-31.5)^2+(32.8-41.5)^2+(32.8-51.5)^2+(32.8-61.5)^2
358
= (127.69)+(1.69)+(75.69)+(349.69)+(823.69)
358
= 1378.45
358
= 3.85

Ingeniería en Tecnología Ambiental


47
Educación Superior Abierta y a Distancia
Desviación Estándar

=sqrt(3.85)
=1.96

Cálculos por Carreras

Carreras FA

Administración de empresas turísticas 63

Desarrollo comunitario 27

Gestión y administración de PYME 147

Mercadotecnia internacional 59

Seguridad pública 62

358

Ingeniería en Tecnología Ambiental


48
Educación Superior Abierta y a Distancia
Resultados por carrera

Administración de Empresas Turísticas

17-26 29 29 21.5

27-36 26 55 31.5

37-46 7 62 41.5

47-56 1 63 51.5

57-66 0 63 61.5

63

Medidas de Tendencia Central

Media

µ=((21.5*29)+(31.5*26)+(41.5*7)+(51.5*1)+(61.5*0))/63
µ=(623.5+819+290.5+51.5+0)/63
µ=1784.5/63
µ=28.3 años

Mediana

N/2=63/2=31.5 el intervalo es el número 2 ya que 31.5 se encuentra dentro de 55


Li = 27
Fi-1 = 29
fi = 26
ai = 10
Sustitución de valores:
Me=27+31.5-29(10) = 27+(2.5)(10) = 27+(0.096)*10 = 27+0.96=27.96
26 26
Me=27.96 años

Ingeniería en Tecnología Ambiental


49
Educación Superior Abierta y a Distancia
Moda

El intervalo con mayor frecuencia absoluta es el 1 (17-26) con 29 repeticiones.


Li = 17
fi = 29
Fi-1 = 0
Fi+1 = 55
ai = 10
Sustitución de valores
Mo=17+ 29-0 (10)= 17+ 29 (10)=17+(9.6*10)=17+96.6=113.6
(29-0)+(29-55) 29-26
Mo=113.6 años

Recorrido

Re=66-18
Re=48

Varianza

= (28.3-21.5)^2+(28.3-31.5)^2+(28.3-41.5)^2+(28.3-51.5)^2+(28.3-61.5)^2
63
= (46.24)+(10.24)+(174.24)+(538.24)+(1102.24)
63
= 1861.2
63
= 29.54

Desviación Estándar

=sqrt(29.54)
=5.44

Ingeniería en Tecnología Ambiental


50
Educación Superior Abierta y a Distancia
Desarrollo Comunitario

17-26 4 4 21.5

27-36 10 14 31.5

37-46 9 23 41.5

47-56 2 25 51.5

57-66 2 27 61.5

27

Medidas de Tendencia Central

Media

µ=((21.5*4)+(31.5*10)+(41.5*9)+(51.5*2)+(61.5*2))/27
µ=(86+315+373.5+103+123)/27
µ=1000.5/27
µ=37.05 años

Mediana

N/2=27/2=13.5 el intervalo es el número 2


Li = 27
Fi-1 = 4
fi = 10
ai = 10
Sustitución de valores:
Me=27+13.5-4(10) = 27+(9.5)(10) = 27+(0.95)*10 = 27+9.5=36.5
10 10
Me=36.5 años

Ingeniería en Tecnología Ambiental


51
Educación Superior Abierta y a Distancia
Moda

El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 10 repeticiones.


Li = 27
fi = 10
Fi-1 = 4
Fi+1 = 23
ai = 10
Sustitución de valores
Mo=27+ 10-4 (10)= 27+ 6 (10)=27+(-0.86*10)=27-8.6=18.4
(10-4)+(10-23) 6-13
Mo=18.4 años

Medidas de dispersión

Recorrido

Re=66-18
Re=48

Varianza

= (37.05-21.5)^2+(37.05-31.5)^2+(37.05-41.5)^2+(37.05-51.5)^2+(37.05-61.5)^2
27
= (241.8)+(30.8)+(19.8)+(208.8)+(597.8)
27
= 1099
27
= 40.7

Desviación Estándar

=sqrt(40.7)
=6.4

Ingeniería en Tecnología Ambiental


52
Educación Superior Abierta y a Distancia
Ingeniería en Tecnología Ambiental
53
Educación Superior Abierta y a Distancia
Administración y Gestión de PyME

17-26 30 30 21.5

27-36 57 87 31.5

37-46 46 133 41.5

47-56 13 146 51.5

57-66 1 147 61.5

147

Medidas de Tendencia Central

Media

µ=((21.5*30)+(31.5*57)+(41.5*46)+(51.5*13)+(61.5*1))/147
µ=(645+1795.5+1909+669.5+61.5)/147
µ=5080.5/147
µ=34.6 años

Mediana

N/2=147/2=73.5 el intervalo es el número 2


Li = 27
Fi-1 = 30
fi = 57
ai = 10
Sustitución de valores:
Me=27+73.5-30(10) = 27+(43.5)(10) = 27+(0.76)*10 = 27+7.6=34.6
57 57
Me=34.6 años

Ingeniería en Tecnología Ambiental


54
Educación Superior Abierta y a Distancia
Moda

El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 57 repeticiones.


Li = 27
fi = 57
Fi-1 = 30
Fi+1 = 133
ai = 10
Sustitución de valores
Mo=27+ 57-30 (10)= 27+ 27 (10)=27+(-0.55*10)=27-5.5=21.5
(57-30)+(57-133) 27-76
Mo=21.5 años

Medidas de dispersión

Recorrido

Re=66-18
Re=48

Varianza

= (34.6-21.5)^2+(34.6-31.5)^2+(34.6-41.5)^2+(34.6-51.5)^2+(34.6-61.5)^2
147
= (171.61)+(9.61)+(47.61)+(285.61)+(723.61)
147
= 1241.05
147
= 8.4

Desviación Estándar

=sqrt(8.4)
=2.9

Ingeniería en Tecnología Ambiental


55
Educación Superior Abierta y a Distancia
Mercadotecnia Internacional

17-26 21 21 21.5
27-36 25 46 31.5
37-46 10 56 41.5
47-56 3 59 51.5
57-66 0 59 61.5
59

Medidas de Tendencia Central

Media

µ=((21.5*21)+(31.5*25)+(41.5*10)+(51.5*3)+(61.5*1))/59
µ=(451.5+787.5+415+154.5+0)/59
µ=1393.5/59
µ=23.62 años

Mediana

N/2=59/2=29.5 el intervalo es el número 2


Li = 27
Fi-1 = 21
fi = 25
ai = 10
Sustitución de valores:
Me=27+29.5-21(10) = 27+(8.5)(10) = 27+(0.34)*10 = 27+3.4=30.4
25 25
Me=30.4 años

Ingeniería en Tecnología Ambiental


56
Educación Superior Abierta y a Distancia
Moda

El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 25 repeticiones.


Li = 27
fi = 25
Fi-1 = 21
Fi+1 = 56
ai = 10
Sustitución de valores
Mo=27+ 25-21 (10)= 27+ 4 (10)=27+(-0.15*10)=27-1.5=25.5
(25-21)+(25-56) 4-31
Mo=25.5 años

Medidas de dispersión

Recorrido

Re=66-18
Re=48

Varianza

= (23.62-21.5)^2+(23.62-31.5)^2+(23.62-41.5)^2+(23.62-51.5)^2+(23.62-61.5)^2
59
= (4.49+62.09+319.69+777.29+1434.89)
59
= 2598.45
59
= 44.04

Desviación Estándar

=sqrt(44.04)
=6.6

Ingeniería en Tecnología Ambiental


57
Educación Superior Abierta y a Distancia
Seguridad Pública

17-26 10 10 21.5
27-36 34 44 31.5
37-46 14 58 41.5
47-56 4 62 51.5
57-66 0 62 61.5
62

Medidas de Tendencia Central

Media

µ=((21.5*10)+(31.5*34)+(41.5*14)+(51.5*4)+(61.5*0))/62
µ=(215+1071+581+206+0)/62
µ=2073/62
µ=33.44 años

Mediana

N/2=62/2=31 el intervalo es el número 2


Li = 27
Fi-1 = 10
fi = 34
ai = 10
Sustitución de valores:
Me=27+31-10(10) = 27+(21)(10) = 27+(0.62)*10 = 27+36.2=33.2
34 34
Me=33.2 años

Ingeniería en Tecnología Ambiental


58
Educación Superior Abierta y a Distancia
Moda

El intervalo con mayor frecuencia absoluta es el 2 (27-36) con 34 repeticiones.


Li = 27
fi = 34
Fi-1 = 10
Fi+1 = 58
ai = 10
Sustitución de valores
Mo=27+ 34-10 (10)= 27+ 24 (10)=27+(0*10)=27+0=27
(34-10)+(34-58) 24-24
Mo=27 años

Medidas de dispersión

Recorrido

Re=66-18
Re=48

Varianza

= (33.44-21.5)^2+(33.44-31.5)^2+(33.44-41.5)^2+(33.44-51.5)^2+(33.44-61.5)^2
62
= (4142.56+3.76+64.96+326.16+787.36)
62
= 5324.8
62
= 85.88

Desviación Estándar

=sqrt(85.88)
=9.3

Ingeniería en Tecnología Ambiental


59
Educación Superior Abierta y a Distancia
Conclusiones

En la mayoría de los casos el intervalo 1 y el intervalo 2 son los que tienen mayor cantidad
de alumnos, es decir la población está compuesta principalmente por personas jóvenes de
entre 17 y 36 años de edad, siendo los intervalos de 37 a 66 años los que presentan
menor cantidad de frecuencias relativas. Esto me indica que el comportamiento de la
población de estudiantes de ESAD es muy parecido al de una universidad tradicional con
clases presenciales, en donde la población es principalmente joven, pero con la ventaja
que en ESAD se está captando personas de edad considerada maduros-jóvenes (los que
se encuentran en sus 30’s) los cuales por lo general representan una frecuencia muy baja
en las escuelas tradicionales y en ESAD tienen gran impacto poblacional.

Puedo agregar también a esta conclusión, que las carreras administrativas siguen siendo
las que mayor demanda presentan en nuestro país, ya que en la muestra que resultó de
mis cálculos, la mayoría de los individuos están inscritos en alguna carrera administrativa y
ninguno de ellos estuvo dentro de una ingeniería, aunque en la población total a estudiar
si había personas inscritas en ingenierías.

Ingeniería en Tecnología Ambiental


60
Educación Superior Abierta y a Distancia
Autorreflexiones: Unidad 3

1.- ¿Qué es la media aritmética?

La media aritmética es el valor que resulta de la suma de todos los valores de una muestra
o población y se divide entre el número de individuos. Este valor nos indica cual es el
promedio de valores de dicha población y es un dato de suma importancia al momento de
tomar una decisión en base a los datos arrojados por una muestra.

2.- ¿En qué consiste la moda aritmética?

La moda representa aquel valor que más veces se presento dentro de una población o
muestra, al igual que la media es un valor muy importante ya que permite tener una idea
general del comportamiento de una determinada población.

3.- ¿Qué es la mediana y como se determina en datos no agrupados?

La mediana es el elemento de la población o muestra que se ubica justo al centro de la


misma, es decir deja el 50% de los elementos tanto a la izquierda como a la derecha de la
recta que forman los valores de la muestra o población. Se representa con Me y la forma
de calcularla en datos no agrupados es la siguiente:

a) Si n es impar, la mediana es el valor que ocupa la posición (n+1)/2 una vez que los datos
han sido ordenados (en orden creciente o decreciente), porque éste es el valor central.

b) Si n es par, la mediana es la media aritmética de las dos observaciones centrales.


Cuando n es par, los dos datos que están en el centro de la muestra ocupan las
posiciones n/2 y (n/2)+1. Es decir: Me = (Xn/2+(Xn/2+1))/2.

4.- ¿En qué consiste la varianza?

La varianza es la diferencia que hay entre el promedio o media aritmética y cada


elemento de la población o muestra, es decir que tanto se alejan estos elementos de la
media, la varianza se expresa en al cuadrado de la unidad original de la muestra, es decir,
si la muestra está en kilómetros la varianza es kilómetros al cuadrado y así con cada tipo
de medida.

(continua sig. hoja)

Ingeniería en Tecnología Ambiental


61
Educación Superior Abierta y a Distancia
5.- ¿En qué consiste la desviación estándar?

La desviación estándar representa un promedio de alejamiento de los elementos de la


muestra respecto a su media, cuando la desviación estándar es un valor muy grande
quiere decir que los elementos tienen valores muy alejados de la media

6.- De los temas vistos en el curso, ¿Cuál fue el que más se te complicó y por qué?

El más complicado para mí fue la mediana, ya que en un principio no me quedó claro que
es y para que se utiliza, aunque después de repasarlo me di cuenta que en realidad es una
de las medidas más sencillas de calcular y representar.

Ingeniería en Tecnología Ambiental


62
Educación Superior Abierta y a Distancia
Comenzado viernes, 26 de agosto de 2011, 13:00
el
Completado viernes, 26 de agosto de 2011, 13:07
el
Tiempo 6 minutos 54 segundos
empleado
Calificación 10 de un máximo de 10 (100%)
Comentario - Has concluido la autoevaluación, para obtener el máximo aprovechamiento de esta actividad te
sugerimos prestar especial atención a la retroalimentación que recibiste, ya que ofrece
información que orienta tu proceso de aprendizaje. Continúa esforzándote.

En una colonia de la Ciudad de México se obtuvo una muestra aleatoria del monto del consumo
mensual de energía eléctrica. Los datos obtenidos en pesos son los siguientes:

20, 30, 39, 45, 55, 21, 31, 40, 46, 65, 74, 68, 82, 108, 123, 154, 167, 193, 181, 95, 81, 64,
25, 32, 141, 152, 167, 173, 194, 204, 208, 73, 97, 94, 87, 120, 151, 140, 21, 64, 52, 39, 52,
165, 172, 94, 83, 24, 193, 119

Question 1
Puntos: 2
Media
Respuesta:
98.3

Retroalimentación

La media o el promedio de los datos es el resultado de la suma de todos los valores entre el
número total de datos.

La fórmula para calcularla en datos agrupados por intervalos: , porque se está


calculando en una muestra.
Correcto
Puntos para este envío: 2/2.

Question 2
Puntos: 2
Mediana
Respuesta:
75.25

Retroalimentación

La mediana es el valor que divide a la mitad los datos. La fórmula para calcularla en datos
agrupados por intervalos es:
Correcto
Puntos para este envío: 2/2.

Question 3
Puntos: 1
Moda
Respuesta:
41

Ingeniería en Tecnología Ambiental


63
Educación Superior Abierta y a Distancia
Retroalimentación

La moda es el valor del dato que se repite más veces. En este caso se ocupa la siguiente
fórmula:

Correcto
Puntos para este envío: 1/1.

Question 4
Puntos: 1
Recorrido
Respuesta:
188

Retroalimentación

El rango o recorrido es el resultado de restar el primero y el último valor de la variable. Se


calcula con la fórmula: Re = máx xi - min xi

Correcto
Puntos para este envío: 1/1.

Question 5
Puntos: 2
Varianza
Respuesta:
3391.0109

Retroalimentación

La varianza siempre es mayor o igual a cero y está dada por la media de los cuadrados de las
diferencias del valor de los datos, menos la media aritmética de éstos.La fórmula para calcularla
es, porque se calcula en una muestra.

Correcto
Puntos para este envío: 2/2.

Question 6
Puntos: 2
Desviación típica
Respuesta:
58.2323

Retroalimentación

La desviación típica o estándar muestra qué tan alejado está un dato de la media.

La fórmula para calcularla es, porque se está calculando en una muestra.

Correcto
Puntos para este envío: 2/2.

Ingeniería en Tecnología Ambiental


64
Educación Superior Abierta y a Distancia
Examen Final
Intento Completado Calificación / 100

1 viernes, 9 de septiembre de 2011, 16:21 80

Su calificación final en este cuestionario es 80 / 100

Ingeniería en Tecnología Ambiental


65
Educación Superior Abierta y a Distancia
Literatura Consultada
Estadística, Datos Agrupados. Guillermo Corbacho. Chile. 2009. Ebook.
http://upload.wikimedia.org/wikipedia/commons/4/4c/Estad
%C3%ADstica_Datos_Agrupados.pdf

Estadística, Datos no Agrupados. Guillermo Corbacho. Chile. 2009. Ebook.


http://upload.wikimedia.org/wikipedia/commons/d/df/Estad
%C3%ADstica_Datos_no_agrupados.pdf

Curso Estadística Básica. Luis Salvaterry. Uruguay. 2000. Ebook.


http://guajiros.udea.edu.co/descriptiva/articulos/Curso%20de%20EstadIstica
%20Basica.pdf

Ingeniería en Tecnología Ambiental


66
Educación Superior Abierta y a Distancia

Вам также может понравиться