Академический Документы
Профессиональный Документы
Культура Документы
Esta gua fue elaborada por la Secretara Acadmica, a travs de la Direccin de Planeacin Acadmica.
Colaborador
Profr. Alejandro Rosas Snell
La presente obra fue editada en el procesador de palabras Word 2002 (Office xp).
Word 2002 es marca registrada de Microsoft Corp.
Este material se utiliza en el proceso de enseanza-aprendizaje del Colegio de Bachilleres, institucin pblica de
educacin media superior del Sistema Educativo Nacional.
Ninguna parte de esta publicacin, incluido el diseo de la cubierta, puede reproducirse, almacenarse o transmitirse en
forma alguna, ni tampoco por medio alguno, sea ste elctrico, electrnico, qumico, mecnico, ptico, de grabacin o
de fotocopia, sin la previa autorizacin escrita por parte del Colegio de Bachilleres, Mxico.
SEPTIEMBRE 2004
II
NDICE
PRESENTACIN ..........................................................................................................
PRLOGO
V
VI
1
3
4
5
6
7
9
10
12
13
14
15
17
20
22
28
32
35
37
39
41
45
49
51
56
60
63
64
66
69
73
74
76
77
78
79
81
83
85
87
91
94
97
98
100
103
106
108
110
112
114
115
117
118
120
122
125
126
128
130
132
133
135
BIBLIOGRAFA .............................................................................................................
136
137
IV
PRESENTACIN
PROLOGO
En el marco del Programa de Desarrollo Institucional 2001-2006 el alumno tiene especial relevancia, por
lo que el Colegio de Bachilleres Metropolitano se ha abocado a la elaboracin de diversos materiales
didcticos que apoyen al estudiante en los diversos momentos del proceso de enseanza-aprendizaje.
Entre los materiales elaborados se encuentran las guas de estudio, las cuales tienen como propsito
apoyar a los estudiantes que deben presentar exmenes de Recuperacin o Acreditacin Especial, con
objeto de favorecer el xito en los mismos.
En este contexto, la Gua para presentar exmenes de Recuperacin o Acreditacin Especial de
Estadstica Descriptiva e Inferencial I, se ha elaborado pensando en los estudiantes que por diversas
causas reprobaron la asignatura en el curso normal y deben acreditarla a travs de exmenes en periodos
extraordinarios.
Esta gua se caracteriza por abordar, de manera sinttica, los principales temas sealados en el programa
de estudios, favorecer la ejercitacin de los mtodos, conceptos y modelos estadsticos en el manejo e
interpretacin cuantitativa y cualitativa de informacin diversa, adems de los elementos bsicos de la
probabilidad estadstica, as como proporcionar elementos de autoevaluacin y sugerencias en caso de
que se necesite mayor informacin para comprender dichos temas.
En la primera unidad de la gua, denominada INTRODUCCIN: USOS Y FUNCIONES DE LA
ESTADSTICA, se abordan los aprendizajes relacionados con las caractersticas y conceptos bsicos de la
estadstica (poblacin, muestra, dato, estimacin, etc.), adems, se incluyen problemas donde se ejercita
su uso adecuado.
En la segunda unidad, PRESENTACIN DE DATOS, se desarrollan aprendizajes sobre organizacin de
informacin, tablas de frecuencia y grficos estadsticos, Tambin se ejercita su aplicacin en diversos
problemas.
La tercera unidad, MEDIDAS DESCRIPTIVAS, abarca el tema de las medidas de tendencia central: media,
mediana y moda para datos agrupados y no agrupados, as como los procedimientos para calcular la
desviacin media, la varianza y la desviacin estndar con datos agrupados.
La cuarta unidad, CORRELACIN Y REGRESIN LINEAL, contiene los aprendizajes sobre el coeficiente
de correlacin de Pearson, la obtencin de la ecuacin de regresin lineal y la aplicacin de la correlacin
y regresin lineal en la solucin de problemas.
En la quinta unidad, ELEMENTOS DE PROBABILIDAD, se desarrollan los elementos bsicos de la
probabilidad, el clculo probabilstico de eventos excluyentes y no mutuamente excluyentes, se estudian
los procedimientos para conocer el nmero de permutaciones y combinaciones con y sin repeticin para
datos ordenados y, como en las dems unidades, se presentan una serie de ejercicios en donde se aplican
los conceptos y mtodos estadsticos desarrollados.
Por ltimo, se proporciona una bibliografa bsica para consultar en fuentes originales los temas
desarrollados en la gua.
VI
UNIDAD 1
INTRODUCCIN:
USOS Y FUNCIONES
DE LA ESTADSTICA
APRENDIZAJES
La palabra estadstica proviene de una voz italiana, statista, que significa estadista. La acu G. Achenwall
(1719-1772), un profesor de matemticas. Su uso lo divulg sir John Sinclair en su obra Statistical account
of scotland (1791-1799); pero ya mucho antes del siglo XVIII se acostumbraba registrar y emplear datos.
La Estadstica surge de la necesidad del hombre por interpretar el conjunto de datos que le proporciona la
realidad, por medio de procedimientos que le permitan describir el comportamiento de un fenmeno en
estudio, que bien pueden ser las edades de un grupo de personas, ingresos, gastos de alimentacin,
estaturas, etc.
Los juegos de azar tambin fueron motivo para que los matemticos desarrollaran principios para
aumentar la posibilidad (probabilidad) de ganar.
La Estadstica es una rama de la ciencia Matemtica que se encarga de la aplicacin de ciertos
procedimientos matemticos a la informacin producida en el proceso de investigacin; es decir, la
estadstica es el conjunto de procedimientos matemticos que permiten captar, clasificar, ordenar,
procesar y analizar la informacin que se produce en el proceso de investigacin, donde midiendo
la regularidad de la misma se puede inferir la tendencia o comportamiento del fenmeno en
estudio, construyendo modelos que se ajustan a su dinmica.
ESTADSTICA
INFERENCIAL
2
UNIDAD 1
EJERCICIOS
INSTRUCCIONES: Lee con atencin los siguientes reactivos y anota en el parntesis de la izquierda la
letra que corresponda a la respuesta correcta.
1. (
) Cul es nombre que se le da a la rama de la Matemtica que se encarga de la
aplicacin de ciertos procedimientos matemticos a la informacin producida en el proceso de
investigacin?
a) Investigacin de operaciones.
b) Aritmtica.
c) Geometra Analtica.
d) Estadstica.
2. (
)
)
)
)
)
UNIDAD 1
TABLA DE COMPROBACIN
Nmero de pregunta
Respuesta correcta
c
5
4
3
2
1
Sugerencias
APRENDIZAJES
El campo de la Estadstica generalmente est dividido en dos reas: Estadstica Descriptiva o Deductiva
y Estadstica Inferencial o Inductiva.
Estadstica descriptiva o deductiva: Es aquella parte de la investigacin estadstica que incluye la
obtencin, organizacin, presentacin y descripcin de informacin numrica.
Estadstica inferencial o inductiva: Es una tcnica mediante la cual se obtienen generalizaciones, o se
toman decisiones con base en una informacin parcial o incompleta obtenida mediante tcnicas
descriptivas.
En resumen, la Estadstica como disciplina o rea de estudio, incluye tanto tcnicas descriptivas como
inferenciales. Incluye la obtencin y tratamiento de datos numricos y el empleo de mtodos estadsticos
con fines inferenciales, por lo tanto:
"La Estadstica es el conjunto de procedimientos matemticos que permiten captar, clasificar, ordenar,
procesar y analizar la informacin que se produce en el proceso de investigacin, donde midiendo la
regularidad de la misma, se puede inferir la tendencia o comportamiento del fenmeno en estudio,
construyendo modelos que se ajusten a su dinmica.
La estadstica no solamente se dedica a la descripcin; sus funciones son mucho ms importantes, pues
tambin podemos inferir propiedades de la poblacin a partir del estudio de una parte de ella, es decir, de
una muestra. Por lo que:
Poblacin se define como la totalidad de todas las posibles observaciones.
Muestra se define como un conjunto de observaciones tomadas a partir de una poblacin.
Por ejemplo, supongamos que se desea estudiar el coeficiente intelectual de los jvenes de
2 semestre de bachillerato. Una forma de hacerlo es proporcionndoles a todos un test de
inteligencia. Una vez realizado y calificado, se calcula la puntuacin media del grupo (la media
es un estadgrafo que refleja el promedio de las puntuaciones del test en dicha muestra).
Como hay muchos alumnos, habr de continuar el proceso; es decir, se obtiene muestra tras
muestra.
UNIDAD 1
Si cada uno de estos grupos es una muestra aleatoria, se pueden combinar todos los
promedios o medias de las muestras para obtener una media total. Esta media es la mejor
estimacin del coeficiente intelectual de los jvenes de 2 semestre de bachillerato.
Esto es, el promedio de las medias de las muestras se utiliza para conocer el valor de la
poblacin. Todos los jvenes de 2 semestre de bachillerato de Mxico forman la poblacin o
universo, del cual se extraen muestras que pueden ser los planteles del Colegio de
Bachilleres del DF o los planteles de las preparatorias del Estado de Mxico.
Los valores que se refieren a la poblacin se llaman parmetros y los que se refieren a las muestras se
llaman estadgrafos.
En la ciencia se utilizan varios tipos de escalas para efectuar mediciones; estas escalas son:
Cardinal o nominal. Esta escala se utiliza como medida de identificacin por ejemplo: los nmeros que
llevan los jugadores en la espalda; cuando se clasifica a una persona por sus ideas religiosas: protestante,
catlico, judo u otra; tambin se puede clasificar por sexo, color de ojos, partido poltico, zona urbana o
rural, etc. Las estadsticas simples se realizan con datos cardinales.
Ordinal. En esta escala, los nmeros reflejan el orden de las personas u objetos; estas medidas se
disponen en orden de mayor a menor o viceversa.
Intervalos. Esta escala proporciona nmeros que reflejan las diferencias entre particularidades por
ejemplo: en termmetros, grados Celsius y Fahrenheit; en test, etc.
Razones. Esta escala tiene un cero absoluto, por ejemplo: las medidas de longitud, peso, capacidad,
sonoridad, etc.
El dato. Es el valor de la variable asociado a un elemento de una poblacin o una muestra. Por ejemplo,
Jos Prez ingres a la Escuela Superior de Medicina a los 21 aos, su cabello es obscuro, mide 1.89
metros y pesa 75 kilogramos. Cada una de estas cuatro mediciones es un valor individual o dato para cada
una de las variables de respuesta medidas para Jos Prez.
La caracterstica que se puede analizar en un elemento de la poblacin puede ser de tipo cualitativo o cuantitativo. El
primer tipo de dato da lugar a la estadstica de atributos, puesto que se est analizando el sexo, estado civil, las
preferencias de un producto, etc., las cuales son cualificables.
Cuando la caracterstica a estudiar de un dato es cuantitativa, daremos lugar a la estadstica de variables,
pues estas caractersticas toman valores distintos y pueden medirse; tal es el caso de la edad, ingresos,
gasto, peso, estatura, etc. As, los datos cualitativos o de atributo son el resultado de un proceso que
categoriza o describe un elemento de una poblacin; por ejemplo: el color es un atributo de un automvil.
Una muestra de los colores de los automviles que estn en un color es un atributo de un automvil. Una
muestra de los colores de los automviles que estn en un estacionamiento producira datos como azul,
rojo, amarillo, gris, etc. Los datos cuantitativos o numricos, son el resultado de un proceso que cuantifica,
es decir, que cuenta o mide.
La estadstica de variables puede ser del tipo discreto (se obtiene contando) o del tipo continuo (se
obtiene midiendo).
Los aspectos que se desean conocer de una poblacin son, en general, la estimacin de un promedio,
de un porcentaje o la prueba de hiptesis. La estimacin y la prueba de hiptesis son dos partes
importantes de la estadstica inferencial.
7
Las tcnicas de estimacin permiten, como su nombre lo indica, estimar parmetros mediante valores, por
ejemplo; puede estimarse la resistencia promedio de ciertas piezas producidas en una fbrica o el
porcentaje de electores que votarn para el candidato en futuras elecciones.
UNIDAD 1
EJERCICIOS
INSTRUCCIONES: Lee con atencin los siguientes planteamientos y contesta lo que se solicita.
1. Un estudiante de estadstica desea tener una idea aproximada acerca del valor (en pesos) del automvil
tpico que poseen los profesores de su escuela. Para este caso, contesta:
I) Cul es la poblacin? ___________________________________________.
II) Cul es la muestra? ____________________________________________.
2. Se desea saber el costo de la educacin. Uno de los gastos que hace un estudiante es la compra de
sus libros de texto. Sea x el costo de todos los libros comprados este semestre por cada estudiante de
cierta escuela superior. Con base en lo anterior describe:
I) Cul es la poblacin? ____________________________________________.
II) Cul es la variable?______________________________________________.
3. El Colegio de Bachilleres tiene una poblacin aproximada de 40 000 alumnos y en los primeros cinco
planteles hay 18 000 alumnos. Con base en lo anterior describe:
I) Cul es el parmetro? ___________________________________________.
II) Cul es el estadgrafo? __________________________________________.
INSTRUCCIONES: Lee con atencin cada uno de los siguientes reactivos y anota en el parntesis de la
izquierda la letra de la opcin de la respuesta correcta.
4. (
) El rea de la estadstica que estudia las caractersticas de un grupo de datos para conocer los
valores que los describen, se llama:
a) estadstica descriptiva o deductiva.
b) probabilidad.
c) estadgrafo.
d) clculo numrico.
5. (
) Cul es el nombre del rea de la estadstica que analiza los datos de una muestra para conocer, a
partir de estos datos, las caractersticas de la poblacin de la cual se tomaron?
a) Estadstica descriptiva o deductiva.
b) Probabilidad.
c) Estadgrafo.
d) Estadstica inferencial o inductiva.
6. (
) Cul es el nombre del conjunto de elementos extrados de un total para realizar un estudio?
a) Estadgrafo.
b) Poblacin.
c) Dato.
d) Muestra.
10
UNIDAD 1
7. (
) Cul es el nombre del total de todos los elementos que tienen una caracterstica en comn?
a) Estadstica.
b) Muestra.
c) Estadgrafo.
d) Poblacin.
Nominal.
Intervalos.
Razones.
Dato.
11
TABLA DE COMPROBACIN
Nmero de pregunta
Respuesta correcta
I) La poblacin son todos los vehculos de los profesores de la
escuela.
II) La muestra es una porcin de la poblacin, es decir, el
nmero de automviles de los profesores de matemticas.
c
Sugerencias
Repasa hasta que tengas claro las diferencias y la relacin entre poblacin, muestra y
estadgrafo.
12
UNIDAD 1
EJERCICIOS DE AUTOEVALUACIN
Cuentas con cuarenta minutos para resolverlos.
INSTRUCCIONES: Lee con atencin los siguientes ejercicios y contesta lo que se solicita, escribiendo en
el parntesis de la izquierda la letra que corresponda a la respuesta correcta.
1. ( ) Cuando no es conveniente considerar todos los elementos de la poblacin, lo que se hace es
estudiar una parte de esa poblacin, a la cual se le llama:
a) estadgrafo.
b) probabilidad.
c) muestra.
d) estadstica.
Poblacin.
Dato.
Muestra.
Paramtrica.
muestras.
probabilidades.
poblaciones.
datos.
Inferencial o inductiva.
Financiera.
Descriptiva o deductiva.
No paramtrica.
d)
Intervalos.
CLAVE DE RESPUESTAS
14
Nmero de pregunta
Respuesta correcta
UNIDAD 2
PRESENTACIN DE DATOS
Estadstica Descriptiva
Inferencial I
APRENDIZAJES
Una vez que se ha obtenido una muestra y se han analizado las observaciones de todas las unidades
contenidas en ella, se ha concluido la tarea de obtencin de los datos. Sin embargo, lo que se ha obtenido
son los datos en bruto, es la informacin antes de ser organizada y analizada. Para manejar
informacin no organizada se comienza con un arreglo de datos, es decir, las observaciones se colocan
en orden por su magnitud (ascendente o descendente), por ejemplo:
Considrese una muestra de los ingresos ganados en cierto sbado por los estudiantes de bachillerato
que trabajan. Suponga que se eligen aleatoriamente 20 de ellos y se obtienen los siguientes salarios:
30 11 42 8 30 18 25 25 17 30
29 21 23 25 15 35 26 13 21 36
El siguiente arreglo muestra las observaciones en forma ascendente.
Arreglo de los ingresos obtenidos en un sbado
por 20 estudiantes de bachillerato.
8
18
25
30
11
21
25
30
13
21
26
35
15
23
29
36
17
25
30
42
Como observas, el arreglo anterior es una forma rudimentaria de organizacin de datos; sera tan
engorrosa como poco prctica si el nmero de observaciones involucradas fuera mucho mayor. Cuando se
trata de grandes cantidades de datos, es recomendable presentarlos en una distribucin de frecuencias.
La organizacin de los datos generalmente implica un arreglo de las observaciones en clases. Al arreglo
de los datos para expresar la frecuencia de ocurrencias (repeticiones) de las observaciones en cada una
de estas clases se le conoce como distribucin de frecuencias. sta consiste en una representacin de
las categoras (intervalos) numricas de la variable junto con el nmero de entidades que se clasifican en
cada categora (intervalos); estas categoras que no se traslapan y son contiguas se denominan intervalos
de clase.
Realicemos un ejemplo para mostrar el procedimiento a seguir para construir tablas de distribucin de
frecuencias absolutas (las frecuencias absolutas de clase son igual al nmero de observaciones o conteo
que pertenecen a la clase tratada) y relativas, las cuales se calculan de la siguiente manera:
frecuencia relativa =
16
frecuencia absoluta
nm. total de observaciones
Estadstica Descriptiva
Inferencial I
UNIDAD 2
Con los datos del ejemplo de los ingresos de 20 estudiantes de bachillerato, construiremos una tabla que
muestre la distribucin de frecuencias.
30 11 42 8 30 18 25 25 17 30
29 21 23 25 15 35 26 13 21 36
Para organizar la informacin debemos pensar en cuntos intervalos de clase se necesitan para presentar los datos. El
procedimiento es el siguiente:
Localizamos los valores mximo y mnimo de los datos: X mx = 42 y Xmn = 8; a la diferencia de estos dos
valores se le conoce como rango o recorrido de la variable, entonces:
(Rango) R = Xmx - Xmn = 42 - 8 = 34
Al rango lo dividimos entre el nmero de intervalos de clase deseados, obteniendo la amplitud o longitud
del intervalo, por lo que:
Amplitud
=
Rango
Nmero de intervalos
Donde el nmero de intervalos se puede calcular de varias formas.
1) Eligiendo un nmero que al resolver el cociente el resultado sea un nmero cercano a un nmero
entero, por ejemplo:
Amplitud = 34/6 = 5.6666; Amplitud = 34/7 = 4.85; Amplitud = 34/8 = 4.25;
la amplitud que seleccionamos es la de 4.85, que aproximamos a 5, porque es la ms cercana a un
nmero entero siguiente del resultado.
2) Calculando la raz cuadrada de los datos en total, es decir, 20 = 4.47 que lo aproximamos a 5 y
con este dato observamos que el nmero de intervalos de clase es 7 (5 = 34/nmero de intervalos).
Recuerda que el nmero de intervalos de clase debe ser mayor que 5 y menor que 18, por ser un convenio
internacional. Ahora bien, con base en la tabla del arreglo de los salarios de los 20 estudiantes de
bachilleres, procederemos a elaborar la tabla de distribucin de frecuencias correspondiente.
Para el primer intervalo de clase se le suma la amplitud al mnimo valor de los datos (es decir, 8 + 5 = 13), por lo que el intervalo
queda como 8 - 13; el siguiente, 13 - 18; despus 18 - 23 y as sucesivamente. Lo anterior lo puedes comprobar examinando la
siguiente tabla de las frecuencias.
Frecuencias
relativas
0.10
0.15
0.15
0.25
0.20
0.10
0.10
1.00
17
Estadstica Descriptiva
Inferencial I
frecuencia absoluta
nmero total de observaciones
5) Las frecuencias absoluta y relativa acumuladas se calculan sumando sucesivamente las frecuencias
absoluta y relativa.
18
Estadstica Descriptiva
Inferencial I
UNIDAD 2
27
43
43
44
47
49
50
54
58
65
68
71
71
71
73
73
74
75
76
77
79
80
81
82
82
84
84
86
88
88
91 94
91 96
93 97
94 103
94 106
107
108
108
116
120
120
122
123
127
128
Como te habrs dado cuenta, la informacin presentada est arreglada, entonces localizamos los valores
mximo y mnimo de los datos para calcular el rango:
Xmx = 128 y Xmn = 27, por lo que: R = 128 - 27 = 101
Para calcular la amplitud necesitamos un nmero de intervalos de clase, por lo que se sugiere calcules la
raz cuadrada del total de datos de la muestra, es decir:
50 = 7.071;
Frecuencias
relativas
0.02
0.14
0.12
0.28
0.20
0.12
0.12
1.00
19
Estadstica Descriptiva
Inferencial I
Con base en lo anterior, ahora construye una tabla de distribucin de frecuencias absoluta y relativa de 20 estudiantes
de una clase de Biologa que obtuvieron las siguientes calificaciones.
5
4
3
6
2
Se sugiere utilices 8 intervalos de clase.
20
9
2
4
3
8
4
6
5
7
5
4
5
6
7
5
Estadstica Descriptiva
Inferencial I
UNIDAD 2
EJERCICIOS
INSTRUCCIONES: Analiza los conjuntos de datos de los reactivos 1 a 6, y contesta para cada uno de
ellos, las siguientes preguntas:
I) Cul es el arreglo ordenado en forma ascendente?
II) Cul es el rango o recorrido de los datos?
III) Cul es la amplitud o longitud del intervalo?
IV) Cul es el nmero de intervalos adecuados?
V) Elabora la tabla de distribuciones de frecuencias.
1. El siguiente conjunto de 60 datos representa las ventas de galletas por da en una tienda de
autoservicio.
73
66
56
52
48
49
66
65
63
47
45
66
48
61
62
57
60
72
53
44
47
59
44
60
57
56
56
54
75
79
61
55
44
52
62
60
69
68
54
57
48
57
74
51
77 64 51 73 49
58 54 71 65 61
55 49 77 53 73
64
I)
II)
III)
IV)
V)
21
Estadstica Descriptiva
Inferencial I
2. El siguiente conjunto de 150 datos representa el coeficiente intelectual de alumnos de la clase de estadstica en el 5to. semestre.
I)
II)
III)
IV)
V)
22
88
91
104
113
125
101
114
104
93
91
96
91
100
94
85
119
91
106
120
129
120
109
106
109
121
126
122
112
92
109
93
89
124
96
105
95
91
114
108
113
107
97
128
125
128
99
120
101
108
118
118
113
124
115
121
120
118
111
121
88
106
106
97
104
105
122
112
103
114
115
115
100
105
108
119
102
127
121
116
100
95
89
108
93
107
118
106
98
119
118
108
89
108
114
102
96
99
105
125
126
100
115
113
116
116
109
104
113
118
110
129
124
92
88
113
100
110
101
103
113
114
106
105
115
98
112
103
101
101
89
109
99
108
111
122
108
114
125
121
122
117
105
112
88
104
97
85
116
113
126
Estadstica Descriptiva
Inferencial I
UNIDAD 2
3. El siguiente conjunto de 18 datos representa las llegadas tarde de ciertos trabajadores en un ao: 40,
45, 46, 48, 46, 42, 50, 50, 41, 56, 51, 44, 52, 48, 43, 55, 49 y 47.
I)
II)
III)
IV)
V)
23
Estadstica Descriptiva
Inferencial I
4. El siguiente conjunto de 20 datos representa las llamadas telefnicas en una oficina de gobierno en 20 das hbiles: 16, 22, 8, 5, 13, 17, 6, 11, 13,
24, 15, 5, 14, 15, 15, 18, 17, 20, 9, 7.
I)
II)
III)
IV)
V)
24
Estadstica Descriptiva
Inferencial I
UNIDAD 2
5. El siguiente conjunto de 16 datos representa los cortes de luz en la delegacin Tlalpan en 30 das naturales: 19, 14,
8, 7, 18, 7, 24, 12, 15, 26, 12, 19, 15, 23, 15 y 11.
I)
II)
III)
IV)
V)
25
Estadstica Descriptiva
Inferencial I
6. El siguiente conjunto de 20 datos representa las licencias mdicas de ciertos trabajadores de un plantel
escolar: 12, 3, 6, 5, 7, 6, 5, 1, 5, 4, 3, 4, 12, 7, 10, 8, 7, 9, 11 y 2.
I)
II)
III)
IV)
V)
26
Estadstica Descriptiva
Inferencial I
UNIDAD 2
TABLA DE COMPROBACIN
Nmero de pregunta
1
Respuesta correcta
I) El arreglo es:
44
49
54
58
63
71
44
49
55
59
64
72
44 45
51 51
55 56
60 60
64 65
73 73
47
52
56
60
65
73
47
52
56
61
66
74
48
53
57
61
66
75
48
53
57
61
66
77
48
54
57
62
68
77
49
54
57
62
69
79
II) Rango = 35
III) Amplitud = 4.375 5
IV) Nmero de intervalos = 8
V)
Distribucin de frecuencias absolutas y relativas de 60 datos.
Intervalo
Fronteras
Punto
Frecuencia
Frecuencia
Conteo
de clase
inf. y sup.
medio
absoluta
relativa
44-48
43.5-48.5
46
/////////
9
0.1500
49-53
48.5-53.5
51
/////////
9
0.1500
54-58
53.5-58.5
56
/////////////
13
0.2166
59-63
58.5-63.5
61
//////////
10
0.1666
64-68
63.5-68.5
66
////////
8
0.1333
69-73
68.5-73.5
71
//////
6
0.1000
74-78
73.5-78.5
76
////
4
0.0667
79-83
78.5-83.5
81
/
1
0.0167
Totales
60
0.9999
27
Estadstica Descriptiva
Inferencial I
Nmero de pregunta
2
Respuesta correcta
I) El arreglo es:
85 85
88
88
88
88
89
89
91
91
91
91
91 92
92
93
93
93
94
95
95
96
96
96
97 97
97
98
98
98
98
99
99
99 100 100
Nmero de pregunta
Respuesta correcta
100 100 100 101 101 101 101 101 102 102 103 103
103 104 104 104 Respuesta
104 104 correcta
105 105 105 105 105 105
Nmero de pregunta
106 106 106 106 106 106 107 107 108 108 108 108
5
I) El arreglo es:
7 7 8 11 12 12 14 15
108 108 108 108 109 109 109 109 109 110 110 111
1546154718 19 19 23 24 26
3
I) El arreglo
es:
40
41
42
43
44
45
46
111 112
112 y relativas
112 112
113 113 113 113 113 113
Distribucin de frecuencias
absolutas
de 16113
II)48
Rango
= 1950datos.
49114
50
51 114
52 55115
56 115 115 115 115
114 Conteo
11448 114
114
Intervalo
Fronteras 113
Punto
Frecuencia
Frecuencia
Distribucin
absolutas
y relativas
18 datos.
116
116de frecuencias
116 116absoluta
117 118
118 de118
118 118 118 119
de clase
inf. y sup.
medio
III) Amplitud = 4 relativa
II) Rango
=119
16 120 Punto
Intervalo
Fronteras
Frecuencia
Frecuencia
119
120
120
120
121
121
121
121 121 122
7-10
6.5-10.5
8.5
///
3Conteo 0.1875
de clase 122inf.122
y sup.122 medio
absoluta
relativa
124
124
124
125
125
125
125 126 126
11-14
10.5-14.5
12.5
////
4
0.2500
IV)
Nmero
intervalos
III) Amplitud
=3
40-42
39.5-42.5
41
///de129
3 =5
0.1666
128 129
15-18
14.5-18.5 126
16.5127 128
////
4
0.2500
19-22
23-26
Totales
43-45
42.5-45.5
44
///
18.5-22.5
20.5
//
2
46-48
45.5-48.5
V)
47 = 6 /////
IV)
Nmero
de
intervalos
22.5-26.5
24.5
///
3
49-51
48.5-51.5
50
////
II) Rango
= 44
16
52-54
51.5-54.5
53
/
V)
55-57
54.5-57.5
56
//
III) Amplitud = 5
Totales
3
0.1250
5
0.1875
4
1.0000
1
2
18
0.1666
0.2777
0.2222
0.0555
0.1111
0.9999
Sugerencias
28
Estadstica Descriptiva
Inferencial I
UNIDAD 2
2.2 GRFICAS
APRENDIZAJES
Comnmente, el significado de los datos se puede comunicar ms efectivamente por medio de grficas que por medio
de tablas de frecuencias. Existen cuatro formas para presentar los datos grficamente: histogramas, polgonos, grfico
o diagrama de barras y grficas circulares.
HISTOGRAMAS
Es un tipo especial de grfico de barras; se emplea para representar una distribucin de frecuencias
absoluta y relativa.
El histograma representa la informacin de las distribuciones de frecuencias, es decir, se representan las
frecuencias de clase por medio de reas de rectngulos (barras). En un histograma las frecuencias
quedan representadas por el rea de los rectngulos y no por sus alturas, por lo que las barras
necesariamente se dibujan sin dejar espacios entre ellas.
Para dar generalidad a la impresin visual que proporciona un histograma, los profesionales en estadstica
recomiendan, para la eleccin de la longitud de los ejes, aplicar la regla de los tres cuartos, lo que quiere
decir que el eje vertical debe ser los tres cuartos de la longitud del eje horizontal.
Para construir un histograma se observan las siguientes caractersticas:
Los valores de las variables se disponen en el eje horizontal (eje x); las frecuencias con que ocurren
los valores de la variable en el eje vertical (eje y).
Cada intervalo de clase se representa por una barra del histograma; recuerda que estas barras tienen la misma
amplitud que los intervalos de clase.
La altura de cada barra corresponde a la frecuencia con que ocurren los valores en dichos
intervalos de clase.
Las barras se dibujan adyacentes entre s y, recuerda, la proporcin encerrada por una barra est
representada por la frecuencia relativa correspondiente a dicho intervalo de clase.
29
Estadstica Descriptiva
Inferencial I
frecuencias
y
intervalos de clase
x
POLGONOS
Los datos de una distribucin de frecuencias tambin se pueden graficar a travs de un polgono de frecuencias. Un
polgono de frecuencias se construye, elaborando primero un histograma y luego conectando, por medio de
lneas rectas, los puntos medios de la parte superior de cada una de las barras.
Para construir un polgono se observan las siguientes caractersticas:
Los puntos terminales del histograma se unen con el eje horizontal (eje x) en el punto que corresponde
al punto medio de un intervalo de clase imaginaria de la misma amplitud y adyacente al histograma
por la izquierda y por la derecha.
El rea total bajo la curva es igual al rea total bajo el histograma correspondiente.
Recuerda que la poligonal, conocida como polgono de frecuencias, se utiliza para mostrar de manera general el
comportamiento de la informacin obtenida, sin la necesidad de realizar clculos de reas de rectngulos para
verificar que el rea bajo la poligonal es igual al rea de las barras de un histograma.
y
frecuencias
x
Intervalos de clase
30
Estadstica Descriptiva
Inferencial I
UNIDAD 2
10%
15%
25%
50%
Matrcula de la E S I M E
500
450
400
350
300
250
200
150
100
50
0
350
Colitis
Otras
300
Hombres
Diabetes
250
200
150
Mujeres
Garganta
Urologa
100
50
0
Civil
Mecnica
1
Electrnica
31
Estadstica Descriptiva
Inferencial I
54321-
intervalos
(nm. de estudiantes)
13
18
23
28
33
38
43
32
Fronteras
inf. y sup.
7.5-12.5
12.5-17.5
17.5-22.5
22.5-27.5
27.5-32.5
32.5-37.5
37.5-42.5
estudiantes de bachilleres.
Puntos
Conteo
Frecuencias
medios
absolutas
10
//
2
15
///
3
20
///
3
25
/////
5
30
////
4
35
//
2
40
/
1
20
Frecuencias
relativas
0.10
0.15
0.15
0.25
0.20
0.10
0.05
1.00
Estadstica Descriptiva
Inferencial I
UNIDAD 2
Construye un polgono de frecuencias relativas con los valores del ejercicio anterior.
Fronteras
inf. y sup.
7.5-12.5
12.5-17.5
17.5-22.5
22.5-27.5
27.5-32.5
32.5-37.5
37.5-42.5
estudiantes de bachilleres.
Puntos
Conteo
Frecuencias
medios
absolutas
10
//
2
15
///
3
20
///
3
25
/////
5
30
////
4
35
//
2
40
/
1
20
Frecuencias
relativas
0.10
0.15
0.15
0.25
0.20
0.10
0.05
1.00
33
Estadstica Descriptiva
Inferencial I
EJERCICIOS
INSTRUCCIONES: De los siguientes enunciados, construye para cada uno de ellos:
I) Un histograma de frecuencias absolutas.
II) Un polgono de frecuencias relativas.
Recuerda que para cada ejercicio ya tienes elaborada la tabla de distribucin de frecuencias.
1. El siguiente conjunto de 60 datos representa las ventas de galletas por da en una tienda de
autoservicio.
Distribucin de frecuencias absoluta y relativa de una muestra de 60 datos.
Intervalos
de clase
44-48
49-53
54-58
59-63
64-68
69-73
74-78
79-83
Totales
I)
II)
34
Fronteras
inf. y sup.
43.5-48.5
48.5-53.5
53.5-58.5
58.5-63.5
63.5-68.5
68.5-73.5
73.5-78.5
78.5-83.5
Puntos
medios
46
51
56
61
66
71
76
81
Conteo
////////
/////////
//////////////
//////////
////////
//////
////
/
Frecuencias
absolutas
9
9
13
10
8
6
4
1
60
Frecuencias
relativas
0.1500
0.1500
0.2166
0.1666
0.1333
0.1000
0.0667
0.0167
0.9999
Estadstica Descriptiva
Inferencial I
UNIDAD 2
Fronteras
inf. y sup.
84.5-89.5
89.5-94.5
94.5-99.5
99.5-104.5
104.5-109.5
109.5-114.5
114.5-119.5
119.5-124.5
124.5-129.5
Puntos
medios
87
92
97
102
107
112
117
122
127
Conteo
/////////
///////////
//////////////
////////////////////
///////////////////////////
//////////////////////
///////////////////
////////////////
////////////
Frecuencias Frecuencias
absolutas
relativas
9
0.0600
11
0.0730
14
0.0930
20
0.1330
27
0.1800
22
0.1470
19
0.1270
16
0.1070
12
0.0800
150
1.0000
I)
II)
35
Estadstica Descriptiva
Inferencial I
TABLA DE COMPROBACIN
Nmero de pregunta
Respuesta correcta
I)
1
y
16 12 84clientes
44
49 54
59
64
69
74
79
83
II)
36
44
49
54 59
64
69
74
79
83
Estadstica Descriptiva
Inferencial I
UNIDAD 2
Nmero de pregunta
2
Respuesta correcta
I)
y
28 24 20 16 12 8 4 c.i.
85
90
95
130
II)
y
85
90
95
100
125 130
Sugerencias
Recuerda que en un histograma las frecuencias estn representadas por el rea de los
rectngulos (barras) y no por sus alturas.
Para construir un polgono de frecuencias no es necesario calcular las reas de los rectngulos
(barras).
37
Estadstica Descriptiva
Inferencial I
EJERCICIOS DE AUTOEVALUACIN
3, 2, 5, 4, 3, 6, 0, 5, 4, 10, 1, 3, 0, 5, 11, 8, 9, 6, 3 y 4
I)
II)
III)
IV)
38
Estadstica Descriptiva
Inferencial I
UNIDAD 2
5
4
5
6
9
7
6
7
4
8
6
8
6
5
10
5
7
8
9
9
4
6
7
8
6
I)
II)
III)
IV)
39
Estadstica Descriptiva
Inferencial I
3. Para comprobar la eficacia de los empleados encargados del llenado de paquetes con arroz, con peso
nominal de 2 kilogramos, en una tienda de autoservicio se elige al azar una muestra de 30 paquetes,
cuyos resultados en gramos fueron:
1930
2120
1907
2075
1946
I)
II)
III)
IV)
40
1865
1985
1880
2025
1999
1977
2053
2005
1954
2061
2015
2030
1830
1934
2047
1943
1972
1966
1988
2093
1898
2000
1910
1967
1876
Estadstica Descriptiva
Inferencial I
UNIDAD 2
I)
II)
Frecuencias
relativas
0.02
0.14
0.12
0.28
0.20
0.12
0.12
1.00
41
Estadstica Descriptiva
Inferencial I
CLAVE DE RESPUESTAS
Nmero de pregunta
R
e
s
p
u
e
Nst
a
c
or
re
ct
a
Respuesta correcta
I) Rango = 11
II) Amplitud = 3
III) Nmero de intervalos = 5
IV)
3I)
R
a
n
g
o
=
2
9
0
II)
A
m
p
li
t
u
d
=
5
0
III)
N
m
e
r
o
42
I)
Rango = 6
II)
Amplitud = 0.9
III)
Nmero de intervalos = 7
IV)
Estadstica Descriptiva
Inferencial I
UNIDAD 2
de intervalos = 6
IV)
nmero de alumnos
16 14 12 10 8
calificaciones
Nmero de pregunta
4
27
42
57
72
87
102
117 132
Respuesta correcta
II)
y
nmero de alumnos
43
Estadstica Descriptiva
Inferencial I
44
27
42
57
72
87
102
117
132
UNIDAD 3
MEDIDAS DESCRIPTIVAS
APRENDIZAJES
Las medidas de tendencia central son valores numricos que tienden a localizar, en algn sentido, la parte central
de un conjunto de datos. A menudo el trmino promedio se asocia a estas mediciones. Cada una de las diferentes
medidas de tendencia central pueden recibir el nombre de valor promedio.
Con base en lo aprendido anteriormente, habrs observado una clara tendencia de agrupacin en el centro de los
valores ms frecuentemente aparecidos. En general, la mayor densidad de frecuencia est en la parte central de las
grficas, de aqu deriva el nombre de medidas de tendencia central que se les da a la moda, mediana y media.
Recuerda que las medidas de tendencia central se utilizan para describir y establecer comparaciones cuantitativas entre
distribuciones.
MODA PARA DATOS NO AGRUPADOS
La moda o promedio tpico de un conjunto de datos es el valor que ocurre ms frecuentemente en el
conjunto. Si un valor es seleccionado al azar del conjunto dado, el valor modal es aqul que es ms
probable de ser seleccionado. As, la moda es generalmente considerada como el valor ms tpico de una
serie de datos.
La moda para datos no agrupados es el valor que aparece con mayor frecuencia en un grupo de
datos. Si existe una sola moda, se le llamar unimodal; si existen dos modas , se le llamar bimodal, y si
son ms de dos, se llamar multimodal.
MEDIANA PARA DATOS NO AGRUPADOS
La mediana es aquel valor que se encuentra a la mitad de una muestra o poblacin cuyos valores estn
ordenados en magnitud. Si el nmero de valores es impar, la mediana para datos no agrupados es igual al valor de la
mitad. Si el nmero de valores es par, la mediana es igual al promedio de los valores que quedan en la mitad.
MEDIA ARITMTICA PARA DATOS NO AGRUPADOS
La medida de tendencia central que se encuentra con ms frecuencia es la media aritmtica o simplemente media. La
media para datos no agrupados es el cociente de la suma de los valores divididos por el nmero de valores en el
conjunto de datos.
Suma de los valores
Media =
50
UNIDAD 3
por lo tanto:
x
n
X 1 X 2 X 3 ... X n
n
donde se utiliza para simbolizar la suma indicada o sumatoria de un conjunto de sumandos. x significa la
sumatoria de los valores de la variable x.
MODA PARA DATOS AGRUPADOS
En una distribucin de frecuencias de datos agrupados, la moda es la marca del intervalo de clase que
contiene la mayor frecuencia.
La moda es la medida de tendencia central que no tiene propiedades que le permitan intervenir en desarrollos
algebraicos como la media aritmtica; por esto es de menor importancia terica que ella; sin embargo, posee
propiedades que ponen en evidencia ciertas cualidades de un colectivo, cosa que no ocurre con la media aritmtica que
promedia todos los valores igualando en un justo reparto todas las observaciones, es decir, suprimiendo sus
individualidades. En cambio, la moda destaca los valores individuales, de lo que se desprende su utilidad e
importancia en cierto tipo de anlisis.
La moda para datos agrupados se puede calcular mediante la frmula:
d1
w
d1 d 2
Mo Lo
donde:
Lo
es el lmite de la frontera inferior de la clase modal (recuerda que la clase modal es la clase con la
ms alta frecuencia en la distribucin).
d1
d2
51
fa
i
Med Lo 2
f
donde:
Lo
fa
X
donde:
52
Xf
f
UNIDAD 3
Recuerda que las medidas de tendencia central son promedios, por lo tanto, mediante un promedio se
puede tomar un puado de cifras sobre cualquier tema (temperaturas, ingresos, velocidades, poblaciones,
etc.) y calcular una cifra que representar al conjunto por completo.
Sin embargo, debes recordar que existen varias clases de mediciones conocidas comnmente como
promedios, y cada uno presenta un panorama diferente sobre las cifras que representa.
Por ejemplo, si consideramos los ingresos mensuales de diez trabajadores:
$4500.00
$3150.00
$3900.00
$3150.00
$3750.00
$3150.00
$3675.00
$3150.00
$3225.00
$2250.00
Cul es el ingreso tpico de estos trabajadores? El promediar sus ingresos podra dar la respuesta a la
pregunta; entonces, el promedio de uso ms frecuente es la media, por que no se especific de qu tipo;
ste promedio se obtiene sumando los elementos de una serie de nmeros y dividiendo entre el nmero
de elementos, para nuestro ejemplo, la media es $3390.00.
La media es representativa de la serie de nmeros en el sentido de que la suma de las cantidades segn
las cuales las cifras mayores exceden a la media es igual a la suma de las cantidades, segn las cuales
las cifras menores estn por debajo de la media.
Para el caso de la mediana, como se observ, seis trabajadores ganan menos que la media, mientras que
cuatro ganan ms. Puede representarse este grupo con el ingreso de la familia que est situado
exactamente en la parte central de todos los ingresos.
Para hacer esto se necesita determinar la mediana; sera fcil si hubiera once familias en el grupo. Al
ordenar los ingresos de menor a mayor, la familia con el sexto ingreso de la ordenacin tendra la mediana
de los ingresos; sin embargo, con diez familias no se tiene una familia que est en el centro de los
ingresos; por tal razn, se suman los dos ingresos centrales ($3150.00 y $3225.00) se divide entre dos y
da como resultado, que la mediana es $3187.50, menor que la media.
Hasta ahora se han obtenido dos clases de promedios y ninguna familia tiene un ingreso igual a alguno de
los valores hallados.
Ahora se quiere representar al grupo estableciendo el ingreso que ocurre con mayor frecuencia; esta clase
de representatividad recibe el nombre de moda. En este ejemplo, el ingreso modal es $3150.00, el cual es
obtenido por un nmero mayor de familias, ms que ningn otro.
Se han obtenido tres promedios diferentes, cada uno es vlido, correcto e informativo a su manera; pero
qu distintos son, stos son:
Media ................ $3390.00
Mediana ............ $3187.50
Moda ................. $3150.00
Estos valores de los ingresos podran diferir ms, si slo una familia en el grupo fuera millonaria o muy
pobre. Con base en lo anterior, podemos decir:
Primero, cuando se vea o se escuche algo sobre un promedio, debe averiguarse de qu clase se trata;
entonces se sabr qu clase de aspecto se considera.
53
Segundo, obsrvense las cifras que se promedian de manera que pueda juzgarse si el promedio es el
adecuado.
Tercero, cada vez que alguien diga promedio no debe suponerse que se implica una cuantificacin
matemtica; no es as, a menudo se habla de la persona promedio sin que ello se refiera a una media,
mediana o moda; todo lo que se quiere significar es la idea de gente que en muchos aspectos se asemeja
bastante al resto.
Recuerda que la moda es aquel valor que se presenta ms frecuentemente, que la mediana es la
medida de tendencia central que divide el rea de un histograma o el rea bajo la curva de
distribucin en dos partes iguales, de manera que el nmero de observaciones por debajo de la
mediana es igual al nmero de observaciones por encima de ella y que la media es la medida de
tendencia central en la que la suma de las desviaciones respecto a ella es cero.
Estas medidas que ests estudiando nos apoyan para visualizar en las grficas donde se han trazado las
ordenadas correspondientes, es decir:
La media aritmtica es un punto de equilibrio (semejante a un centro de gravedad).
La mediana tiene la propiedad de que su ordenada divide el rea bajo la curva en dos partes
iguales.
La moda es la abscisa correspondiente a la mayor ordenada o pico de la curva.
54
UNIDAD 3
Kilmetros
Recorridos
1
4
8
10
10
1 4 10 8 10
6.6 km
5
Ahora, realiza los clculos necesarios para encontrar la solucin del siguiente planteamiento.
Las edades de los profesores de Taller de Lectura y Redaccin son: 28, 30, 31, 30, 45, 25, 60, 48, 30, 24,
30, 39 y 30. Calcula el valor de la moda.
55
En los ejercicios que se muestran a continuacin calcularemos las medidas de tendencia central para
datos agrupados.
La siguiente distribucin de frecuencias corresponde a 150 puntajes del coeficiente de inteligencia (CI) de
ciertos alumnos.
Distribucin de frecuencias de 150 puntajes del CI
Intervalos
Fronteras
Marca de Frecuencia
de clase
inf. sup
clase
absoluta
85-89
90-94
95-99
100-104
105-109
110-114
115-119
120-124
125-129
84.5-89.5
89.5-94.5
94.5-99.5
99.5-104.5
104.5-109.5
109.-114.5
114.5-119.5
119.5-124.5
124.5-129.5
87
92
97
102
107
112
117
122
127
9
11
14
20
27
22
19
16
12
d1
w
d1 d 2
Mo Lo
7
5 107.41
7 5
Mo 104.5
UNIDAD 3
fa
2
i
Med Lo
f
Observamos que n/2 = 150/2 = 75 y, por otra parte, la clase que contiene a la mediana es: 105 - 109, con una
frecuencia de 27 y una frec. abs. acumulada de 81; la clase inmediata inferior de la mediana es de 54 y el ancho de
clase o del intervalo es de 5 y el lmite real inferior de la clase de la mediana es 104.5, entonces:
75 54
5
27
Med 104.5
Xf
f
16245
108.3
150
57
Siguiendo las ideas del ejemplo anterior realiza los clculos necesarios para encontrar la solucin del
siguiente problema.
En esta distribucin de frecuencias se presentan el nmero de retardos semestrales de los trabajadores en
cierta empresa.
Intervalo de clase (retardos)
1-4
5-8
9-12
13-16
17-20
Encuentra el valor de la moda.
58
UNIDAD 3
EJERCICIOS
INSTRUCCIONES: Lee con atencin los siguientes enunciados y contesta lo que se solicita. Recuerda que
estos ejercicios son de datos no agrupados.
1. El siguiente conjunto de datos representa el gasto diario en pesos ($) de 15 seoras para la preparacin de la
comida: 60, 65, 80, 85, 70, 75, 75, 70, 69, 70, 68, 70,74, 70 y 70.
I. Cul es el valor que se presenta ms frecuentemente (moda) en esta serie de datos?
2. Los siguientes valores representan los kilmetros recorridos por 5 estudiantes al venir a la escuela desde sus casas:
1, 4, 10, 8 y 10. Cul es el valor de la moda?
II. La mediana.
III. La media.
59
4.
Las edades de los profesores de Taller de Lectura y Redaccin son: 28, 30, 31, 30, 45, 25, 60, 48, 30, 24, 30, 39 y
30.
I. Cul es el valor de la mediana?
INSTRUCCIONES: Lee con atencin los siguientes enunciados y contesta lo que se solicita. Recuerda que
en estos ejercicios debes aplicar las frmulas para datos agrupados.
5. La siguiente distribucin de frecuencias representa los clientes de una tienda de abarrotes.
Intervalo de clase
1-4
6-9
11-14
16-19
21-24
26-29
31-34
36-39
Calcula:
I. El valor de la moda.
60
Frecuencias
5
25
70
50
40
30
20
10
UNIDAD 3
6. La siguiente distribucin de frecuencias representa las ventas en cientos de pesos en una tienda
departamental.
Intervalo de clase (ventas)
1-5
6-10
11-15
16-20
21-25
Obtn:
I. La moda.
II. La mediana.
III. La media.
7. La siguiente distribucin de frecuencias representa las edades de los trabajadores de una empresa.
Intervalo de clase (edades)
18-22
23-27
28-32
33-37
38-42
61
TABLA DE COMPROBACIN
Nmero de pregunta
Respuesta correcta
I. Mo. = 70
II. Med. = 70
III. Media = 71.4
I. Mo. = 10
I. Mo. = 3
II. Med. = 4
III. Media = 4.6
I. Med. = 30
II. 16.78
III. 18.80
I. 14.73
II. 14.67
III. 14.57
I. 30.28
II. 30.50
III. 30.57
Sugerencias
X 1 X 2 X 3 ... X n
n
62
Xf
f
UNIDAD 3
APRENDIZAJES
Las medidas de dispersin abarcan el rango o recorrido (se estudi en las distribuciones de frecuencias),
la desviacin media, la desviacin estndar o tpica y la varianza. Estos valores numricos describen el
grado de dispersin o variabilidad de los datos.
Los valores de estas medidas de variabilidad o dispersin, sern mayores entre ms dispersos se
encuentran los datos, y sern menores cuando los datos se encuentren menos dispersos.
DESVIACIN MEDIA
La desviacin media (DM) es la media aritmtica de las desviaciones de los valores individuales con respecto al
promedio de los datos. Al calcular la desviacin media para datos agrupados, los valores absolutos de las
desviaciones son utilizados, es decir, los signos (+) y (-) de las desviaciones se ignoran. La desviacin media para
datos agrupados se calcula con la siguiente expresin:
DM
f x f X X
f
f
Recuerda que la desviacin media (DM) es una medida de la dispersin bastante objetiva: cuanto mayor sea su valor,
mayor es la dispersin de los datos; sin embargo, no proporciona una relacin matemtica precisa entre su magnitud y
la posicin de un dato dentro de la distribucin. Por otra parte, al tomar los valores absolutos mide la desviacin de
una observacin sin mostrar si est por encima o por debajo a la media aritmtica.
VARIANZA
Recordemos, como se vio anteriormente, que para calcular la desviacin media, fue necesario prescindir
de los signos negativos tomando los valores absolutos de las desviaciones con respecto a la media
aritmtica. Si elevamos al cuadrado estas desviaciones, logramos con esta operacin que todas las
desviaciones den resultados positivos, sumando los cuadrados de las desviaciones y dividiendo por n 1
(para muestras), se obtiene un estadstico llamado varianza.
La varianza para datos agrupados, denotada por S, es la media aritmtica de los cuadrados de las
desviaciones respecto a la media y sirve de base para calcular la desviacin estndar que es la ms
importante de todas las medidas de dispersin. Entonces:
63
S2
f(X X )
n 1
64
f ( X X )
f 1
S2
UNIDAD 3
Ganancias (intervalo)
140-159
160-179
180-199
200-219
220-239
240-259
fX
f
17355
192.833
90
Ahora elaboremos la tabla que necesitamos para aplicar la frmula de la desviacin media, es decir,
calculamos la marca de clase, el valor absoluto de las desviaciones y, finalmente, el producto de la
frecuencia por las desviaciones; estos productos se suman como lo indica la frmula, y tenemos que:
Marca de
Clase (X)
149.5
189.5
189.5
209.5
229.5
249.5
Desviaciones
x X X
43.333
23.333
3.333
16.667
36.667
56.667
f x
303.331
699.990
43.329
416.675
403.337
226.668
f x = 2093.330
DM
f x
f
2093.330
23.259
90
65
Cul es la varianza de la siguiente distribucin de frecuencias que representa las ventas de una tienda
de autoservicio de refrescos durante un da?.
Intervalo
27-29
30-32
33-35
36-38
39-41
42-44
45-47
Frecuencia
1
10
14
33
14
7
3
Para calcular la varianza para esta distribucin de frecuencias es necesario agregar algunas
columnas para realizar el clculo. No debes olvidar que para el clculo de la varianza es
necesario hacer el producto de las frecuencias por las correspondientes marcas de clase o
punto medio (fX), calcular las desviaciones con respecto a la media (x), elevarlas al cuadrado
(x) y despus, multiplicarlas por las frecuencias correspondientes (fx), como se indica en la
siguiente tabla:
Intervalo Frecuencia
20-29
30-32
33-35
36-38
39-41
42-44
45-47
1
10
14
33
14
7
3
Marca de
clase(X)
28
31
34
37
40
43
46
Xf
28
310
476
1221
560
301
138
x X X
9
6
3
0
3
6
9
f X-X
9
60
42
0
42
42
27
f X X
81
36
9
0
9
36
81
81
360
126
0
126
252
243
f X
Xf=3034
fX
f
3034
37
82
S2
66
f (X X )
f 1
1188
14.666
81
X 1188
2
UNIDAD 3
Cul es la desviacin estndar de la distribucin de frecuencias para este mismo ejercicio? Para poder
calcular la desviacin estndar para esta distribucin de frecuencias, es necesario agregar algunas
columnas para realizar el clculo, de la siguiente manera:
la varianza es:
por lo tanto:
fX
f
f (X X )
n 1
S=
3034
37
82
1188
14.666
81
14.666 = 3.8296
De acuerdo con el ejemplo anterior, resuelve el siguiente ejercicio. Los kilmetros recorridos por 20
estudiantes al venir a la escuela desde sus casas, se muestra a continuacin:
Km recorridos (Intervalo) Nmero de estudiantes (frecuencia)
0 y menos de 2
2
2 y menos de 4
5
4 y menos de 6
4
6 y menos de 8
8
8 y menos de 10
1
Calcula:
I. La desviacin media.
67
EJERCICIOS.
INSTRUCCIONES: Lee con atencin los siguientes enunciados y contesta lo que se solicita.
1. La siguiente distribucin de frecuencias muestra la estatura en cm de 108 alumnos.
Intervalo (estatura)
123.5-128.5
128.5-133.5
133.5-138.5
138.5-143.5
143.5-148.5
148.5-153.5
153.5-158.5
158.5-163.5
Calcula:
I. La desviacin media.
II. La varianza.
68
Frecuencia (alumnos)
1
4
9
24
29
22
14
5
UNIDAD 3
2. Calcula la desviacin media de la siguiente distribucin de frecuencias que muestra los defectos de 180
productos de una lnea de papelera.
Intervalo
42-46
47-51
52-56
57-61
62-66
67-71
72-76
Frecuencia
2
9
31
50
51
30
7
69
Calcula:
I. La desviacin media.
II. La varianza.
70
Frecuencia (alumnos)
1
127.5-130.5
130.5-133.5
133.5-136.5
136.5-139.5
14
139.5-142.5
10
142.5-145.5
23
145.5-148.5
14
148.5-151.5
12
151.5-154.5
15
154.5-157.5
157.5-160.5
160.5-163.5
UNIDAD 3
Nmero de empresas
14
23
30
8
4
Obtn:
I. El valor de la varianza.
71
TABLA DE COMPROBACIN
Nmero de pregunta
Respuesta correcta
I. D.M. = 19.6572
I. D.M. = 5.84
II. S2 = 52.11
III. S = 7.2187
I. S = 28.04
II. S = 5.2952
Sugerencias
72
UNIDAD 3
APRENDIZAJES
MEDIDAS DE ASIMETRA
Recordemos que las medidas de tendencia central en una distribucin de frecuencias simtricas se encuentran
todas en el centro; es decir, las tres medidas (media, mediana y moda) coinciden. Cuando estos valores se apartan
uno del otro, entonces la distribucin se convierte en asimtrica o con sesgo.
El sesgo es el grado de asimetra o falta de simetra de una distribucin. Si la curva de frecuencia de
una distribucin tiene cola ms larga a la derecha del mximo central, se dice de la distribucin est
sesgada a la derecha o tiene sesgo positivo. Si es al contrario, se dice que est sesgada a la izquierda o
que tiene sesgo negativo.
En distribuciones sesgadas, la media tiende a situarse con respecto a la moda al mismo lado que la cola ms larga; as,
una medida de asimetra nos es dada por la diferencia de la media con la moda, dividindola por la desviacin
estndar, cuya expresin es:
X Mo
S
3( X Med .)
S
S k1
Sk2
x
73
Los valores de las medidas de tendencia central se localizan en el centro de la curva, siendo esta curva
simtrica (curva normal).
Si las frecuencias arriba de la clase modal no son las mismas que las frecuencias debajo de la clase modal, la
distribucin no es simtrica y los valores de los tres promedios de la distribucin no son los mismos.
Cuando una distribucin no es simtrica, la curva se torna asimtrica, ya sea hacia el lado derecho sobre
el eje X o hacia el lado izquierdo sobre el eje X, como se muestra a continuacin:
y
Asimetra hacia la derecha
o sesgo positivo
(hacia valores ms altos)
74
UNIDAD 3
S K1
Tenemos que S K 1
X Mo
S
759 672
= 1.474576
59
Una muestra de las ventas de doce tiendas departamentales revel que en promedio sus ventas en un
mes fueron de $8000.00, con una mediana de $7200.00, una moda de $6900.00 y una desviacin
estndar de $5700.00. Calcula el segundo coeficiente de asimetra de Pearson.
De la siguiente grfica, indica qu tipo de asimetra (sesgo) tiene:
x
La curva presenta un sesgo hacia la derecha; por lo tanto, su asimetra es positiva.
75
EJERCICIOS.
INSTRUCCIONES: Lee con atencin los siguientes enunciados y contesta lo que se solicita.
1. La siguiente distribucin muestra las edades de los trabajadores de una maquiladora para partes
automotrices:
Edades
18 - 22
23 27
28 - 32
33 - 37
38 - 42
43 - 47
Nmero de empleados
8
45
60
68
23
16
x
3. En una curva simtrica, dnde se encuentran situadas las tres medidas de tendencia central?
76
UNIDAD 3
TABLA DE COMPROBACIN
Nmero de pregunta
1
Respuesta correcta
Sk1=-0.1556
77
EJERCICIOS DE AUTOEVALUACIN
Frecuencia
7
30
13
25
11
4
78
Empresas
1
6
12
15
8
3
3
UNIDAD 3
3. La siguiente distribucin de frecuencias muestra las edades de los empleados de una empresa aduanal.
Edades
18-22
23-27
28-32
33-37
38-42
43-47
Empleados
8
45
60
68
23
16
79
CLAVE DE RESPUESTAS
Nmero de pregunta
Respuesta correcta
D.M. = 23.259
S = 85.777
3
S = 6.1806
I
II
Sk1 = - 0.2361
Negativo
(sesgo hacia la izquierda)
NOTA.
Recuerda que para los tres primeros ejercicios debes calcular la media aritmtica:
para el ejercicio 1, de 192.833
para el ejercicio 2, de 59.41
para el ejercicio 3, de 32.295
80
UNIDAD 4
CORRELACIN
Y REGRESIN LINEAL
APRENDIZAJES
Calcular la correlacin lineal entre dos variables.
Calcular el coeficiente de correlacin de Pearson.
En las diferentes reas del conocimiento existen problemas que requieren el anlisis de ms de una variable; por
ejemplo:
Un socilogo puede estar interesado en saber qu clase de relacin existe entre la tasa de
delincuencia juvenil que hay en una comunidad y el grado de hacinamiento de los hogares que all se
encuentran.
Un psiclogo desea saber si existe alguna relacin entre el concepto que tiene un estudiante de s
mismo y su promedio en el estudio.
Un agrnomo desea conocer si existe relacin entre la cantidad de lluvia cada y el rendimiento de ciertos
productos agrcolas; es decir, si se afecta desfavorablemente tanto por la excesiva lluvia como por la sequa del
suelo.
Estas relaciones y muchas otras se pueden investigar por medio del anlisis de correlacin y regresin lineal. Cuando
el anlisis involucra ms de dos variables, la correlacin y regresin ser mltiple.
El objetivo principal de la correlacin es medir la intensidad de una relacin lineal entre dos variables; en
esencia, la correlacin es una medida de la relacin entre dos variables.
La medida de correlacin implica encontrar un valor numrico que exprese el grado de correspondencia o
dependencia que existe entre dos variables. Al hablar de la correlacin de dos variables, es necesario
distinguir dos casos bsicos:
Correlacin positiva. Ocurre cuando al crecer o decrecer una de las variables, la otra crece o decrece
paralelamente, por ejemplo: a medida que se eleva el nivel de vida de una poblacin, tiende a aumentar el
consumo de artculos que no son de primera necesidad.
Correlacin negativa. Ocurre cuando al crecer alguna de las variables, la otra decrece; por ejemplo: a
medida que se amplan los sistemas de salubridad y medicina preventiva, decrece el ndice de mortalidad
por enfermedades infecto-contagiosas.
Estas dos correlaciones y otras ms, se pueden mostrar utilizando los diagramas de dispersin.
84
UNIDAD 4
DIAGRAMAS DE DISPERSIN
La forma ms sencilla para predeterminar si existe o no una correlacin entre dos variables es
construyendo un diagrama de dispersin. Al localizar los puntos sobre los ejes cartesianos, podemos ver lo
siguiente:
Si los valores de las variables X y Y van aumentando, entonces existe una correlacin positiva.
Por ejemplo: al correlacionar las edades del marido y de la esposa en las parejas conyugales; es decir, a
mayor edad del marido, mayor edad de la esposa.
Si los valores de la variable X aumentan y ocasionan que los valores de la variable Y disminuyan,
entonces existe una correlacin negativa.
Por ejemplo: al correlacionar el nmero de accidentes de trabajo acaecidos en un espacio de tiempo, con el nmero de
dispositivos de seguridad operantes en la planta de una industria; es decir, a mayor nmero de dispositivos de
seguridad, menor nmero de accidentes de trabajo.
COEFICIENTE DE CORRELACIN DE PEARSON
De los diversos coeficientes de correlacin que existen, el ms conocido y utilizado es el Coeficiente de Pearson, el
cual se simboliza con la letra minscula r. Se calcula dividiendo la suma de los productos de las desviaciones de
cada variable de X y Y con respecto a sus medias (suma que se denomina covarianza1 de X y Y), entre el
producto de las desviaciones estndar de ambas variables; de manera prctica, el coeficiente de correlacin de
Pearson se calcula con la siguiente frmula:
N XY X Y
N X
N Y
donde:
N: es el nmero de pares de datos.
A travs de algunos ejemplos, mostraremos cmo se utiliza la frmula del coeficiente de Pearson, para ver la
correlacin que puede existir entre dos variables.
La covarianza es una medida de la fuerza con la que dos variables x y y se encuentran linealmente relacionadas (correlacin
positiva o negativa), es decir, todos los puntos graficados deben pertenecer a una lnea recta.
85
Pedidos
13.4
10.3
15.1
6.9
7.3
14.2
5.2
11.8
14.3
5.5
Visitas realizadas
245
172
291
124
191
218
101
259
307
142
Considerando al nmero de visitas como la primera variable (x) y al monto de los pedidos como la segunda variable
(y), se construye un diagrama de dispersin y se indica el tipo de correlacin existente.
y
(Pedidos)
15
*
*
*
*
*
10
*
*
*
*
(Nmero de visitas)
50
100
150
200
250
300
86
UNIDAD 4
b) Cuando la relacin de dos variables es perfectamente positiva; o sea, cuando al variar la primera variable, la segunda variable vara en las mismas
proporciones y en la misma direccin, el coeficiente de correlacin es +1.
c) Cuando la relacin de dos variables es perfectamente negativa; o sea, al variar la primera variable, la
segunda variable vara en las mismas proporciones pero en direccin contraria, el coeficiente de
correlacin es -1.
d) Cuando no existe relacin entre dos variables; o sea, cuando al variar la primera variable,
las variaciones de la segunda variable no reflejan dependencia o conexin alguna con las
variaciones de la primera variable, el coeficiente de correlacin lineal es cero.
Lo anterior significa que, entre 0 y +1 cabe toda una gama de correlaciones positivas, que sern tanto ms
directamente proporcionales, cuanto ms se acerquen a +1. Y entre -1 y 0 cabe toda una gama de correlaciones
negativas, que sern tanto ms inversamente proporcionales, cuanto ms se acerquen a -1. Recuerda que en los
coeficientes de correlacin, cuanto ms cerca de cero, indicarn ausencia de correlacin.
87
A continuacin se muestran las puntuaciones obtenidas por diez personas en una prueba de destreza
manual para hacer una artesana, con base en dos variables, X y Y:
X: 20 18 16 15 14 12 12 10 8 5
Y: 12 16 10 14 12 10 9 8 7 2
Cul es el valor del coeficiente de correlacin de Pearson y qu significa?
Se recomienda elaborar una tabla que muestre las variables para realizar los clculos directos del coeficiente de
correlacin de Pearson, de la siguiente manera:
Columnas
Variables
1
X
20
18
16
15
14
12
12
10
8
5
X = 130
2
Y
12
16
10
14
12
10
9
8
7
2
Y = 100
3
X2
400
324
256
225
196
144
144
100
64
25
X2 = 1878
4
Y2
144
256
100
196
144
100
81
64
49
4
Y2 = 1138
5
XY
240
288
160
210
168
120
108
80
56
10
XY = 1440
Con base en la tabla anterior, observa que en las columnas (1) y (2) estn los datos de las variables X y Y del
enunciado (pares de puntuaciones); en la columna (3) se obtuvieron los cuadrados de las puntuaciones de X, y en la
columna (4) los cuadrados de las puntuaciones de Y. En la columna (5) estn los productos de X por Y, finalmente se
calcula la suma de los valores de las cinco columnas, los cuales se sustituyen en la frmula del coeficiente de
correlacin de Pearson, de la siguiente forma:
N ( XY ) ( X )( Y )
N X
( X ) 2 N Y 2 ( Y ) 2
14400 13000
1440
1440
0.89
2594400 1610
1440
(1880(1380)
88
UNIDAD 4
Con todas las caractersticas del coeficiente de correlacin lineal, ya mencionadas, podemos
interpretar el resultado del ejemplo anterior, donde calculamos el coeficiente de correlacin de
Pearson. Entonces, como r = 0.89, podemos concluir que la correlacin que existe es fuerte y
positiva entre estas dos variables.
Como observas, lo nico tedioso es la elaboracin de la tabla, pero sta concentra todos los resultados que necesitas
para aplicar la frmula del coeficiente de correlacin de Pearson de una manera sencilla y clara.
Ahora calcula el coeficiente de correlacin de Pearson de la siguiente tabla de valores, que muestra los puntajes
obtenidos por diez personas al iniciar estudios superiores en una prueba de aptitud (X) para la profesin y los puntajes
obtenidos en satisfaccin por el trabajo que desarrollan (Y).
89
EJERCICIOS
INSTRUCCIONES: Lee con atencin los siguientes reactivos y realiza lo que se solicita.
1. La siguiente informacin muestra la relacin entre variables X (experiencia en ventas) y Y (cantidad
vendida), de ciertos vendedores de una tienda departamental:
Experiencia en ventas (X): 3 4 4 5 5 6 6 7 7 7 8 9 9 10 10
Ventas (Y): 2 3 4 3 4 3 4 4 5 6 5 6 7 7 8
I. Construye el diagrama de dispersin.
90
UNIDAD 4
2. Los siguientes datos muestran el nmero de horas (X) dedicadas a preparar un examen, y la
calificacin (Y) obtenida en dicha prueba.
Horas para el estudio (X): 2 3 3 4 4 5 5 6 6 6 7 7 7 8 8
Calificaciones (Y): 5 5 7 5 7 7 8 6 9 8 7 9 10 8 9
I. Construye el diagrama de dispersin.
91
3. Los siguientes resultados muestran las aptitudes de seis estudiantes a travs de exmenes para la
materia de estadstica, y para idiomas.
Idiomas (Y): 525 515 510 495 430 400
Estadstica (X): 550 535 535 520 455 420
92
UNIDAD 4
TABLA DE COMPROBACIN
Nmero de
preg
unta
1
Respuesta correcta
I. Diagrama de dispersin.
*
*
1
1
10
II. Los valores de los resultados al elaborar la tabla para aplicar la frmula del
coeficiente de correlacin de Pearson son:
X = 100
Y = 71
XY = 523
X2 = 736
Y2 = 379;
que al sustituir en la expresin de Pearson, tenemos que: r = 0.91
III. La correlacin entre estas dos variables es positiva, grfica y
algebraicamente.
93
Nmero de
preg
unta
2
Respuesta correcta
I.
Diagrama de dispersin
y
10
*
*
*
*
4
3
2
1
1
10
94
UNIDAD 4
Nmero de
preg
unta
3
Respuesta correcta
I. Diagrama d e dispersin
y
550
*
520
*
*
490
460
430
400
*
400
430
460
490
520
550
Sugerencias
Comprueba que seguiste adecuadamente los procedimientos para encontrar el coeficiente de
correlacin de Person y para construir los correspondientes diagramas de dispersin.
95
APRENDIZAJES
Recuerda que la correlacin informa sobre la intensidad de una relacin lineal, nos dice cul es la relacin numrica
exacta.
Por ejemplo, el coeficiente de correlacin calculado para los datos del puntaje que obtuvieron al hacer artesanas,
implica que hay una correlacin lineal entre el nmero de los puntajes y las artesanas que realizaron los artesanos.
Esto significa que el nmero de puntaje sirve para predecir el nmero de artesanas. Sin embargo, la correlacin no
informa cmo determinar un valor de y dado un valor de x. Lo anterior se hace con un exponencial y logartmica.
Podemos recordar fcilmente que para trazar una lnea recta es necesario tener dos valores para x, para obtener los
valores correspondientes de y, y tener dos puntos o parejas ordenadas que al localizarlas en los ejes cartesianos y al
unirlos resulte una grfica lineal. Entonces podemos pensar que para la relacin entre dos variables X y Y, con un
alto coeficiente de correlacin lineal, puede suponerse una relacin lineal del tipo que existe entre las variables
de los ejercicios del clculo del coeficiente de correlacin de Pearson.
A la ecuacin y = ax + b, que describe la relacin lineal entre las variables x y y, se le llama ecuacin de
regresin, y su grfica, recta de regresin. La pendiente de la recta y la ordenada al origen de la recta de regresin
se obtienen mediante las siguientes expresiones:
X Y X XY
N X X
2
N XY X Y
N X 2 X
96
UNIDAD 4
X2
4
9
9
16
16
16
16
25
25
25
36
36
64
X2 = 297
Y
1
2
3
1
2
3
4
2
3
4
3
5
5
Y = 38
XY
2
6
9
4
8
12
16
10
15
20
18
30
40
XY = 190
Con base en los datos obtenidos, los sustituimos en las frmulas correspondientes que ya conoces, por lo
tanto:
X Y X XY
b
N X X
2
0 .2
2
3861 3481
380
13( 297) (59)
X Y X XY
N X X
0.6
380
380
380
97
y = 0.6x + 0.2
Los puntos que acabamos de calcular, P 1 y P2, son los puntos por donde la recta de regresin pasa.
Hagamos el diagrama de dispersin para comprobar esta afirmacin; recuerda que para construir este
diagrama, slo necesitamos las parejas ordenadas de las variables de la tabla del enunciado y localizarlas
en los ejes coordenados.
y
*
1
*
3
La ecuacin de regresin permite tener un valor de la variable Y cuando se tiene un valor de la variable X; lo anterior
permite realizar estimaciones si, por ejemplo, X = 15, la estimacin se obtiene al sustituir el valor de X en la ecuacin
de regresin, la cual es y = 0.6x + 0.2, dando por resultado que y = 9.2.
Calcula la ecuacin de regresin lineal y verifcala con el diagrama de dispersin correspondiente de la
siguiente tabla de valores, que muestra los puntajes que obtuvieron diez personas al iniciar estudios
superiores en una prueba de aptitud (X) para la profesin y los puntajes obtenidos en satisfaccin por el
trabajo que desarrollan (Y).
X: 245 172 291 124 191 218 101 259 307 142
Y: 13.4 10.3 15.1 6.9 7.3 14.2 5.2 11.8 14.3 5.2
98
UNIDAD 4
EJERCICIOS
INSTRUCCIONES: Lee con atencin los siguientes reactivos y realiza lo que se solicita.
1. La siguiente informacin muestra la relacin entre variables X (experiencia en ventas) y Y (cantidad
vendida), de ciertos vendedores de una tienda departamental:
Experiencia en ventas (X): 3 4 4 5 5 6 6 7 7 7 8 9 9 10 10
Cantidad vendida (Y): 2 3 4 3 4 3 4 4 5 6 5 6 7 7 8
I. Calcula la ecuacin de regresin lineal.
99
2. Los siguientes datos muestran el nmero de horas (X) dedicadas a preparar un examen, y la calificacin
(Y) obtenida en dicha prueba.
Horas para el estudio (X) : 2 3 3 4 4 5 5 6 6 6 7 7 7 8 8
Calificaciones (Y) : 5 5 7 5 7 7 8 6 9 8 7 9 10 8 9
I. Calcula la ecuacin de regresin lineal.
100
UNIDAD 4
3. Los siguientes resultados muestran las aptitudes de seis estudiantes a travs de exmenes para la
materia de estadstica y para idiomas.
Idiomas (Y): 525 515 510 495 430 400
Estadstica (X): 550 535 535 520 455 420
I. Calcula la ecuacin de regresin lineal.
101
TABLA DE COMPROBACIN
Nmero de pregunta
1
Respuesta correcta
I. Para calcular la ecuacin de regresin lineal, necesitamos de valores
que al sustituirlos en las expresiones de a y b, encontremos los valores
de la pendiente de la recta y su ordenada al origen:
a = 0.7163
b = -0.0423
*
*
1
1
10
102
UNIDAD 4
Nmero de Pregunta
2
Respuesta correcta
I. Para calcular la ecuacin de regresin lineal, necesitamos de valores
que al sustituirlos en las expresiones de a y b, encontremos los valores
de la pendiente de la recta y su ordenada al origen, entonces:
a = 0.625 y b = 3.958
la ecuacin es y =0.625x + 3.958
II. El diagrama de dispersin es P1(3, 5.833) y P2(8, 8.958)
y
9
8
7
*
6
*
*
*
*
4
*
3
1
1
103
10
Nmero de pregunta
Respuesta correcta
b = -14.1886
*
*
490
460
430
400
*
400
430
460
490
520
550
Sugerencias
Para encontrar la ecuacin de regresin lineal es necesario calcular los siguientes valores, que al
sustituirlos en las expresiones de a y b, encontremos los valores de la pendiente de la recta y su
ordenada al origen.
Ejercicio 1: X = 100, Y = 71, XY = 523 y X2 = 736
Ejercicio 2: X = 81, Y = 110, XY = 625 y X 2=487
Ejercicio 3: X = 3015, Y = 2875, XY = 1458175 y X 2=1528775
104
UNIDAD 4
EJERCICIOS DE AUTOEVALUACIN
Cuentas con sesenta minutos para resolver los problemas.
INSTRUCCIONES: Lee con atencin los siguientes reactivos y contesta lo que se solicita.
1. La siguiente informacin muestra la relacin entre las variables X (citatorios de mala conducta) y Y
(visitas a la escuela), de ciertos padres de familia:
Citatorios de mala conducta (X): 1
2
2.5 3 4
4.5
Visitas a la escuela (Y): 1.5 2.2 2
2.5 4.5 4
I. Construye el diagrama de dispersin.
105
5
5
6
5
2. La siguiente informacin muestra la relacin entre las variables X (llegadas temprano al trabajo) y Y
(estmulos a la puntualidad), de ciertos trabajadores:
Llegadas temprano al trabajo (X): 2 3 2 3 4 3 5 6
Estmulos a la puntualidad (Y): 1 2 3 3 3 5 5 7
I. Calcula la ecuacin de regresin lineal.
106
UNIDAD 4
CLAVE DE RESPUESTAS
Numero de pregunta
1
Respuesta correcta
I. Diagrama de dispersin.
y
8
7
6
5
4
3
2
1
*
*
*
1
II.
2
*
*
*
2
Correlacin positiva.
b = -3.75
10 987654321-
*
*
*
*
*
*
1
107
UNIDAD 5
ELEMENTOS
DE PROBABILIDAD
Estadstica
Inferencial I
Descriptiva
APRENDIZAJES
La probabilidad es el estudio de los fenmenos puramente aleatorios. La probabilidad apareci con base
en los juegos de azar; cuando se utiliz la palabra probabilidad fue para indicar la posibilidad de que ocurra
un evento o resultado.
El mundo en que vivimos est lleno de incertidumbre; las situaciones que implican incertidumbre varan de
simples juegos de azar, como los dados y naipes, hasta problemas en campos tan variados e importantes
como son las ciencias fsicas, las sociales, la industria y los seguros, por mencionar algunos. Los
problemas representativos de estos campos implican predicciones de lo que suceder a futuro; es decir,
qu probabilidad de ocurrencia existe para asegurar las predicciones.
Los primeros estudios sobre probabilidad fueron motivados por la posibilidad de acierto o de fracaso en los juegos de azar; es decir, qu ocurrencia
tiene un suceso entre varios posibles.
La probabilidad segn la frecuencia relativa, es el punto de vista ms ampliamente sostenido, debido a que la frecuencia relativa es un cociente,
como recuerdas, entre la frecuencia absoluta y el nmero de veces que se repite el experimento, entonces:
Consideremos un evento E que se produce en n repeticiones o ensayos de algn experimento; de acuerdo con
el concepto de frecuencia relativa de ocurrencia (fa = NA/N), la probabilidad del evento E, denotado por
P( E )
nE
n
111
UNIDAD 5
Con base en lo aprendido anteriormente sobre estadstica descriptiva (frecuencia relativa en distribuciones de frecuencias), es necesario recordar
algunos conceptos de probabilidad que se mencionaron anteriormente, cmo:
Al conjunto de los posibles resultados de un experimento se le llama espacio muestral, espacio muestra o espacio de eventos.
112
Estadstica
Inferencial I
Descriptiva
P( E )
nE 1
0 .5
n
2
Veamos otro ejemplo. Cul es el espacio muestra del experimento de lanzar una moneda?
Recuerda que el espacio muestral es el formado por todos los posibles resultados del experimento,
entonces:
S = {a, s}
Donde S representa al espacio muestral; a es el resultado de que aparezca guila y s es el resultado de que aparezca sol.
113
UNIDAD 5
EJERCICIOS
INSTRUCCIONES: Lee con atencin los siguientes reactivos y coloca en el parntesis de la izquierda la
letra de la opcin correcta.
1. (
) Cul es el nombre que se le da al nmero asignado a un evento que mide la creencia de que ese
evento pueda ocurrir?
a) Estadstica.
b) Probabilidad.
c) Estadgrafo.
d) Medida de dispersin.
2. (
) Cul es el nombre que recibe el cociente de los casos favorables entre todos los casos posibles
de un experimento dado?
a) Frecuencia absoluta.
b) Estadstica.
c) Posibilidad.
d) Distribucin.
INSTRUCCIONES: Lee con atencin los siguientes enunciados y contesta lo que se te pide.
3. Cul es la probabilidad de sacar un as de una baraja de 52 cartas?
4. Una urna contiene tres bolas rojas, cinco bolas blancas y cuatro azules.
I. Cul es la probabilidad de extraer de la urna una bola roja?
II. Qu probabilidad existe de que al extraer una bola, sta sea blanca?
114
Estadstica
Inferencial I
Descriptiva
5. En una urna hay dos mil bolas rojas y tres mil bolas blancas; si se extraen 100 bolas al azar, cul es la
probabilidad que sean rojas?
6. Se lanzan dos dados, cul es la probabilidad de que aparezcan dos nmeros iguales?
7. Se lanzan dos dados, cul es la probabilidad de que aparezcan dos nmeros diferentes?
9. Cul es el espacio de eventos del experimento de una urna que contiene dos bolas blancas y una
negra, donde se extraen al azar dos bolas? El experimento se realiza con reemplazo.
115
UNIDAD 5
TABLA DE COMPROBACIN
Nmero de
preg
unta
Respuesta correcta
P ( A ) = 0.077
I. P ( R ) = 0.25
II. P ( B ) = 0.417
III. P ( A ) = 0.333
S = {(b1, b1), (b1, b2), (b1, n), (b2, b1), (b2, b2), (b2,n),
(n, b1), (n, b2), (n, n)}
Sugerencias
Si persisten las dudas, puedes consultar los libros cuyos ttulos son:
Estadstica, Primer Curso. Portilla. Ed. Interamaricana,1987, Mxico, p. 93-109.
Curso Prctico de Estadstica. Lincoyan Portus G. Ed. McGraw-Hill,1988, Mxico,
p. 135-142.
116
Estadstica
Inferencial I
Descriptiva
APRENDIZAJES
Calcular la probabilidad de eventos excluyentes y no
mutuamente excluyentes.
Calcular la probabilidad condicional de dos eventos.
Calcular la probabilidad de eventos independientes.
( P B) = P(A) + P(B)
En este tipo de eventos no existe la interseccin de los eventos A y B .
EVENTOS NO MUTUAMENTE EXCLUYENTES
Estos eventos llamados tambin eventos que se intersectan, son eventos que se traslapan parcialmente;
es decir, si parte de uno de ellos y parte de otro de ellos ocurren conjuntamente. Sean los eventos A y B
que se intersectan; es decir, parte del evento A es tambin parte del evento B , entonces:
( P B) = P (A) + P (B) - P ( A B )
PROBABILIDAD CONDICIONAL
Si A y B son dos eventos dependientes, entonces la probabilidad de que ocurra tanto A como B es igual al
117
UNIDAD 5
Por lo tanto, la probabilidad condicional de cualquier evento es la probabilidad de que este evento
ocurra con la condicin de que el otro evento haya ocurrido, entonces:
P( BA)
P( A B )
P ( A)
donde P(A) 0
SUCESOS INDEPENDIENTES
Recuerda que si dos eventos son independientes, la ocurrencia de uno de ellos no afecta a la
probabilidad de que el otro ocurra o deje de ocurrir.
Sean A y B dos eventos independientes, entonces:
P ( A B ) = P(A) P(B)
118
Estadstica
Inferencial I
Descriptiva
Cul es la probabilidad de que al lanzar un dado, aparezca un nmero par o un nmero primo?
El espacio muestra de lanzar un dado es: D = {1, 2, 3, 4, 5, 6}, si el evento A = (2, 4, 6) y B = (2, 3, 5),
entonces sus probabilidades son:
P (A) = 3/6 =
, P (B) = 3/6 = y
P ( A B ) = 1/6, entonces:
P ( A B ) = + - 1/6 = 5/6
Suponga que la probabilidad de que usted asista a un Politcnico es 0.6 , la probabilidad de que trabaje es 0.7 y la probabilidad de que realice ambas
actividades es 0.5. Cul es la probabilidad de que asista a un Politcnico o trabaje?
119
UNIDAD 5
Se lanzan tres monedas, cul es la probabilidad de que todas sean soles, si la primera moneda es sol?
Si A es el evento, la primera moneda es sol y B es el evento, las tres monedas son soles, entonces:
A = {(sss), (ssa), (sas), (saa)}, P (A) = 4/8
B = {(sss)}, P (B) = 1/8, por lo que: P ( A B ) = 1/8, entonces:
P (B|A)
P( A B) 1 8
1 0.25
4
P ( A)
48
Se lanzan un par de dados, si los nmeros que resultan son diferentes, cul es la probabilidad de que su suma sea par?
La probabilidad de que un hombre vivir diez aos ms es , la probabilidad de que su esposa vivir diez
aos ms es 1/3; cul es la probabilidad de que ambos estn vivos dentro de diez aos?
Como son eventos independientes, entonces:
120
Estadstica
Inferencial I
Descriptiva
EJERCICIOS
INSTRUCCIONES: Lee con atencin los siguientes enunciados y contesta lo que se te pide.
1. Se lanza un dado, si A es el evento aparece un nmero menor que tres y B es el evento, aparece
un nmero mayor que tres, cul es la probabilidad de que ocurra por lo menos uno de los eventos?
2. Se lanza un dado, cul es la probabilidad de que aparezca un nmero par o un nmero non?
3. Se lanza un dado, cul es la probabilidad de que aparezca un nmero primo o el nmero uno?
4. Las edades de los integrantes de un equipo de ocho jvenes y cuatro mujercitas son: cinco jvenes
tienen menos de 16 aos y tres tienen 18 aos; dos mujercitas tienen menos de 15 aos y dos tienen
ms de 18 aos. Si se elige al azar una persona, cul es la probabilidad de que la persona elegida
sea mujer o una persona menor de 16 aos?
121
UNIDAD 5
6. Se lanza un dado, si el nmero que resulta es impar, cul es la probabilidad de que sea primo?
7. Se lanza un dado, si el nmero que resulta es par, cul es la probabilidad de que sea primo?
8. La probabilidad de que un alumno repruebe Estadstica es 18%, de que repruebe Costos es 16% y de
que repruebe ambas asignaturas es 4%. Si se elige al azar un alumno y ste reprob Costos, cul es
la probabilidad de que haya reprobado tambin Estadstica?
122
Estadstica
Inferencial I
9.
Descriptiva
Al realizar una encuesta de hbitos alimenticios en una colonia del DF, se encontr que el 16% de las personas toman leche en sus comidas, el
80% toma refresco embotellado y el 4% toma leche y refresco embotellado. Si se elige a una persona al azar de estas colonias y sta toma
leche en sus comidas, cul es la probabilidad de que tambin tome refresco embotellado?
10. En la caja A se tienen quince artculos, de los cuales seis son defectuosos y en la caja B se tienen
trece artculos de los cuales cinco son defectuosos. Si se extrae al azar un artculo de cada caja.
Cul es la probabilidad de que ambos artculos no sean defectuosos?
11. En la papelera EMY hay dos urnas; la urna A contiene 18 lpices, de los cuales 7 son defectuosos y
en la urna B hay 22 lpices, de los cuales 9 son defectuosos. Si se extrae al azar un lpiz de cada
urna, cul es la probabilidad de que ambos lpices no sean defectuosos?
12. Se lanzan dos dados, si A es el evento, el primer dado es par y B es el Evento, el segundo dado es
dos o tres, cul es la probabilidad de que ocurra A y B?
123
UNIDAD 5
TABLA DE COMPROBACIN
Nmero de pregunta
Respuesta correcta
( P B ) = 0.8333
( P B) = 1
( P B ) = 0.6666
( P B) = 0.75
( P B ) = 0.6923
P (B|A) 0.6666
P (B|A) 0.3333
P (E|C) 0.25
P (R|L) 0.25
10
P ( A B ) = 0.3692
11
P ( A B ) = 0.36111
P ( A B ) = 0.1666
12
Sugerencias
Recuerda que cuando los eventos son mutuamente excluyentes, utilizamos la frmula:
P (B|A)
P( A B)
Se utiliza para los ejercicios 6, 7, 8 y 9.
P ( A)
124
Estadstica
Inferencial I
Descriptiva
APRENDIZAJES
PERMUTACIONES
Una permutacin es un arreglo de todos o parte de los objetos dentro de un conjunto de objetos de un
orden definido. El nmero total de permutaciones de un conjunto de objetos depende del nmero de
objetos, tomados a la vez para cada permutacin; es decir, puede ser, todos a la vez o parte de ellos.
PERMUTACIONES SIN REPETICIN
Las Permutaciones de diferentes objetos tomados todos a la vez, se calcula con la siguiente
expresin:
n
donde:
Pn = n (n 1) (n 2).(3) (2)(1) = n
Las permutaciones de n objetos diferentes, tomados parte de ellos a la vez, se calcula con la
siguiente expresin:
donde
n!
( n r )!
125
UNIDAD 5
nr
Si se tienen n objetos de los cuales i son iguales, j son iguales y k son iguales, entonces el nmero
de permutaciones se calcula con la siguiente expresin:
PIJK
n!
i! j! k!
COMBINACIONES
Una combinacin es un arreglo de todos o parte de los objetos de un conjunto sin considerar el orden de
stos. El nmero total de combinaciones posibles de un conjunto de datos tomados todos a la vez es uno;
por ejemplo: los arreglos posibles de las letras (a, b) son: ab y ba, ya que el orden no es considerado, por
lo que el arreglo ab es el mismo que ba, por lo que hay slo una combinacin, entonces para calcular las
combinaciones totales de n objetos tomados todos o parte de ellos a la vez, utilizaremos la siguiente
expresin:
donde
C r C rn ( r n )
n!
r! ( n r )
Cr
126
Estadstica
Inferencial I
Descriptiva
Calcula el nmero de permutaciones del evento (a, b, c), tomados todos a la vez.
Como son todos a la vez, entonces: n = 3; por lo tanto;
Pn = n ( n - 1 ) ( n - 2 )...( 3 ) ( 2 )( 1 ) = n
Pn = n 3P3 = 3 = 6
Calcula el nmero de permutaciones del evento (1, 3, 5, 7), tomados todos a la vez.
Calcula el nmero total de permutaciones del evento (a, b, c, d), tomados tres a la vez.
n 4yr 3
P3
4!
(4)(3)( 2) 24
(4 3)!
Halla el total de permutaciones del evento (a, b, c, d), tomados dos a la vez.
Cuntos nmeros de cuatro cifras se pueden formar con los elementos del evento (6, 9)?
Del enunciado observamos que n = 2 y r = 4, entonces aplicamos la expresin
nr = 24 = 16
Cuntas placas de automvil existen que consten de dos letras y tres nmeros, si la primera letra es A y
la segunda letra puede ser de la A a la F?
127
P3, 4 , 2
9!
1260
3!4!2!
UNIDAD 5
Cuntas juntas directivas de cinco personas se pueden formar con doce miembros de una organizacin?
Del enunciado vemos que: n = 12 y r = 5, entonces:
12
C5
12!
792
5!(12 5)!
Un alumno del Plantel 4 del Colegio de Bachilleres tiene que contestar diez de doce
preguntas de un examen de estadstica, de cuntas maneras puede contestar estas
preguntas?
128
Estadstica
Inferencial I
Descriptiva
JERCICIOS
INSTRUCCIONES: Lee con atencin los siguientes enunciados y contesta lo que se te pide.
4. Cuntos nmeros telefnicos de seis cifras existen que inicien con los dgitos 1, 2, 3, 4
6?
5. Cuntas placas para automvil existen que consten de dos letras y tres cifras, si el alfabeto consta de
veintisiete letras?
129
UNIDAD 5
6. Cuntos nmeros telefnicos de siete dgitos se pueden formar con los dgitos 1, 3, 5, 7
y 9?
100
C 98?
130
Estadstica
Inferencial I
Descriptiva
TABLA DE COMPROBACIN
Nmero de
preg Respuesta correcta
unta
P5 = 5 = 120
30
2
3
4
5
P3 = 24360
7
P3 = 210
6
7
C3 = 10 maneras.
C4 = 70 maneras.
100
C 98 = 4950
Sugerencias
No pierdas de vista que en las combinaciones no importa el orden de los objetos para llegar a
el resultado.
131
PIJK
n!
i! j! k!
UNIDAD 5
EJERCICIOS DE AUTOEVALUACIN
Cuentas con sesenta minutos para resolver los siguientes ejercicios.
INSTRUCCIONES: Lee con atencin los siguientes reactivos y coloca en el parntesis de la izquierda la
letra de la opcin correcta.
1. (
2. (
Evento.
Espacio muestral.
Probabilidad.
Poblacin.
) Qu nombre recibe el nmero asignado a un evento que mide la creencia de que ese evento
puede ocurrir?
a)
b)
c)
d)
Espacio muestral.
Poblacin.
Probabilidad.
Experimento.
INSTRUCCIONES: Lee con atencin los siguientes reactivos y contesta lo que se te pide.
3. La siguiente tabla muestra a un grupo de 300 estudiantes, de los cuales, 130 son mujeres
y 110 son hombres, 240 son estudiantes de tiempo completo y 60 (40 mujeres y 20 hombres) son
de tiempo parcial.
Mujeres
Hombres
Totales
Tiempo completo
130
110
240
Tiempo parcial
40
20
60
Totales
170
130
300
I. Cul es la probabilidad de que un estudiante elegido al azar sea mujer o de tiempo completo?
II. Cul es la probabilidad de que un estudiante elegido al azar, sea de tiempo completo si se sabe que es
mujer?
132
Estadstica
Inferencial I
Descriptiva
4. En dos contenedores A y B, hay 5000 pantalones de los cuales el 10% estn defectuosos y 4000
pantalones de los cuales el 15% estn defectuosos, respectivamente. Si se extrae al azar un pantaln
de cada contenedor, cul es la probabilidad de que ambos pantalones sean defectuosos?
6. Se disponen de cuatro lienzos de diferentes colores, cuntas banderas bicolores se pueden formar?
7. El director de una empresa desea seleccionar a tres personas de un total de 123, para realizar clculos
aritmticos, de cuntas maneras puede seleccionarlos?
8. Se lanzan tres monedas, cul es la probabilidad de que dos de las monedas caigan soles?
133
UNIDAD 5
CLAVE DE RESPUESTAS.
Nmero de pregunta.
Respuesta correcta.
c
I.
P(M
II.
Tc) = 0.93333
Tc
0.7647
M
P(A
B) = 0.015
40320
12
1815726
3/8
134
Estadstica
Inferencial I
Descriptiva
BIBLIOGRAFA
135
Para evitar cualquier contratiempo al presentar el examen de recuperacin o acreditacin especial debes
considerar las siguientes recomendaciones:
Organizacin:
Presntate al menos con 10 minutos de anticipacin al saln indicado. Debes presentarle al profesor
aplicador, esta Gua resuelta.
Lleva el comprobante de inscripcin al examen y tu credencial actualizada.
Lleva dos lpices del No. 2 o 2 .
No olvides una goma que no manche.
Durante el examen:
Lee con atencin tanto las instrucciones como las preguntas y si tienes alguna duda consltala con el
aplicador.
Contesta primero las preguntas que te parezcan fciles y despus concentra toda tu atencin en las
difciles.
Si te solicitan explicar o desarrollar algn tema, identifica las ideas principales que quieras exponer y
escrbelas de la manera ms concreta y clara que puedas, evita el planteamiento de ideas
innecesarias.
Escribe tus respuestas con letra clara, legible y sin faltas de ortografa.
Al terminar de contestar el examen, revsalo nuevamente para asegurarte que todas las preguntas
estn contestadas.
Centra tu atencin en el examen, no trates de copiar, recuerda que el compaero de junto puede estar
equivocado.
136