Академический Документы
Профессиональный Документы
Культура Документы
La estadstica es una disciplina muy til que se origin a partir de las matemticas. La estadstica descriptiva
es empleada para realizar estudios sistemticos de informacin a travs de la recopilacin, organizacin y
anlisis de datos para una investigacin o una encuesta. Es muy til en el pronstico y prediccin de varios
resultados.
Los datos estadsticos sern datos relacionados con una investigacin. Los datos (cualitativos o cuantitativos),
pueden presentarse una sola vez, repetirse dos veces o ms de dos veces. La repeticin de los valores de la
variable es lo que se denomina como la frecuencia. Las frecuencias de los valores de las variables pueden ser
organizadas en una tabla. Esta tabla se denomina tabla de distribucin de frecuencias. En esta seccin se
incluye el estudio de la distribucin de frecuencias con varios ejemplos. La Distribucin de frecuencia se puede
definir como la tabulacin de los valores de las variables consideradas. Una distribucin de frecuencias se
define como una disposicin ordenada de datos clasificados de acuerdo a la magnitud de las observaciones.
A travs de los ejemplos observa como son organizados los datos en tablas de distribucin de frecuencias, los
grficos asociados y las medidas de tendencia central.
Para variables cualitativas:
Las variables categricas de naturaleza cualitativa son aquellas cuya caracterstica permite clasificar a los
individuos en categoras, por ejemplo, nacionalidad, sexo, color preferido, etc. Los sistemas de representacin
grfica asociados a este tipo de variables son el diagrama de barras y el diagrama circular o grfico de sectores,
en los cuales las barras o los sectores representan las categoras de la variable estadstica.
Ejemplo: En un estudio realizado por una red de cinemas de la ciudad, se encuesta a 8400 personas mayores
de 18 aos, las dos primeras preguntas fueron:
Cul es su estado civil?
Cul es su da favorito de la semana para asistir a cine?
Tablas de distribucin de frecuencias:
Nmero de
personas
(Frecuencia
Absoluta)
Frecuencia
Absoluta
Acumulada
Lunes
500
500
6%
6%
Martes
1200
1700
14,3%
20,3%
Mircoles
1500
3200
17,8%
38,1%
75%
Jueves
1000
4200
11,9%
50%
18%
93%
Viernes
1200
5400
14,3%
64,3%
7%
100%
Sbado
1000
6400
11,9%
76,2%
Domingo
2000
8400
23,8%
100%
ESTADO
CIVIL
Nmero
de
personas
(Frecuenc
ia
Absoluta)
Frecuencia
Absoluta
Acumulada
Porcentaje
(Frecuenc
ia
Relativa)
Frecuencia
Relativa
Acumulada
Soltero
2100
2100
25%
25%
Casado
1680
3780
20%
45%
Unin
Libre
2520
6300
30%
1512
7812
588
8400
Divorciado
Viudo
DA
FAVORITO A
LA SEMANA
PARA
ASISTIR A
CINE
Porcentaje
(Frecuencia
Relativa)
Frecuencia
Relativa
Acumulada
Grficos apropiados
Cantidad de personas
2500
ESTADO CIVIL
7%
2000
SOLTERO
1500
18%
1000
25%
500
30%
20%
CASADO
UNION LIBRE
DIVORCIADO
VIUDO
Dia de la semana
Nmero
de
Alumnos
(Frecuencia
Absoluta)
Frecuencia
Absoluta
Acumulada
Porcentaje
(Frecuencia
Relativa)
Frecuencia
Relativa
Acumulada
0
1
2
3
4
5
6
7
8
9
2
3
1
1
1
3
2
5
7
5
2
5
6
7
8
11
13
18
25
30
6,6%
10%
3,3%
3,3%
3,3%
10%
6,6%
16,6%
23,3%
16,6%
6,6%
16,6%
19,9%
23,2%
26,5%
36,5%
43,1%
59,7%
83,3%
100%
Tomado de: http://www.vadenumeros.es/sociales/frecuencia-absoluta-relativa.htm
Mediana: Del conjunto de datos obtenidos es el valor que al organizar los datos en orden ascendente o
descendente se encuentra a la mitad o centro de los mismos. Divide al conjunto de datos en dos.
Notas de los alumnos organizadas en este caso de mayor a menor:
0,0,1,1,1,2,3,4,5,5,5,6,6,7,7,7,7,7,8,8,8,8,8,8,8,9,9,9,9,9
El 50% de los alumnos obtuvieron notas por encima de 7
El 50% de los alumnos obtuvieron notas por debajo de 7
Moda: Es el dato que ocurre con mayor frecuencia en un conjunto de elementos estudiados.
La nota ms obtenida por los alumnos fue 8.
Datos agrupados:
Ejemplo: Se encuesta a un grupo de 65 personas de mayores de 60 aos sobre cul es su peso en kilogramos,
los resultados son los siguientes:
Peso Menor: 50 Kg, Peso Mayor: 120 kg
Rango: Xmax-Xmin = 120 50 = 70
Intervalos de clase
Lk , Lk 1
[50 - 60)
[60 - 70)
[70 - 80)
[80 - 90)
[90 - 100)
[100 - 110)
[110 - 120]
8
10
16
14
10
5
2
8
18
34
48
58
63
65
12,31 %
15,38 %
24,62 %
21,54 %
15,38 %
7,69 %
3,08 %
Frecuencia Relativa
Acumulada
12,31 %
27,69 %
52,31 %
73,85 %
89,23 %
96,92 %
100 %
Histograma:
Nmero de personas
Peso en kg
Tomado de http://estadisticaeducativaunefm.blogspot.com/2010/05/poligonos-de-frecuencia.html
(C
k 1
nk )
: Sumatoria
Ck : Marcas de clase de los intervalos en los que se han agrupado los datos.
nk : Frecuencia absolutas de los intervalos de clase.
N : Frecuencia total de los datos considerados.
X =
() + () + () + () + () + () + ()
= ,
N k 1
2
*A
Lk
nk
Para calcularla, es necesario ubicar primero en la distribucin de frecuencias el intervalo en donde se encuentra
la mediana la forma de calcularlo es a travs de encontrar la posicin N / 2, el intervalo donde se encuentra la
mediana se conoce como intervalo mediano.
Son 65 datos, el intervalo mediano se encuentra en 65/2, el intervalo mediano es donde se encuentra el dato 33. El
intervalo mediano se encuentra sealado en la tabla con verde, se observa con base en la frecuencia absoluta
acumulada.
Intervalos de clase
Lk , Lk 1
Frecuencia Relativa
Acumulada
[50 - 60)
[60 - 70)
55
65
8
10
8
18
12,31 %
15,38 %
12,31 %
27,69 %
[70 - 80)
[80 - 90)
[90 - 100)
[100 - 110)
[110 - 120]
75
85
95
105
115
16
14
10
5
2
34
24,62 %
21,54 %
15,38 %
7,69 %
3,08 %
52,31 %
73,85 %
89,23 %
96,92 %
100 %
48
58
63
65
X med
65
18
N k 1
2
2
*10 --------- * A ----------------- X
Lk
med 70
16
nk
X med 79,06
d1
X mod Lk A
d
2
1
d1 nk nk 1
d 2 nk nk 1
Primero se localiza el intervalo modal, que es aquel en el que hay la mayor densidad de frecuencia por unidad de
intervalo y luego se aplica la formula
El intervalo modal se encuentra sealado en la tabla con morado, se observa el intervalo que tiene mayor frecuencia
absoluta acumulada.
Intervalos de clase
Lk , Lk 1
[50 - 60)
[60 - 70)
[70 - 80)
[80 - 90)
[90 - 100)
[100 - 110)
[110 - 120]
16
14
10
5
2
34
48
58
63
65
24,62 %
21,54 %
15,38 %
7,69 %
3,08 %
d1
X mod Lk A
d
d
2
1
6
X mod 70 10
77,5
6
Frecuencia Relativa
Acumulada
12,31 %
27,69 %
52,31 %
73,85 %
89,23 %
96,92 %
100 %
ACTIVIDAD PARTE 1.
LEA EL SIGUIENTE TEXTO Y RESUELVA LAS PREGUNTAS PLANTEADAS:
La intensidad de la utilizacin del "mundo online"
En la ltima dcada, la utilizacin de las llamadas "redes sociales", como el Facebook, el Twitter y el MySpace,
ha tenido un incremento exponencial, siendo particularmente popular entre los ms jvenes. Se estima que
en 2011, el Facebook tena ms de 500 millones de usuarios activos. Datos recientes indican que ms de la
mitad de los adolescentes accede a su red social preferida ms de una vez por da y que el 22% lo hace ms de
10 veces por da. Se puede decir que una gran parte del desarrollo social y emocional de esta generacin, tiene
lugar frente a la pantalla de la computadora y del celular.
Para verificar la existencia de asociacin entre la utilizacin de redes sociales del Internet y algunos sntomas
depresivos en adolescentes, se realiza un estudio inicial en donde se define como poblacin los adolescentes
bogotanos, recurrindose a una muestra de conveniencia constituida por 522 alumnos que frecuentan el 8
ao de escolaridad, inscritos en Colegios Privados del Distrito Capital.
Algunos resultados iniciales de la informacin recolectada se muestran a continuacin:
DISTRIBUCION DE LOS ADOLESCENTES ENCUESTADOS SEGN SEXO
No. de Adolescentes
Porcentaje
SEXO
FEMENINO
MASCULINO
(Frecuencia Absoluta)
(Frecuencia relativa)
nk
298
224
fk
57,1%
42,9%
nk
6
7
8
9
10
11
12
13
14
15
51
68
61
75
70
90
43
37
17
10
fk
10%
13%
12%
14%
13%
17%
8%
7%
3%
2%
10%
23%
25%
49%
62%
79%
87%
94%
97%
100%
ES POSIBLE HALLAR
(seale con una x)
Media:
Si ___ No ____
Moda:
Media:
Si ___ No ____
Si ___ No ____
EDAD A LA CUAL
INGRESARON POR
Mediana: Si ___ No ____
PRIMERA VEZ A LAS
REDES SOCIALES
SEXO DE LOS
ADOLESCENTES
ENCUESTADOS
Si ___ No ____
Media:
Si ___ No ____
Si ___ No ____
JUSTIFICACIN
2. Completa la tabla de distribucin de frecuencias para datos agrupados teniendo en cuenta el histograma
presentado para el tiempo que dedican los adolescentes diariamente a las redes sociales:
TABLA DE DISTRIBUCION DE FRECUENCIAS
Lk , Lk 1
Marcas de clase
Ck
(Frecuencia
Absoluta)
nk
Frecuencia
Absoluta
Acumulada
Porcentaje
(Frecuencia relativa)
fk
Nk
[0 - 60)
[60 - 120)
[120 - 180)
[180 - 240)
[240 - 300)
[300 - 360)
[360 - 420)
[420 - 480]
N= 522
3, 4 y 5: Teniendo en cuenta la distribucin de frecuencias realizada en el numeral anterior, calcula las tres
medidas de tendencia central y a partir de estos valores redacta dos conclusiones realizando un anlisis del
tiempo que dedican los adolescentes diariamente a las redes sociales:
CLCULOS
CONCLUSIN
CLCULOS
CONCLUSIN
ACTIVIDAD PARTE 2.
MEDIDAS DE DISPERSIN PARA DATOS NO AGRUPADOS:
6. Las siguientes son las calificaciones de dos estudiantes a primer corte en la asignatura de geometra y
estadstica:
Juan Jos:
4,7
8,9
6,8
4,5
0,4
Ana Mara:
6,5
6,8
8.RANGO
Qu es el Rango?
RANGO
Ejemplo 1:
Rango de las calificaciones de Juan Jos:
Ejemplo 2:
Rango de las calificaciones de Ana Mara:
Calificaciones
Xi
4,7
8,9
6,8
4,5
0,4
8
6,5
6,8
5
Qu es la desviacin media?
Se toma la sumatoria del valor absoluto de la desviacin media de los datos y se divide entre el
nmero de datos.
Cul es su expresin general?
Calificaciones
Xi
4,7
8,9
6,8
4,5
0,4
8
fi
|Xi - X |* fi
|Xi - X |* fi
6,5
6,8
5
N=
N=
D X = _______ =
D X = _______ =
fi
Qu es la varianza?
Calificaciones
Xi
4,7
8,9
6,8
4,5
0,4
8
fi
( Xi - X ) 2* fi
fi
( Xi - X ) 2* fi
6,5
6,8
5
N=
S 2 = _______ =
N=
S 2 = _______ =
Qu es la desviacin tpica?
S 2 S =
S 2 S =
S =
S =
Cierta empresa colombiana lleva un registro del kilometraje de sus 52 vehculos. A continuacin se presentan
los registros del kilometraje semanal en una tabla de distribucin de frecuencias que refleja 7 agrupaciones de
acuerdo al nivel de kilometraje:
Intervalos
(Kilometraje)
[109
[234
[359
[484
[609
[734
[859
Marcas de
clase Ck
Vehculos
fi
234)
359)
484)
609)
734)
859)
984]
Ck * fi
| Ck - X |* fi
1
1
8
14
8
14
6
N=
14.
Media: X = -----------------
X =
15.
Desviacin media: D X = _______ =
16.
Varianza: S 2 = _______ =
17.
Desviacin tpica: S 2 S =
( Ck - X ) 2* fi
S =