Вы находитесь на странице: 1из 82

UNIDAD I: ESTADSTICA

DESCRIPTIVA

Asignatura: Estadstica
Grupo: 206 A

TEMA I: Introduccin a la
estadstica

La Estadstica es una ciencia


que facilita la solucin de
problemas en los cuales
necesitamos
conocer
caractersticas
sobre
el
comportamiento de algn
suceso permite
o evento. inferir
Nos
el
comportamiento de sucesos
iguales
o
similares
sin
necesidad de que estos

Esto nos da la posibilidad de


tomar decisiones acertadas
y a tiempo, as como
realizar proyecciones del
comportamiento del suceso.
Slo se realizan los clculos
y el anlisis con los datos
obtenidos de una muestra
de la poblacin y no con
toda la poblacin.

Conceptos bsicos

Estadstica:
Es la ciencia que se encarga de recolectar,
organizar, resumir y analizar datos para despus
obtener conclusiones. Se divide en
Estadstica Descriptiva y Estadstica Inferencial.

Estadstica descriptiva:
Se encarga de la
recoleccin, organizacin,
presentacin y anlisis de
los datos de una poblacin.

Estadstica inferencial:
Se encarga de analizar la
informacin presentada por la
estadstica descriptiva mediante
tcnicas que nos ayuden a conocer,
con determinado grado de
confianza, a la poblacin. Lo que
nos permite tomar decisiones.

Poblacin:
Conjunto definido de TODOS los
INDIVIDUOS, de donde se observa cierta
caracterstica.
Al nmero de integrantes de la poblacin
se llama tamao de la poblacin y se
representa con la letra N.
Las poblaciones pueden ser finitas o
infinitas.

Poblacin Estadstica:
Conjunto de TODOS los DATOS que se
obtienen al realizar la medicin de una
variable en los elementos de una
poblacin.
Muestra:
Subconjunto de una poblacin, que
intenta reflejar las caractersticas de la
poblacin lo mejor posible.
El nmero de individuos que integran la
muestra, llamado tamao de la
muestra se representa con la letra n.

Individuo:
Es el elemento de la poblacin o de la
muestra que aporta informacin sobre lo
que se estudia.
Variable:
Caracterstica o propiedad de los
individuos que se desea estudiar y se
puede medir o calificar; cambia o vara
con el tiempo en un individuo dado, o
cambia o vara de elemento a elemento.
Ej. Edad, peso, sexo, estado civil,

Dato:
Valor que se obtiene al realizar la
medicin de la caracterstica de la
variable en estudio.
La naturaleza de los datos pueden ser
datos cuantitativos o datos
cualitativos.

Datos Cuantitativos
(nmeros):
Valores obtenidos al
medir peso, estatura,
temperatura, nmero de
Datos Cualitativos
hijos.

(categoras):
Se obtienen al calificar la
caracterstica en cuestin
como el sexo, estado civil,
grado mximo de estudios.

V. CUANTITATIVA:

Variable Continua:
Si la variable puede tomar
cualquier nmero real entre dos
valores dados (decimal o entero).
Ej. El peso de un individuo.

Variable Discreta:
Si la variable slo puede
tomar nmeros enteros.
Ej. El nmero de hijos de un
individuo.

Fuentes de informacin

Encuesta:
Recopilar los datos mediante
el uso de cuestionarios o
entrevistas.

Experimento:
Procedimiento utilizado en la
investigacin
cientfica
para
obtener informacin que permita
conocer el comportamiento de
algn proceso.

Fuentes de Informacin

Investigacin
Documental:
Procedimiento para
obtener
datos mediante la consulta
de informacin ya escrita y
concentrada en
documentos
que se localicen en libros o
revistas en bibliotecas,

ACTIVIDAD 1.
CUESTIONARIO 1
1.

2.

3.

4.

5.

Cul es la importancia de la estadstica


en la contabilidad?
Cul es la diferencia entre la
estadstica descriptiva e inferencial?
Define los conceptos de poblacin,
muestra e individuo.
Qu es una variable y como se
clasifican? Menciona 3 ejemplos de
cada tipo
Cules son las principales formas de
obtener datos (informacin)?

ACTIVIDAD II.
CUESTIONARIO 2

Retroalimentacin del cuestionario con r


espuestas

ESTADISTICA UNIDAD I.docx

TEMA II: Organizacin de


la informacin

La ordenacin es el proceso mediante el


cual los datos estn acomodados de tal
manera que se establece un orden
(ascendente o descendente) entre ellos.

Hay dos mtodos comunes para


variables cuantitativas:

Listado en orden
ascendente
Mtodo de tallo y hojas

Ejemplo

Considera que la variable de estudio es


el peso de 25 estudiantes. Los pesos se
encuentran en la siguiente tabla:
Peso de 25 estudiantes
(en kg)
40
43
48
51
49
56
44
42
55
52
52
62
44
50
59
63
50
56
55
45
57
66
63
51
58

Listado en orden
ascendente

El proceso consiste en ordenarlos de


menor a mayor

Peso de 25 estudiantes
(en kg)
42
40
48
51
49
56
44
43
55
52
52
62
44
50
59
63
50
56
55
45
57
66
63
51
58

Peso de 25 estudiantes
(en kg)
40
45
51
55
59

42
48
51
56
62

43
49
52
56
63

44
50
52
57
63

44
50
55
58
66

Mtodo de tallo y hojas

Si los nmeros de los datos


estn formados por dos dgitos,
se hace una columna con el
primer dgito (decenas) y a la
derecha de cada uno de ellos se
escribe, en fila, slo el segundo
dgito (unidades) de cada uno
de los datos que tengan el
mismo primer dgito.

Datos sin ordenar:

Datos ordenados:

4
5
6

Peso de 25 estudiantes
(en kg)
2,0,8,9,4,3,4,5
42
40
48
51
49
1,6,5,2,2,0,9,0,6,5,7,1 56 44 43 55 52
52
62
44
50
59
,8
2,3,6,3
63
50
56
55
45
57
66
63
51
58

4
5
6

0,2,3,4,4,5,8,9
0,0,1,1,2,2,5,5,6,6,7,8
2,3,3,6
,9

Doble tallo

Una variante de este mtodo es en lugar


de dividir en un grupo las decenas, se
divide en dos grupos. El primero
abarcando los dgitos del 0 al 4 y el
segundo del 5 al 9.
El ejemplo
queda:

4
4
anterior
5
5
6
6

0,2,3,4,4
5,8,9
0,0,1,1,2,2,
5,5,6,6,7,8,9
2,3,3
6

Caso de variables
cualitatitivas

El procedimiento es:

Se identifican todos los valores


diferentes y se acomodan en columna.

Se agrega una segunda columna en


donde se van registrando, mediante una
lnea vertical, la veces que aparece el
valor dado.

Ejemplo

Considera que la variable de estudio es


el color de playera de 25 estudiantes.
Los colores se encuentran en la
siguiente tabla:
rosa
gris
rosa
gris
gris

azul
blanco
azul
azul
blanco

blanco
caf
caf
blanco
caf

azul
negro
blanco
rosa
negro

rosa
blanco
blanco
gris
verde

Color

rosa
gris
rosa
gris
gris

azul

blanc azul
o
blanc caf negro
o
azul
caf blanc
o
azul
blanc rosa
o
blanc caf negro
o

rosa
blanc
o
blanc
o
gris
verde

Azul
Blanco
Caf
Gris
Negro
Rosa
Verde

Frecuen
cia

IIII
IIII I
II I I
IIII
II
IIII
I

Tabla de Frecuencia de
Datos

Una vez que se tenga ordenados los


datos, se acomodan en la Tabla de
distribucin de frecuencias o tabla
de frecuencias.

La tabla es bsicamente una tabla


de valores x-y, dnde x representa
el dato y y representa la
frecuencia.

La frecuencia es el nmero de veces que


aparece cada dato.

Hay dos clases de tablas de frecuencias:

Para datos NO agrupados.


Para datos agrupados.

Tabla de frecuencias para


datos NO agrupados

Est formada por dos columnas: una


para la variable xi y la otra para su
frecuencia f, a esta frecuencia se le
llama frecuencia absoluta o frecuencia
observada.

Ejemplo

Tabla de frecuencias de los pesos en kg


de 25 alumnos.

Peso de 25 estudiantes
(en kg)
40
45
51
55
59

42
48
51
56
62

43
49
52
56
63

44
50
52
57
63

44
50
55
58
66

xi

xi

40

52

42

55

43

1
2

56

44

57

1
1

45

58

48

59

49

62

2
1

50
51

63
66

25

Frecuencia relativa y
acumulada

Por lo regular, se agregan dos columnas:


la de la frecuencia relativa fr y la de la
frecuencia acumulada fa.
La frecuencia relativa se obtiene
mediante el cociente de la frecuencia y
el nmero total de datos, esto es fr =
f/n.
La frecuencia acumulada se obtiene
sumando las frecuencias anteriores a las
frecuencias de un dato dado.

Ejemplo
1/25
xi

fr

40

42

0.0
4
0.0

43

44

45

48

49

50

51

fa
1

xi

fr

fa

52

14

55

56

57

0.0
8
0.0
8.0
0
8
0.0

58

59

2/25

4
0.0
4
0.0
8
0.0

4
0.0
4
0.0

7
8

4
0.0
8
0.0
8

10

62

12

63

66

5
6

Tot
al

4
0.0
4
0.0
4
0.0
4
0.0
8
0.0
4
1

16
18
19
20
21
22
24
25

25
Siempre es 1

Siempre
es el
nmero
total

Intervalo de clase

En ocasiones es conveniente
acomodar los datos en pequeos
grupos de igual tamao, llamados
intervalos de clase.

El punto medio o marca de clase


xi, se obtiene
con:
Lmite
inferior + lmite
Marca de
2
superior
clase =

El tamao del intervalo se obtiene

Ejemplo
Lmite inferior

Lmite superior

Intervalo de clase
38 42
43 47
48 52
53 57
58 62
63 67

+5

+5

Lm inf + Lim sup


2

Punto medio xi
40
45
50
55
60
65

+5

Lmite verdadero del


intervalo
Frontera de clase o lmite verdadero del
intervalo: de clase Punto medio xi
Intervalo
37.5 42.5
40
5/2 = 2.5
45
40 + 2.5
40 2.5 42.5 47.5
47.5 52.5
50
52.5 57.5
55
57.5 62.5
60
62.5 67.5
65

+5

+5

Tabla de intervalos con


lmites verdaderos
Usando smbolos
Est incluido
No est incluido
de desigualdad

Intervalo
de clase
37.5 x
42.5
42.5 x
47.5
47.5 x
52.5
52.5 x
57.5

<

Punto
medio
xi
40

<

45

<

50

<

55

Usando
Est incluido
No est incluido

parntesis y
corchetesPunto
Intervalo
de clase

[37.5
[42.5
[47.5
[52.5
[57.5
[62.5

,
,
,
,
,
,

42.5)
47.5)
52.5)
57.5)
62.5)
67.5)

El tamao del intervalo es

medio
xi
40
45
50
55
60
65

Cmo elegir el intervalo?

Si por alguna razn no es fcil decidir el


ancho del intervalo y el nmero de ellos,
se pueden utilizar las siguientes
frmulas:
K
= 1 + 3.3 log (n)
Donde K = nmero aproximado de
clases
n =
de datos.
Amplitud de
losnmero
intervalos
= Rango / K
Donde Rango = diferencia entre el
dato mayor
y el dato menor.

Ejemplo

Para el ejemplo de los datos de los pesos


de 25 alumnos, el valor de K:
K = 1 + 3.3 log (n) = 1 + 3.3 log (25) =
5.6.
Por lo tanto se requieren
aproximadamente
6
intervalos.
Y la amplitud de los intervalos sera:
Amplitud = Rango / K = (66 40) / 5.6 =
4.64.
Aproximadamente 5 unidades es la
amplitud de los intervalos.

Tabla de distribucin de
frecuencias para datos
agrupados

Se elabora con los intervalos de clase,


sus puntos medios y las frecuencias
correspondientes para cada uno de los
Datos
xi
f
52
2
intervalos.
55
2
40
1
agrupados
Interval
Punto
f
42

56

43

57

44

45

o de
clase

medio
xi

58

38 42

40

2
4

59

43 47

45

48

62

49

50

63

48 52

50

66

53 57

55

51

Tota
l

25

58 62

60

Datos sin
agrupar

3
3
2

Se agregan las columnas de frecuencia


relativa fr y frecuencia acumulada
Interva
Punto
f
fr
Fa
fa:
2/25
lo de
clase
38 42
43 47
48 52
53 57
58 62
63- 68

medio
xi
40
45
50
55
60
65
Total

2
4
8
5
3
3
25

0.08
0.16
0.32
0.20
0.12
0.12
1

2
6
14
19
22
25

4/25
8/25

Por ltimo se agregan las columnas:


Frecuencia porcentual, f% %f,
se obtiene multiplicando la frecuencia
relativa fr x 100.
Frecuencia relativa acumulada fra,
se obtiene sumando las frecuencias
relativas anteriores a un dato dado.
Frecuencia porcentual acumulada, f
%a, se obtiene sumando las
frecuencias porcentuales acumuladas a
un dato dado.

Tablas de frecuencias
absoluta, relativa y
acumulada0.08 x
Interva
lo de
clase
38 42
43 47
48 52

Punto
medio
xi
40
45
50

2
4
8

53 57

55

58 62

60

fr

0.0
8
0.1
6
0.3
2
0.2
0
0.1

f%

100

fa

8
16
32
20
12

14

12
100

19

2
6

22

0.08 x
100
2/25

fra f%a
0.0
8
0.2
4
0.5
6
0.7

8
24
56
76

6
0.8
88
8
1 100

TEMA III. Representacin


grfica de Datos

Existen dos tipos de grficas mas


usuales:
Polgono de Frecuencias
Histograma

Otros grficos:
Grfica de barras
Pictograma
Grfico Circular o de pastel.

Polgono de Frecuencias

Es la representacin mediante un
grfico de lnea. En l se muestra la
distribucin de frecuencias y est
formado por segmentos de lnea que
unen los puntos correspondientes a
la frecuencia de cada una de las
clases.

El eje x representa el dato xi


y el eje y las frecuencias.

Ejemplo
Polgono de Frecuencias
10
8
6
Intervalo
de clase

Punto medio
xi

38 42

40

43 47

45

48 52

50

53 57

55

58 62

60

63 - 68

65

3
Total

4
2

25

0
35

40

45

50

xi

55

60

65

70

El eje y puede ser sustituido por las


frecuencias relativas o porcentuales.
Polgono de Frecuencia Relativa

0.35
0.3
0.25

fr

0.2
0.15
0.1
0.05
0
35

40

45

50

xi

55

60

65

70

Polgono de Frecuencia Porcentual


35
30
25

% f 20
15
10
5
0
35

40

45

xi

50

55

60

65

Histograma
Es la representacin grfica de
los datos mediante una sucesin
de rectngulos.
Est formado por rectngulos cuya
anchura representa a cada uno de
los intervalos y la altura corresponde
a la frecuencia.
En el eje x estarn los lmites
verdaderos, los puntos medios y en
el eje y las frecuencias.

Ejemplo

Histograma

Intervalo
de clase

Punto medio
xi

38 42

40

43 47

45

48 52

50

53 57

55

58 62

60

63 - 68

65

3
Total

10
8
6
f

4
2
0

35

40

45

50
xi

55

60

65

25

Tambin podemos usar la frecuencia


relativa y la frecuencia porcentual.
Histograma con frecuencias relativas

0.35
0.3
fr

0.25
0.2
0.15
0.1
0.05
0

35

40

45

xi

50

55

60

65

Histograma con frecuencias porcentuales


35
30
25
%f

20
15
10
5
0

35

40

45

50
xi

55

60

65

Pirmide Poblacional

Una variante en el histograma es


colocar en el eje x de tal manera
que las columnas quedarn en forma
horizontal, es muy comn en datos
poblacionales.

Ojiva

Es la representacin grfica de las


frecuencias acumuladas mediante un
grfico de lnea. Se muestra la
distribucin de frecuencias
acumuladas de los datos.

En el eje x estarn los puntos


medios y en el eje y las
frecuencias acumuladas.

Ejemplo
Interva
lo de
clase
38 42
43 47
48 52
53 57
58 62
63- 68

Punto
medio
xi
40
45
50
55
60
65
Total

fr

fa

2
4
8
5
3
3
25

0.08
0.16
0.32
0.20
0.12
0.12
1

2
6
14
19
22
25

Ojiva
30
25

25
22

20

19

fa 15

14

10
6

5
00
35

40

45

50

xi

55

60

65

Usando la frecuencia acumulada y la


frecuencia porcentual.

Interval
Punto
o de
medio xi
clase
38 42
40

fr

f%

fa

fra

f%a

45

16

48 52

50

32

14

53 57

55

20

19

0.0
8
0.2
4
0.5
6
0.7

43 47

0.0
8
0.1
6
0.3
2
0.2

24
56
76

Ojiva con frecuencia relativa acumulada


1
0.88

0.8

0.76

0.6

fra

0.56

0.4
0.24

0.2
0.08

00
35

40

45

50

xi

55

60

Ojiva con frecuencia porcentual acumulada


100
90
80
70
60
f%a 50
40
30
20
10
00
35

88
76

56

24

40

45

50

xi

55

60

65

Grfico Circular

Tambin es llamado grfico de pastel.

Slo se representan datos de frecuencias


relativas o frecuencias porcentuales.

Se debe dividir el rea del crculo de


manera proporcional a las frecuencias.

Agregaremos una columna a nuestra


tabla de frecuencias Frecuencia
relativa al crculo, multiplicando (fr)
(360), para mostrar la parte
proporcional de crculo medida en
grados que corresponde a cada
intervalo.

Ejemplo 1
Interval
o de
clase
38 42
43 47
48 52
53 57
58 62
63- 68

Punto
medio
xi
40
45
50
55
60
65
Total

2
4
8
5
3
3
25

fr

0.08
0.16
0.32
0.20
0.12
0.12
1

0.08 x
360

(fr )
(360)

28.8
57.6
115.2
72
43.2
43.2
360

0.16 x
360

Grfico Circular
40; 8%
65; 12%
45; 16%
60; 12%
55; 20%
50; 32%

Ejemplo 2
Color

Azul
Blanco
Caf
Gris
Negro
Rosa
Verde

Frecuen
cia

IIII
IIII I
II I I
IIII
II
IIII
I

Conteo

4
7
3
4
2
4
1

Color de Playera
Azul
Negro

Blanco
Rosa

16%

4%

8%
16%

Caf
Verde

Gris

16%
28%

12%

Otros Grficos
La grfica de barras se traza similar
al Histograma, slo que las barras se
dibujan separadas unas de otras.
La escala en el eje x es para
mostrar categoras o intervalos de
nmeros NO consecutivos.

Carrera
Medicina
Mecnica
Civil
Agronoma
Fsico Matemticas
Leyes
Contadura

Alumn
os
8
11
8
3
3
6
11

Eleccin de Carrera

11

11

8
3

Pictograma

Similar al de barras, slo que se


sustituyen por figuras, generalmente
relacionadas con la variable estudiada.

TEMA IV. Medidas de


Tendencia Central

TEMA V. Medidas de
dispersin

La dispersin o variacin es una


caracterstica importante de un conjunto
de datos porque intenta dar una idea de
cun esparcidos se encuentran stos.

Existen diversas medidas de dispersin,


algunas de ellas son:

Rango
Desviacin media
Desviacin estndar
Varianza

Rango

Mide
la amplitud de los valores de la
muestra y se calcula por diferencia entre
el valor mas elevado (lmite superior) y
el valor mas bajo (limite inferior)
Ejemplo 1: Ante la pregunta sobre nmero
de hijos por familia, una muestra de 12
hogares marc las siguientes respuestas:
2, 1, 2, 4, 1, 3, 2, 3, 2, 0, 5, 1

Varianza (datos no
agrupados)

Mide la distancia entre los valores de la


serie y la media. Se calcula como la
sumatoria de las difeencias al cuadrado
entre
cada
valor
y
la
media,
multiplicadas por le nmero de veces
que se ha repetido cada valor.

Ejemplo: Calcula la varianza para los


siguientes datos:
2 1 2 4 1 3 2 3 2 0 5 1
Aplicando la frmula:

Desviacin Estndar (Datos no


agrupados)

Llamada desviacin tpica, es una


medida
de
dispersin
usada
en
estadstica cuyo valor seala cuanto
tiende a alejarse los valores puntuales
del promedio en una distribucin
La
desviacin
estndar es la raz
cuadrada
de
la
varianza

Ejemplo: Tomando los datos del ejemplo de


varianza, calcular la desviacin estndar:
2 1 2 4 1 3 2 3 2 0 5 1

Coeficiente de variacin

Es una medida de dispersin que se


utiliza
para
poder
comparar
las
desviaciones
de
poblaciones
con
diferentes medias y se calcula como
cociente entre la desviacin tpica y la
media.

Ejemplo: En dos cursos los promedios que


sacaron los alumnos fueron 6.1 y 4.3
respectivamente y las desviaciones
estndar respectivas fueron 0.6 y 0.45
respectivamente. En qu curso hay
mayor dispersin?
El curso B muestra mayor
dispersin de sus datos

Ejercicio:
En la siguiente tabla se muestran lo
salarios de 10 trabajadores en distintos
puestos. Realiza el anlisis de varianza,
desviacin estndar y coeficiente de
variacin:

Salario (miles de pesos)

Puesto
A

12

10

12

11

12

14

15

12

11

13

1
1

Varianza y desviacin
estndar (Datos agrupados)

Cuando los datos se encuentren


agrupados en tablas de frecuencias, el
significado es el mismo, sin embargo la
manera de calcularla la varianza es
distinta, aunque la desviacin estndar
sigue siendo la raz cuadrada de la
varianza:

Fin de la unidad I