Академический Документы
Профессиональный Документы
Культура Документы
MANUAL DE ESTADSTICA
Sistema de Gestin
de la Investigacin
UPN
MANUAL DE
ESTADSTICA
Profesor: MsC. Luis Alberto Rubio Jcobo
pg. 2
PRESENTACIN
El equipo de docentes que coordina las propuestas y la elaboracin de instrumentos para
el Sistema de Gestin de la Investigacin de la Universidad Privada del Norte, pone a su
disposicin el Manual de Estadstica.
Este manual pretende ser un material de consulta bsica para docentes y estudiantes de
las diferentes carreras profesionales de nuestra universidad, en cuanto al uso adecuado
de la estadstica, requerida en diversos momentos del proceso investigativo.
pg. 3
NDICE
LA ESTADSTICA .............................................................................................................................. 8
1.
DEFINICIN. .................................................... 8
2.
UNIVERSO. .................................................... 14
2.
POBLACIN. ................................................... 14
A. SEGN SU EXTENSIN: ....................................... 14
B. SEGN SU MBITO O NATURALEZA: ............................. 14
3.
MUESTRA. .................................................... 14
4.
5.
VARIABLE. .................................................... 15
6.
PARMETRO. .................................................. 15
pg. 4
7.
ESTIMADOR. ................................................... 15
8.
9.
2.
3.
4.
5.
pg. 5
3.
2.
3.
A.
B.
B.
B.
pg. 6
C.
D.
E.
F.
G.
pg. 7
LA ESTADSTICA
1. DEFINICIN.
La Estadstica es una ciencia que nos ofrece un conjunto de mtodos y tcnicas para
recopilar, organizar, presentar, analizar e interpretar un conjunto de datos respecto a variables
en estudio de una poblacin, con el fin de obtener conclusiones y tomar decisiones sobre
determinados hechos o fenmenos en estudio.
La estadstica es una rama de la matemtica y es parte del mtodo cientfico. En la actualidad,
para hacer investigacin cientfica se necesita conocer de estadstica.
2. CLASIFICACIN DE LA ESTADSTICA
La Estadstica se clasifica de la siguiente manera:
2.1. Estadstica Descriptiva
Es el rea de la Estadstica que describe y analiza una poblacin, sin pretender sacar
conclusiones de tipo general. Es decir, las conclusiones obtenidas son vlidas slo para
dicha poblacin.
2.2. Estadstica Inferencial
Es el rea de la Estadstica, cuyo propsito es inferir o inducir leyes de comportamiento de
una poblacin, a partir del estudio de una muestra. Es decir, las conclusiones obtenidas a
partir de una muestra, son vlidas para toda la poblacin.
PARTE I:
DISEOS DE INVESTIGACIN
Segn Hernndez, Fernndez y Baptista (2006), una vez que se ha realizado el planteamiento del
problema, se ha definido el alcance de la investigacin y se formularon las hiptesis, se debe
visualizar la manera prctica y concreta de responder a las interrogantes de investigacin, y
cumplir con los objetivos propuestos.
Para esto se debe seleccionar o desarrollar uno o ms diseos de investigacin y aplicarlos al
contexto particular de cada estudio.
El diseo se refiere al plan o estrategia concebida para obtener la informacin que se desea.
pg. 8
A2.
DISEOS DESCRIPTIVOS
Tienen como objetivo indagar la incidencia
de las modalidades o niveles de una o ms
variables en una poblacin. Los estudios
son puramente descriptivos, y cuando
establecen hiptesis, son puramente
descriptivas.
En ciertas ocasiones, el investigador
pretende
realizar
descripciones
comparativas entre grupos o subgrupos de
personas, objetos o indicadores.
Ejemplos:
1. En las encuestas pre-electorales de opinin sobre las tendencias electorales de
la poblacin, su objetivo es describir en una eleccin especfica- el nmero de
electores que se inclinan por los diferentes candidatos contendientes, es decir se
centran en la descripcin de las preferencias del electorado.
pg. 9
A3.
DISEOS DESCRIPTIVOS
CORRELACIONALES
Describen relaciones entre dos o ms
categoras, conceptos o variables en
momento
determinado.
A
veces,
nicamente en trminos correlacionales,
otros en funcin de la relacin causaefecto (causales).
Los diseos correlacionales-causales
pueden limitarse a establecer relaciones
entre variables sin precisar sentido de
causalidad
o
pretender
analizar
relaciones causales.
El inters es la relacin
entre variables
Correlacin
X1
Y1
X2
Y2
X3
Y3
Relacin causal
X1
Y1
X2
Y2
X3
Y3
Ejemplos:
1. Un estudio pretende indagar la relacin entre la atraccin y la confianza durante
el noviazgo en parejas jvenes, observando cun vinculadas estn ambas
variables (correlacional).
2. Un estudio pretende analizar quines compran ms en las megatiendas, los
hombres o las mujeres (correlacional: asocia gnero y nivel de compras).
3. En un estudio se tiene inters en analizar las causas por las cuales algunos
clientes, y otros no, han utilizado el crdito que les fue otorgado por Saga
Falabella. (causal, retrospectivo).
4. En un estudio se desea indagar si la antigedad provoca o no mayor lealtad a la
empresa y por qu. (causal, prospectivo).
pg. 10
B1.
DISEOS DE TENDENCIA
Analizan cambios a travs del tiempo dentro de una poblacin. Se puede
observar o medir a toda la poblacin, o bien, tomar una muestra de ella,
cada vez que se observen o midan las variables o las relaciones entre
stas. Es importante sealar que los sujetos del estudio no son los mismos,
pero la poblacin s.
Ejemplo
1. Analizar la manera en que evoluciona la percepcin sobre tener relaciones
sexuales prematrimoniales en las mujeres adultas jvenes (20-25 aos) de
Trujillo, hasta el ao 2020. Las mujeres aumentan de edad, pero siempre habr
una poblacin de mujeres entre esas edades. La poblacin particular en estudio
son las mujeres adultas jvenes de 20-25 aos.
B2.
B3.
DISEOS DE PANEL
Un mismo grupo de participantes (panel) es observado o medido en todos
los tiempos o momentos. En estos diseos, adems de conocer los cambios
grupales, se conocen los cambios individuales.
Ejemplo
1. En un estudio se analiza la evolucin de las pacientes de cncer de mama. En la
primera etapa, se evalan un mes despus de iniciar la terapia. La segunda, seis
meses despus; la tercera, una ao despus; y la cuarta, dos aos despus.
Siempre se incluirn a las mismas pacientes, descartndose a quienes fallecen.
2. Se analiza en rendimiento de los motores de autos tico pertenecientes a una
compaa de taxis a travs del tiempo. El rendimiento se analiza anualmente,
desde su compra por un lapso de cinco aos. Los autos son siempre los mismos.
pg. 11
A. DISEOS PRE-EXPERIMENTALES
A1.
O1
A2.
O2
B. EXPERIMENTOS PUROS
Los experimentos puros son aquellos que renen los dos requisitos para logar el
control y la validez interna: 1) grupos de comparacin, y 2) equivalencia de grupos.
B1.
O1
RG2:
O2
B2.
O1
O2
RG2:
O3
O4
pg. 12
B3.
O1
O2
RG2:
O3
O4
RG3:
O5
RG4:
O6
Constituye una mezcla de los dos diseos anteriores. Utiliza dos grupos
experimentales y dos grupos control. Los dos primeros reciben el
tratamiento experimental y los segundos no reciben tratamiento. Slo a uno
de los grupos experimentales y a uno de los grupos control se les administra
la preprueba. A los cuatro grupos se les aplica la posprueba. Los sujetos se
asignan en forma aleatoria.
B4.
B5.
DISEOS FACTORIALES
Se utilizan para analizar experimentalmente el efecto sobre la(s) variable(s)
dependiente(s) que tiene la manipulacin de ms de una variable
dependiente o factor. Cada variable independiente puede tener dos ms
niveles de presencia. La construccin bsica de un diseo factorial consiste
en que todos los niveles de cada variable independiente se combinan con
todos los niveles de las otras variables independientes.
C. CUASI-EXPERIMENTOS
En los diseos cuasi-experimentales tambin se manipulan deliberadamente, al
menos, una variable independiente para analizar su efecto y relacin con una o
ms variables dependientes. Se diferencian de los experimentos puros en el
grado de seguridad o confiabilidad que pueda tenerse sobre la equivalencia inicial
de los grupos. En estos diseos, los sujetos no se asignan al azar a los grupos
ni se emparejan, sino que dichos grupos ya estn formados antes del
experimento: son grupos intactos.
C1.
G 1:
O1
G 2:
O2
pg. 13
O1
O2
G2:
O3
O4
PARTE II:
DEFINICIONES ESTADSTICAS
1.
UNIVERSO.
Es el conjunto de individuos, objetos o entes que tienen caractersticas comunes, definidas en
forma general en un espacio y tiempo.
Ejemplo:
Conjuntos de alumnos, conjunto de docentes universitarios, conjunto de de pacientes, conjunto de
clientes, conjunto de proveedores, conjunto de viviendas, conjunto de establecimientos, conjunto de
documentos, etc.; de una determinada regin o zona en un tiempo determinado.
2.
POBLACIN.
Es un conjunto grande y completo de individuos, elementos o unidades que presentan como
mnimo una caracterstica en comn y observable. Para definir una poblacin esta debe
contener los siguientes elementos: CONTENIDO, ESPACIO Y TIEMPO.
Al nmero de elementos de una poblacin de denota por N.
Una poblacin puede clasificarse de la siguiente manera:
A. SEGN SU EXTENSIN:
Poblacin Finita: es aquella que tiene un determinado nmero de elementos.
Poblacin Infinita: es aquella cuyos elementos no se pueden contar.
3.
MUESTRA.
Es una parte o un subconjunto de la poblacin en estudio. Tambin se puede decir que es
una coleccin de unidades de muestreo seleccionados de un marco muestral o de varios
marcos muestrales. Al nmero de elementos de la muestra se denota por n.
Una muestra tiene las siguientes caractersticas:
a. Es representativa.
b. Es adecuada.
c. Homognea.
4.
UNIDAD DE ESTUDIO.
Es el animal persona o cosa de quien se dice algo. Es el elemento quien nos va a dar la
informacin. Es el individuo u objeto del cual se toman las mediciones u observaciones.
Ejemplos:
pg. 14
5.
Un docente, un auxiliar de educacin, un votante, una factura, una empresa, una botella de cerveza,
una universidad, una vaca, una gota de sangre, etc.
VARIABLE.
Una variable es una caracterstica de estudio de una poblacin. Una variable es lo que se
quiere evaluar en una investigacin. Las caractersticas toma diferentes valores que varan de
individuo a individuo o de objeto a objeto. Aquellas caractersticas que permanecen
inalterables en las unidades de estudio reciben el nombre de constantes.
Generalmente, las variables se designan con las ltimas letras maysculas del abecedario: X,
Y, Z; y los valores de las variables se designan con letras minsculas: xi , yi , etc.
Las variables se clasifican de la siguiente manera:
Por su relacin:
Por su escala de medicin:
Por su naturaleza:
Ejemplos:
Unidad de estudio
Estudiante
Variable
Nmero
de
trabajadores,
aos
de
funcionamiento, ganancias, etc
Empresa
PYME
Variable
Cualidad
O
Atributo
Cualitativa
Nominal
No orden
6.
Cuantitativa
Ordinal
Discreta
Continua
Orden
Conteo
Medicin
Cantidad
o
nmero
PARMETRO.
Es un valor, una cantidad, un indicador que se obtiene con informacin de la poblacin.
Dentro de estos tenemos:
a. El promedio poblacional
b. La varianza poblacional.
c. La proporcin poblacional, etc.
7.
ESTIMADOR.
Es un valor, una cantidad, un indicador que se obtiene con informacin de la muestra. Dentro
de estos tenemos:
a. El promedio muestral.
b. La varianza muestral.
c. La proporcin muestral, etc.
pg. 15
8.
Observacin
Entrevista (cara a cara)
Encuestas
Experimentacin
Focus Groups
Lluvia de ideas
Otras
OBSERVACIN:
La observacin es una tcnica que implica seleccionar ver y registrar sistemticamente, la
conducta y caractersticas de seres vivos, objetos o fenmenos. La observacin de la
conducta humana es una tcnica de recoleccin de datos muy utilizada que puede llevarse
a cabo de diferentes formas:
a. Observacin participativa: El observador participa en la situacin que observa
b. Observacin no participativa: El observador no participa en la situacin que observa
Las observaciones pueden servir para diferentes propsitos. Pueden dar informacin
adicional y ms confiable de la conducta de las u.e. que las entrevistas o los cuestionarios.
Los cuestionarios pueden ser incompletos ya que se pueden olvidar algunas preguntas o
porque los entrevistados olvidan o no desean contestar algunas cosas. Con la observacin
se puede, entonces, verificar la informacin recolectada (especialmente sobre temas como
alcoholismo, drogadiccin, sida,) pero tambin puede ser una fuente primaria de
informacin (observacin sistemtica de los juegos de los nios).
La observacin de la conducta humana puede formar parte de algn estudio, pero como
consume tiempo se usa con mayor frecuencia en estudios de pequea escala.
ENTREVISTA:
La entrevista es una tcnica de recoleccin de datos que involucra el cuestionamiento oral
de los entrevistados ya sea individualmente o en grupo. Las respuestas a las preguntas
durante la entrevista pueden ser registradas por escrito o grabadas en una cinta. La
entrevista puede conducirse con diferentes grados de flexibilidad.
Las entrevistas utilizan una cdula para asegurar que se discuten todos los puntos, pero
dando suficiente tiempo y permitiendo seguir cualquier orden. El entrevistador puede hacer
preguntas adicionales para obtener tanta informacin adicional como sea posible, Las
preguntas son abiertas y no hay restricciones para las respuestas.
Este mtodo poco estructurado de hacer las preguntas puede ser til para entrevistas
individuales o grupales con informantes claves.
Un mtodo de entrevista flexible es til si el investigador sabe poco del problema o de la
situacin que esta investigando. Se aplica en estudios exploratorios y en los estudios de
caso.
ENCUESTAS:
Hoy en da la palabra "encuesta" se usa ms frecuentemente para describir un mtodo de
obtener informacin de una muestra de individuos. Una "encuesta" recoge informacin de
una "muestra. Las encuestas pueden ser usadas para estudiar poblaciones humanas o no
humanas (por ejemplo, objetos animados o inanimados, animales, terrenos, viviendas).
Las encuestas pueden ser clasificadas por su mtodo de recoleccin de datos: las
encuestas por correo, telefnicas y entrevistas en persona son las ms comunes. En los
mtodos ms nuevos de recoger datos, la informacin se entra directamente a la
computadora ya sea por un entrevistador adiestrado o an por la misma persona
entrevistada. Un ejemplo bien conocido es la medicin de audiencias de televisin usando
pg. 16
9.
PARTE III:
COMO DETERMINAR UNA MUESTRA
1.
DEFINICIN DE MUESTREO
Es una herramienta de la investigacin cientfica, su funcin bsica es determinar qu parte
de la realidad en estudio (poblacin o universo) debe de examinarse con la finalidad de hacer
inferencias sobre el TODO de la que procede.
El muestreo estadstico es un enfoque sistemtico que se refiere al proceso de seleccin de
los elementos, sujetos o casos de una poblacin. Para que el muestreo est bien realizado es
necesario que los elementos escogidos representen bien a toda la poblacin. Si la muestra no
cumple este cometido se dice que la muestra es sesgada o tendenciosa; en el caso
contrario, cuando la muestra ha sido bien seleccionada, se habla de muestra representativa.
2.
pg. 17
g.
h.
i.
j.
3.
B. MARCO MUESTRAL.
Es una lista o registro actualizado de todas las unidades de la poblacin, de manera que
puedan ser ordenadas numricamente desde el primer elemento hasta el ltimo elemento
(N) de la poblacin. Las diferentes especificaciones que se tenga del marco muestral
definirn su alcance geogrfico, periodo de estudio y su fuente. De este marco muestral se
seleccionarn los elementos de la muestra.
Ejemplo:
Base de datos de pacientes atendidos en el Hospital Regional Docente. Ao 2000.
Historias Clnicas del Servicio de Pediatra del HRDT.
Directorio de los mdicos del Hospital
Plano de viviendas del distrito de Trujillo.
Listado de los alumnos matriculados en la UNT-2004.
Listado de las facturas de las ventas del primer trimestre de una Farmacia.
Listado de todas las farmacias del Departamento de La Libertad.
C. ERROR DE ESTIMACIN:
El error de estimacin es la diferencia que existe entre el valor de una estimacin muestral
y el valor del parmetro obtenido de la poblacin.
Esta clase de error es llamado tambin error de muestreo.
-E
+
E
Ejemplo:
x+
z
Generalmente este error es desconocido, por lo tanto el investigador tienen fijar este error
(variacin mxima entre el estimador y el parmetro).
Esta diferencia recibe el nombre de Precisin del estimador o error tolerable.
Este error se expresar en valores absolutos: 2 aos, 3 aos o en trminos relativos:
5%, 8 %, 0.002.
D. ERROR NO MUESTRAL:
Estos errores, son llamados tambin errores ajenos al muestreo o errores de no muestreo.
No se pueden medir fcilmente, y aumentan a medida que aumenta el tamao de la
muestra. Los tipos de errores no muestrales que suelen presentarse son:
Definicin equivocada del problema,
Definicin defectuosa de la poblacin;
Marco muestral imperfecto o desactualizado,
La no-respuesta,
El sesgo de respuesta,
pg. 18
1
-
/
2 x
st
Valor Z
Bilateral
1.64
1.96
2.57
Unilateral
1.28
1.64
2.32
Valor Z
0.842
1.282
1.645
2.326
4.
TIPOS DE MUESTREO
A. MUESTREO PROBABILSTICO:
A1. Muestreo aleatorio simple (m.a.s.):
Si se selecciona una muestra de tamao n de una poblacin de tamao N elementos,
de tal manera que cada elemento tiene la misma probabilidad de pertenecer a la
muestra, el procedimiento de muestreo se denomina Muestreo Aleatorio Simple
(M.A.S) y a la muestra as obtenida se la llama muestra aleatoria simple (m.a.s). Es el
muestreo ms sencillo y de fcil comprensin.
pg. 19
Muestra del
estrato 1, con
n1 unidades
Muestra del
estrato 2, con
n2 unidades
ESTRATO 1
N1 = n de unidades
del estrato I
Muestra del
estrato 3, con
n3 unidades
ESTRATO 3
N3
ESTRATO 4
N4
Muestra del
estrato 4, con
n4 unidades
Procedimiento de Seleccin
El procedimiento de seleccin de una muestra estratificada consiste en:
(i)Dividir la poblacin en L estratos mutuamente excluyentes y colectivamente
exhaustivos, siendo (L>1). Cada estrato de la poblacin tendr N i unidades, y la
poblacin total consta de:
L
N Ni
i 1
n ni
i 1
pg. 20
5.
pg. 21
VARIABLE
Cualitativa
(Proporcin Poblacional)
POBLACIN INFINITA
(Cuando no se conoce N)
Z 2 P(1 P)
n0
E2
Z 2S 2
n0
E2
Z 2 P(1 P) N
n 2
E ( N 1) Z 2 P(1 P)
Z 2S 2 N
n 2
E ( N 1) Z 2 S 2
POBLACIN FINITA
(Cuando se conoce N)
6.
P
E
N
Cuantitativa
(Promedio Poblacional)
pg. 22
Fila
01
02
03
04
05
06
07
08
09
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
01-05
06-10
11-15
16-20
Columna
21-25
26-30
31-35
36-40
41-45
46-50
54463
15389
85941
61149
05219
41417
28357
17783
40950
82995
96574
34754
06318
62111
47534
98614
24856
96887
90801
55165
75884
16777
46230
42020
81007
68089
20411
58212
70577
94522
42626
16051
08244
59497
97155
98409
45476
89300
50051
31753
79152
44560
68328
46939
83544
91621
91896
55751
85156
07521
22662
85205
40756
49440
81619
98326
94070
00015
84820
64157
17676
88040
73403
52820
09243
75993
03648
12479
21472
77312
12952
37116
43877
66892
00333
01122
67081
13160
42866
74358
86819
33763
27647
04392
13428
66162
84882
69700
95137
85178
53829
38750
83378
38689
86141
00881
67126
62515
87689
56898
65905
18850
82414
11286
10651
87719
20652
10806
29881
66164
55659
53364
49927
07243
67879
84460
44898
80621
42815
83666
84318
58550
80207
46134
39693
51111
89950
06468
24969
71659
85651
57194
33851
09419
40293
95763
65109
50741
91631
31310
77250
86635
63369
58625
15707
04900
04151
21108
95493
12236
70639
39226
02015
88218
67079
92294
35774
83091
85966
41180
44105
71726
57715
79931
00544
62846
09351
66223
77408
36028
95108
42958
88877
01432
28039
72373
16944
15718
61210
62038
88780
16752
44705
89964
09985
47420
96597
30329
66315
89642
20190
56540
71381
08342
96256
54224
03795
80830
88842
60277
79365
42249
13858
58925
92111
46614
16249
91530
62800
10089
47361
45690
50423
89292
23410
59844
98795
86085
37390
28420
72305
21460
89380
94710
10154
06902
93054
82627
76046
79643
17401
54450
94211
51211
58434
20792
25930
11658
91428
98364
56535
64900
39564
30459
23068
46177
59077
02263
00664
39102
29085
96325
16269
52862
84502
64886
21145
39981
84740
78258
86679
60332
63116
85693
02540
48730
39765
02432
52615
81369
91318
01175
91380
20423
39220
96199
66930
05999
42054
44741
99547
58580
11738
72882
69124
20441
65706
05400
24816
24617
69942
13953
42451
20781
08467
17852
12630
37204
55539
12239
69831
23248
65978
62733
72095
20002
05217
62481
62660
96448
23930
22554
48888
73947
54440
73443
71058
53342
32141
41943
89872
87894
03164
60137
19774
97017
87236
58680
12696
05437
32404
47629
55784
17805
82171
39435
61203
66669
68091
09609
77448
79149
64559
09284
89467
27491
98375
96926
17771
07105
47058
60933
01385
33451
83453
97365
47286
49177
77379
88629
53249
90600
21515
22278
32949
48167
90368
42856
30268
47366
45375
81378
98656
60609
31782
41273
77054
96739
93758
39038
17918
54132
95374
21896
59058
11859
53634
48708
71710
83942
32278
18710
97501
26333
93842
89415
52068
30506
69448
11844
08186
26927
15345
77455
75577
30976
76305
75779
90279
37231
27083
71113
80183
11551
13491
34770
44104
94771
18106
41067
85436
10620
59337
13119
49037
21546
33848
63700
03283
13163
62880
60631
72655
83864
82859
41567
22557
03887
33258
22716
48805
68618
65747
91777
55349
23466
60142
09808
87530
01117
67382
90669
78030
03638
59888
50948
75019
36466
70326
41757
34833
66334
67372
84767
12740
14922
18644
78285
76766
70219
64620
43910
32992
23474
95425
74373
87687
76999
42054
44741
03252
19031
46716
04894
01412
61527
66790
23166
12275
02306
18760
42912
05615
85863
13782
55309
11848
29303
55017
62315
PUNTO DE ARRANQUE:
A (a , b)
Nmero de fila
Nmero de columna
pg. 23
PARTE IV:
TCNICAS ESTADSTICAS EN DISEOS DESCRIPTIVOS
Cuando se va a analizar los datos obtenidos a travs de diseos descriptivos, las tcnicas
estadsticas a utilizar son las siguientes:
1. Cuadros de Distribucin de frecuencias
2. Grficos estadsticos
3. Medidas estadsticas descriptivas
1. CUADRO DE DISTRIBUCIN DE FRECUENCIAS (CDF):
1.1.
DEFINICIN:
Un cuadro de distribucin de frecuencias, es una tabla resumen de un conjunto de
datos que muestra el comportamiento o distribucin de la variable en estudio en forma
rpida y resumida.
An cuando un cuadro de frecuencias se construye a libre criterio de quien lo ejecuta,
generalmente es comn seguir algunos pasos que de alguna forma homogenizan
criterios y ayudan a los fines didcticos.
Para realizar este anlisis se tienen que tener en cuenta el tipo de variable que se est
evaluando.
1.2.
1.3.
pg. 24
Intervalos de clase:
Los intervalos son subconjuntos de la recta real Ron que estn definidos por un
lmite menor o inferior Li y un lmite mayor o superior Ls.
c.
Frecuencia:
1. Frecuencia absoluta simple:
Se denotan por fi. Est constituida por el nmero de veces que se repite un
valor. En el caso de intervalos es el nmero de observaciones
comprendidas en dicho intervalo. Estas frecuencias siempre son enteros
positivos y adems la suma de todos ellos es el tamao de la muestra n.
2. Frecuencia relativa:
Se denotan por hi. Indica la relacin o proporcin existente entre la
frecuencia absoluta simple y el nmero total de datos. Estas frecuencias son
numeros fraccionarios positivos entre o y 1. Para fines interpretativos estas
frecuencias se expresan en % (hi%). As:
hi
fi
n
hi(%)
fi
x100
n
Fj = f1 + f2 + f3 + ....... + fi
4. Frecuencia relativa acumulada:
SE denotan Hi. Resulta de la suma de las frecuencias relativas simples hasta
la frecuencia del intervalo considerado. As:
H4 = h1 + h2 + h3 + h4
H6 = h1 + h2 + ....+ h6
Para fines interpretativos estas frecuencias se expresan en % (Hi%)
d.
Marca de clase:
Se denota por Yi. Es el promedio de los valores correspondientes a los lmites
inferior y superior de cada uno de los intervalos determinados.
1.4.
PROPIEDADES DE UN CDF:
A. Las fi y Fi son siempre nmeros enteros positivos. Es decir: fi , Fi 0.
B. Las hi y Hi son siempre nmeros fraccionarios positivos comprendidos entre 0 y
1, es decir 0 hi , Hi 1.
C. F1 siempre es igual f1 y H1 siempre es igual a h1.
D. La suma de todas las fi es igual a n y la suma de las hi es igual a 1.
E. Fm siempre es igual a n y Hm siempre es igual a 1.
1.5.
pg. 25
Para la construccin de este cuadro hay que realizar los siguientes pasos:
PASO 1. Determinar el Rango del conjunto de datos.
R = Valor mximo - Valor mnimo
PASO 2. Determinar el nmero de intervalos m.
m
=
( n )
3.322
log
pg. 26
pg. 27
2. GRFICOS ESTADSTICOS:
2.1
DEFINICIN
Un grfico estadstico es una representacin pictrica, cuyo objetivo es expresar el
comportamiento de una variable en estudio.
Los grficos estadsticos son representaciones de informacin real que existe en
nuestro mundo, es una expresin artstica de datos reales y observados.
Un grfico sirve tambin para comparar visualmente el comportamiento de dos o
ms variables similares o relacionadas.
2.2
2.3
2.4
2.5
pg. 28
Luego seleccionar el rango de los datos a evaluar, sealando correctamente las series
que estn evaluando.
Luego debemos configurar los aspectos que conciernen a la presentacin del grfico,
aportando una vista preliminar del mismo. As, se determinan el ttulo, las inscripciones
de los ejes, la apariencia de stos, la leyenda, la aparicin o no de tabla de datos y los
rtulos. Las opciones de <Atrs, Siguiente> y Finalizar son las mismas que en los
otros cuadros.
Finalmente hacer clic en el botn Finalizar, el grfico aparece ya en el lugar
seleccionado. Si se quiere desplazar a algn otro lugar sobre la propia hoja en que se
encuentra basta seleccionar todo el grfico y arrastrarlo con el mouse.
3. MEDIDAS ESTADSTICAS
La estadstica descriptiva es una tcnica que consiste en obtener indicadores que describen el
comportamiento de un conjunto de datos. Dentro de estas medidas estadsticas tenemos:
A. Las medidas de Posicin: Dentro de estas tenemos:
a. Medidas de tendencia central: Media, Moda, Mediana.
b. Medidas de localizacin: cuartiles, deciles y percentiles.
B. Las medidas de variacin: rango, varianza, desviacin estndar, coeficiente de variacin.
C. Las medidas de deformacin: asimetra y kurtosis.
pg. 29
MEDIA ARITMTICA:
Se denota por x
Es la medida estadstica ms fcil de calcular.
La media o promedio es el punto central de un conjunto de datos.
Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
B.
MEDIANA:
Se denota por Me.
Es un valor que divide al conjunto de datos en dos partes iguales, es decir,
cada segmento tiene el 50% de los datos.
Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
C.
MODA:
Se denota por Mo.
La moda es el valor que ms se repite en un conjunto de datos.
En un conjunto de datos se presentan los siguientes casos:
a. No existir datos
Amodal
b. 1 moda
Unimodal.
c. 2 modas
Bimodal
d. 3 a ms modas
Multimodal
Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
CUARTILES:
Se denotan por Qk, donde k=1,2,3
Son valores que dividen a un conjunto de datos en 4 partes iguales, es decir,
cada sector tiene el 25% de los datos.
Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
B.
DECILES:
Se denotan por Dk, donde k=1,2,3,4,5,6,7,8,9
Son valores que dividen a un conjunto de datos en 10 partes iguales, es decir,
cada sector tiene el 10% de los datos.
C.
PERCENTILES:
Se denotan por Pk, donde k=1,2,3,4,5,6,7,8,9,10, , 99
Son valores que dividen a un conjunto de datos en 100 partes iguales, es decir,
cada sector tiene el 1% de los datos.
Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
RANGO:
Se denota por R y la medida de variabilidad ms fcil de calcular.
Es la diferencia que existe entre el valor mximo y el valor mnimo del conjunto
de datos.
pg. 30
B.
VARIANZA:
Mide la variabilidad de un conjunto de datos respecto a un valor
central(promedio)
Mide la variabilidad pero en unidades elevadas al cuadrado, por lo tanto es
ilgica su interpretacin.
Para calcular la media aritmtica se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
C.
DESVIACIN ESTANDAR:
Mide la variabilidad de un conjunto de datos respecto a su valor central pero en
unidades originales.
Esta es la medida de variabilidad que tiene una interpretacin lgica.
Se obtiene al sacar la raz cuadrada de la varianza.
D.
COEFICIETE DE VARIACIN:
Se denota por C.V.
El C.V. sirve para determinar si un conjunto de datos tiene un comportamiento
homogneo o heterogneo.
Para llegar a determinar la homogeneidad se compara con un valor
convencional del 33%.
Si el CV 33% el conjunto de datos tiene un comportamiento homogneo.
Si el CV > 33% el conjunto de datos tiene un comportamiento heterogneo.
ASIMETRIA:
La asimetra se entiende como la deformacin horizontal de un conjunto de
datos.
Para conocer esta asimetra se calcula el coeficiente de asimetra As.
En un conjunto de datos pueden presentar los siguientes casos:
a.
As= 0, el conjunto de datos es simtrica.
b.
As<0, el conjunto de datos es asimtrica negativa.
c.
As>0, el conjunto de datos es asimtrica positiva.
As
B.
X Mo
S
As
3( X Me)
S
As
Q3 2Q2 Q1
Q3 Q1
KURTOSIS:
Se entiende por Kurtosis a la deformacin vertical de un conjunto de datos, es
decir, mide el apuntamiento o achatamiento de un conjunto de datos.
Para conocer qu tipo de asimetra tiene un conjunto de datos, se utilizan las
siguientes formulas:
B.1 Kurtosis en funcin de los momentos:
Si K1>3, el conjunto de datos es leptocrtica.
Si K1=3, el conjunto de datos es mesoctica.
Si K1<3, el conjunto de datos es platicrtica.
K1
M4
(M 2 )2
pg. 31
K2
M4
3
( s) 2
As
Q3 Q1
2( P90 P10 )
pg. 32
pg. 33
Parte V:
TCNICAS ESTADSTICAS EN DISEOS DE DOS GRUPOS
1.
ANALISIS DE CORRELACIN:
El anlisis de correlacin es una tcnica estadstica que mide el grado de asociacin o
afinidad entre las variables cuantitativas consideradas en un estudio.
Se llamar CORRELACIN SIMPLE cuando se trata de analizar la relacin entre dos
variables. Se llamar CORRELACIN LINEAL O RECTILNEA si la funcin es una recta, y
de CORRELACIN NO LINEAL cuando la funcin es una curva o una funcin de grado
superior.
El COEFICIENTE DE CORRELACIN DE PEARSON, es el estadgrafo que mide el grado
de asociacin o afinidad entre las variables cuantitativas y se denota por r la cual se
define como:
n
n X iYi X i Yi
i 1
i 1
i 1
i 1
i 1
i 1
i 1
n X i2 ( X i ) 2 n Yi 2 ( Y1 ) 2
Interpretacin:
-1
Perfecta
-0.7
Alta
-0.4
Regular
0
Baja
NEGATIVA
2.
0.4
Baja
0.7
Regular
+1
Alta
Perfecta
POSITIVA
ANLISIS DE REGRESIN
pg. 34
b. Aplicar el mtodo de los Mnimos Cuadrados Ordinarios para estimar los parmetros
de la ecuacin. Las frmulas son las siguientes:
n
i 1
n
i 1
n X i Yi X i Yi
i 1
n X ( X i )
i 1
2
i
A Y BX
i 1
Y 0 1 X1 2 X 2 ... K X K
Para encontrar este modelo, es decir, estimar sus coeficientes tambin se utiliza el
Mtodo de los Mnimos Cuadrados Ordinarios.
Los elementos de este modelo de regresin mltiple son los siguientes:
Y es la variable dependiente o variable respuesta.
A las Xs se le llama variables independientes.
Bs se les llama coeficientes de regresin.
En el ARLM se prueban las siguientes Hiptesis:
Ho: Los Bs son iguales a cero (No hay efecto de las variables independientes en Y);
H1: Los Bs son diferentes de cero (Por lo menos un X influye en Y).
Para dar respuesta a esta Hiptesis se utiliza el anlisis de varianza.
3.
pg. 35
PARTE VI:
INFERENCIA ESTADSTICA
ESTIMACIN ESTADSTICA
ESTIMACIN: Es el proceso mediante el cual se intenta determinar el valor del parmetro de la
poblacin a partir de la informacin de una muestra. Al realizar una estimacin siempre se va a
cometer un error. Existen dos tipos de estimacin:
A. ESTIMACIN PUNTUAL
A.
B. ESTIMACIN INTERVLICA
ESTIMACIN PUNTUAL:
Es aquel nico valor que se obtiene de la muestra, es decir, que para su clculo se debe tener
informacin muestral. Las formulas para calcular o realizar estas estimaciones son las
siguientes:
PROMEDIO
VARIANZA
PROPORCIN
PARMETRO
ESTIMACIN
PUNTUAL
B.
xi
i 1
s
2
(x x)
i 1
n 1
a
P p
n
ESTIMACIN INTERVLICA:
Al realizar una estimacin, siempre se va a cometer un error. Entonces, cuando estimamos un
parmetro nunca va a ser exacto, ese valor ser mayor o menor al verdadero. Entonces se
obtendr un intervalo de valores posibles. Ese intervalo se llama estimacin intervlica. A esa
diferencia mayor o menor se llama error de estimacin, el cual est en relacin directa con la
variabilidad del estimador y el nivel de confianza determinado por el investigador. La
estimacin intervlica para un parmetro en general, est dada por:
Z / 2
Z / 2
Error de Estimacin
Error de estimacin
pg. 36
: Z / 2
Para determinar este intervalo se necesita de:
a. La estimacin puntual
b. La desviacin estndar del estimador.
c. Nivel de confianza, el cual ser repartido para cada lado del intervalo.
FRMULAS DE LOS INTERVALOS DE CONFIANZA
I. INTERVALO DE CONFIANZA PARA EL PROMEDIO POBLACIONAL
A. Si la muestra (n) es mayor de 30 y la varianza poblacional es conocida:
: x Z / 2
s
n
: x t ( / 2, n 1)
PQ
n
P : p Z / 2
P : p Z / 2
pq
n
1 2 : ( x1 x 2 ) Z / 2
12
n1
22
n2
B. Si las muestras son de tamao n1<30 y n2<30 (pequeas) y adems las varianzas
poblacionales DESCONOCIDAS:
1 2 : ( x1 x2 ) t( / 2, n n
1
2)
sc2 (
1 1
)
n1 n2
Donde :
(n 1 1)s 12 (n 2 1)s 22
sc
n1 n 2 2
2
pg. 37
P1 P2 : ( p1 p 2 ) Z / 2
p1 q1 p 2 q 2
n1
n2
PRUEBA DE HIPTESIS
Para realizar un anlisis de pruebas de hiptesis hay que conocer algunas definiciones
preliminares que debemos conocer:
A.
DEFINICIONES PRELIMINARES:
a. HIPTESIS: Es una respuesta a priori a un problema.
b. HIPTESIS ESTADSTICA: En un enunciado acerca del valor de un parmetro
poblacional.
c. PRUEBA DE HIPTESIS: Es un procedimiento basado en la informacin muestral y en
la teora de probabilidad, para determinar si una hiptesis estadstica debe ser aceptada
o rechazada.
B.
CLASES DE HIPTESIS:
a. HIPTESIS NULA.
Se denota por Ho.
Es una afirmacin o enunciado tentativo que se realiza acerca del valor de un
parmetro poblacional.
Por lo comn es una afirmacin acerca del parmetro de poblacin cuando toma
un valor especfico.
b. HIPTESIS ALTERNATIVA.
Se denota por H1.
Es una afirmacin o enunciado contraria a la presentada en la hiptesis nula.
C.
Decisin
posible
Aceptar Ho
Rechazar Ho
Ho Verdadera
Decisin
correcta
Error tipo I
Ho Falsa
Error Tipo II
Decisin Correcta
pg. 38
D.
/2
Ho: = 0
H1: 0
/2
E.
F.
pg. 39
Z t Z / 2
(distribucin normal)
n
B. Si n es menor o igual a 30 y la varianza poblacional es desconocida:
Estadstico de prueba:
x
s
n
t t t ( / 2, n 1)
(distribucin t de student)
pP
PQ
n
Z t Z / 2
Esta frmula es tanto para muestras grandes como para muestras pequeas.
III. PRUEBA DE HIPTESIS PARA LA DIFERENCIA DE MEDIAS
A. Si las muestras son de tamao n1>30 y n2>30 (grandes) y adems las varianzas poblacionales
se CONOCEN:
Estadstico de prueba:
( x1 x 2 ) D
1
n1
Z t Z / 2
2
n2
B. Si las muestras son de tamao n1<30 y n2<30 (pequeas) y adems las varianzas
poblacionales DESCONOCIDAS:
( x1 x 2 ) D
Sc
t t t ( / 2, n 1)
1
1
n1 n 2
(distribucin t de student)
Donde :
(n 1 1)s 12 (n 2 1)s 22
sc
n1 n 2 2
2
( p1 p 2 ) D
p1 q1 p 2 q 2
n1
n2
Z t Z / 2
Esta frmula es tanto para muestras grandes como para muestras pequeas.
pg. 40
G.
pg. 41