Вы находитесь на странице: 1из 33

TRABAJO FASE 2

HAMILTON CORTES AGUAZACO

PRESENTADO A: HERNAN LUIS AGAMEZ


ESTADISTICA Y PROBABILIDAD

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA


INGENIERA INDUSTRIAL
TUNJA
2017
Se realiza una encuesta a un grupo de empleados de una empresa de licores en la ciudad de Tunja, sobre la car
resultados fueron: FUTBOLISTA-FUTBOLISTA-INGENIERA-MEDICINA-MEDICINA-CHEF-TENIS-PE
FUTBOLISTA-TENISTA-PERIODISMO-INGENIERA-VETERINARIA-VETERINARIA-INGENIERA-A
MEDICINA-PROFESOR-PERIODISMO-MEDICINA-PILOTO-MEDICINA-PILOTO Tabule esta informac
Excel, luego realice su grfico estadstico

xi (variable)

Futbolista

Ingenieria

Medicina

chef

Tenis
Periodismo

Veterinaria

Arquitectura
Profesor
Piloto

Chart Title
8.00% 12.00%
4.00%
8.00%

8.00%

16.00%

8.00% 4.00%

Futbol i sta Ingeni eri a Medi ci na chef Teni s Peri odi s mo


16.00%

8.00% 4.00%

Futbol i sta Ingeni eri a Medi ci na chef Teni s Peri odi s mo


ni hi Ni Hi

3 12% 3 12%

3 12% 6 24%

5 20% 11 44%

1 4% 12 48%

2 8% 14 56%

4 16% 18 72%

2 8% 20 80%

2 8% 22 88%
1 4% 23 92%
2 8% 25 100%
25 100%

Pi l oto
Pi l oto
Xmax 821
Xmin 599
Rango =Xmax-Xmin 222
# intervalos =K(sturges)= 8.9132020286
Amplitud = C = R/K 24.6666666667
Nuevo Rango = R*=k*C 225
Diferencia de rango= 3
DR-1= 2
Nuevo X min 598

Costo LIMITE INFERIOR LIMITE SUPERIOR


697 Yi-1 Yi
661 622.0 598 623
701 647.0 623 648
733 672.0 648 673
708 697.0 673 698
759 722.0 698 723
667 747.0 723 748
775 772.0 748 773
629 797.0 773 798
701 822.0 798 823
648
662
714

histograma
MARCA DE CLASE x FRECUENCIA ABSOLUTA f FRECUENCIA RELATIVA f
FRECUENCIA ABS.ACUMULADA Fi FRECUENCIA REL ACUMULADA Fri

810.5
691
785.5
760.5
735.5
710.5
685.5
660.5
635.5
610.5

704
656

696
758
245

674
229
202

599
164
118

712
59

59

776
46

38
32
27

27
66%

81%

92%

98%
47%
11%

13%
24%

24%

18%

15%

11%
22

16
2%
2%

9%

6%
5
5

[5 9 8 ; 6 2 3 ) [6 2 3 ; 6 4 8 ) [6 4 8 ; 6 7 3 ) [6 7 3 ; 6 9 8 ) [6 9 8 ; 7 2 3 ) [7 2 3 ; 7 4 8 ) [7 4 8 ; 7 7 3 ) [7 7 3 ; 7 9 8 ) [7 9 8 ;
623 648 673 698 723 748 773 798 82
598 623 648 673 698 723 748 773 79
202

2
164
118
59

59

46

38
32
27

98%
27
66%

81%

92%
13%
24%

24%
47%

18%

15%
11%

11%
22

16
2%
2%

9%

6%
760

5
5

4
[5 9 8 ; 6 2 3 ) [6 2 3 ; 6 4 8 ) [6 4 8 ; 6 7 3 ) [6 7 3 ; 6 9 8 ) [6 9 8 ; 7 2 3 ) [7 2 3 ; 7 4 8 ) [7 4 8 ; 7 7 3 ) [7 7 3 ; 7 9 8 ) [7 9 8 ;
680 623 648 673 698 723 748 773 798 82
598 623 648 673 698 723 748 773 79
670
733
680

la frecuencia mas
repetido se encuentra
en el rango [673;698)
Qu conclusiones puede con 59 datos, la menor
obtener? frecuencia se da en el
rango [798;823) con 4
datos equivalente al
2% de los datos

670

683

697
668
736
663
650
762
636
651
689
696
675
753
729
692
661
785
675
690
687
711
707
634
771
622
696
634
627
631
735
797
750
617
695
701
717
751
731
728
656
797
640
685
677
697
663
629
662
820
668
789
684
691
675
651
714
642
772
709
643
636
672
700
778
667
724
815
684
634
722
678
782
696
712
706
686
768
688
731
694
673
742
753
730
644
735
714
723
745
695
631
725
719
672
718
770
732
719
745
609
712
721
707
795
696
637
724
728
764
766
725
707
796
684
715
663
654
759
667
679
669
685
674
634
697
624
777
720
697
686
619
736
705
719
782
821
737
692
705
708
668
734
715
711
695
714
731
660
676
725
663
768
757
754
744
680
691
639
702
685
733
705
725
706
679
725
716
674
647
637
731
752
746
743
736
779
692
667
755
640
705
676
680
714
689
759
713
693
731
756
725
717
811
707
770
656
708
629
787
684
729
674
656
723
670
679
797
714
717
684
729
675
668
765
751
709
751
754
676
680
791
9
25

Nuevo Xmax= 822

VARIABLE MARCA DE CLASE FRECUENCIA ABSOLUTA


(Yi-1,Yi) x f
[598;623) 610.5 5
[623;648) 635.5 22
[648;673) 660.5 32
[673;698) 685.5 59
[698;723) 710.5 46
[723;748) 735.5 38
[748;773) 760.5 27
[773;798) 785.5 16
[798;823) 810.5 4
249

ograma
NCIA ABSOLUTA f FRECUENCIA RELATIVA fr
NCIA REL ACUMULADA Fri

poligono de frecuencia
810.5
785.5
760.5

FRECUENCIA ABSOLUTA f FRECUENCI


735.5

FRECUENCIA ABS.ACUMULADA Fi FRECUENCI


300

250

200

150
249
245
229
202
164

100
46

100%
38

50
27
66%

81%

92%

98%
18%

15%

11%

16
6%

2%
4

9 8 ; 7 2 3 ) [7 2 3 ; 7 4 8 ) [7 4 8 ; 7 7 3 ) [7 7 3 ; 7 9 8 ) [7 9 8 ; 8 2 3 )
723 748 773 798 823 0
698 723 748 773 798 550 600 650 700
202

2
164
100
46

100%
38 50

98%
27
66%

81%

92%
18%

15%

11%

16
6%

2%
4
9 8 ; 7 2 3 ) [7 2 3 ; 7 4 8 ) [7 4 8 ; 7 7 3 ) [7 7 3 ; 7 9 8 ) [7 9 8 ; 8 2 3 )
723 748 773 798 823 0
698 723 748 773 798 550 600 650 700

Moda: el valor con


mayor frecuencia en
Encuentre las esta distribucin de
medidas de tendencia datos fue,
central: Media Mo=673,03.El
aritmtica, mediana y promedio de este Encuentre e interprete el cuartil 3,
moda usando sus conjunto de valores es el decil 4 y el percentil 20.
frmulas e interprete de = 705,18. El
los parmetros nmero central de este
encontrados. grupo de nmeros
ordenados es
Me=701,53

[698;723)
[723;748)

Q3=[723;748)
D4=(TotDat*4)/10 =99,6
[648;673)
[673;698)

D4=[673;698)
P20=TotDat*20/100=49,8
[623;648)
[648;673)

P20=[648;673)
Recorrido: Xma-Xmin 222
Nuevo recorrido 224

FRECUENCIA RELATIVA FRECUENCIA ABS.ACUMULADA


fr Fi
2% 5
9% 27
13% 59
24% 118
18% 164
15% 202
11% 229
6% 245
2% 249
100%

poligono de frecuencia
FRECUENCIA ABSOLUTA f FRECUENCIA RELATIVA fr
FRECUENCIA ABS.ACUMULADA Fi FRECUENCIA REL ACUMULADA Fri

650 700 750 800 850


650 700 750 800 850

Encuentre las medidas de tendencia


Q3=[723;748)=746,10 central: Media aritmtica, mediana y
D4=[673;698)=690,20 moda usando sus frmulas e
P20=[648;673)=665,81 interprete los parmetros
encontrados.

Moda: el valor con mayor frecuencia


en esta distribucin de datos fue,
Q3=(TotDat*3)/4
Mo=673,03.El promedio de este
Q3=(249*3)/4 =182,25
conjunto de valores es de = 705,18.
Q3=723+25((182,25-164)/(202-182,25)
El nmero central de este grupo de
nmeros ordenados es Me=701,53

243
3
4
182.25
164
202
0.9240506329
25
723
746.1012658228
99.6
59
118
17.2033898305
690.2033898305
690.2
49.8
27
59
17.8125
665.8125
665.81
FRECUENCIA REL ACUMULADA MEDIDAS DE CENTRALIZACION
Fri x*f MEDIANA
2% 3052.5
11% 13981
24% 21136
47% 40444.5
66% 32683 Me=701,53
81% 27949
92% 20533.5
98% 12568
100% 3242
175589.5

Mediana impar Total


de datos+1/2 Me =
Media Aritmetica [ Limite inferior +[((Total
= Yi*f /Total de datos datos/2)-
FrecuenciaAComuladanter
ior)/ Frec.Abs]]*C

Mediana impar :(Total de


Media Aritmetica datos+1)/2=125 Me
= Yi*f /Total de datos = [698+[((249/2)-118/
46]]*25
705.1787148594 249
Media Aritmetica
= 175589,5/249=705,18 2
698
118
46
25
701.5326086957
Me=701,53

Encuentre el grado de dispersin:


varianza, desviacin tpica y coeficiente
de variacin (usando las frmulas).
La distribucin es homognea o
heterognea? Interprete la asimetra
y curtosis de la distribucin.

Varianza = 3388,08
Desv.Est. = 58,21
C.V. = 8,25%
Datos Homogeneos
Cutosis=0,28
Asimetria =0,72

Apuntamiento de distribucion
mesocurtica
Asimetria positiva =0,72
RALIZACION MEDIDAS DE DISPERCION
MODA (x-) (x-)
-94.6787148594 8964.0590474347
-69.6787148594 4855.1233044628
-44.6787148594 1996.1875614909
Mo=673,03 -19.6787148594 387.2518185191
5.3212851406 28.3160755472
30.3212851406 919.3803325753
55.3212851406 3060.4445896034
80.3212851406 6451.5088466315
105.3212851406 11092.5731036596

Moda
Mo =LimInf. [[fre.Abs
-Frec.Abs.Anterior)/ Varianza
(fre.Abs = (x-) *f /Total de
Frec.Abs.Anterior)+ datos
(fre.Abs
Frec.Abs.posterior) ]*C

Moda: Varianza
Desviacion Estandar
Mo = 673+[[(59-32)/ (59- =
=
32)+(59-46)]*25] 504824,30/149=3388,08 varianza

673 504824.3 varianza= 3388,08

59 149 58.21
32 3388.0825503356
46 Varianza = 3388,08 Desv.Est. = 58,21
25
27
13
1000
673.027
Mo=673,03
DISPERCION
(x-) *f (x-) ((x-)^4)*f
44820.2952371736 -94.6787148594 80354354.6058961
106812.712698182 -69.6787148594 23572222.301538
63878.0019677101 -44.6787148594 3984764.78065115
22847.8572926242 -19.6787148594 149963.970946315
1302.5394751698 5.3212851406 801.800134393
34936.4526378608 30.3212851406 845260.195926238
82632.0039192917 55.3212851406 9366321.08603271
103224.141546104 80.3212851406 41621966.3981647
44370.2924146385 105.3212851406 123045178.060033
504824.297188755 47.8915662651 282940833.199323

CURTOSIS =
ASIMETRIA =(-
1/n((x-) *f) /
Mo )/ { ((x-) *f) / f )}
[1/n(((x-)^4)*f ]

Coeficiente de variacion
=
(Dev.Est0/Promedio)*100
1136308.56706555 2027.4068160191
3388,08 2027.4068160191 45.0267344588

0.0825464507 4110378.39764069 0.714058331


8.254645067 0.276448652
C.V. = 8,25% Cutosis=0,28 Asimetria positiva =0,72
Datos Homogeneos
% Protena Costo
2.9 697 Co
2.48 661 900
2.95 701
3.33 733 800 f(x) = 84.9921178151x + 450.0738505234
3.04 708
700
3.64 759
2.55 667 600
3.82 775
500
2.1 629

costo
2.95 701 400
2.33 648
2.49 662 300

3.11 714
200
2.83 691
2.99 704 100
2.42 656
0
2.89 696 1.5 2 2.5
3.62 758
2.63 674
1.75 599
3.08 712
3.84 776
3.65 760
2.7 680
2.59 670
3.33 733
2.71 680
2.59 670
2.74 683
2.91 697
2.56 668
3.36 736
2.51 663
2.35 650
3.67 762
2.19 636
2.37 651
2.81 689
2.89 696
2.65 675
3.57 753
3.28 729
2.85 692
2.48 661
3.94 785
2.65 675
2.82 690
2.79 687
3.07 711
3.02 707
2.17 634
3.78 771
2.02 622
2.89 696
2.17 634
2.08 627
2.13 631
3.35 735
4.08 797
3.53 750
1.97 617
2.88 695
2.95 701
3.14 717
3.54 751
3.3 731
3.27 728
2.42 656
4.08 797
2.23 640
2.76 685
2.67 677
2.9 697
2.51 663
2.1 629
2.49 662
4.35 820
2.57 668
3.99 789
2.75 684
2.84 691
2.65 675
2.37 651
3.11 714
2.26 642
3.79 772
3.05 709
2.27 643
2.19 636
2.61 672
2.94 700
3.86 778
2.55 667
3.22 724
4.29 815
2.75 684
2.16 634
3.2 722
2.68 678
3.9 782
2.89 696
3.08 712
3.01 706
2.78 686
3.74 768
2.8 688
3.31 731
2.87 694
2.62 673
3.43 742
3.56 753
3.29 730
2.28 644
3.35 735
3.1 714
3.21 723
3.47 745
2.88 695
2.13 631
3.23 725
3.16 719
2.61 672
3.15 718
3.77 770
3.32 732
3.16 719
3.47 745
1.87 609
3.08 712
3.19 721
3.02 707
4.06 795
2.89 696
2.2 637
3.22 724
3.27 728
3.69 764
3.72 766
3.23 725
3.02 707
4.07 796
2.75 684
3.12 715
2.51 663
2.4 654
3.64 759
2.55 667
2.69 679
2.58 669
2.77 685
2.63 674
2.17 634
2.9 697
2.05 624
3.85 777
3.18 720
2.91 697
2.78 686
1.99 619
3.36 736
3 705
3.17 719
3.9 782
4.37 821
3.38 737
2.85 692
3 705
3.04 708
2.56 668
3.34 734
3.12 715
3.07 711
2.88 695
3.1 714
3.3 731
2.47 660
2.66 676
3.23 725
2.5 663
3.74 768
3.61 757
3.58 754
3.46 744
2.71 680
2.84 691
2.22 639
2.96 702
2.76 685
3.33 733
3 705
3.24 725
3.01 706
2.69 679
3.24 725
3.13 716
2.63 674
2.32 647
2.2 637
3.31 731
3.55 752
3.48 746
3.45 743
3.37 736
3.87 779
2.85 692
2.55 667
3.59 755
2.24 640
3 705
2.66 676
2.71 680
3.1 714
2.81 689
3.63 759
3.09 713
2.86 693
3.3 731
3.6 756
3.24 725
3.14 717
4.25 811
3.02 707
3.76 770
2.42 656
3.03 708
2.11 629
3.97 787
2.75 684
3.28 729
2.64 674
2.42 656
3.21 723
2.59 670
2.69 679
4.08 797
3.11 714
3.14 717
2.75 684
3.28 729
2.65 675
2.56 668
3.71 765
3.54 751
3.05 709
3.54 751
3.58 754
2.66 676
2.71 680
4.01 791
Costovs%deproteina
900

800 f(x) = 84.9921178151x + 450.0738505234

700

600

500
costo

400

300

200

100

0
1.5 2 2.5 3 3.5 4

%Protei na

Con la variable costo vs % protena, encuentre el coeficiente de correlacin de Pearson, luego responda:
La relacin entre las dos variables es positiva o negativa? Interprtela.
Qu tan fuerte es la relacin entre las dos variables, segn el coeficiente de correlacin de Pearson?
0.9999785451
Correlacion Positiva =1
La relacion es fuerte entre las dos variables y es en sentido directo

D una conclusin usando el coeficiente de determinacin.


A mayor consumo de proteina mayor costo
0.9999570907
Correlacion determinacion =1

Haga predicciones con el modelo de recta de regresin encontrado:


Si el costo de la leche es 700.000 pesos, Cul es el % de protena?
Si el costo de la leche es de 700.000 pesos el % de proteina es de 2,94
y=84,992x + 450,07
2.9406297063

Si el % de protena medido es 3, Cul es el costo de la leche?


Si el % de proteina medido es 3 el costo de la leche es de $705.046
y=84,992x + 450,07
705.046
5
EL
consumo de proteina genera altos costos ya que hay una relacion directa entre
estas dos variables. El productor y empresario debe buscar la manera de
obtener materias primas mas economicas o naturales que no afecten la calidad
del producto pero que baje costos .
REFERENCIAS BIBLIOGRAFICAS

Martnez, C. (2011). Captulo 1. Generalidades. En: Estadstica Bsica Aplicada, 4a ed. [Online] Bogot: Ecoe
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=20&docID=10624529&tm=149860589
Martnez, C. (2011). Captulo 2.Distribuciones de frecuencia. En: Estadstica y muestreo, 13a ed. [Online] Bogo
http://bibliotecavirtual.unad.edu.co:2077/lib/unadsp/reader.action?ppg=67&docID=10560355&tm=149853157

Вам также может понравиться