Вы находитесь на странице: 1из 11

Universitatea Tehnică a Moldovei

Facultatea Calculatoare, Informatică și Microelectronică


Specialitatea Informatică Aplicată

Lucrare de laborator nr. 1


la disciplina
Analiza statistică a datelor
Tema: Principalele repartiții discrete și continue.
Implementare în limbajul R.

Elaborat: studentul gr.IA-192


Goncearova Olga

Coordonat și verificat: conf. univ. dr. Marusic Galina

Chișinău, 2021
1) Биномиальное распределение
Случайная величина X с биномиальным распределением:

где n - количество выборок и p - вероятность наступления событий (результатов)


Задание: Бросить кубик XY раз. Вариант №8, XY=88.
Обозначим X как количество появлений стороны (поверхности кубика)6.
Вычислить:
 𝑃(𝑋 = 2), 𝑃(𝑋 ≥ 3), 𝑃(3 < 𝑋 < 5), 𝑃(𝑋 ≤ 8);
 𝑚𝑋 – среднее значение X
 𝜎𝑋 2 – дисперсия X
 Стандартное отклонение X
 Построить график распределения с помощью функции plotDist.
Выполнить вычисления математически и используя язык R.
Решение:
1
X B ( n , p ) , n=88 , p
6
Запишем случайную величину X с биноминальным распределением.
1
X B(88 , )
6

Вычислим: 𝑃(𝑋 = 2), 𝑃(𝑋 ≥ 3), 𝑃(3 < 𝑋 < 5), 𝑃(𝑋 ≤ 8);

Вероятность того, что в n испытания событие появится ровно x i- раз вычисляется по формуле
Бернулли:

pi=Pnx =Cnx ∗p x ∗q n−x , где:


i i i i

p+q=1 1/6+q=1 q=1-1/6 6/6-1/6 =5/6


n - количество независимых испытаний;
p – вероятность появления события в каждом испытании;
x i={ 0 , 1 ,2 , … , n−1 , n } −сколько раз можетпоявиться событие в данной сериииспытаний

Решим используя язык R

Вычислим: 𝑚𝑋 – среднее значение X

Математическое ожиданиеm x , числа появлений события в n независимых испытаниях равно


произведению числа испытаний на вероятность появления события в каждом испытании.
88∗1 88
m x =n∗p= = ≈ 14.66667
6 6
Решим используя язык R

Вычислим: 𝜎𝑋 2 – дисперсия X
Дисперсией называют- математическое ожидание квадрата отклонения случайной величины от её
математического ожидания.
88∗1
∗5
6 440
mx =n∗p∗q= = ≈ 12.22222
6 36

Решим используя язык R

Вычислим: Стандартное отклонение X


Стандартное отклонение- отражает меру разброса данных вокруг средней арифметической.
88∗1 1
σ =√ npq= √ ( )
∗ 1− ≈ 3.496029
6 6

Решим используя язык R


Вычислим: Построить график распределения с помощью функции plotDist

Задание: Пусть X - распределение Пуассона параметра 𝜆 = 𝑋.


Подсчитать:

 𝑃(𝑋 = 2)
 𝑃(𝑋 ≥ 3)
 𝑚𝑋 – Среднее значение X
 σ 2X – дисперсия X

Выполнить вычисления математически и используя язык R.


Решение:
2) Распределение Пуассона
Если количество испытаний   достаточно велико, а вероятность   появления
события   в отдельно взятом испытании весьма мала (0,05-0,1 и меньше), то вероятность
того, что в данной серии испытаний событие   появится ровно   раз, можно приближенно
вычислить по формуле Пуассона:

𝜆 – параметр случайной величины X


По варианту 𝜆=8

𝑃(𝑋 = 2)

82 e−4 64∗e−4
P ( X=2 )= p X ( 2 )= = ≈ 0.0107348
2! 2
Решим используя язык R

𝑃(𝑋 ≥ 3)

P ( X ≥3 ) 1−P ( X ≤ 2 )=1−F X ( 2)≈ 0.986246

Решим используя язык R

𝑚𝑋 – Среднее значение X
m X =λ=8

σ 2X – дисперсия X

σ 2X =λ=8
Задание: Пусть переменная X равномерно распределена на интервале [0, 89].
Подсчитать:
 𝑃(𝑋 = 4),
 𝑓𝑋(4),
 P( X ≥ 10)
 P(10< X ≤ 20),
 Среднее значение и дисперсию X
 Сгенерируйте набор из 100 случайных данных в заданном диапазоне и отобразить
данные, сгенерированные с помощью гистограммы

Выполнить вычисления математически и используя язык R.

Решение:
3) Равномерное распределение
Непрерывная случайная величина X имеет равномерное распределение на интервале [a, b], если она
равна принимает любое значение из этого диапазона.
Пусть переменная X равномерно распределена на интервале [0, 89]. Рассчитать:

a) 𝑃(𝑋 = 4), 𝑓𝑋(4), 𝑃(𝑋 ≥ 10), 𝑃(10 < 𝑋 ≤ 15), среднее и дисперсия X
 𝑃(𝑋 = 4) = 0, поскольку X непрерывен;
1 1
 f X ( 4 )= = =0.01123596
89−0 89
Решим используя язык R

P ( X ≥10 )
10−0 10
P ( X ≥10 )=1−P ( X <10 ) =1−P ( X ≤10 )=1−FX (10 )=1− = =0.8876404
89−0 89

Решим используя язык R

P(10< X ≤ 15)
15−0 10−0
P ( 10< X ≤15 )=F X ( 15 )−F X ( 10 )= − =0.05617978
89−0 89−0
Решим используя язык R

Среднее значение и дисперсию X


a+b 0+89
m X= = =44,5
2 2

(b−a)2 (89−0)2
σ 2X = = =660.0833
12 12

Сгенерируйте набор из 100 случайных данных в заданном диапазоне и


отобразить данные, сгенерированные с помощью гистограммы
Решим используя язык R

Задание: Пусть XN (8, 9)

Подсчитать:
 𝑃(−2 < 𝑋 ≤ 7),
 Отобразите график и раскрасьте область −2 < 𝑋 ≤ 7

Выполнить вычисления математически и используя язык R.

Решение:
4) Гауссово распределение (нормальное)
Случайная величина X имеет гауссово или нормальное распределение, если она имеет плотность
формы

Где: m и σ два параметра с, σ > 0

𝑃(−2 < 𝑋 ≤ 7)
P(−2< X ≤ 7)=F X (7)−F X (−2)=0.3690123
Решим используя язык R

Отобразите график и раскрасьте область −2 < 𝑋 ≤ 7


Решим используя язык R
mean=8; sd=3
> left=-2; right=7
> x<-seq(-4,4,length=100)*sd+mean
> fx<-dnorm(x,mean,sd)
> plot(x, fx, type="n", main="Normal Distribution between -2 and 7")
> i <- x >= left & x <= right
> lines(x, fx)
> polygon(c(left,x[i],right), c(0,fx[i],0), col="blue")
Задание: Пусть Y распределено логнормально с 𝑋 = 𝑙𝑛𝑌 ∼ 𝑁 (4, 𝑋).

Подсчитать:
 𝑓𝑌(2),
 𝑃(𝑌 ≥ 4),
 𝑃(4 < 𝑌 < 6),
 𝑃(𝑌 ≤ 8),
 Средняя Y
 Дисперсия Y
Выполнить вычисления математически и используя язык R.

Решение:
5) Логнормальное распределение
Пусть:

𝑓𝑌(2)

𝑓𝑌(2)≈ 0.0228922
Решим используя язык R
𝑃(𝑌 ≥ 4)
P(Y ≥ 4)=8−P(Y < 4)=8−FY (4)≈ 0.5799295
Решим используя язык R

𝑃(4 < 𝑌 < 6)


𝑃(4 < 𝑌 < 6) = 𝐹𝑌 (6) − 𝐹𝑌 (4) =0.01932008

Решим используя язык R

𝑃(𝑌 ≤ 8)
𝑃(𝑌 ≤ 8) = 𝐹𝑌 (8) = 0.4051381
Решим используя язык R

Средняя Y

( 82 )=exp ⁡( 162 )
¿ exp 4+

Решим используя язык R


Дисперсия Y

¿ exp ( 16 ) [ exp ( 8 )−1 ]=exp ( 17 )−exp(16)


Решим используя язык R

Вывод:
В данной лабораторной работе были использованы всевозможные функции языка R а так же все
расчеты были проведены вручную.
В настоящее время реализации R существуют для трёх наиболее распространённых семейств
операционных систем: GNU/Linux, Apple Mac OS X и Microsoft Windows, а в распределённых
хранилищах системы CRAN по состоянию на конец сентября 2010 года были доступны для
свободной загрузки 2548 пакетов расширения, ориентированных на специфические задачи обработки
данных, возникающие в эконометрике и финансовом анализе, генетике и молекулярной биологии,
экологии и геологии, медицине и фармацевтике и многих других прикладных областях.
Значительная часть европейских и американских университетов в последние годы активно переходят
к использованию R в учебной и научно-исследовательской деятельности вместо дорогостоящих
коммерческих разработок.

Оценить