Академический Документы
Профессиональный Документы
Культура Документы
УВОД
От авторите
ЗА САМОПОДГОТОВКА
Задачи за упражнение
Литература
Уеблиография
където:
ЗА САМОПОДГОТОВКА
Литература
1. Crocker, L., Algina, J. Introduction to Classical and Modern Test Theory. Harcourt
Brace, 1986.
65.7 33.9 54.0 79.5 67.7 54.7 41.4 86.0 43.0 73.0 71.1 32.3 59.3
80.5 46.8 68.6 63.5 72.5 81.1 71.4 53.2 76.6 29.1 85.7 59.3 44.6
74.5 34.5 57.5 55.1 78.5 71.2 65.0 68.2 78.1 78.1 66.8 18.0 59.3
59.1 23.5 68.8 53.1 74.7 64.5 75.9 78.4 75.0 58.0 54.2 47.6 60.2
54.6 27.4 70.6 35.0 26.7 51.0 78.4 72.6 62.1 56.5 28.2 34.4 71.7
44.9 36.5 61.5 45.5 52.7 22.6 74.7 58.3 32.9 77.4 73.9 35.8 42.6
67.3 41.3 64.1 44.5 68.7 31 56.1 47.3 40.7 58.1 55.5 50.3 60.3
51.6 85.8 57.2 47 64.6 67.5 44.3 64.3 13.5 63.3 66.2 21.7 64.8
62.7 79.7 51.6 57.1 29.8 67.8 59.6 48.9 70.8 25.9 61.8 27.3 33.1
83.6 65.2 37 70.2 73.4 56.7 69.2 61.6 69.3 20.9 63.2 64.7 55.2
40.4 37.8 17.7 13.9 46.5 25.2 45.5 75.8 43.3 14.0 61.8 46.0 44.9
39.4 33.4 63.4 59.9
Решение:
Табл. 2
където fi е честотата в i-тата група, т.е. броят фирми, чиито брутна печалба е в
съответния интервал, описан в първата колонка на таблицата.
Задачи за упражнение
25.7 19.9 14.0 9.5 27.7 47.0 114 16.0 13.0 73.0 51.1 32.0 59.3
80.5 46.0 68.6 63.5 72.0 81.1 71.0 53.2 76.6 91.0 85.0 59.3 44.6
64.5 34.0 57.5 55.1 48.5 41.0 65.0 68.2 48.1 48.1 66.8 18.0 59.3
59.1 23.0 48.8 53.0 74.7 64.5 45.9 78.4 45.0 58.0 54.2 47.0 60.2
54.6 27.4 70.6 35.0 26.7 51.0 48.4 42.6 62.0 56.5 28.0 34.4 51.7
67.3 51.0 44.1 44.0 68.0 31.0 56.1 47.3 64.6 67.5 44.0 34.3 61.8
51.6 85.0 57.0 47.0 83.6 65.2 37.0 40.2 43.4 56.7 69.0 51.6 25.9
12.0 49.7 51.6 57.1 29.8 67.0 59.6 48.9 27.3 33.1 40.4 37.8 17.7
13.5 63.3 56.2 21.7 64.8 64.7 55.2 13.9 70.8 77.4 73.9 35.8 42.6
44.9 36.5 61.5 45.5 52.7 22.6 74.7 58.3 32.9
Във всеки миг около нас тече информация, но не всяка информация сме готови да
уловим, анализираме и превърнем в практически полезно за нас знание.
След усвояването на информацията от тази глава Вие ще можете:
ЗА САМОПОДГОТОВКА
Въпроси към темата
Представете си, че сте застрахователен агент и трябва да направите отчет на
извършените от вас застраховки през 2004 г. Какъв по вид статистически ред ще
получите след групировката по признаците: вид на застраховката,
продължителност, застрахователна сума, пол и възраст на навършени години на
застрахованото лице.
Изследвате инфлацията в страната през последните 20 години. Какъв
статистически ред ще построите, ако разполагате с данни за индекса на
инфлацията (виж Петров, В., Тодоров, Т. Основи на статистиката. В. Търново,
2000, стр. 403) за този период по месеци?
Литература
1. Гатев, К. Въведение в общата теория на статистиката. София, 1980.
2. Петков, П. Статистика. Варна, 2001.
3. Петров, В., Тодоров, Т. Основи на статистиката. В. Търново, 2000.
Казуси:
Направете план и програма на статистическо наблюдение, характеризиращо
финансовото състояние на строителните фирми в гр. Шумен. За целта използвайте
признаци като: краткотрайни активи, дълготрайни активи, собствен капитал,
заемен капитал, парични средства, краткосрочни вземания и краткосрочни заеми
(виж 3, стр.521-526) и др. Представете си, че сте извършили наблюдението и
използвайте избрани от вас данни. Постройте ранжиран, вариационен и
прогресивно-кумулативен ред на разпределение по разглежданите признаци, като
използвате първо - абсолютните, а след това и относителни честоти на
разпределение на единиците по разглежданите признаци. Определете ширината на
интервалите по формулата на Стъджерс. Визуализирайте резултатите от
статистическото наблюдение с подходящи статистически графични изображения.
Определете класовите представители. Направете статистически анализ. Приложете
съответните статистически методи, които той изисква.
(1)
където Xi е измерената стойност на разглеждания признак при i-тата
статистическа единица, n е броя на наблюденията, а
(2)
където Yi са левите краища на интервалите, а к е броя на групите.
Виж трите примера след тази тема.
За сравняване на две и повече еднородни статистически величини обикновено се
използват плосткостни диаграми. Това са графични изображения във вид на
правоъгълници, триъгълници, кръгове и др. Основното правило при тяхното
построяване е:
Отношението на лицата на получените фигури да е равно на отношението на
сравняваните величини.
Често заедно със сравняването на обема се представя и структурата на
съвкупностите. За целта фигурите от плосткостната диаграма се разделят на
сектори, оцветени в различен цвят. Всеки сектор представя дела на съответната
подсъвкупност. Правилото при определянето, големината на секторите е:
Отношението на броя на статистическите единици в подсъвкупността и обема на
съвкупността да е равно на отношението на лицето на съответния сектор и лицето
на цялата фигура.
Ако структурната диаграма е кръгова на 100% съответстват 360° . Това значи, че
на 1% съответстват 3,6° .
Когато е необходимо да се представи диференциацията или концентрацията на
единиците на съвкупността по даден признак, се използва кривата на Лоренц -
Lorenz, M. O. Methods of measuring the Concentration of Wealth. - Journal of the
American Statistical Association. Vol.70, 1995. В първи квадрант на координатна
система се нанася ъглополовяща, която изобразява линията на равномерността. По
двете координатни оси, в определен мащаб се нанасят числата от 0 до 100 в %-ти.
За да обясним нейния смисъл да разгледаме един пример. Разглеждаме
населението на България по “годишен доход на глава от населението” през 2003г.
Разполагаме с прогресивно-кумулативен ред на разпределение с относителни
честоти. Определяме какъв процент от общия доход на населението за 2003 г.
представлява дохода на населението, който е по-малък от горната граница на всяка
група. Така за всяка група имаме по две относителни честоти. Чертаем начупена
линия свързваща точките с тези две координати. Колкото нашата линия е по-
отдалечена от линията на неравномерността, толкова по-неравномерно е
разпределението на доходите на населението.
Пример за изгладена крива на концентрацията на доходите на населението за
1990г и 2003г е дадена на Фиг. 1.
Фиг. 1
За представянето на динамиката на изследваното явление най-популярна е
линейната, а за цикличността – радиалната диаграма.
При линейната диаграма по абсцисната ос се нанасят моментите или периодите от
време, а по ординатната – членовете на динамичния ред.
Сега да си представим, че разглеждаме динамичен ред с равноотдалечени
интервали от време. Ако относителните изменения между съседните му членове са
еднакви и приблизително равни на а и по ординатната ос използваме
логаритмична скала с основа на логаритъма а, линейната диаграма е близка до
права.
Радиалната диаграма има толкова ординатни оси, колкото са моментите или
периодите включени в един цикъл на изследваното явление. Те започват от
центъра на кръг и са равноотдалечени. Скалата с мерките за обема на явлението се
нанася по един от лъчите. Значенията на величините се нанасят по съответните за
момента или периода лъчи. Ако искаме да представим сезонни колебания,
радиусите – ординати ще са 12. Можем да направим радиална диаграма на
индексите на сезонните колебания в проценти. Ако върху радиалната диаграма
начертаем един по-ярък кръг идентифициращ 100%, тогава отклоненията от този
кръг характеризират сезонните колебания в проценти. Виж Пример 2 след тази
тема.
Остана да разгледаме корелационното поле. От неговия графичен образ можем да
определим какви са силата и формата на зависимостта между два метрирани
признака. Прилага се при негрупирани данни. На всяка статистическа единица
съответства точка с координати съответните измерени значения на наблюдаваните
признаци. По аналогичен начин при групирани данни се построяват стереограми.
По-подробно описание може да бъде намерено в Гатев, К. Въведение в общата
теория на статистиката. София, 1980 и Петков, П. Статистика. Варна, 2001.
ЗА САМОПОДГОТОВКА
Въпроси към темата
В кои случаи е удачно да изберем логаритмична скала за представяне на данните?
Какви статистически графични изображения за представяне на разпределението на
единиците от съвкупността познавате? А какви за представяне на структурата на
съвкупността?
Кога се използва радиална диаграма?
Литература
1. Lorenz, M. O. Methods of measuring the Concentration of Wealth. - Journal of the
American Statistical Association. Vol.70, 1995.
2. Гатев, К. Въведение в общата теория на статистиката. София, 1980.
3. Петков, П. Статистика. Варна, 2001.
Примерни ситуации и решения
Пример 1: Като използвате данните от Error! Reference source not found.
а) Начертайте кръгова диаграма, разкриваща структурата на наблюдаваната
съвкупност по признака “брутна печалба”;
б) Постройте полигон и хистограма на абсолютните честоти на разпределението на
фирмите според тяхната брутна печалба;
в) Постройте графиката на емпиричната функция на разпределение на фирмите
според тяхната брутна печалба.
Решение: а) За да начертаем кръгова диаграма от Фиг. 2, трябва да пресметнем
колко градуса от централния ъгъл ще съответстват на всяка група поотделно. На
100% съответстват 360° , значи на 1% ще съответстват 3,6° . Умножаваме числата
от третата колонка наТабл. 1 по 3.6 и получаваме съответните ъгли. Може да ги
видите в предпоследната й колона.
Фиг. 2 Разпределение на фирмите по признака "брутна печалба през 2004 г".
2003 2 4 8 16 32 64 128 64 32 16 8 4
2004 3 6 9 18 27 90 243 81 54 24 9 4
а) Характеризирайте динамиката на посещенията като начертаете линейни
диаграми на данните с аритметична и логаритмична скали.
б) Характеризирайте сезонността в наблюдаваното явление като начертаете
радиална диаграма.
Решение:
а) Линейната диаграма на данните с аритметична скала (Фиг. 6) показва силно
изразена сезонност.
Линейната диаграма на същите данни, но с логаритмична скала по ординатната ос
(Фиг. 7) показва сравнително постоянен темп на изменение.
б) Радиалната диаграма (Фиг. 8) е с 12 сектора, т.к. периодичността на
изследваното явление е от сезонен тип.
Фиг. 6 Посещения на туристите в курортен комплекс Х през 2003 и 2004 г. по
месеци.
Фиг. 7 Посещения на туристите в курортен комплекс Х през 2003 и 2004 г. по
месеци.
СРЗ в 220’ 250’ 300’ 310’ 280’ 330’ 350’ 400’ 270’ 420’ 370’ 350’ 330’ 310’
лв.
ПТ 4 6 7 8 7 9 9 10 6 8 9 8 7 6
изд/ч.
Задачи за упражнение
Задача 1: Като използвате данните от Error! Reference source not found.
а) Постройте ранжирания ред на изходните данни;
б) Постройте полигон и хистограма на относителните честоти на разпределението
на фирмите според тяхната брутна печалба.
Задача 2: Като използвате данните от Error! Reference source not found.
а) Постройте ранжирания ред на изходните данни;
б) Постройте полигон и хистограма на относителните често-ти на разпределението
на туристите според техния средномесечен разход за нощувки в курортен
комплекс Х през 2004 г.
в) Постройте интервален вариационен ред на разпределе-нието на туристите,
съдържащ абсолютните и с относителните честоти по признака “Средномесечен
разход за нощувки в курортен комплекс Х през 2004 г.” и определете класовите
представители;
г) Начертайте кръгова диаграма, разкриваща структурата на наблюдаваната
съвкупност по признака “Средномесечен разход за нощувки в курортен комплекс
Х през 2004 г. в лв.”;
д) Постройте полигон и хистограма на абсолютните честоти на разпределението на
туристите според техния средномесечен разход за нощувки в Х през 2004 г.;
е) Постройте графиката на емпиричната функция на разпределение на туристите
според техния средномесечен разход за нощувки в курортен комплекс Х през 2004
г.
3.1. СЪЩНОСТ
Статистически величини са количествени измерители на характеристиките на
разпределението на единиците от разглежданата съвкупност, на зависимостите
между наблюдаваните признаци или развитието във времето и пространството на
масовите явления и процеси. С тяхна помощ могат да се проверяват хипотези, да
се оформят прогнози или да се моделират зависимости. Получават се след
отброяване на единици от съвкупността или чрез използване на определени
формули. В зависимост от това дали се пресмятат от групирани или от не
групирани данни формулите се разделят на претеглени и непретеглени.
Претеглените формули са приблизителни и за това ще ги означаваме с точка върху
съответния символ. Това се дължи на факта, че при групирането се губи част от
статистическата информация.
В зависимост от мярката си статистическите величини биват наименовани и
ненаименовани. Наименованите величини изразяват размера на съответната
характеристика в мерни единици например: лев, брой, метър, литър, килограм,
човекочас, kWh и др. Ненаименованите изразяват обикновено относителен дял или
относително изменение в изследваното явление. Според базата си за сравнение те
се подразделят на:
ЗА САМОПОДГОТОВКА
Въпроси към темата
Колко са а% от d лв.?
Колко процента от r лв. са h лв.?
Ако имаме нарастване на обема на дадено явление от g% на f% с колко пункта е
нараснал обема на това явление?
Ако имаме нарастване на обема на дадено явление от g% на f% с колко процента е
нараснал обема на това явление?
където
ni - брой статистически единици в i – тата подсъвкупност,
n - обем на разглежданата съвкупност.
Съотносителните величини показват колко пъти една подсъвкупност е по-голяма
или по-малка в сравнение с друга подсъвкупност образувана от единиците
притежаващи друго значение на същия признак. Пресмятат се чрез отношението
Когато разчленяването е по повече от един признак говорим за вътрешногрупова и
междугрупова структура.
Ако се съпоставят структурите на една и съща съвкупност за няколко
последователни периода е възможно да се установят структурните изменения,
тяхното направление и тенденции. Те се изразяват обикновено в пунктове.
За характеризиране на скоростта на изменение на дадена, величина или явление
във времето се използват относителни величини на динамиката. Това са
ненаименовани величини, които обикновено се записват като индекси. При
изчисляването им се включват два момента или периода от време. Пресмятат се
като разделим величината през индексирания период на величината през базисния.
Когато се разглеждат два или повече динамични индекси в зависимост от базата за
сравнение имаме индекси с постоянна и променлива база. При първите базисния
период за различните индекси е един и същ, а при вторите се променя и той е
предходен на индексирания период.
При съпоставянето на две съвкупности, като едната съвкупност, която ще
наричаме явление, се получава в резултат от някакво събитие свързано с
единиците на другата съвкупност – среда, е удобно да използваме относителните
величини на интензивността. Това са наименовани числови характеристики, които
показват с каква интензивност се случва явлението при единиците от съвкупността
среда. В зависимост от това дали явлението може или не може да се случи при
всички единици от съвкупността среда към разглеждания период, различаваме
брутни и нетни относителни величини на интензивност. Ако съвкупността среда е
разделена на подсъвкупности по даден признак на единиците в нея и пресметнем
относителните величини на интензивността за тези подсъвкупности говорим за
частни относителни величини, а в противния случай за общи.
Екстензивните относителни величини показват колко единици от една съвкупност
се падат на една (сто, 1000, … ) единици от друга разнородна на първата
съвкупност, но свързана с нея в логическа връзка. Това са именовани числови
характеристики. Образуват се като разделим обема на първата съвкупност на
обема на втората. Такива величини са БВП на едно лице от носелението,
националния доход на лице от населението, брой лекари на 1000 човека от
населението, разходите за обръщение на единица стокооборот и др. Напишете като
отношение на кои величини се получават те.
Различията по място на едноименни величини за един и същ период се измерват с
относителните величини на териториални сравнения. Това са ненаименовани
числови характеристики. Показват каква част представлява абсолютната или
производна величина за индексирания район (чиято стойност се пише в числителя)
от същата величина за базисния район. Често пъти, за да се осигури възможност за
сравняване на териториалните индекси, се разглеждат величините например на
квадратен метър или на една статистическа единица за съответните териториални
поделения и вместо величина за базисния район в знаменателя се поставя средния
размер на съответния показател общо за целия район.
ЗА САМОПОДГОТОВКА
Въпроси към темата
Какви величини трябва да се пресметнат ако искаме да сравним стокооборота на
глава от населението в различните области на България?
Какви величини трябва да се пресметнат ако искаме да сравним средния доход на
глава от населението в различните области на България?
Какви величини трябва да се пресметнат ако искаме да сравним средната работна
заплата в различните области на България?
За да се сравни икономическото развитие на отделните страни се използва БВП на
глава от населението. Каква величина е това и как се пресмята?
По какво се различават относителните величини на интензивност и тези на
екстензивност?
Дайте примери на относителни величини от всеки от посочените видове.
Литература
1. Петров, В., Тодоров, Т. Основи на статистиката. В.Търново, 2000.
Казуси:
От http://www.nsi.bg вземете данни и характеризирайте структурите на брутния
вътрешен продукт, брутния национален продукт и чистия национален продукт
през 2003 г.
Забележка: За дефиниция на понятията брутен вътрешен продукт, брутен
национален продукт и чист национален продукт виж Петров, В., Тодоров, Т.
Основи на статистиката. В. Търново, 2000, стр. 410.
• Средна аритметична
Определящата функция е
(1)
Тъй като тук не участват честотите, т.е. тази формула се използва при работа с
негрупирани данни, тя се нарича непретеглена формула за пресмятане на средна
аритметична величина. Ако включим и честотите получаваме съответната
претеглена формула:
(2)
където
fi - е честотата в i -тата група на осреднявания признак
- e класовия представител в i - тата група,
k - броя на групите.
Да припомним, че точката означава, че това е формула за приблизително
пресмятане на съответната величина, тъй като използва значения от интервален
ред. Оценката на величината е по-точна, когато се пресмята от негрупирани данни.
Защото при групировката се предполага, че разпределението на единиците в
групите е равномерно, което не винаги е вярно.
Когато обемът на извадката е голям e в сила Закона за големите числа:
С увеличаване обема на извадката средното аритметично пресметнато по данни от
нея се приближава към средното теоретично за съвкупността, т.е. към значението,
което би имал признака при отделните статистически единици, ако върху тях не
действаха случайни фактори.
В сила са следните свойства на средната аритметична величина, които лесно се
доказват.
- Сумата от отклоненията на членовете на реда от тяхната средна аритметична е
нула, т.е.
- Ако към всеки член на реда прибавим или извадим една и съща константа или го
умножим или разделим с една и съща константа, то средната аритметична на
новия ред се получава като със средната аритметична на стария ред извършим
същата аритметична операция, т.е.
• Средна квадратична
• Средна геометрична
Претеглената формула е
• Средна хармонична
Литература
1. Гатев, К. Въведение в общата теория на статистиката. София, 1980.
Табл. 1
Брутна печалба в х.лв. fi
fi
Над 13.5000 до 22.5625 7 18.0313 126.2191
Над 22.5625 до 31.625 11 27.0938 298.0318
Над 31.6250 до 40.6875 14 36.1563 506.1882
Над 40.6875 до 49.75 21 45.2188 949.5948
Над 49.7500 до 58.8125 23 54.2813 1248.4700
Над 58.8125 до 67.875 32 63.3438 2027.0020
Над 67.8750 до 76.9375 27 72.4063 1954.9700
Над 76.9375 до 86 12 81.4688 977.6256
Общо: 147 x 8088.1010
Задачи за упражнение
Задача 1: ІІ курс специалност Икономика се състои от две групи съответно по 20 и
30 човека. По дисциплината Статистика двете групи имат среден успех съответно
4 и 5. Какъв е средния успех на целия курс?
Задача 2: Фирма продава в два магазина еднакви фаянсови плочки. През месец май
в І магазин цената на един квадратен метър е 10 лв. и са продадени 1000 м2, във ІІ
магазин цената на един квадратен метър е 12лв. и са продадени 500 м2. Каква е
средната цена на квадратен метър, на която са продадени плочките в двата
магазина през месец май?
Задача 3: ІІо данните от Error! Reference source not found. пресметнете
средномесечния разход за нощувки в курортен комплекс Х през 2004 г. на
всичките 126 наблюдавани туристи. Определете същата средна от групирани
данни. Защо двете средни се различават?
ЗА САМОПОДГОТОВКА
Въпроси към темата
Какъв динамичен ред ще използвате ако искате да характеризирате следните
величини в динамика
Литература
1. Гатев, К. Въведение в общата теория на статистиката. София, 1980.
ЗА САМОПОДГОТОВКА
Въпроси към темата
Обяснете защо модата, медианата, както и средното аритметично, построени от
групирани данни, са по-неточни в сравнение с тези определени от негрупирани
данни.
Какво значи “разпределението на единиците в групите е равномерно”? Дайте
пример на равномерно разпределени единици в групите от конкретен ред на
разпределение построен по метриран признак.
Литература
1. Гатев, К. Въведение в общата теория на статистиката. София, 1980.
в х. лв. Ci
ст-ва
До 10 5 5 25 5
над 10 до 20 15 15 225 20
над 20 до 30 45 25 1125 65
над 30 до 40 25 35 875 90
Медианни случаи са 50-тия и 51-вия. Два на брой т.к. статистическия ред има
четен брой членове. От колонката с кумулативни честоти определяме, че
медианната група е “над 20 до 30”. Тогава медианата е
Задачи за упражнение
Задача 1: По данните от Error! Reference source not found. определете Мо и Ме на
разпределението на фирмите по признака “Средна брутна печалба за 2004 г.”
Пресметнете същите характеристики и по данните от Error! Reference source not
found. На какво се дължат различията в получените резултати?
Задача 2: ІІо данните от Error! Reference source not found. определете Мо и Ме на
разпределението на туристите по признака “Средномесечен разход за нощувки в
курортен комплекс Х през 2004 г.”. Определете същите Мо и Ме от групирани
данни. Защо съответните характеристики, пресметнати по двата начина се
различават?
• Размах на разсейването
Относителният размер е
• Средноаритметично отклонение
- при групирани
ЗА САМОПОДГОТОВКА
Въпроси към темата
Защо абсолютният размах на разсейването е твърде груба негова характеристика?
Литература
1. Петров, В., Тодоров, Т. Основи на статистиката. В. Търново, 2000.
Съответният му относителен е
Абсолютният размер на стандартното откланение е
Относителният е
Задачи за упражнение
Задача 1: По данните от Error! Reference source not found. пресметнете абсолютния
и относителен размер на размаха на разсейването, абсолютния и относителен
размер на средното аритметично отклонение и на стандартното отклонение и
определете дисперсията на разпределението на туристите по признака
“Средномесечен разход за нощувки в курортен комплекс Х през 2004 г.”.
Пресметнете същите характеристики и от групирани данни. На какво се дължат
различията в получените резултати? Кои са по-точни и защо?
, x Î R.
На Фиг. 1 и Фиг. 2 е начертана с плътна линия. Лицето на фигурата под
нормалната крива и над абсцисната ос е единица.
Отклоненията в хоризонтална посока от нормалната крива се наричат – асиметрия.
Илюстрирани са на Фиг. 1. Първични представи за асиметрията на
разпределението на единиците от извадката по групировачния признак
получаваме, когато начертаем полигона или хистограмата на разпределението и ги
сравним с нормалната крива. Количествено можем да я измерим чрез следните
ненаименовани величини:
• коефициент на асиметрия на Юл
.
Различните коефициенти на асиметрия изчислени по една и съща извадка имат
различни стойности, за това при сравнителен анализ трябва да се използва един и
същ коефициент. Общото при трите коефициента е, че при симетрични
разпределения са равни на нула. Положителни са, когато имаме дясна асиметрия
(виж --- на Фиг. 1), а отрицателни при лява (виж -× × -× × - на Фиг. 1). Колкото
абсолютната стойност на коефициента на асиметрия е по-голяма, толкова по-
несиметрични са двата склона на кривата на разпределението на изследваната
съвкупност.
Отклоненията във вертикална посока от нормалната крива се наричат – ексцес
(изостреност). Първични представи за ексцеса на разпределението на единиците от
извадката по групировачния признак получаваме, когато начертаем полигона или
хистограмата на разпределението и ги сравним с нормалната крива. Моментният
коефициент на ексцес е един ненаименован количествен измерител на ексцеса и се
определя по формулата:
ЗА САМОПОДГОТОВКА
Въпроси към темата
Напишете претеглената и непретеглената формула за s – ти централен момент.
Табл. 2 Р-р на ДМА на 100 частни зем. ст-ва в обл. Х към 31.12.2003 г.
ДМА ЗC Междинни изчисления
в х. лв. в
До 10. бр.
5 5 22 110 2420 -53240 1171280
10 ÷ 15 15 12 180 2160 -52920 311040
20
20 ÷ 45 25 2 90 180 -360 720
30
30 ÷ 25 35 8 200 1600 12800 102400
40
над 40 10 45 18 180 3240 58320 1049760
Общо: 100 x 62 760 9600 -35400 2635200
• Коефициентът на асиметрия на Юл е
Задачи за упражнение
Задача 1: По данните от Error! Reference source not found. определете
коефициентите на асиметрия и ексцес на разпределението на фирмите по признака
"Средна брутна печалба за 2004 г." Пресметнете същите характеристики и по
данните от Error! Reference source not found.. На какво се дължат различията в
получените резултати?
Задача 2: ІІо данните от Error! Reference source not found. определете
коефициентите на асиметрия и ексцес на разпределението на туристите по
признака "Средномесечен разход за нощувки в курортен комплекс Х през 2004 г.".
Определете същите коефициенти от групирани данни. Защо съответните
характеристики, пресметнати по двата начина, се различават?
А А
⇒ ⊆
Ще се сбъднат А и В А∩ В
Ще се сбъдне А или В А∪ В
А и В са несъвместими А∩ В=∅
А няма да се сбъдне
Понякога знакът Ç се пропуска и вместо А Ç В пишем АВ.
Вероятността на елементарното събитие, най-общо казано е мярка за обективната
възможност то да се сбъдне. Тя е неотрицателно число и сумата от всички такива
вероятности е 1. Когато пространството на елементарните събития е крайно или
безкрайно, но изброимо, вероятността на А се задава като сума от вероятностите
на благоприятстващите А елементарни събития и се означава с Р(А).
Ако елементарните събития са равновъзможни и пространството им е крайно
множество, е приложима класическа дефиниция за вероятност. Ако А е събитие
свързано със същия опит
(1)
където с m(A) сме означили броя на благоприятстващите елементарни събития за
събитието А, а с m(W ) - броя на всички елементарни събития.
Ако опитът е случаен избор на точка в геометрично множество G с положително
крайно лице (повърхнина) S(g(W )), то е приложима геометричната дефиниция за
вероятност
(2)
където S(g(A)) e лицето (повърхнината) на онова подмножество g(A) на G, в което
ако попадне избраната точка със сигурност ще се сбъдне събитието А.
Очевидно G = g(W ).
Ако многократно и независимо се повтаря един и същ опит N пъти, то
(3)
където m (A) е броя на изходите, при които е настъпило събитието А, се нарича
относителна честота за А.
Числото, около което при големи N варира относителната честота се нарича
статистическа вероятност и се бележи с P(A).
Пълната група Н1, Н2,…, Нk ще наричаме базова пълна група
за събитието А, ако от всяко нейно събитие следва А или . Елементите на
базовите групи ще наричаме базови събития. Лесно се доказва, че всяка пълна
група събития съдържаща n елемента, може да бъде базова за 2n събития. Пълната
група от елементарни събития може винаги да се избере за група на базовите
събития на всяко събитие, но това не винаги е разумно, защото пълната група от
елементарни събития е най-многобройна и често е трудно обозрима.
Да изброим по-важните свойства на вероятностната мярка.
1. Формула за събиране на вероятностите - Ако всеки две от събитията А1, А2, …,
Аn са несъвместими, то
Р(А1 È А2 È … È Аn ) = Р(А1) + Р(А2) + …+ Р(Аn)
Това свойство е вярно и ако n = ¥ .
2. При всяка крайна или бeзкрайна базова група за А, Р(А) е равна на сума от
вероятностите на благоприятстващите А базови събития. Частен случай на това
твърдение е следната
Класическа формула за вероятност - Ако съществува група от n равновъзможни
базови събития за А, М(А) от които благоприятстват А, то
(4)
3. Ако събитията А1, А2, …, Аn образуват пълна група, то
Р(А1) + Р(А2) + …+ Р(Аn) = 1.
Това свойство е също е вярно и ако n = ¥ .
В частност
ЗА САМОПОДГОТОВКА
Въпроси към темата
Подхвърля се зар с размери 9 мм на 10 мм на 11 мм. Защо при този опит не е
приложима класическа дефиниция за вероятност?
Ако зара е с правилна форма. Намерете вероятността на събитието “След като е
подхвърлен по случаен начин зара показва четен брой точки”. А каква е
вероятността на събитието той да покаже точно 6 точки?
Подхвърлете 1000 пъти правилен зар и се убедете, че действително броят на
падналите се 6-ци, разделен на 1000 е около 1/6. Защо това е така?
Литература
P(А1) =
По аналогичен начин благоприятстващите елементарни събития за А2 са означени
с клетките над главния диагонал в таблицата. Те са също 15 на брой. Тогава
P(А2) =
Благоприятстващите елементарни събития за А3 са означени в таблицата с
клетките от главния диагонал. Те са 6 на брой. Тогава
P(А1) =
Един пример на пълна група събития свързани с този опит е А1, А2, А3. За това и
сумата от техните вероятности е 1.
Друга пълна група събития е В1, В2. Благоприятстващите елементарни събития за
В1 са означени в табличката с триъгълник. Те са 18 на брой. Тогава
P(В1) =
Тогава, от свойство 3 на вероятностната мярка
Благоприятстващите елементарни събития за С1 се моделират с означените с “ ”
11 клетки. От класическа дефиниция за вероятност
P(В4) =
По аналогичен начин, благоприятставщите елементарни събития за събитието Т4
се моделират с точките на линията
, които са също 10 на брой. P(Т4) = 0,1.
Благоприятстващите елементарни събития за събитието С4 се моделират с точките
под линията
, които са 5 на брой. P(С4) = 0,05.
Благоприятстващите елементарни събития за събитието К се моделират с точките
на линията
P(Т4) = 0,1.
Благоприятстващите елементарни събития за събитието А4 се моделират с точките
на линията
, които са 6 на брой. P(А4) = 0,06.
Благоприятстващите елементарни събития за събитието Н4 се моделират с точките
на линията
P(А4) = 0,06.
Пример 3: От касичка, в която има 2 банкноти по 10 лв. и 3 банкноти по 5 лв., по
случаен начин, едновременно се изваждат две банкноти. Опишете пространството
от всички елементарни събития. Намерете вероятностите на събитията
Е = “Извадените банкноти са с еднаква стойност”,
И10 = “Извадени са 10 лв.”,
И15 = “Извадени са 15 лв.”,
И20 = “Извадени са 20 лв.”
Решение: За да опишем по-лесно всички възможни изходи от експеримента,
номерираме банкнотите от по 10 лв. с числата 1 и 2, а банкнотите от по 5 лв. с
числата 3, 4 и 5. Ще отбележим с една клетка с по-плътен контур от следната
таблица без диагонала
Фиг. 2
Сега да намерим Р(q < z ). Трябва да видим къде са точките от квадрата, с които
ако съвпадне Т, събитието “q < z ” ще се сбъдне. От дефиницията на q , те съвпадат
с точките, които се намират на разстояние по-малко от z от най-близката страна на
квадрата ABCD, т.е. ако страната на малкия квадрат на Фиг. 2 е на разстояние z от
най-близката страна на големия квадрат, точките от големия квадрат, които са на
по-малко от z разстояние от най-близката страна са между големия и малкия
квадрат. Страната на малкия квадрат е 2-2z. Лицето на фигурата заключена между
големия и малкия квадрат е 4 – (2-2z)2. Тогава
за z Î (0, 1].
Задачи за упражнение
Задача 1: Около кръгла маса има 6 стола, на които по случаен начин сядат, три
момчета, между които е и Ромео и три момичета, сред които е и Жулиета.
Намерете вероятността на събитията
А = “Ромео ще седне до Жулиета”,
В = “Ромео ще седне срещу Жулиета”,
С = “Ромео ще седне от ляво на Жулиета”,
Е = “Момичетата ще седнат едно до друго”,
О = “От двете страни на всяко момиче ще има момчета”.
Н = “От двете страни на Жулиета ще има момчета”.
3адача 2: На 7 картончета са написани цифрите 1, 2, 3, 4, 5, 6 и 7. По случаен
начин, последователно без връщане се изваждат три картончета и се поставят едно
до друго в реда на изваждането. Намерете вероятността на събитията
А = “Полученото трицифрено число ще е четно”,
В = “Полученото трицифрено число ще е нечетно”,
С = “Полученото трицифрено число ще е по – голямо от 300”,
Е = “Полученото трицифрено число ще е съставено само от нечетни цифри”,
F = “Полученото трицифрено число ще се дели на 9”,
За i = 0, 1, 2 или 3
Gi = “Точно i от цифрите му ще бъдат четни”,
Н = “Полученото трицифрено число ще е със строго растящи от ляво на дясно
цифри”,
I = “Полученото трицифрено число ще е със строго намаляващи от ляво на дясно
цифри”,
М = “Цифрите на полученото трицифрено число ще образуват от ляво на дясно
аритметична прогресия”.
Задача 3: В урна има 4 черни и 2 бели топки. Топките се вадят последователно,
a) без връщане,
б) с връщане
до първата поява на бяла топка. Нека с h (ета) е означен броя на изважданията.
Намерете вероятността на събитията
А = “h да е 3”,
В = “h да е четно”,
С = “h да е нечетно”,
Е = “никога да не извадим бяла топка”.
Задача 4: В урна има 7 топки, номерирани с числата от 1 до 7. Всички топки се
изваждат последователно, без връщане. Нека с x i е означен номера на i - тата
извадeна топка. Намерете вероятността на събитията
“x 1 < x 2 < x 3 < x 4 < x 5 < x 6 < x 7”,
“x 1 < x 2 < x 3 ”,
“x 1 £ x 2 £ x 3 ”,
А = “x 1 + x 2 + x 3 да е нечетно”,
В = “x 1 + x 2 + x 3 да е четно”,
С = “Няма да има последователно извадени топки с нечетни номера”,
D = “Няма да има последователно извадени топки с четни номера”,
E = “Ще има поне две последователно извадени топки с четни номера”,
F = “Ще има поне две последователно извадени топки с нечетни номера”.
където P(B)>0.
От тази дефиниция, лесно се получава следната формула за умножение на
вероятностите. Ако P(B)>0, то
ЗА САМОПОДГОТОВКА
Въпроси към темата
Могат ли две несъвместими събития да са независими? Обосновете отговора си.
Литература
P(Б1Б2) = P(Б1)P(Б2/Б1) =
Аналогично се доказва, че
P(Н1D) = P(H1)P(D/H1) =
Аналогично се доказва, че
P(Н2D) = , P(H1 )= и
P( H1 ) =
Тъй като благоприятстващите, базови за D събития са “Н1D” и “Н2D”, то
откъдето следва, че
Аналогично се получава, че
Ще намерим
Аналогично се получава, че
Пример 4: В първа урна има 2 бели и 2 черни топки. Във втора урна има 2 бели и 3
черни топки. От всяка урна по случаен начин се изваждат по две топки и се
поставят в трета празна урна, след което от нея пак по случаен начин се изваждат
две топки. Нека за i = 0, 1, 2, 3, Нi = “Броят на поставените в трета урна бели топки
е i”, а за i = 0, 1, 2 да означим с Аi събитието “Броят на извадените от трета урна
бели топки е i”. Намерете вероятностите на тези седем събития. Колко най-
вероятно е бил броят на белите топки, ако се е сбъднало събитието Аi, за i = 0, 1,
2?
Табл. 2
K 0 1 2 3 4 Сума
P (Hk) 3/60 18/60 28/60 10/60 1/60 1
P (A0 / Hk) 1 3/6 1/6 0 0 -
P (Hk) P (A0 / Hk) 9/180 27/180 14/180 0 0 P(A0)=50/180
P (Hk / A0) 9/50 27/50 14/50 0 0 1
P (A1 / Hk) 0 3/6 4/6 3/6 0 -
P (Hk) P (A1 / Hk) 0 27/180 56/180 15/180 0 P(A1)=98/180
P (Hk / A1) 0 27/98 56/98 15/98 0 1
P (A2 / Hk) 0 0 1/6 3/6 1 -
P (Hk) P (A2 / Hk) 0 0 14/180 15/180 3/180 P(A2)=32/180
P (Hk / A2) 0 0 14/32 15/32 3/32 1
Решение: При решаването на подобни задачи, трябва да се съобрази кой е първият
етап на провеждания опит. В тази задача, това е поставянето на топки в трета урна.
Една подходяща пълна група събития описваща резултатите от тази част на опита
е Н0, Н1, Н2, Н3, Н4. Удобно е да се състави Табл. 2:
За i = 0, 1, 2 да означим с Di събитието “Броят на извадените бели топки от първа
урна е i”, а с Еi събитието “Броят на извадените бели топки от втора урна е i”. Като
използваме факта, че събитията D0E2, D1E1 и D2E0 са 2 по 2 несъвместими, а
събитията Di и Еj са независими, получаваме
P(H2) = P(D0E2 È D1E1 È D2E0) =
= P(D0E2) + P(D1E1) + P(D2E0) =
= P(D0)P(E2) + P(D1)P(E1) + P(D0)P(E2) =
=
Аналогично се намират останалите четири априорни вероятности.
Сумите в първи, четвърти, седми и десети ред на таблицата са единици, защото се
сумират вероятности на пълни групи събития. По силата на формулата за пълната
вероятност, сумирайки числата от трети, шести и девети ред ще получим
съответно P(А0), P(А1) и P(А2). Апостериорните вероятности от четвърти, седми и
десети ред на горната таблица, са пресметнати по формулата на Бейс. От
таблицата се вижда, че ако са се сбъднали събитията А0, А1 и А2, то най-
вероятните предположения за състава на третата урна са съответно - Н1, Н2 и Н3.
Задачи за упражнение
Задача 1: Разпишете 24-те формули за умножение на вероятности на 4 събития.
Задача 2: Разпишете 11-те равенства определящи незави-симостта в съвкупност на
събитията А, В, С, D.
Задача 3: В първа урна има 2 бели и 2 черни топки. Във втора урна има 2 бели и 3
черни топки. От всяка от урните се изважда по една топка. Независими ли са
събитията
А1 = “От първа урна е извадена бяла топка” и
А2 = “От втора урна е извадена бяла топка”? Защо?
Задача 4: В първа урна има 2 бели и 2 черни топки. Във втора урна има 2 бели и 3
черни топки. От първа урна се изважда една топка и се прехвърля във втора урна,
след което от втора урна се изважда една топка. Независими ли са събитията
А1 = “От първа урна е извадена бяла топка” и
А2 = “От втора урна е извадена бяла топка”? Защо?
Задача 5: Едновременно се подхвърлят бял, зелен и червен зар. Нека с x 1, x 2, x 3,
са означени броевете на точките, които показват съответно белия, зеления и
червения зар.Независими ли са събитията:
а) “x 1 = 3”, “x 2 = 3” и“x 3 = 3”;
б) “x 1 = 3”, “x 2 < x 1” и“x 3 = 3”.
Защо? Независими ли са 2 по 2 горните тройки събития? Посочете 2 от тези 4
събития, които са независими.
в) Докажете, че събитията “x 1 + x 2 = 7” и “x 3 + x 2 = 7” са независими, а
събитията “x 1 + x 2 = 8” и “x 3 + x 2 = 10” не са независими;
г) Покажете, че P( x 1 = 3 / x 1 + x 2 = 8 ) = 0,2, P( x 1 + x 2 = 8 / x 2 + x 3 = 10 ) =
1/6, P( x 3 + x 2 = 10 / x 1 + x 2 = 8 ) = 0,1.
д) Докажете, че събитията “x 1 = 3”, “x 2 = x 1” и“x 2 = 3” са 2 по 2 независими, но
са зависими в съвкупност.
е) Докажете, че събитията “x 1 = 3”, “x 2 + x 1 = 7” и “x 2 = 4” са 2 по 2
независими, но са зависими в съвкупност.
Задача 6: В първа урна има 2 бели и 3 черни топки. Във втора урна има 2 бели и 2
черни топки. В трета - 3 бели и 1 черна топка. От първа урна по случаен начин се
изважда една топка и се прехвърля във втора урна, след което от втора урна се
изважда една произволна топка и се прехвърля в трета и накрая от трета урна по
случаен начин се изважда топка и се прехвърля в първа урна. Ако с d i смe
означили събитието от i – та урна е извадена бяла топка, за i = 1, 2, 3, а с А
събитието “След това трикратно прехвърляне цветовият състав на топките в
урните да е както в началото”, намерете
а) P( A );
б) P( d 1 / d 3 );
в) P( d 3 / d 1 ).
Задача 7: В първа урна има 2 бели и 3 черни топки. Във втора урна има 2 бели и 1
черна топка. В трета - 2 бели и 1 черна топка. От първа урна по случаен начин се
изваждат две топки и се прехвърлят във втора урна, след което от втора урна се
изваждат две произволни топки и се прехвърлят в трета и накрая от трета урна по
случаен начин се изваждат две топки и се прехвърлят в първа урна. Намерете
вероятността на събитието А = “След това трикратно прехвърляне броевете на
белите топки в урните да е както в началото”. Ако се е сбъднало А намерете
вероятностите на събитията “От трета урна да са извадени точно i – бели топки”,
за i = 0, 1, 2.
Задача 8: В урна има една червена, една зелена и 6 бели топки. Топките се вадят по
случаен начин, последователно, без връщане, до появата на червената топка. С q е
означен броят на извадените бели топки, а с G - събитието “Зелената топка ще
бъде една от извадените топки”. Кое е единственото възможно за q значение к, при
което събитията “ q = к ” и G са независими?
Задача 9: В урна има една 3 бели и 3 черни топки. От нея се изваждат по случаен
начин, без връщане толкова топки, колкото точки показва подхвърлен зар. Колко
точки най-вероятно е показал зарът, ако от урната са извадени i - бели топки,
където i = 0, 1, 2, 3?
Задача 10: По случаен начин, последователно, без връщане се изваждат две от
плочките на играта домино. Намерете вероятностите на събитията
а) “Извадените плочки ще паснат”, т.е. поне на едната половинка от първата
плочка броят на точките ще бъде равен на броя на точките върху поне едната
половинка от втората плочка;
б) “Броя на точките върху двете половинки на първата извадена плочка са равни,
ако двете извадени плочки са паснали”.
Ако m e цяло число, то x има две моди m и m-1. Ако m не е цяло число, mod x =
[m].
Вярно е, че
~ Р0(l ), ако
където k = 0, 1, 2, …
Ако l e цяло число, то h има две моди l и l -1. Ако l не е цяло число, mod h = [l].
Вярно е, че Eh = l , a Dh = l .
Нека един и същ опит се повтаря, докато се сбъдне събитието А и резултатите от
всеки опит са независими един от друг. Нека р e вероятността да се осъществи
събитието А, в резултат от провеждането на един от тези опити. Да означим с m
номера на опита, при който за първи път се е сбъднало събитието А. Ще наричаме
m геометрично разпределена случайна величина с вероятност за успех p.
Реда на разпределение на m е където
k = 1, 2, ….
mod m = 1, Em = , a Dm = .
Ще казваме, че x е равномерно разпределена случайна величина върху интервала
[а,b], накратко x ~ U (a, b), ако плътността на разпределение на x има вида
Функцията на разпределение
където и
се нарича разпределена по закона на Стюдент случайна величина с n-1 степени на
свобода. Накратко t n-1 ~ t (n-1).
Съществуват таблици, с помощта на които се определят, функцията на
разпределение, кватнилите и т.н. на стюдентово разпределени случайни величини.
Една такава таблица е табл. 3 в приложението.
Нека x 1, x 2,…,x n са независими, еднакво гаусово разпределени случайни
величини с параметри а1 и s 2. Нека h 1, h 2,…, h m също са независими, еднакво
гаусово разпределени случайни величини, но с параметри а2 и s 2 и редиците x 1, x
2, …, x n и h 1, h 2, …, h m също да са независими. Случайната величина
където
ЗА САМОПОДГОТОВКА
Въпроси към темата
За всяко реално число х функцията на разпределение е вероятност. Може ли да се
каже същото за плътността на разпределение?
Може ли средноквадратичното отклонение да е отрицателно число?
Ковариацията може да приема произволни реални значения. Може ли да се каже
същото за корелационния коефициент?
Може ли математическото очакване на случайната величина q да е извън
интервала от възможни значения на q ? Може ли да се каже същото за mod q ?
Литература
Стандартното отклонение е
Пример 2: В урна има 3 бели, 3 зелени и 3 червени топки. От урната по случаен
начин, без връщане се изваждат 3 топки. С x 1, x 2 и x 3 да означим броя на
извадените съответно бели, зелени и червени топки.
а) Еднакво разпределени ли са x 1, x 2, x 3?
б) Независими ли са x 1, x 2,x 3?
в) Намерете Еx k, Dx k, стандартното отклонение на x k, cov(x 1, x 2) и cor(x 1, x 2).
Решение: x i ~ Hi(3; 3, 6), k = 1, 2, 3, откъдето следва, че те са
P( x 1 = 0, x 2 = 0 ) =
P(x 1 = 0) = P(x 2 = 0) =
Пример 3: Последователно се подхвърля зар до третата поява на шест. С x 1, x 2 и
x 3 да означим съответно броя на подхвърлянията до първата поява на шестица,
след първата до втората поява на шестица включително и след втората до третата
поява на шестица, включително.Да означим с q общия брой на подхвърлянията на
зара.
а) Еднакво разпределени ли са x 1, x 2, x 3?
б) Независими ли са x 1, x 2,x 3?
в) Намерете Еx k, Dx k, стандартното отклонение на x k, Еq , Dq и стандартното
отклонение на q .
Решение: x 1,x 2,x 3 са независими геометрично разпределени случайни величини
с вероятност за успех р = 1 / 6, от където следва, че Еx k = 1 / р = 6, Dx k = (1-p) / p2
= 30, стандартното отклонение на x k, тогава е . Еq = Е(x 1 + x 2 + x 3 ) = Еx 1
+ Еx 2 + Еx 3 = 18, Dq = D(x 1 + x 2 + x 3 ) = Dx 1 + Dx 2 + Dx 3 = 90 и
стандартното отклонение на q e .
Пример 4: Със статистически методи е доказано, че h - броя на корабите, които
акустират на пристанище Варна на 01.06. е разпределена по закона на Поасон
случайна величина със средно значение 9 кораба. Намерете mod h , Eh , Dh ,
стандартното отклонение и вероятността на следващия 01.06. на пристанище
Варна да акустират най-много 6 кораба.
Решение: Eh = Dh = 9, cтандартното отклонение е 3, mod h = 7;8 кораба.
P(“На 01.06. на пр. Варна да акустират най-много 6 кораба”) =
Пример 5: Зар се подхвърля 180 пъти. Нека h е броя на падналите се шестици при
тези подхвърляния. Намерете mod h , Eh , Dh и стандартното й отклонение.
Задачи за упражнение
Задача 1: Ако е известно, че данните от Error! Reference source not found. са от
нормално разпределена извадка, пресметнете вероятността ако на събитието
“Брутната печалба на случайно избрана българска фирма, занимаваща се с
разглеждания вид дейност, да е между 30 000 и 40 000 лв.”.
Задача 2: Човек, който има в джоба си 2 монети по 20 ст. и 4 – по 5 ст., по случаен
начин изважда 3 монети. Нека q е общата стойност (в стотинки) на извадените
монети. Намерете реда на разпределение, модата, средното значение, дисперсията
и средното квадратично отклонение на q . Начертайте полигона и графиката на
функцията на разпределение на q .
Задача 3: Монета се подхвърля до третата поява на герб. Нека q е общият брой на
подхвърлянията на монетата. Намерете реда на разпределение, модата, средното
значение, дисперсията и средното квадратично отклонение на q . Начертайте
полигона и графиката на функцията на разпределение на q .
Упътване: q може да се представи като сума от 3 незав-исими, геометрично
разпределени случайни величини.
Задача 4: Със статистически методи е доказано, че h - броя на клиентите, които
посещават определен магазин между 9 часа и 9 часа и 5 мин. е разпределена по
закона на Поасон случайна величина със средно значение 3 клиента. Намерете mod
h , Eh , Dh , стандартното отклонение и вероятността на следващия ден между 9
часа и 9 часа и 5 мин. същия магазин да бъде посетен най-много от 5 клиента.
Задача 5: Когато човек купува 1 кг. сирене, той го получава с известно
приближение, така че точното тегло, което получава е случайна величина. Да я
означим с q . От предварителни изследвания е известно, че q ~ N(1, 0.0001).
Намерете вероятността на събитието действително закупения от нас грамаж на
сиренето да се отличава най-много с 5% от желания грамаж.
Задача 6: Човек има в джоба си 1 монета от 50 ст., 1 монета от 20 ст. и 4 – по 5 ст.
По случаен начин, последователно, без връщане изважда монети до момента,
когато общата им стойност ще стане повече от 20 ст. Нека q е общата стойност (в
стотинки) на извадените монети, t - стойността на последната извадена монета, x -
стойността на първата извадена монета, h 1 – общата стойност на извадените бели
монети, h 2 – общата стойност на извадените жълти монети, x 1 – броя на
извадените бели монети, x 2 – броя на извадените жълти монети. Намерете
редовете на разпределение, вероятностите поотделно всяка от разглежданите
величини да е четно число, намерете модите, средните значения, дисперсиите и
средните квадратични отклонения на така определените случайни величини.
Начертайте полигоните им и графиките на функциите им на разпределение.
Задача 7: От урна, в която има 2 бели, 2 зелени и 2 червени топки по случаен
начин, без връщане се изваждат 3 топки. С x 1, x 2 и x 3 да означим броя на
извадените съответно бели, зелени и червени топки. q да е x 1 + x 2 , t да е x 1 - x 2,
h да е x 1.x 2, m да е min(x 1,x 2), n да е max(x 1, x 2), z да е |x 1- x 2|. Намерете
редовете на разпределение, вероятностите поотделно всяка от разглежданите
величини да е четно число, намерете модите, средните значения, дисперсиите и
средните квадратични отклонения на така определените случайни величини.
Начертайте полигоните им и графиките на функциите им на разпределение.
Задача 8: От урна, в която има 5 топки номерирани с числата от 1 до 5 по случаен
начин, последователно, без връщане се изваждат 3 топки. С x 1, x 2 и x 3 да
означим номерата на извадените съответно първа, втора и трета топки. q да е x 1 +
x 2 , t да е x 1 - x 2, h да е x 1.x 2, m да е min(x 1,x 2), n да е max(x 1, x 2), z да е |x 1-
x 2|. Намерете редовете на разпределение, вероятностите поотделно всяка от
разглежданите величини да е четно число, намерете модите, средните значения,
дисперсиите и средните квадратични отклонения на така определените случайни
величини. Начертайте полигоните им и графиките на функциите им на
разпределение.
Задача 9: В урна има 6 бели и 2 черни топки. Всички топки се изваждат по случаен
начин, последователно, без връщане. С x 1, x 2 и x 3 да означим броя на
извадените бели топки съответно преди първата поява на черна топка, между
първата и втората поява на черна топка и след втората поява на черна топка. q да е
x 1 + x 2 , t да е x 1 - x 2, h да е x 1.x 2, m да е min(x 1,x 2), n да е max(x 1, x 2), z да
е |x 1- x 2|. Намерете редовете на разпределение, вероятностите поотделно всяка от
разглежданите величини да е четно число, намерете модите, средните значения,
дисперсиите и средните квадратични отклонения на така определените случайни
величини. Начертайте полигоните им и графиките на функциите им на
разпределение.
Задача 10: По случаен начин се избира трицифрено число. С x 1, x 2 и x 3 да
означим съответно първата, втората и третата цифра на това число. q да е x 1 + x
2 , t да е x 1 - x 2, h да е x 1.x 2, m да е min(x 1,x 2), n да е max(x 1, x 2), z да е |x 1- x
2|. Намерете редовете на разпределение, вероятностите поотделно всяка от
разглежданите величини да е четно число, намерете модите, средните значения,
дисперсиите и средните квадратични отклонения на така определените случайни
величини. Начертайте полигоните им и графиките на функциите им на
разпределение.
Задача 11: Едновременно се подхвърлят бял, зелен ичервен зар. Нека x 1, x 2 и x 3
са броя на точките, които са се паднали съответно на белия, зеления и червения
зар. q да е x 1 + x 2 , t да е x 1 - x 2, h да е x 1.x 2, m да е min(x 1,x 2), n да е max(x 1,
x 2), z да е |x 1- x 2|. Намерете редовете на разпределение, вероятностите
поотделно всяка от разглежданите величини да е четно число, намерете модите,
средните значения, дисперсиите и средните квадратични отклонения на така
определените случайни величини. Начертайте полигоните им и графиките на
функциите им на разпределение.
Задача 12: В първа урна има 3 бели и 2 зелени топки. Във втора урна има 1 бяла и
3 червени топки. От двете урни по случаен начин, последователно, без връщане се
изваждат по 2 топки. С x 1, x 2 и x 3 да означим съответно общия брой на
извадените бели, зелени и червени топки. q да е x 1 + x 2 , t да е x 1 - x 2, h да е x
1.x 2, m да е min(x 1,x 2), n да е max(x 1, x 2), z да е |x 1- x 2|. Намерете редовете на
разпределение, вероятностите поотделно всяка от разглежданите величини да е
четно число, намерете модите, средните значения, дисперсиите и средните
квадратични отклонения на така определените случайни величини. Начертайте
полигоните им и графиките на функциите им на разпределение.
Задача 13: Човек има в джоба си 1 монета от 50 ст., 1 монета от 20 ст. и 2 – по 5 ст.
По случаен начин, последователно, без връщане изважда 3 монети. . С x 1, x 2 и x
3 да означим съответно стойността в стотинки на извадените първа, втора и трета
монети. Нека q е x 1 + x 2 , t да е x 1 - x 2, h да е x 1.x 2, m да е min(x 1,x 2), n да е
max(x 1, x 2), z да е |x 1- x 2|. Намерете редовете на разпределение, вероятностите
поотделно всяка от разглежданите величини да е четно число, намерете модите,
средните значения, дисперсиите и средните квадратични отклонения на така
определените случайни величини. Начертайте полигоните им и графиките на
функциите им на разпределение.
Задача 14: По случаен начин, последователно се избират 3 от върховете на
правилен шестоъгълник със страна 1 дм. С x 1, x 2 и x 3 да означим съответно най-
малкия, средния и най-големия от ъглите в градуси на получения триъгълник.
Нека q е x 1 + x 2 , t да е x 1 - x 2, h да е x 1.x 2, m да е min(x 1,x 2), n да е max(x 1, x
2), z да е |x 1- x 2|. Намерете редовете на разпределение, вероятностите поотделно
всяка от разглежданите величини да е четно число, намерете модите, средните
значения, дисперсиите и средните квадратични отклонения на така определените
случайни величини. Начертайте полигоните им и графиките на функциите им на
разпределение.
Задача 15: По случаен начин, последователно се избират 3 от върховете на
правилен шестоъгълник със страна 1 дм. С x 1, x 2 и x 3 да означим съответно най-
малката, средната и най-голямата дължина на страна в дециметри на получения
триъгълник. Нека q е x 1 + x 2 , t да е x 1 - x 2, h да е x 1.x 2, m да е min(x 1,x 2), n
да е max(x 1, x 2), z да е |x 1- x 2|. Намерете редовете на разпределение,
вероятностите поотделно всяка от разглежданите величини да е четно число,
намерете модите, средните значения, дисперсиите и средните квадратични
отклонения на така определените случайни величини. Начертайте полигоните им и
графиките на функциите им на разпределение.
Задача 16: Група от 5 мъже и 10 жени по случаен начин се разделя на пет групи по
трима човека. С x 1, x 2 и x 3 да означим съответно броя на групите само от мъже,
само от жени и такива в които има и мъже и жени. Нека q е x 1 + x 2 , t да е x 1 - x
2, h да е x 1.x 2, m да е min(x 1,x 2), n да е max(x 1, x 2), z да е |x 1- x 2|. Намерете
редовете на разпределение, вероятностите поотделно всяка от разглежданите
величини да е четно число, намерете модите, средните значения, дисперсиите и
средните квадратични отклонения на така определените случайни величини.
Начертайте полигоните им и графиките на функциите им на разпределение.
ЗА САМОПОДГОТОВКА
Въпроси към темата
Кога е удобно да използваме P-P plot и кога Q-Q plot?
Литература
Задачи за упражнение
Задача 1: Изчертайте емпиричната функция на разпределение на студентите от
вашия курс по признака среден успех от дипломата за средно образование.
Приложими ли са разгледаните два метода за определянето на разпределението на
наблюдавания от вас признак? Защо?
Задача 2: Определете средномесечния разход за нощувки на туристите посетили
курортен комплекс Х и стандартното отклонение по този признак като използвате
данните от Задача 1 на § 1.2. Начертайте P-P plot и определете типа на
разпределението на фирмите по този признак.
Тук
Да обърнем внимание, че
ЗА САМОПОДГОТОВКА
Въпроси към темата
Кои оценки са най-добри?
Каква е разликата между съвместно разпределение на независими дискретни
случайни величини, независими непрекъснати случайни величини и функция на
правдоподобие?
Ако разполагате с данни от репрезентативна извадка, посочете добри оценки за
математическото очакване, дисперсията и емпиричната функция на разпределение
на изучавания признак. Обосновете защо избрахте точно тях.
Литература
Фиг. 1
и дължината на интервала (аn(X1, X2, …, Xn ), вn(X1, X2, …, Xn )] е минимална за
така избраното от нас a . За простота на записа надолу ще пишем само аn и вn.
Ще се спрем по-подробно на определяне на доверителен интервал на средното
аритметично на нормално разпределена съвкупност. Нека са извършени n на брой
независими наблюдения X1, X2, …, Xn върху нормално разпределена съвкупност,
т.е. X`1, X`2, …, X`n са независими, еднакво нормално разпределени и q е
неизвестния параметър. От математическата статистика е известно, че средната
аритметична q на нормално разпределени величини е нормално разпределена.
Тогава разпределението на q е симетрично относно математическото й очакване.
От свойствата на математическото очакване знаем, че математическото очакване
на средното аритметично съвпада с математическото очакване на осредняваните
величини. Ние не го знаем, но знаем, че средното аритметично на извадката е
много добра негова оценка. Тогава можем с него да центрираме q . С цел
опростяване на записа да изпуснем означението (X1, X2, …, Xn ) и да означим с
(6) P( ) = 1- a / 2
(7)
се използва не само за нормално разпределени извадки. Тази величина се нарича
стандартна стохастична грешка на средната аритметична, а z 1-a /2 – гаранционен
множител. Величината
(8)
се нарича максимална стохастична грешка.
Често пъти стандартното отклонение s на генералната съвкупност не е известно. В
този случай, при определянето на доверителния интервал се използва неговата
(9)
В случаите, когато съвкупността не е нормално разпределена се използва
Централната гранична теорема:
Асимптотичното разпределение на средното аритметично на всяка съвкупност с
крайна дисперсия е нормално.
С други думи при голям обем на извадката можем да приложим горния алгоритъм
за намиране на доверителен интервал на средното аритметично на извадка от
съвкупност с произволно разпределение и с крайна дисперсия. При възвратен
подбор, условието извадката да е голяма по обем, за да важи Централната
гранична теорема, не създава проблем. Ако обаче извадката е формирана с
връщане, за да важи Централната гранична теорема трябва тя да е голяма по обем,
а за да имаме проста извадка тя трябва да е с обем много по-малък от обема на
съвкупността. Във втория случай изследователят трябва да е много внимателен и
да намери подходящия обем на извадката, така че и двете условия за n да са
удовлетворени.
Когато подборът е с връщане и обема на извадката не е много по-малък от обема
на генералната съвкупност, стандартната грешка е по-малка в сравнение с тази
(11)
Доверителния интервал за средната аритметична в този случай (при известна
дисперсия на генералната съвкупност) е
(12)
Когато дисперсията на генералната съвкупност не е известна, заменяме s с .
Ако построяваме доверителен интервал на относителен дял, границите му се
ЗА САМОПОДГОТОВКА
Въпроси към темата
Защо се налага при построяване на доверителен интервал на средното
аритметично на генерална съвкупност да центрираме и нормираме случайните
величини и какво означава това?
Кога се използва Централната гранична теорема и какъв е смисъла й?
Начертайте на графиката на плътността на стандартното нормално разпределение
къде се намира гаранционния множител
z 1-a /2. Обяснете в какви съотношения правата, която минава през него и е
успоредна на ординатната ос, разделя лицата под кривата на плътността? Колко е
цялото лице на фигурата под кривата на плътността? Само за нормалното
разпределение ли е толкова или и за другите също?
В различните задачи при едно и също ниво на доверие един и същ гаранционен
множител ли се получава?
Променят ли се стандартната стохастична грешка и максималната стохастична
грешка, ако данните са различни, а гаранционния множител е един и същ?
Задачи за упражнение
Задача 1: В пример 1 на този параграф, е намерен доверителен интервал, като
използваните величини са пресметнати по непретеглените формули. По данните от
Error! Reference source not found., с равнище на значимост 0.05, постройте
доверителен интервал за средната брутна печалба на фирмите в България за 2004
г., които се занимават с разглеждания вид дейност.
Упътване: Трябва да използвате претеглените формули.
Кой доверителен интервал е по-точен и защо?
(14)
И от двете формули се вижда, че връзката между обема на извадката и
максималната стохастична грешка е обратно пропорционална. Това значи, че при
по-малки n ще получим по-широк доверителен интервал. Не можем, обаче да
намалим неограничено максималната стохастична грешка. Работа на
изследователя е да намери оптималния вариант.
Ако определяме n, с цел построяване на доверителен интервал на относителен дял,
се използват същите формули, но
като заменим в тях s с .
Изложената методология за определяне на обема на извадката може да се използва
и при оценка на други параметри на извадката. Това, което се променя е връзката
между максималната стохастична грешка на съответния параметър и n, а от тук и
вида на формулите (13) и (14).
ЗА САМОПОДГОТОВКА
Въпроси към темата
Покажете защо формули (13) и (14) са верни. В кои случаи се използват?
При една и съща максимална стохастична грешка и гаранционна вероятност, за
различни съвкупности еднакъв обем на извадката ли ще получим?
Задачи за упражнение
Задача 1: В разсадник се отглеждат за продажба дръвчета. В края на зимата трябва
да се определи броя на здравите дръвчета за продан. При изследване на леха от
сребрист клен с ширина 1 м, и дължина 430 м, по пътя на изчерпателното
изследване е намерен средният брой фиданки на м2. Той е 19 броя. Дисперсията се
е оказала 85,6 броя на м2. Колко метра леха трябва да се наблюдават, за да може да
се твърди с риск за грешка 5%, че броя на дръвчетата на м2 е средния брой,
пресметнат от извадката ± 2 бр.
ЗА САМОПОДГОТОВКА
Въпроси към темата
Дефинирайте понятията: Критична област, ниво на доверие, мощност на критерия.
Какво се получава с критичната област, грешката от втори род и мощността на
критерия, когато грешката от първи род намалява? Защо?
Какво значи, от математическа гледна точка, да проверим статистическа хипотеза?
Каква е математическата постановка на задачата?
Дайте примери на задачи, които изискват статистическа проверка на хипотези.
Формулирайте хипотезите и определете вида им.
Литература
1. Димитров, Б., Янев, Н. Вероятности и статистика. София, 1990.
2. Гатев, К. Въведение в общата теория на статистиката. София, 1980.
3. Ван-ден-Верден, Б. Д. Математическая статистика. 1960.
4. Hald, A. Statistical Theory with Engineering Applications. London, 1952.
Задачи за упражнение
Задача 1: Млекопреработвателна фирма решава да произвежда и пакетира краве
масло. За целта закупува машина, която го пакетира. След началото на
производствената дейност, контролните органи решават да проверят дали са
спазени изискванията по пакетирането. По случаен начин избират 100 пакетчета и
проверяват техните маси. Средната маса от извадката е 121 гр. Формулирайте
хипотезите, чиято проверка ще ни покаже дали средната маса на всички
произведени пакетчета е 125 гр или трябва да пренастроим машината? Определете
вида на хипотезите.
Задача 2: Фирма прозводител на хлебна пшеница решава да провери
ефективността на два вида торове върху добивите от пшеница. За целта се засяват
2 дка, от които половината се торят с тор А, а другата половина с тор В. Цените на
изразходваните торове са съответно 12 лв. и 12,80 лв. От пшеницата торена с тор А
са добити 300 кг при стандартно отклонение 0.3 кг на м2, а от тази торена с тор В -
350 кг, при стандартно отклонение 0.7 кг на м2. Каква проверка на хипотези ще
предложите на производителите за да решат кой тип тор е за предпочитане?
Определете вида на хипотезите.
Задача 3: Главният готвач на кухня в ресторант твърди, че не повече от 1% от
приготвените в кухнята стоки са с нестандартно тегло. Управителят на ресторанта
се съмнява в това и подлага на проверка 100 продукта, чрез случаен избор с
връщане. Оказва се, че Х бр. са нестандартни. Каква проверка на хипотези ще
предложите на управителя на ресторанта, за да постъпи коректно, без да обиди
своя персонал? Определете вида на хипотезите.
и случайната величина
срещу алтернативата
Н1 :
Една неизместена оценка на дисперсията на генералната съвкупност, в този
случай, се получава като претеглена средна аритметична на неизместените оценки
на дисперсиите на двете извадки с тегла съответно n1 - 1 и n2 - 1, т.е. тя е
Случайната величина
.
Критичната област има вида
Случайната величина
има разпределение на Стюдент с
срещу алтернативата,
ЗА САМОПОДГОТОВКА
Въпроси към темата
Какво е ниво на съгласие, критична област, грешка от първи род, риск за грешка от
първи род, грешка от втори род, риск за грешка от втори род, мощност на
критерия, оптимална критична област?
Как се определя грешката от първи род?
В кои случаи и как се построява оптимална критична област?
Можем ли да използваме критерия с отношението на правдоподобията при
проверка на проста хипотеза срещу проста алтернатива? Каква критична област ще
получим?
Казуси: По аналогичен начин с разгледаните в тази глава задачи изберете своя
постановка на задача произлязла от практиката. Направете изследвания и я
решете.
Задачи за упражнение
Задача 1: С ниво на съгласие 5% постройте критерий за проверка на хипотезата, че
средното на нормално разпределена генералната съвкупност е 125 срещу
алтернативата от 120 при предположение, че дисперсиите са известни и равни на
25 и a = 0.01.
Задача 2: Млекопреработвателна фирма решава да произвежда и пакетира краве
масло. За целта закупува машина, която го пакетира. След началото на
производствената дейност, контролните органи решават да проверят дали са
спазени изискванията по пакетирането. По случаен начин избират 100 пакетчета и
проверяват техните маси. Оказва се, че разпределението на извадката е нормално и
средната маса от извадката е 121 гр. С ниво на съгласие 5% можем ли да твърдим,
че средната маса на всички произведени пакетчета е 125 гр или трябва да
пренастроим машината?
(4)
Проверяваме хипотезата
ЗА САМОПОДГОТОВКА
Въпроси към темата
Колкото интервалите са по-тесни толкова разгледаните методи са по-точни. Защо?
За какво се използва c 2 критерия на Пирсън?
Защо Сa е 1- a квантила на c 2 разпределението с k-1-r степени на свобода?
Литература
1. Закс, Ш. Теория статистических выводов. Москва, 1975.
2. Cramer, H. Mathematical Methods of Statistics. Prienceton, 1946.
Да припомним, че и
Центрираме краищата на интервалите и получаваме третата колона в Табл. 1.,
където за i = 1,…, k сме използвали означението
Освен това F (а1c) = np1 и 1- F (а8c) = np8. Попълваме петата колонка от Табл. 1.
Табл. 1
aI fi аic Φ (aic) npi (fi -npi) (fi -npi)2 (fi -npi)2\(npi)
Н0 : F( x ) =
срещу алтернативата
Н1 : F( x ) ¹
с ниво на съгласие a .
Както вече знаем параметъра на Поасоновото разпределение е равен на
математическото му очакване, а средното аритметично е ефективна оценка за
математическото очакване. Ето защо в тази задача е логично да използваме вместо
параметъра l , неговата оценка
Т.е. през наблюдаваните дни средно на ден са били повредени 1,8 шевни машини.
От дефиницията за ред на разпределение на поасоново разпределена случайна
величина и от формула (5) определяме теоретичните честоти на съответните
значения. Получаваме, че за i = 0, …, 10
Табл. 2
Брой Брой Междинни изчисления
повредени дни
ifi npi npi (fi -npi) (fi -npi)2 (fi -npi)2\(npi)
машини ai fi
об. об. об. об.
за i = 1, …, k.
Избираме ниво на съгласие a . Проверяваме хипотезата
Н0 : , отклоненията между средните в различните групи се дължат
на случайни, кратко действащи фактори, т.е. влиянието на фактор признака върху
резултативния признак не е статистически значимо,
Алтернативата е Н1 :
Някои са различни, т.е. влиянието на фактор признака е статистически значимо.
Като критерий за проверка на тези хипотези се използва отношението на между
груповата и вътрешно груповата дисперсии. За да ги дефинираме се нуждаем от
следните понятия.
Обща девиация (отклонение) се нарича сумата от квадратите на отклоненията на
всичките n измерени стойности на метрирания признак от тяхната средна
аритметична. Ще я означаваме с SSо. Т.е. ако общата средна е
тогава
ЗА САМОПОДГОТОВКА
Въпроси към темата
За какво се използва дисперсионния анализ?
За какви съвкупности заключенията получени чрез дисперсионен анализ са най-
точни?
Какво характеризират общата, вътрешно груповата и между груповата девиации?
Ако знаем общата и вътрешно груповата девиации как ще намерим между
груповата?
В случая, когато оценката на между груповата дисперсия е по-малка от тази на
вътрешно груповата, защо и как се трансформира критичната област?
Вярно ли е, че вътрешно груповата девиация измерва разпръснатостта на средните
в групите около общата средна?
Основно 65.7 33.9 54.0 31 67.7 54.7 41.4 32.3 43.0 22.6
80.5 46.8 68.6 63.5 72.5 81.1 71.4 53.2 76.6 29.1 85.7 59.3 44.6
Средно
74.5 34.5 57.5 55.1 78.5 71.2 65.0 68.2 78.1 78.1 66.8 18.0 59.3
Бакалавър 59.1 23.5 68.8 53.1 74.7 64.5 75.9 78.4 75.0 58.0 54.2 47.6 60.2
54.6 27.4 70.6 35.0 26.7 51.0 78.4 72.6 62.1 56.5 28.2 34.4 71.7
44.9 36.5 61.5 45.5 52.7 59.3 74.7 58.3 32.9 77.4 73.9 35.8 42.6
67.3 41.3 64.1 44.5 68.7 73 56.1 47.3 40.7 58.1 55.5 50.3 60.3
51.6 85.8 57.2 47 64.6 67.5 44.3 64.3 13.5 63.3 66.2 21.7 64.8
магистър 62.7 79.7 51.6 57.1 29.8 67.8 59.6 48.9 70.8 25.9 61.8 27.3 33.1
83.6 65.2 37 70.2 73.4 56.7 69.2 61.6 69.3 20.9 63.2 64.7 55.2
40.4 37.8 17.7 13.9 46.5 25.2 45.5 75.8 43.3 14.0 61.8 46.0 44.9
Вече сме готови да проверим дали сме в критичната област за нулевата хипотеза.
Тъй като между груповата дисперсия е по-голяма от вътрешно груповата тя има
вида
Тогава сме в критичната област за нулевата хипотеза, т.е. с риск за грешка 0,05
можем да твърдим, че степента на образованост на управителя на фирмата оказва
статистически значимо влияние върху брутната й печалба.
Задачи за упражнение
Задача 1: Завод произвежда 3 вида автомобилни гуми. Наблюдавани са 36 от тях.
В Табл. 4 е даден пробега им в хиляди километри до момента на пълното им
износване, поотделно за трите вида. Проверете дали извадките са от нормално
разпределени съвкупности (като пренебрегнете факта, че наблюденията са
прекалено малко на брой за да получите правилно заключение). С ниво на
съгласие a , проверете можем ли да твърдим, че вида на гумите е статистически
значим за пробега им.
Табл. 4
Вид на Пробег в х.км.
гумите
А 4.5, 6.7, 8.8, 7.9, 3.0, 9.4, 6.5, 6.0, 4.4, 7.2, 5.7
В 4.4, 6.0, 5.0, 6.4, 3.7, 8.0, 7.9, 3.2, 9.3, 7.5, 6.0, 7.4, 6.3
С 5.4, 6.4, 7.0, 6.8, 5.7, 7.3, 7.7, 3.7, 8.4, 9.7, 7.2, 5.5
ЗА САМОПОДГОТОВКА
Въпроси към темата
За какво служи корелационния анализ?
В какъв интервал се изменят корелационните коефициенти и какво значи когато са
близо до 1? А до -1?
За какви съвкупности е вярно, че когато корелационния коефициент е 0 значи
имаме независимост на разглежданите признаци?
Кога пресмятаме коефициент на детерминация?
Литература
Да разгледаме двумерно, просто наблюдение (X1, Y1),… , (Xn, Yn), т.е. при
всички статистически единици се измерват значенията на два признака, правят се
наблюдения върху две случайни величини X` и Y`.
Коефициента на праволинейна корелация на Браве се определя по формулата
(1)
Както си личи от названието му, този коефициент измерва до колко точките от
корелационното поле се групират около права. В случая на репрезентативна
извадка, корелационния коефициент е точкова оценка за cor(X`,Y`). Повече за
качествата на тази оценка може да прочетете в Закс, Ш. Теория статистических
выводов. Москва, 1975.
Когато данните са групирани, т.е. представени в корелационна таблица се прилага
следната формула:
(2)
където k1, k2 са броя на групите, а s 1 и s 2 са съответно стандартните отклонения
на признаците X и Y. С fij е означен броя на статистическите единици, попаднали
в i – тата група на признака Х и в j – тата група на признака Y.
ЗА САМОПОДГОТОВКА
Въпроси към темата
Какво измерва коефициента на корелация на Браве?
Може ли при функционална зависимост между данните да получим корелационен
коефициент на Браве различен от 1?
Литература
1. Закс, Ш. Теория статистических выводов. Москва, 1975.
Табл. 1
Ср.РЗ ПТ
Междинни изчисления
Откл от Откл от Произв. от Кв. на откл. Кв. на откл.
Xi Yi
ф. № ср. на Х ср. на Y откл. по Х по Y
Табл. 2
Обем на краткотрайните активи в х.лв.
до 35 над 35 до 45 над 45 до 55 Над 55 до над 65
65
Среди на интервалите
Обем на ДМА в Брой
Д.х. лв. 30 40 50 60 70 фирми
до 15 10 15 5 3 0 0 23
над 15 до 25 20 7 20 7 4 0 38
над 25 до 35 30 3 15 18 9 2 47
над 35 до 45 40 1 4 17 19 5 46
над 45 до 55 50 0 3 5 10 5 23
Над 55 60 0 1 5 8 9 23
Табл. 3
30 40 50 60 70 Общо:
Задачи за упражнение
Задача 1: С цел изследване на зависимостта между обема на дълготрайните
материални активи и равнището на производи-телността на труда са наблюдавани
12 еднотипни промишлени предприятия. Резултатите от наблюдението са дадени в
Табл. 4.
Табл. 4
Фирма № 1 2 3 4 5 6 7 8 9 10 11 12
ДМА в млн. лв. 2 3.3 5.3 2.5 7 4.5 1.1 3.2 6.3 4.2 3.7 5.2
До 0,2 5 5 3 0 13
над 0,8 до 1 0 3 7 6 16
над 1 0 1 5 6 12
(3)
Да обърнем внимание, че от описаните разсъждения става ясно, че за да
използваме този коефициент, ранговете по един и същ признак трябва да са
различни числа от 1 до n.
За да разкажем как се пресмята ранговия коефициент на корелация на Кендал,
трябва да дефинираме понятията съответствия и инверсии. Да предположим, че
статистическите единици са подредени по ранговете на признака Х във възходящ
ред. Брой на съответствията рi на i – тата статистическа единица, се нарича броя на
двойките след i – тата, т.е. за j = i+1,…,n такива че Хi < Xj и Yi < Yj. Брой на
инверсиите qi на i – тата статистическа единица, се нарича броя на двойките след i
ГЛАВА 11. РЕГРЕСИОНЕН АНАЛИЗ
След усвояването на информацията от тази глава Вие ще можете:
11.1. СЪЩНОСТ
При еднофакторния регресионен анализ е добре да започнем с изчертаване на
корелационно поле. По абсцисната ос се нанасят значенията на фактор-признака
X, а по ординатната, на резултативния признак Y. По графичния образ на това
поле избираме линия, която най-добре ще приближава точките му. Трябва да
знаем аналитичното й представяне
(1) y = F(x, a),
където а е d-мерен вектор, чиито координати са неизвестни параметри за
функцията F.
По данните от извадката, използвайки метода на най-малките квадрати, правим
оценка на вектора а. Ще я означаваме с . Тя минимизира сумата от квадратите на
отклоненията (Yi – F(Xi, a)). Намира се като решим относно а, следната система
(2)
(3)
е най-добър.
След избора на модел се прави проверка на хипотезата, че отклоненията на
фактическите стойности от техните оценки имат случаен характер. За целта се
използва критерия за възходящите и низходящите серии от знаци. Проверява се
дали тези остатъци са еднакво разпределени. С някои от критериите за съгласие се
проверява дали разпределението им е нормално. Чрез критерия на Фон Нойман се
проверява хипотезата за липса на корелация в остатъчния компонент.
Алгоритмите и теоретичните обосновки на всички тези проверки могат да бъдат
намерени в Гатев, К. Въведение в общата теория на статистиката. София, 1980.
След намирането на уравнението на регресия можем да получим най-добра оценка
за Y по зададено значение на X.
В следващите параграфи на тази глава ще разгледаме по-подробно случаите,
когато точките от корелационното поле се групират около права или част от крива
от втора степен. В останалите случаи се работи по аналогичен начин. примери на
други модели могат да бъдат намерени на стр. 353 в Гатев, К. Въведение в общата
теория на статистиката. София, 1980.
ЗА САМОПОДГОТОВКА
Въпроси към темата
В кои случаи пресмятаме обща стандартна грешка на модела?
Защо решаваме система нормални уравнения?
По какво се различават фактор-признака и резултативния признак? Ще се промени
ли извода от регресионния анализ ако сменим местата им? Винаги ли можем да
сменим местата им?
Литература
1. Гатев, К. Въведение в общата теория на статистиката. София, 1980.
2. Петков, П. Статистика. ВСУ “Черноризец Храбър”, 2001.
(5)
Нейното решение означаваме с ( ). Тогава уравнението на регресия е
ЗА САМОПОДГОТОВКА
Въпроси към темата
Какъв е смисъла на коефициента в уравнението на изглаждащата права и как се
намира самия коефициент?
С какво се различава изглаждащата права от всички останали прави, които можем
да прекараме между точките от корелационното поле?
Кои са логическите обосновки, които ни дават основание да използваме
корелационния коефициент на Пирсън за измерител на силата на зависимостта
между наблюдаваните признаци?
Литература
1. Гатев, К. Въведение в общата теория на статистиката. София, 1980.
2. Петков, П. Статистика. ВСУ “Черноризец Храбър”, 2001.
Получаваме
Задачи за упражнение
Задача 1: При условието на Задача 1 на §10.2 определете формата на зависимостта
между обема на дълготрайните материални активи и равнището на
производителността на труда в наблюдаваните промишлени предприятия.
Пресметнете корелационния каефициент на Пирсън и го сравнете с този на Браве.
ГЛАВА 11. РЕГРЕСИОНЕН АНАЛИЗ
11.3. ЕДИНИЧНА НЕЛИНЕЙНА РЕГРЕСИЯ
(8)
Нейното решение означаваме с ( ). Тогава уравнението на регресия е
(9)
Анализирането му също е аналогично на праволинейния случай, с тази разлика, че
измерва разпръснатостта на точките от корелационното поле около разглежданата
крива от втора степен.
ЗА САМОПОДГОТОВКА
Въпроси към темата
Вярно ли е, че щом при праволинейна зависимост корелационния коефициент на
Пирсън съвпада с корелационния коефициент на Браве, то коефициента на Пирсън
не е подходящ за измерване на криволинейна зависимост?
Напишете системата нормални уравнения, която ще се получи ако за моделиране
на данните използваме клон от хипербола.
Нейното решение е
а1 = -5,799, а2 = 0,0410343, а3 = -0,0000006373.
Третият коефициент е близо до 0, следователно параболата е много близо до
права. Виж фиг. 19.
Фиг. 1
Задачи за упражнение
Задача 1: При условието на Задача 1 на § 10.2 моделирайте зависимостта между
равнището на производителността на труда и дълготрайните материални активи
като използвате уравнение на крива от втора степен. Кой модел е по-добър този
или праволинейния от Задача 1 на предния параграф?
а с верижна база
• с постоянна база:
• с верижна база:
ЗА САМОПОДГОТОВКА
Въпроси към темата
Като използвате понятията, дефинирани в този параграф, определете понятието
сложна лихва. Припомнете си как се пресмята.
Като сума от какви компоненти може да се представи всеки динамичен ред?
Кои от дефинираните в този параграф характеристики на динамичните редове са
абсолютни и кои са относителни величини?
Какъв е смисъла на понятието абсолютно значение на 1% от прираста? А на
понятието среден темп на прираста?
Примерни ситуации и решения
Пример 1: Посещенията на туристите в хотел Х за периода 1998–2004 г. са дадени
в първите две колонки на Табл. 1. Определете описателните характеристики за
изучаване на този динамичен ред.
Табл. 1
Абс. прираст в х. броя Темп на ръст в % Темп на прираст в % Абс. зн. на
Туристи в
Год. с пост. с пром. с пост. с пром. с пост. с пром. 1% от пр. в
х. души
база база база База база база х. бр.
1998 90 - - - - - - -
Общо: 634 4 6 x x x x х
.
Абсолютните прирасти с постоянна база са изчислени спрямо 1998 г. Например
D 1999/1998 = 89 – 90 = -1.
Т.е. през 1999 г. посещенията на туристите са намалели с 1000 души спрямо 1998
г.
D 2000/1998 = 87 – 90 = -3.
Т.е. през 2000 г. спрямо 1998 г. посещенията на туристите са намалели с 3000
души.
По аналогичен начин за останалите периоди.
Абсолютните прирасти с променлива база са изчислени по отделно за всяка година
спрямо предходната. Първият прираст съвпада. Втория се пресмята от
D 2000/1999 = 87 – 89 = -2.
Т.е. през 2000 г. спрямо 1999 г. посещенията на туристите са намалели с 2000
души и т.н.
По аналогичен начин за останалите периоди.
Средният абсолютен прираст за периода 1998 г.–2004 г. е
Т.е. ако броя на туристите през 1998 г. е 90 000 души и всяка година техния брой
нараства с 1000 души, през 2004 г. броя на туристите посетили хотел Х ще се
запази 96 000 души.
Темповете на ръст с постоянна база също са изчислени спрямо 1998 г.
Това значи, че ако броя на туристите през 1998 г. е 90 000 души. и всяка година
техния брой нараства с 1,0814% в сравнение с предходната година, тогава броя на
туристите посетили хотел Х през 2004 г. ще се запази на 96 000 души.
По аналогичен начин могат да се тълкуват и средните величини пресметнати от
характеристиките на динамичния ред с постоянна база.
Абсолютното значение на 1% от прираста в броя на туристите през 1999 г. спрямо
1998 г. е
Задачи за упражнение
Задача 1: Броят на туристите посетили през 1995 година еднотипните хотели А и Б
е бил равен. През 1996 г. броя на туристите в хотел А е намалял с 2,9%, през 1997
г., той се е увеличил с 8,9% в сравнение с предходната година и през 1998 г.
нараства с още 6,9% в сравнение с 1997 г. Броя на туристите в хотел Б, нараства
всяка година с r%. В края на 1998 г. броя на туристите в двата хотела е един и същ.
Намерете с колко процента на година нараства броя на туристите в хотел Б, т.е.
колко е r?
Задача 2: Броят на кандидат-студентите общо за редовно и задочно обучение в
специалност Икономика в университет Х за периода 1996–2004 г. са както следва
Табл. 2
Год. 1996 1997 1998 1999 2000 2001 2002 2003 2004
к.- ст. в бр. 330 420 480 540 560 600 670 720 890
Определете описателните характеристики за изучаване на този динамичен ред.
ГЛАВА 12. АНАЛИЗ НА ДИНАМИЧНИ РЕДОВЕ
12.2. МЕТОДИ И МОДЕЛИ ЗА АНАЛИЗ НА ТЕНДЕНЦИЯТА В РАЗВИТИЕТО
(1)
За петчленни
…,
По аналогичен начин за 7, 9, 11 и т.н. членни плъзгащи се средни. Виж пример 1.
При четен брой членове на реда, средните периоди са два, за това не можем да
работим както по-горе. При четиричленните плъзгащи се средни, първо
пресмятаме средната хронологична на първите четири члена на реда, после на
втория до петия член включително, след което определяме средната на тези две
величини и полученото число е третия член на изгладения ред. По аналогичен
начин постъпваме и с останалите членове на реда. Получаваме следните формули
за членовете на изгладения ред:
(2) …
Така при увеличаване броя на осредняваните величини, линейната диаграма на
изгладения ред е все по-плавна линия.
Основният недостатък на този метод е, че не може да се използва за прогнозиране.
Освен това, колкото повече увеличаваме броя на осредняваните величини, толкова
повече членове на реда губим.
Този метод също не се препоръчва при циклични временни редове.
· Метод на средния абсолютен прираст и средния темп
Първият метод се прилага, когато членовете на реда се изменят подобно на
аритметична прогресия, а втория - когато изменението е подобно на геометрична
прогресия. И двата начина могат да бъдат използвани за интерполация и
екстраполация на данни.
При осредняването чрез средния абсолютен прираст, първо пресмятаме , а след
това изгладените стойности на реда се получават, като към предходната
изгладена стойност прибавим , т.е.
- експоненциална функция
При работа с него за леснота полагаме t –1 = t`. Така го свеждаме към уравнение на
права.
Неизвестните коефициенти в избрания модел се определят по метода на най-
малките квадрати, т.е. така, че сумата от квадратите на разликите между
фактическите стойности yi и изгладените стойности да е минимална. Това се
постига с решаването на система нормални уравнения.
След пресмятане на изгладените стойности сравняваме разгледаните модели. Най-
подходяща е функцията, за която се получава най-малка стандартна грешка на
оценката
(4)
ЗА САМОПОДГОТОВКА
Въпроси към темата
За какво се използва метода на аналитичното изравняване?
По кои от изброените по-горе методи можем да направим прогноза за стойността
на изследваното явление през следващи периоди и за колко периода напред
прогнозата е добра?
В какво се състои метода на най-малките квадрати? Кога се използва?
Каква ще е системата нормални уравнения ако изглаждаме реда с полином от
трета степен?
Избройте уравнения на познати за вас функции, които могат се използват при
моделиране на тренда? Начертайте графиките на тези функции. Кога е удачно да
ги изберем? Виж Гатев, К. Въведение в общата теория на статистиката. София,
1980, стр. 353.
Литература
1. Петков, П. Статистика. Варна, 2001.
2. Петров, С., Велева–Стефанова, С. Обща теория на статистиката. Габрово, 2001.
3. Гатев, К. Въведение в общата теория на статистиката. София, 1980.
и следователно
Табл. 4. Брой на продадените телевизори в България за периода 1995–2003 г.
Междинни изчисления
Телев. в
Год.
бр. yi ti yi ti ti2
1995 15 432 -4 - 16 15 779.3 347.33 120640.35
Задачи за упражнение
Задача 1: Като използвате данните от Табл. 1 моделирайте тенденцията на
развитие
a ) по метода на тричленните плъзгащи се средни;
б ) по метода на четиричленните плъзгащи се средни;
в ) по метода на аналитичното изглаждане с уравнение на права. Направете
прогноза за следващата година.
ГЛАВА 12. АНАЛИЗ НА ДИНАМИЧНИ РЕДОВЕ
12.3. СТАТИСТИЧЕСКИ АНАЛИЗ НА СЕЗОННИ КОЛЕБАНИЯ
...
(6)
където е члена съответстващ на s-тия месец от i-тата година, а g е броя на
наблюдаваните години. Ако искаме да изготвим по този метод прогноза по месеци
за следващата година, използваме така определените средни величини. За да
определим абсолютния размер на сезонните колебания е необходимо да
пресметнем и средната хронологична на всичките данни, за целия изследван
период. Това може да бъде направено, като използваме формулата за претеглена
средна аритметична. След съкращаване получаваме
(7)
Да отбележим, че в тази средна са елиминирани влиянията на случайните и
сезонни фактори. Тя показва само най-типичното за съвкупността.
Характеристиките на сезонните колебания се определят по месеци.
Абсолютният размер на сезонните колебания представлява разликата между
средните месечни и общата средна, т.е.
...
(8)
Изразява в абсолютни числа отклонението на средната на изследваното явление за
съответния месец от средното равнище за разглеждания период. В това
отклонение са елиминирани случайните колебания. Ако в членовете на реда не се
съдържа тенденция на развитие, тези колебания са резултат само от сезонността.
Индексите на сезонните колебания измерват в относителни числа дела на
месечните средни от общата средна. Пресмятат се по формулите
(9)
Относителният размер на сезонните колебания характеризира в относителни числа
ГЛАВА 13. ИНДЕКСИ И ИНДЕКСЕН ФАКТОРЕН АНАЛИЗ
(2)
Тези индекси се появяват за първи път като индекси на цените. В тях обемите (в
случая продадените количества) са означени с q (от латинската дума quantitas), а
равнищата с p (от латинската дума pretium). Те измерват средното относително
изменение на цените (равнищата), на две различни съвкупности. Ако
индивидуалните индекси на равнищата ip са равни, индивидуалните индекси на
обемите iq са равни или няма линейна корелация между двете групи единични
индекси, то индексите на Ласпер и Пааше са равни. При правопропорционална
зависимост между индивидуалните индекси, индекса на Ласпер е по-малък от
индекса на Пааше. При обратнопропорционална зависимост между
индивидуалните индекси, обратно.
Всички множествени индекси се означават обикновено с I. Долният индекс
показва величината която се изменя, т.е. която се индексира, а величината в
скобите е тази, която е постоянна. Според това дали обемите се изменят или не
през индексирания спрямо базисния период, индексите на равнище биват с
променлив или с постоянен състав. Например индексите на Ласпер и Пааше са с
постоянен състав. Когато разделим индекс с променлив състав на съответния
индекс с постоянен състав получаваме индекс на структурата.
Динамичните индекси на средни равнища или, което е все едно индекси с
променлив състав, характеризират изменението на средното равнище на
съвкупността. Получават се като отношение на двете средни равнища
(3)
Да отбележим, че това не е същото като индекси на средното изменение на
равнищата. Защо? Как ще се определи средното изменение на равнищата?
Ако двете равнища в последния индекс съвпадат получаваме индекс на влиянието
на структурните изменения т.е. индекс на структурата.
(4)
Ако се нуждаем от съизмерител за да сумираме количествата, този индекс е
(5)
където с pc cме означили равнището съизмерител. При множествения индекс на
обем на Ласпер, съизмерител е равнището през базисния период, а при индекса на
обем на Пааше, съизмерител е равнището през индексирания период.
Динамичните индекси на маси характеризират едновременното изменение на
равнищата и обемите. Техният вид е
(6)
Ако изследваме изменението на явлението в повече от два периода от време, по
аналогия с горните индекси могат да се определят индекси с постоянна и верижна
база. Динамиката се изразява в индексираната величина, а ако има величина
съизмерител, тя се подбира според целта на изследването, обикновено от базисния
или индексирания период.
Подробно е описано приложението на тези индекси в Икономическата статистика
в Йорданов, В., Тодоров, Т. Основи на статистиката. Велико Търново, 2000, Глава
VIII. Различни връзки между индексите на равнище обем и маса, както и други
осредняващи методи за намирането им могат да бъдат намерени в Йорданов, В.,
Тодоров, Т. Основи на статистиката. Велико Търново, 2000.
ЗА САМОПОДГОТОВКА
Въпроси към темата
За какво се използват индексите на Ласпер и Пааше и в кои случаи техните
стойности са равни?
Как се анализира индекса с променлив състав? А как се разлага?
Литература
1. Йорданов, В., Тодоров, Т. Основи на статистиката. Велико Търново, 2000.
2. Гатев, К. Въведение в общата теория на статистиката. София, 1980.
Задачи за упражнение
Задача 1: Данните в Табл. 3 се отнасят до годишната посещаемост в 3 басейна на
фирма Х, през периода 2003, 2004 година.
Табл. 3
Цена на 1 билет в Продадени билети Реализиран
Басейн лв. в х.бр. стокооборот в х. лв.
2003 2004 2003 2004 2003 2004
А 1.5 2.0 12.2 8.3 18.30 16.60
Б 2.0 2.5 8.5 10.5 17.00 26.25
В 2.5 2.5 6.5 9.5 16.25 23.75
Изчислете и анализирайте
а) индивидуалните индекси на изменение на цените;
б) индивидуалните индекси на изменението на количеството на продажбите;
в) индивидуалните индекси на изменението на реализирания стокооборот;
г) средното относително изменение на обема на реализирания стокооборот;
д) средното относително изменение на цените общо за разглежданите басейни;
е) средното относително изменение на количеството на продажбите;
ж) индекса на изменение на средното равнище на цените;
з) индекса отчитащ влиянието на структурните промени.
Тяхната сума дава общия прираст в относителни числа. (Виж пример 1 след тази
тема.)
и субиндекс
(7)
Смисълът на тези връзки може да бъде намерен в пример 2 след тази тема.
По аналогичен начин се прави индексен факторен анализ при три и повече
фактори.
(8)
Той показва каква част от явлението през базисния период представлява явлението
през индексирания период и се разлага по следния начин
и
средните равнища на интензивния фактор, съответно през базисния и
индексирания период, с
където
Като използваме индекса на Пааше получаваме
където
(9)
В крайна сметка получаваме разлагането
(10)
• Ако формата на връзка е S = S pq и съвкупността не е еднородна индексът
на сложното съставно явление се определя отново по формула (8) и има
същия смисъл както в предния случай. Тъй като съвкупността е разнородна,
обемите не могат да се сумират без съизмерител и общия индекс се разлага
по следния начин
ЗА САМОПОДГОТОВКА
Въпроси към темата
За какво ни служи индексния факторен анализ?
Каква е основната разлика между индексния факторен анализ в адитивен и в
мултипликативен аспект?
Напишете разлаганията на индекса на сложното съставно явление при различните
форми на връзка.
Напишете разлаганията на прираста на сложното съставно явление при различните
форми на връзка.
Проверете верността на равенства (11), (12) и ( 13 ).
Литература
1. Гатев, К. Въведение в общата теория на статистиката. София, 1980.
Тогава
Задачи за упражнение
Задача 1: За изучаване на динамиката на себестойността на единица изделие е
направено изследване и са получени данните от Табл. 7.
Табл. 7
Разходи за единица продукция в лв.
Вид на разходите за
разглежданата пр-я
2003 г. 2004 г.
Материални р-ди 90 95
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9726 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9980
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
ПРИЛОЖЕНИЕ
Табл. 2. Ординати на стандартната нормална крива
х 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.3989 0.3989 0.3989 0.3988 0.3986 0.3984 0.3982 0.3980 0.3977 0.3973
0.1 0.3970 0.3965 0.3961 0.3956 0.3951 0.3945 0.3939 0.3932 0.3925 0.3918
0.2 0.3910 0.3902 0.38949 0.3885 0.3876 0.3867 0.3857 0.3847 0.3836 0.3825
0.3 0.3914 0.3802 0.3790 0.3778 0.3765 0.3752 0.3739 0.3725 0.3712 0.3697
0.4 0.3683 0.3668 0.3653 0.3637 0.3621 0.3605 0.3589 0.3572 0.3555 0.3538
0.5 0.3521 0.3503 0.3485 0.3467 0.3448 0.3429 0.3410 0.3391 0.3372 0.3352
0.6 0.3332 0.3312 0.3292 0.3271 0.3251 0.3230 0.3209 0.3187 0.3166 0.3144
0.7 0.3123 0.3101 0.3079 0.3056 0.3034 0.3011 0.2989 0.2966 0.2943 0.2920
0.8 0.2897 0.2874 0.2850 0.2827 0.2803 0.2780 0.2756 0.2732 0.2709 0.2685
0.9 0.2661 0.2637 0.2613 0.2589 0.2565 0.2541 0.2516 0.2492 0.2468 0.2444
1.0 0.2420 0.2396 0.2371 0.2347 0.2323 0.2299 0.2275 0.2251 0.2227 0.2203
1.1 0.2179 0.2155 0.2131 0.2107 0.2083 0.2059 0.2036 0.2012 0.1989 0.1965
1.2 0.1942 0.1919 0.1895 0.1872 0.1849 0.1826 0.1804 0.1781 0.1758 0.1736
1.3 0.1714 0.1691 0.1669 0.1647 0.1626 0.1604 0.1582 0.1561 0.1539 0.1518
1.4 0.1497 0.1476 0.1456 0.1435 0.1415 0.1394 0.1374 0.1354 0.1334 0.1315
1.5 0.1295 0.1276 0.1257 0.1238 0.1219 0.1200 0.1182 0.1163 0.1145 0.1127
1.6 0.1109 0.1092 0.1074 0.1057 0.1040 0.1023 0.1006 0.0989 0.0973 0.0957
1.7 0.0940 0.0925 0.0909 0.0893 0.0878 0.0863 0.0848 0.0833 0.0818 0.0804
1.8 0.0790 0.0775 0.0761 0.0748 0.0734 0.0721 0.0707 0.0694 0.0681 0.0669
1.9 0.0656 0.0644 0.0632 0.0620 0.0608 0.0596 0.0584 0.0573 0.0562 0.0551
2.0 0.0540 0.0529 0.0519 0.0508 0.0498 0.0488 0.0478 0.0468 0.0459 0.0449
2.1 0.0440 0.0431 0.0422 0.0413 0.0404 0.0396 0.0387 0.0379 0.0371 0.0363
2.2 0.0855 0.0347 0.3390 0.0332 0.0325 0.0317 0.0310 0.0303 0.0297 0.0290
2.3 0.0283 0.0277 0.0270 0.0264 0.0258 0.0252 0.0246 0.0241 0.0235 0.0229
2.4 0.0224 0.0219 0.0213 0.0203 0.0203 0.0198 0.0194 0.0189 0.0184 0.0180
2.5 0.0175 0.0171 0.0167 0.0163 0.0158 0.0154 0.0151 0.0147 0.0143 0.0139
2.6 0.0136 0.0132 0.0129 0.0126 0.1220 0.0119 0.0116 0.0113 0.0110 0.0107
2.7 0.0104 0.0101 0.0099 0.0096 0.0093 0.0091 0.0088 0.0086 0.0084 0.0081
2.8 0.0079 0.0077 0.0075 0.0073 0.0071 0.0069 0.0067 0.0065 0.0063 0.0061
2.9 0.0060 0.0058 0.0056 0.0055 0.0053 0.0051 0.0050 0.0048 0.0047 0.0046
3.0 0.0044 0.0043 0.0042 0.0040 0.0039 0.0038 0.0037 0.0036 0.0035 0.0034
4.0 0.0001 0.0001 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000
ПРИЛОЖЕНИЕ
Табл.3. Разпределение на Стюдент (t - разпределение)
При двустранна критична област
0.1 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
х
При едностранна критична област
0.2 0.1 0.05 0.02 0.01 0.005 0.002 0.001
1 3.078 6.314 12.706 31.821 63.657 127.320 318.300 636.619
2 1.886 2.920 4.303 6.965 9.925 14.090 22.330 31.598
3 1.638 2.353 3.182 4.541 5.841 7.450 10.210 12.941
4 1.563 2.132 2.776 3.747 4.604 5.600 7.170 8.610
5 1.476 2.015 2.571 3.365 4.043 4.770 5.890 6.859
6 1.440 1.943 2.447 3.143 3.707 4.320 5.210 5.959
7 1.415 1.895 2.365 2.998 3.499 4.030 4.790 5.405
8 1.397 1.860 2.306 2.896 3.355 3.830 4.500 5.041
9 1.383 1.833 2.262 2.821 3.250 3.690 4.300 4.781
10 1.372 1.812 2.228 2.764 3.169 3.580 4.140 4.583
ПРИЛОЖЕНИЕ
св.на 1 2 3 4 5 6 8 12 24 ∞
числ.
1 161.40 199.50 215.70 224.60 230.20 234.00 238.90 243.90 249.00 254.30
2 18.51 19.00 19.16 19.25 19.30 19.33 19.37 19.41 19.45 19.53
3 10.13 9.55 9.28 9.12 9.01 8.94 8.84 8.74 8.64 8.53
4 7.71 6.94 6.59 6.39 6.26 6.16 6.04 5.91 5.77 5.66
5 6.61 5.79 5.41 5.19 5.05 4.95 4.82 4.68 4.53 4.37
6 5.99 5.14 4.76 4.53 4.39 4.28 4.15 4.00 3.84 3.60
7 5.59 4.74 4.35 4.12 3.97 3.87 3.73 3.57 3.41 3.23
8 5.32 4.46 4.07 3.84 3.69 3.58 3.44 3.28 3.12 2.93
9 5.12 4.26 3.86 3.63 3.48 3.37 3.23 3.07 2.90 2.71
10 4.96 4.10 3.71 3.48 3.33 3.22 3.07 2.91 2.74 2.54
11 4.84 3.98 3.59 3.36 3.20 3.09 2.95 2.79 2.61 2.40
12 4.75 3.88 3.49 3.26 3.11 3.00 2.85 2.69 2.50 2.30
13 4.67 3.80 3.41 3.18 3.02 2.92 2.77 2.60 2.42 2.21
14 4.60 3.74 3.34 3.11 2.96 2.85 2.70 2.53 2.35 2.13
15 4.54 3.68 3.29 3.06 2.90 2.79 2.64 2.48 2.29 2.07
16 4.49 3.63 3.24 3.01 2.85 2.74 2.59 2.42 2.24 2.01
17 4.45 3.59 3.20 2.96 2.81 2.70 2.55 2.38 2.19 1.96
18 4.41 3.55 3.16 2.93 2.77 2.66 2.51 2.34 2.15 1.92
19 4.38 3.52 3.13 2.90 2.74 2.63 2.48 2.31 2.11 1.88
20 4.35 3.49 3.10 2.87 2.71 2.60 2.45 2.28 2.08 1.84
21 4.32 3.47 3.07 2.84 2.68 2.57 2.42 2.25 2.05 1.81
22 4.30 3.44 3.05 2.82 2.66 2.55 2.40 2.23 2.03 1.78
23 4.28 3.42 3.03 2.80 2.64 2.53 2.38 2.20 2.00 1.76
24 4.26 3.40 3.01 2.78 2.62 2.51 2.36 2.18 1.98 1.73
25 4.42 3.38 2.99 2.76 2.60 2.49 2.34 2.16 1.96 1.71
26 4.22 3.37 2.98 2.74 2.59 2.47 2.32 2.15 1.95 1.69
27 4.21 3.35 2.96 2.73 2.5 2.46 2.30 2.13 1.93 1.67
28 4.20 3.34 2.95 2.71 2.56 2.44 2.29 2.12 1.93 1.65
29 4.18 3.33 2.93 2.70 2.54 2.43 2.28 2(10 1.90 1.64
30 4.17 3.32 2.92 2.69 2.53 2.42 2.27 2.09 1.89 1.62
40 4.08 3.23 2.84 2.61 2.45 2.34 2.18 2.00 1.79 1.52
60 4.00 3.15 2.76 2.52 2.73 2.25 2.10 1.92 1.70 1.39
120 3.92 3.0 2.68 2.45 2.29 2.17 2.02 1.83 1.61 1.25
∞ 3.84 2.99 2.60 2.37 2.21 2.09 1.94 1.75 1.52 1.00
Табл.5. (Продължение) Разпределение на Фишер (F разпределение) при a = 0.01
Ст.на Степени на свобода на знаменателя
св.на 1 2 3 4 5 6 8 12 24 ∞
числ.
1 4052 4999 5403 5625 5764 5859 5981 6106 6234 6366
2 98.49 99.01 99.17 99.25 99.30 99.33 99.36 99.42 99.46 99.50
3 34.12 30.81 29.46 28.71 28.24 27.91 27.49 27.05 26.60 26.12
4 21.20 18.00 16.69 15.98 15.52 15.21 14.18 14.37 13.93 13.46
5 16.26 13.27 12.06 11.39 10.97 10.67 10.29 9.89 9.47 9.02
6 13.47 10.92 9.78 9.15 8.75 8.47 8.10 7.72 7.31 6.88
7 12.25 9.55 8.45 7.85 7.46 7.19 6.84 6.47 6.07 5.65
8 11.26 8.65 7.59 7.01 6.63 6.37 6.03 5.67 5.28 4.86
9 10.56 8.02 6.99 6.42 6.06 5.80 5.47 5.11 4.78 4.31
10 10.04 7.56 6.55 5.99 5.64 5.39 5.06 4.71 4.33 3.91
11 9.65 7.20 6.22 5.67 5.32 5.07 4.74 4.40 4.02 3.06
12 9.33 6.93 5.95 5.41 5.06 4.82 4.50 4.16 3.78 3.36
13 9.07 6.70 5.74 5.20 4.86 4.62 4.30 3.96 3.59 3.16
14 8.86 6.51 5.56 5.03 4.69 4.46 4.14 3.80 3.43 3.00
15 8.68 6.36 5.42 4.89 4.56 4.32 4.00 3.67 3.29 2.87
16 8.53 6.23 5.29 4.77 4.44 4.20 3.89 3.55 3.18 2.75
17 8.40 6.11 5.18 4.67 4.34 4.10 3.79 3.45 3.08 2.65
18 8.28 6.01 5.09 4.58 4.25 4.01 3.71 3.37 3.00 2.57
19 8.18 5.93 5.01 4.50 4.17 3.94 3.63 3.30 2.92 2.49
20 8.10 5.85 4.94 4.43 4.10 3.87 3.56 3.23 2.86 2.42
21 8.02 5.78 4.87 4.37 4.04 3.81 3.51 3.17 2.80 2.36
22 7.94 5.72 4.82 4.31 3.99 3.76 3.45 3.12 2.75 2.31
23 7.88 5.66 4.76 4.26 3.94 3.71 3.41 3.07 2.70 2.26
24 7.82 5.61 4.52 4.22 3.90 3.67 3.36 3.03 2.66 2.21
25 7.77 5.57 4.68 4.18 3.86 3.63 3.32 2.99 2.62 2.17
26 7.72 5.53 4.64 4.14 3.82 3.59 3.29 2.96 2.58 2.13
27 7.68 5.49 4.60 4.11 3.78 3.56 3.26 2.93 2.55 2.10
28 7.64 5.45 4.57 4.07 3.75 3.53 3.23 2.90 2.52 2.06
29 7.60 5.42 4.54 4.04 3.73 3.50 3.20 2.87 2.49 2.03
30 7.56 5.39 4.51 4.02 3.70 3.47 3.17 2.84 2.47 2.01
40 7.31 5.18 4.31 3.83 3.58 3.29 2.99 2.66 2.29 1.80
60 7.08 4.98 4.13 3.65 3.34 3.12 2.82 2.50 2.12 1.60
120 6.85 4.79 3.95 3.48 3.17 2.96 2.66 2.34 1.95 1.38
∞ 6.64 4.60 3.78 3.32 3.02 2.80 2.51 2.18 1.79 1.00