Манга
Манга
Занимательная
СТАТИСТИКА
Син Такахаси
Перевод с японского
Москва
Издательский дом «Додэка-XXI»
2010
УДК 311
ББК 60.6
Т15
Такахаcи, Син.
Т15 Занимательная статистика. Манга / Син Такахаси ; пер. с яп. Захаровой Е. А., Коги
Муцуми. — М. : Додэка-ХХI, 2010. — 224 с. : ил. — (Серия «Образовательная Ман-
га»). — Доп. тит. л. яп. — ISBN 978-5-94120-244-7.
I. Захарова, Е. А., пер.
Если тебя интересует статистика, или тебе просто нужно как-то обработать данные, то
«Занимательная статистика» поможет тебе преодолеть чувство, что «ты плохо знаешь мате-
матику». Этот иллюстрированный путеводитель легко и непринуждённо проведёт тебя по пути
познания статистики. А полученные знания ты сможешь закрепить с помощью упражнений, без
которых, как известно, не обходится ни одна книга по математике.
Последуй за всегда невозмутимым Ямамото и ты увидишь, как он научит Руи:
• рассчитать среднее значение, медиану и стандартное отклонение результатов в боулинге;
• построить гистограмму цен на китайскую лапшу рамэн;
• определить вероятность получения проходного балла на экзаменах по математике;
• вычислить коэффициент Крамера, чтобы узнать, как предпочитают признаваться в любви
юноши и девушки;
• узнать, как нормируются результаты тестов, когда учителя оценивают успеваемость.
Эти и другие примеры из реальной жизни позволят тебе с лёгкостью усвоить то, что многие
находят трудным для понимания.
Если ты хочешь разобраться в статистике, но от обычных учебников статистики у тебя
пухнет голова и клонит в сон, или если тебе просто нужно освежить забытые знания, пусть
Ямамото-сан и Руи будут твоими гидами.
Книга будет полезна учащимся старших классов средних школ и колледжей, студентам ву-
зов, а также всем, кто интересуется статистикой и хочет, чтобы обучение было лёгким и увле-
кательным.
УДК 311
ББК 60.6
Все права защищены. Никакая часть этого издания не может быть воспроизведена в любой
форме или любыми средствами, электронными или механическими, включая фотографирование,
ксерокопирование или иные средства копирования или сохранения информации, без письменного
разрешения издательства.
vi Содержание
Предисловие
Данная книга — наглядное учебное пособие по статистике, которое, в первую очередь,
предназначается тем, кому приходится заниматься анализом различных данных, а также
тем, кто пока такой анализ не проводит, но хотел бы знать, что же такое статистика.
Автору также будет весьма приятно, если книга окажется интересной и для тех, кто
уже изучал эту дисциплину.
Статистика — одна из областей математики, тесно связанная с жизнью и работой.
Если овладеть всеми премудростями этой науки, то можно, например:
• предусмотреть, сколько коробок жареной лапши будет продано в студенческом ки-
оске, который планируется открыть на университетском празднике;
• оценить вероятность успешной сдачи квалификационного экзамена;
• сравнить вероятность выздоровления, если принимать лекарство Х и не принимать
это лекарство.
Книга содержит 7 глав. За некоторым исключением, главы книги построены следую-
щим образом:
• манга (комикс);
• объяснение, дополняющее мангу;
• упражнения и ответы;
• выводы.
Книга написана так, что читатель может усвоить материал, прочитав только мангу. А
вот чтобы получить более глубокие знания, придётся прочитать и всё остальное.
Предел мечтаний автора — читатель, который, перевернув последнюю страницу кни-
ги, скажет: «Статистика — это так интересно! Но это ещё и полезно! Да это просто здо-
рово!».
Я бесконечно благодарен всем сотрудникам редакции издательства Ohmsha за пре-
доставленную мне возможность написать эту книгу, а также всем сотрудникам компании
Trend-Pro. Я глубоко признателен г-ну Ре Акино, автору сценария, и г-ну Ироха Иноуэ,
воплотившему этот сценарий в виде рисунков, за те титанические усилия, которые им при-
шлось приложить, чтобы на основе моей рукописи создать потрясающий комикс. Я также
благодарен г-ну Фумитакэ Сакаи (социологический факультет университета Риккё), со-
ветами которого я руководствовался во время работы над этой книгой.
Син Такахаси
Июль, 2004 год
Пролог
Любовь
и статистика
А вот и мы.
Извините
за беспокойство.
Проходите, пожалуйста.
Извините,
у нас тесновато…
Какой
хорошенький!
Добрый
вечер.
ркетингом?
Ма
Работаю
в одной компании
с твоим отцом.
Возможно,
вы еще не проходили в школе,
что такое маркетинг ?
Честная девочка.
Ну, а что такое статистика, Вижу, что нет.
знаешь? В общем, статистика — наука,
изучающая
большие совокупности
однородных объектов
на основании
их выборочного
исследования.
Эээ…
Чтото
я слишком
загнул.
…
…о
ВЕДОМ
им
ОСТИ
ст
иф
ж
Упоф
Не
По исследованиям, проведённым
газетой "Ведомости", И что это
рейтинг кабинета министров значит?
среди избирателей 39%.
Меня...
Нет, меня тоже
не спрашивали.
ЗА н,
О ди д
ИВ
ва, три …
прот
ив ПРОТИВ
Поэтому опрос
проводят
среди ограниченного
числа респондентов.
Поня...тно
Папа, ты что,
В статистике исследуемые объекты надо мной издеваешься,
или явления называются генеральной говоря такие
совокупностью, а часть объектов такой сложные вещи?!
совокупности, отобранных для её изучения,
называют выборочной совокупностью
(или выборкой).
Плачет
Я не хотел
тебя рас*
страивать
Вывоку
я
со
на ь…
аль ост
бо пн
р
ро ос
е н
Ген окуп
чн ть
сов
ая …
Нетнет. Это
1м2
в следующий раз.
Ограничимся 1 м2
и воспользуемся
помощью статистики!
Ул
ы
ба
Кажется, я начинаю ет
ся
понимать.
И что дальше?
Какой же
он симпатяга…
Мечтает Сжимает
хватает
мишку
Как бы поближе
Мысли о нём познакомиться
делают
Смеется
меня
счастливой … с Игараси*сан?
вид
нд
я
ят
и
у
в л альные зан сии
юбви согла
и
Хи*Хи*Хи
Клёвая
идея.
р о
ы т
д р
а а
е
т д
о
с
т
и
Хорошо!
Отлично! Можно даже,
Каждую субботу чтобы это был
к тебе будет ваш сотрудник,
приходить
репетитор! (скажем,
Игарасисан!!)
Наступила суббота
з
Доверь это мне! в
о
н
о
к
в
д
в
е Спасибо, что пришёл!
Йес! р Заходи.
ь
Пролог. Любовь и статистика 9
Пришёл!
Эй, Руи!
Учитель
пришёл.
Да, идуиду.
топ
'
топ
'
топ
Привет…
Очень
Кто этот приятно!
парень?!!
Папа,
а Игарасисан? Причём тут
Игараси?
Мамору
и живёт ближе,
и учить будет
не хуже.
Ну,
я пошёл,
счастливо
позаниматься.
У*У*У…
Ну что, Руи,
начнём?
Игараси*сан, Отлично!
я постигла Будем работать
все премудрости вместе!
статистики!
Руи…?
(Не об этом
я мечтала)
Начнём
Идея!
прямо
сейчас!
O … Ok.
Он помотжет мнеику,
с атист
выучить ану ближе
и я ст си*сан !!! Так начались их занятия…
к Игара
Никогда не сдавайся!
Итак,
Ямамотосан,
с чего начнём?
Ну…
Для начала
хорошо бы Дай
чтонибудь подумать…
совсем
простенькое…
Ааа… (удивленно)
(удивлённо)
Майский дождь 4
Майский дождь 3
О, да я вижу, у тебя
Майский дождь
Майский дождь
Повесть о школе
Повесть о школе
Повесть о школе
«Повести о школе».
т)
ро ,
и д ся
жа
ук ует
Это мой
е р лн
аж во
любимый
о д так
сериал!
чт (
Немного…
Нуну…
Но какое отношение
она имеет к статистике? Повесть о школе, т. 5
Анкета постоянных читателей
Вопрос 1. Ваше мнение о 5м томе
«Повести о школе»?
(Хсим
книтает
1. Очень интересно
*еХеи
гу)
т*сХя
2. Довольно интересно
с
(ли
и)
3. Так себе
4. Скучновато
5. Совершенно неинтересно
сь…
Ка глупы бе
т я те ла.
ы
пост Я…
араю
А ери
пов
Вспышка
Но
ты не
… можно получить, нравим
шьс
… я
брелок «Рина»
если, конечно, повезёт.
Мммм…
Да мне
както…
Поста
то
раюсь. (что*
)
Так пишет
сразу?..
Вот и хорошо.
А довольно интересно ж 17 1
Б так себе м 18 5
В скучновато м 22 7
Г довольно интересно ж 25 4
Д совершенно неинтересно м 20 3
Е очень интересно ж 16 1
Ж довольно интересно ж 17 2
З так себе м 18 0
И так себе ж 21 3
Давай
представим
результаты
анкетирования,
например,
в таком виде. Давайте.
Прямо
одержимый
какойто…
которые … и которые
нельзя измерить … можно измерить
ко
ли
че
ст
ве
нн
ые
ые
твенн
ес
кач
17 лет е
е данны
Вопрос 3. Ваш возраст? ____
е с нны журнала
твевыпусков
о л ч
Вопрос 4. Сколько
и
К вы приобретаете в месяц? __ шт 2
Среди участников
анкетирования
будут разыграны
30 брелоков
«Рина»!
Качественные данные —
это данные, которые
нельзя измерить.
Аа, понятно.
Количественные данные —
данные, которые
можно измерить.
Вопрос
1
«Повест . Ваше мнени
и о шко е
1. Очень ле».
инте ресно
2. Довол
ьно инте
3. Так се ресно
Однако… 4. Скучн
бе
овато
Ах, согласен?!
5. Совер
шенно
неинте
ресно
Тогда, может быть,
объясните,
в чём тут дело.
Сначала вывод:
варианты ответов
на вопрос 1
относятся
к качественным Почему?!
данным.
Видишьли, Возьмём
шкала оценок,
конкретный
или отзывов,
не имеет равных пример...
интервалов.
Ну, и что…
Что??
Сколько ты
весишь? Что?!
Слава богу,
ты уже не
сердишься.
Для измерения
роста используют Да!
так называемый
ростомер, так?
Извини.
Посмотри
на эту шкалу. Да…
Это значит,
что шкала имеет равные,
или одинаковые, интервалы
между соседними делениями.
Следовательно,
рост можно измерить Теперь перейдём
и он, таким образом, к следующему
Ура,
относится к примеру.
поняла!
количественным данным.
Что
теперь?
звук открывания
Открываем...
крышки ноутбука
Так…
из « ебя обои
оле» ти
с
Пове
т
Ой, у
о шк
Короче,
Руи, ты же сдавала ты сдавала
квалификационный экзамен экзамен
по английскому языку, который Eiken ?
проводит общество для тестирования
знания английского языка ?
Об этом
этом
мне сказал
мне сказал
твой папа.
твой папа.
1й уровень 2й уровень 3й уровень 4й уровень 5й уровень
Критерии сложности
экзамена я представил Ухты…
в виде таблицы.
Количество слов,
которые необходимо знать,
зависит от уровня
сложности экзамена.
Так?
Да.
Но кроме количества слов,
существует и разная
степень сложности…
«Повесть о
Анкета посто школе», т. 5
Молодец, Руи, янных чита
телей
я вижу, ты поняла, Вопрос 1. Ва
ше мнение
о 5м томе
«Повести о
да ? школе»?
1. Очень ин
тересно
2. Довольно
интересно
3. Так себе Можно сказать,
4. Скучнова
5. Совершен
то что интервалы
но неинтере
Вопрос 2. Ва
сно между вариантами
ш пол?
1. ж 2. м ответов на вопрос 1
Вопрос 3. Ва
ш возраст?
17
__ лет
равны ?
Вопрос 4. Ск
олько выпу
вы приобрет сков журнал
аете в меся а
ц? __ шт 2
Среди участн
иков
анкетировани
Потому что
у каждого опрошенного
свой вкус.
Правильно!
Качественные ! Количественные!
Количественные! Качественные!
Встретимся на
Спасибо! следующей неделе.
Кстати,
Ура! Руи …
Наконец&то
с данными
покончено!
… я отправлю это…
Дв
ер
ьо
тк
ры
ва ... от своего имени ?
...... ет
ся
ДВ
ЕР
за Ь
кр Странный
ыв тип…
ае
тс
я
топ
топ
Потерпи
топ еще немножко,
А статистикато Игарасисан.
тесно связана с нашей
повседневной жизнью
и намного интереснее,
чем я думала!
балл
очень интересно 5
довольно интересно 4
так себе 3
скучновато 2
совершенно неинтересно 1
или так:
балл
очень интересно 2
довольно интересно 1
так себе 0
скучновато –1
совершенно неинтересно –2
Посмотрите на таблицу:
Ответ
«Группа крови» и «Оценка вкусовых качеств спортивного коктейля Х»
относятся к качественным данным.
«Комфортная комнатная температура при работающем кондиционере»
и «Лучший результат бега на 100 м» относятся к количественным данным.
Выводы
Выводы 29
Глава 2
Знакомимся
с количественными
данными
1. Ряды распределения и гистограммы
Дв
ер
ьо
тк
ры
* Вкусный ва
ет
рамэн**. ся
50 лучших
Важно ресторанов Привет,
Руи.
Ааа…
(удивляется)
Всё так
аппетитно,
правда?
Здравствуйте,
Ямамото
сан.
Да, никак
ты любишь
рамэн ?
(листает
страницы
журнала)
(что
*то
пише
т)
От обсуждения
ресторанов
плавно перешли
к занятию…
Всё*таки
странный тип…
О чем ты думаешь, Хочется И это всё ?
когда смотришь поесть Подумай ещё.
на эту таблицу? рамэн
Мммм…
Что?! Ещё ?…
Э*э …
Надо их
както Мм?
упорядочить.
По… ,
н потрясающе
мэ !
Ра
5 этаж
5 18 47
900—1000 На каждом этаже
свой интервал цен
37 38 46 на рамэн (от … до … )
4 этаж
800—900 2 8 9 11 19 21 24 31 36
Такое разделение
26 30 33 34 39 40 41 49 50
3 этаж в статистике
700—800 1 6 10 12 15 20 22 23 25 называется
распределением.
2 этаж 43 44 45 48
600—700 3 4 13 14 16 17 28 35 42
1 этаж Понятно
7 27 29 32
500—600 …
ь!
ват
пож обро
Рамэн
670
ало
Д
2 этаж
600…700
650
1 этаж
550
500…600
Это
На втором этаже называется
цены варьируются серединой
от 600 до 700 йен. интервала
Значит, средняя цена
равна 650 йен!
(смеется)
Рестораны распределены
по этажам в соответствии (Ямамото*сан
с ценами на рамэн. в статусе сотрудницы,
На каждом этаже может быть сопровождающей
разное количество посетителей по этажам)
ресторанов.
Действительно.
На 3м этаже
На 1м этаже — 4,
больше всего
на 2ом этаже — 13, ресторанов — 18!
и т.д.
Число ресторанов,
Теперь вычислим
расположенных
относительную частоту
на каждом этаже,
ресторанов
называют
на 3м этаже!
частотой.
Есть
вот такая
формула:
Относительная Часть совокупности
частота = Вся совокупность
18 = 36 = 0,36
О, нет!
50 100
Правильно? Это же математика …
Итого:
Графическое представление
распределения данных Чтобы получить
называется гистограммой,
гистограммой столбиковую
или столбиковой диаграммой.
диаграммой диаграмму …
Ну, как?
Вот это
«худобедно»
Будем очень важно!
считать, Таблицы (или ряды)
Ммм что с ценами распределения
на рамэн … и гистограммы
помогают лучше
понять данные!
…я
худобедно
разобралась.
Вот как?..
Понятно!
2. Средняя величина
Мы недавно с девочками
из моего класса
ходили в боулинг…
во время
перерыва Удалось сбить
на чай хоть одну кеглю?
Смотри,
вот таблица
результатов
игры.
Я (быстро достает
достаёт таблицу)
пошутил.
Результаты игры в боулинг
Команда А Команда Б Команда В
Игрок Очки Игрок Очки Игрок Очки
РуиРуи 86 Томи 84 Синобу 229
Дзюн 73 Хаси 71 Юкки 77
Юми 124 Хана 103 Хитоми 59
О! Это Сизука 111 Мэй 85 Рисако 95
отличный материал Токо 90 Канна 90 Май 70
Каэдэ 38 Асами 89 Козуэ 88
для исследования.
Беглый просмотр
А РуиРуи — результатов позволяет
это ты? сделать вывод,
РуиРуи что у тебя, Руи, был И что
средний результат сстого?!
того!
в команде, да?
Дзюн
Да!
Я набрала
Юми 86 очков!
Да, и что?
Команда А
Средний результат равен
общему количеству очков,
набранному командой,
делённому на число
игроков в команде. Команда Б
Команда В
Команда В
молодец!!
Значит, Так Вы
среднее количество угостите меня
очков в твоей команде, пирожным?
РуиРуи, равно 87.
ебя (злится)
А у т , так?
86
было
Извини…
Ус…успокойся. Например?
Например,
средней величиной, Кроме неё есть ещё
о которой я тебе средняя геометрическая
только что рассказывал. и средняя гармоническая.
Кстати, она называется Формулы оставим на десерт,
средней арифметической. а сами термины тебе придется
запомнить. Хорошо?
дняя ая
Сретрическ гармСредняя
е онич
геом еская
Лучше бы Вы
угостили меня
пирожным.
2. Средняя величина 43
Посмотри
3. Медиана
ещё раз
на таблицу
результатов
Ну что
на этот раз?
Синобу
просто
моло
дееец…
Медиану?
Команда Б
Команда В
3. Медиана 45
Покажука я тебе
ещё коечто интересное,
имеющее отношение Руи, копишь ли ты
к средним величинам… на чтонибудь
деньги ?
(смеется,
(смеётся,
радуясь
мечтам)
Да… Но
Опять… все мои сбережения
< 10000 йен*.
Тогда скажи,
когда в газетах или
в телевизионных новостях
обсуждают средний размер
накоплений японцев,
тебя не удивляют
размеры этой суммы.
3. Медиана 47
4. Стандартное отклонение
… команд
Итак, давай А и Б.
рассмотрим
результаты …
Давай.
(рисует)
(пишет)
Руи
Каэдэ Д Р
зюн уи
Токо
Команда А Средняя
Канна
величина
Средняя величина
РуиРуи и для команды А,
Каэдэ Дзюн Токо Сизука Юми и для команды Б
была равна 87,
Средняя
Канна
величина
но ситуация
Команда Б Канна на рисунке
Асами (линии на шкале)
Мэй сильно различается,
Томи верно?
Хаси Хана
Ммммм…
(непонятно)
(минимум)
Нет разброса Разброс Ммм…
значений — значений
все значения равны Может, в А?
4. Стандартное отклонение 49
Правильно! И опять математика…
А точная формула
имеет вид
Хочу. =
=
Готово! Команда Б
Корень из 89,6 —
это сколько же? =
Пр
=
иб
ли
зи
те
=
ль
но
9,5
.
= Правильно!
= Видишь,
справилась
же!
(пишет)
О!
(смеётся) (удивлён) Стандартное отклонение:
Это просто! Команда А — 27,5
Команда Б — 9,5
4. Стандартное отклонение 51
Я сказал, что формула для стандартного От общего количества
отклонения имеет вид значений отнимают 1 ?
(i*е значение – среднее значение)2
кол*во значений
но есть и другая формула
Да.
(удивляется)
Генеральная
совокупность Выборочная
совокупность
Генеральная
совокупность —
вся изучаемая … а выборочная
группа людей совокупность —
или объектов, … это группа людей
или объектов,
отобранная
из генеральной
совокупности,
так?
… обычно сделать
это сложно.
Поэтому почти
всегда используют Вот как…
вторую формулу.
Спасибо!
4. Стандартное отклонение 53
5. Ряды распределения и величина интервала
Всего: 50 1,00
Как следует из таблицы, величина интервала равна 100. Это значение не являZ
ется стандартом в математике. Просто так захотел ЯмамотоZсан. Решение о выZ
боре интервала принимает тот, кто анализирует данные.
Не исключено, что среди читателей найдутся и такие, которым не дает покоя
вопрос: «Ряды распределения, построенные на основе субъективных решений,
неубедительны. Я не смогу показать их другим. Нет ли математического способа
определения величины интервала?». Конечно, есть. Покажем, как можно вычисZ
лить величину интервала для Табл. 2.1.
log10 N
КолZво интервалов = 1 + ,
log10 2
где N — количество значений в совокупности.
log10 50
1+ = 1 + 5,6438... = 6,6438… ≈ 7
log10 2
Шаг 2
MAX – MIN
,
КолZво интервалов
где MAX — максимальное значение в совокупности,
MIN — минимальное значение в совокупности.
Итого 50 1,00
Упражнение
Упражнение 57
Ответ
Стандартное отклонение =
(16,3 – 19,2)2 + (22,4 – 19,2)2 + (18,5 – 19,2)2 + (18,7 – 19,2)2 + (20,1 – 19,2)2
= =
5
20,2
= =
5
= 4,04 =
≈ 2,01
Выводы
(ставит чашку)
Ты сегодня
в школьной форме…
А, это?
Уже скоро …
… я скажу
ей прощай.
Поэтомуто,
в нашем классе
(звук фанфар) было проведено
Вот такую! анкетирование.
Ответы «нравится»,
О! Эта анкета — «не нравится» —
отличный пример это же
качественныx неизмеряемые данные,
данных! не так ли?
Это
простая
статистическая Нравится!
таблица.
Значит,
процентное соотношение
будет таким:
Хорошо. Так
Чтобы было действительно
более понятно, намного
нарисуем диаграмму. понятнее.
Из диаграммы следует,
что большую часть
занимают ответы «нравится»,
что, в свою очередь, Я так и знала!
свидетельствует о популярности Потому что
новой школьной формы. форма классная!
Хихихи…
Вас забыли
спросить.
1 победит Б
2 победит Б
3 победит Б
4 не знаю
5 победит А
6 победит Б
7 победит А
8 не знаю
9 победит Б
10 победит Б
Ответ
Простая статистическая таблица выглядит так:
Оценка партии Частота %
Победит А 2 20
Не знаю 2 20
Победит Б 6 60
Итого 10 100
Выводы
Приятно
познакомиться
познакомиться.
Извините,
я вам Это не то,
не помешаю? что ты
Хихи… подумала!!
Расскажите,
пожалуйста,
о рейтинге
успеваемости!
ниже
Почему?!
(чтото
(что*то Оо?!
Почему?! ищет всумомке)
в сумочке)
Попробуй
вычислить
средний балл
по каждому
предмету.
средний
Готово!
балл
английский
язык
средний
Средний балл литература
балл
по англий = 81.3
скому ———
по литера
туре = 74.3——— Сравните степень отклонения своих
результатов от среднего балла и, таким
образом, ощутите разницу в значимости
набранных 90 баллов.
Ура!!!
Пирожные!
Пирожные!
Но 90 баллов —
отличный
результат!
73
балла
… по истории 73
и по биологии балла 7—3—
средний балл 73
ист—— огия
ория биол
был одинаков
и равнялся 53.
И несмотря на это, н
здесь тоже и
ж
разный рейтинг
успеваемости? е р в
е ы
т ш
е е
в
Хотя отклонение Угу,
от среднего А как насчёт
результата понятно. стандартного Аа!
одинаковое. отклонения Степень
по этим разброса
Ученик История Биология Ученик История Биология
предметам? значений!
Руи З
Юми И
А К
Б Л
В М
Г Н
Д О
Е ии,,
, РРуу ь!
П
Ж Р ННуу, даёш
Средний ты
балл:
р т ное о:
Так…
т а нд ие равн
а
С онен
т к л 2 2 ,7
о =
т о рия 3
ис 18,
=
огия
биол
Готово!
КакКак
ему ему
идётидет
форма
форма абитуриента…
старшеклассника…
Хи*Хи*Хи
(расстроилась)
(расстроилась) (недовольна)
(не довольна)
Нормирование ?
Применительно к тестам
нормированное отклонение Согласны!
(оно же Zпоказатель) имеет другое
название — стандартизованный
балл.
Результаты тестов
по истории и биологии Нормированные отклонения
Ученик История Биология История Биология
Руи
Юми
А
Б
В
Г
Д
Е
Ж
З
И
К
Л
М
Н
О
П
Р
Средний балл
Станд. отклонение
онение 73 53 = 20 = 0.88
Нормированное откл = 22.7
Да, Руи по истории 22.7
так. клонение 73 53 = 20 = 1.09
Нормированное отбиологии = 18.3 18.3
Ю м и по
Можно
1. Независимо от максимального количества сравнивать
результаты
баллов, среднее значение нормированного тестов
отклонения (ZZпоказателя) всегда равно 0, с максимальным
а стандартное отклонение нормированных количеством баллов,
отклонений всегда равно 1. равным 100 и 200.
Можно также
сравнивать
2. В чём бы ни измерялась переменная, количество ударов
среднее значение её нормированных по воротам
отклонений всегда равно 0, а стандартное или угловых
в футболе .
отклонение нормированных отклонений
всегда равно 1.
Вы опять
Нормированное отклонение об этом …
позволяет понять (плачет)
значимость 73 баллов
в тестах
по истории и биологии
Попытаемся
Руи
вычислить
(история)
рейтинг
успеваемости
в ваших тестах. Юми
(биология)
Дада,
такие цифры и были.
Ура!
В тестах, а также
в других аналогичных
исследованиях, значимость
каждого балла имеет Пирожные!
важное значение,
поэтому и используют
рейтинг успеваемости.
Ямамотосэнсей,
спасибо!
(нервничает)
А хватит ли
у меня денег…
3. Рейтинг успеваемости 75
4. Что такое рейтинг успеваемости?
В общем случае это TZпоказатель, который вычисляется по формуле:
Стандартное
отклонение 27,5 26,9
по всему классу
Участник Результат
бега на 100 м,
c
А 16,3
Б 22,4
В 18,5
Г 18,7
Д 20,1
Среднее 19,2
значение
Стандартное 2,01
отклонение
16,3 – 19,2 22,4 – 19,2 18,5 – 19,2 18,7 – 19,2 20,1 – 19,2
+ + + +
2,01 2,01 2,01 2,01 2,01
= =
5
(16,3 – 19,2) + (22,4 – 19,2) + (18,5 – 19,2) + (18,7 – 19,2) + (20,1 – 19,2)
2,01
= = упорядочили
5
числитель
16,3 + 22,4 + 18,5 + 18,7 + 20,1 – 19,2 – 19,2 – 19,2 – 19,2 – 19,2
2,01
= =
5
96 – 19,2 5
отдельно индивидуальные значения,
2,01 отдельно средние значения (–19,2).
= =
5
96 – 96
2,01
= =
5
0
= =
5
=0
(16,3 – 19,2)2 + (22,4 – 19,2)2 + (18,5 – 19,2)2 + (18,7 – 19,2)2 + (20,1 – 19,2)2 упорядочили
2,012
= = числитель
5
1 (16,3 – 19,2)2 + (22,4 – 19,2)2 + (18,5 – 19,2)2 + (18,7 – 19,2)2 + (20,1 – 19,2)2
= =
2,012 5
1 (16,3 – 19,2)2 + (22,4 – 19,2)2 + (18,5 – 19,2)2 + (18,7 – 19,2)2 + (20,1 – 19,2)2
= =
2,01 5
1
= Стандартно отклонение =
Стандартное отклонение
=1 Внимательно посмотрите на таблицу на стр. 78.
Упражнение 79
Выводы
(п отр
ри
см
В статистике иногда говорят:
ст ит)
аль
«вероятность чегото меньше 0,05»
но
Чем же?
Ямамотосан Мне нравится
довольно Игарасисан.
симпатичный.
Руи ?
Извините!
Вероятность — Содержание То, о чём сегодня пойдет речь,
это та самая вероятность, сегодняшнего очень частое явление
про которую говорят занятия в статистике, поэтому
в прогнозе погоды ? несколько слушайте внимательно.
абстрактное.
Абстрактное?
Да.
Руи Хорошо…
Вы сегодня (перевернул
очень хорошо страницу)
подготовлены.
Если эту таблицу
(смеется)
Ха*Ха*Ха. представить
Мы только в виде гистограммы,
начали. то получим …
Потому что
наглядно.
м
(Яма
Величина интервала
равна 10
О…
Превращается
в непрерывную
линию!
Величина интервала
равна 5
Кривая
распределения
Известно Сегодня
достаточно я расскажу о тех,
много которые используются
форм кривых наиболее часто.
распределения.
Хорошо!
Вот.
Это — часто
встречающаяся А что это
Что это ?!! в статистике за знак «е»?
функция
распределения
вероятности.
Ха*Ха*Ха
Ммм…
(не очень*то
понятно)
2. Нормальное распределение 87
Послушай, … распределение величины х при определённых значениях
существует средней арифметической ряда (или среднего значения, x)
правило, и стандартного отклонения называют нормальным
согласно распределением, если плотность распределения вероятностей
которому … выражается формулой
2
f(x) =
1
——————
1
(
– — –––––––
e 2 Ст.откл.
x–x
)
2 ⫻ Стандартное отклонение
… называют нормальным
распределением… !?
Ну, хорошо.
… будут иметь
стандартное
нормальное
распределение.
Понятно!
Не сдавайся!
Цель близко!
Следуй за мной!
А какая
у нас цель?
Из этой таблицы
становится понятен
смысл площади Площадь?
под кривой. Что это значит?
Ооооо!
Ты жива!
Проснись, Руи!
е
ны
ш …
ло ры
Сп иф
ц
Ожила!
Пусть Z
равно 1,96,
Представим Разделим
это значение десятые и сотые
Пусть. в виде двух чисел: доли, так?
Теперь
посмотрим
на таблицу,
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
: : : : : : : : : : :
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
: : : : : : : : : : :
Площадь = 1
Правильно! Это площадь
заштрихованной на графике
области при Z = 1,96. Надо же!
Площадь области,
ограниченной кривой стандартного
нормального распределения и осью х,
равна доле и вероятности.
0,05
0,04
0,03
0,02
0,01
0
0 10 20 30 40 50 60 70 80 90 100
0,5
0,4
0,3
0,2
0,1
0
–4 –3 –2 –1 0 1 2 3 4
Ну, это
даже мне
Ты меня успокоила.
понятно.
Теперь пример
чуть посложнее.
2. Доля учеников, чей результат > 63 баллов, = 0,5 – 0,4641= 0,0359 или 3,59%
от общего числа сдававших экзамен.
3. Предположим, что из общего числа учеников был произвольно выбран один.
Вероятность того, что он набрал > 63 баллов, = 0,5 – 0,4641 = 0,0359 или 3,59%.
4. При нормальном распределении доля учеников с нормированным отклонением
18 63 – 45 Значение – Среднее значение
балла > 1.8 = — = ———— = —————————————————
10 10 Стандартное отклонение
составляет 3,59% (0,5 – 0,4641 = 0,0359)
(см. Таблицу стандартного нормального распределения).
0,5
0,4
0,3
0,2
0,1
0
–4 –3 –2 –1 0 1 2 4
1.8
5. Предположим, что оценки учеников после нормирования распределены по
стандартному нормальному закону. Вероятность того, что нормированное
отклонение произвольно выбранного ученика > 1,8 равна 3,59%.
(плачет
от радости)
Ну, а теперь
еще один важный вид
кривой распределения
плотности вероятности.
Я готова.
0 при x 0,
Спасите!
4. Распределение хи-квадрат 99
Число степеней свободы равно 2
В зависимости
от числа
степеней свободы
форма графика
совершенно меняется.
Число степеней свободы равно 10
Правильно!
Что такое «а» в линейной Если меняется
функции f(x) = ax + b ? значение а,
меняется и наклон
прямой на графике.
А почему это ты
Может, наклон?
меня об этом Угу.
спрашиваешь?
Таблица распределения
хиквадрат — это …
Ну, давай
посмотрим
таблицу.
Это критерий
согласия Пирсона,
хиквадрат.
χ греческая буква хи.
Степень
свободы
Похожа на таблицу
стандартного
нормального
распределения
Похожа, но есть
небольшое отличие.
Вероятность
равна площади,
или доле. Так?
Ну подожди,
не нервничай.
В голове у меня
полная каша!!!
Давай посмотрим,
какое будет значение,
если число
степеней свободы = 1
и Р = 0,05.
Значение, находящееся
на пересечении строки «1», … будет 3,8415
и столбца «0.05», …
Хорошо, спасибо.
Ну, тогда
на сегодня всё.
Ээх…
(встает)
(встаёт)
Дзынь
Ты хорошо сегодня
потрудилась.
Значит, он
всётаки
получил брелок…
Хи
х
и
хи
…
0,5
0,4
0,3
0,2
0,1
0
–6 –4 –2 0 2 4 6
×
n
x2
1
при x > 0,
nm
f(x) = (
0
n
x2
1
) (
e xdx × 0 x
m
2
1
e xdx ) (nx + m) 2
0 при x 0,
где n и m — число степеней свободы величины x.
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0 2 4 6 8 10
7. Распределения и Excel
До начала 90Zх вычисление вероятности и значения х было настолько сложным и
трудоёмким, что его можно было выполнить только с помощью таблиц стандартного
нормального распределения и распределения хиZквадрат. Однако, по мере развития
компьютерных технологий, необходимость в этих таблицах отпала, поскольку
величины, которые указаны в таблицах, можно получить с помощью программы
Excel.
Таблица 5.1.
Функция
Распределение Значение функции
русский английский
Нормальное НОРМРАСП NORMDIST Вероятность для заданного х
распределение* НОРМОБР NORMINV Значение х для заданной вероятности
Стандартное нормальное НОРМСТРАСП NORMSDIST Вероятность для заданного х
распределение НОРМСТОБР NORMSINV Значение х для заданной вероятности
Распределение ХИ2РАСП CHIDIST Вероятность для заданного х
хиZквадрат ХИ2ОБР CHIINV Значение х для заданной вероятности
Распределение СТЬЮДРАСП TDIST Вероятность для заданного х
Стьюдента СТЬЮДРАСПОБР TINV Значение х для заданной вероятности
Распределение Фишера FРАСП FDIST Вероятность для заданного х
FРАСПОБР FINV Значение х для заданной вероятности
0,5
0,4
0,3
0,2
0,1
0
–4 –3 –2 –1 0 1 2 3 4
–0,29
2. Используя таблицу распределения хиZквадрат на стр. 103, вычислите значение
χ2, если число степеней свободы равно 2, а Р = 0,05.
Ответ
1. Искомая вероятность равна вероятности заштрихованной области.
0,5
0,4
0,3
0,2
0,1
0
–4 –3 –2 –1 0 1 2 3 4
0,29
• Кятностей
широко используемым видам функции распределения веро
можно отнести:
– нормальное распределение;
– стандартное нормальное распределение;
– распределение хиквадрат;
– распределение Стьюдента;
– распределение Фишера.
• Сможно
помощью таблиц распределений или программы Excel
вычислить:
– вероятность при определенном значении х;
– значение х при определенном значении вероятности.
Выводы 109
Глава 6
Что может связывать
две переменные
(ктото
(кто*то идет,
идёт,
шаркая ногами)
На самом деле …
… хорошо
иногда Ах, если бы Игарасисан…
провести урок это был
на улице Игарасисан,
было бы так
здорово…
Игарасисан…
Эээ ?
Черт…
Чёрт… Сегодня
Я уже стала я тебе расскажу
забывать, как про связь между
он выглядит… двумя переменными
И всё потому,
что этот тип
вечно у меня
перед Да слышуслышу.
глазами!
Ты меня слышишь?
Например, Или
«если человек высокий, «в зависимости от места
то и весит много» проживания человек
или отдает предпочтение
«любимая марка пива той или иной партии»
может меняться и так далее…
в зависимости
от возраста человека».
Спа… спасибо
(открывает
книгу)
Вес
Количественные данные
и количественные данные
Рост
Точечная диаграмма
«Любимая марка пива» и «Возраст»
Возраст
Количественные данные
и качественные данные
Когда
построишь диаграмму,
сразу ясно, есть или нет
А Б В Г Марка взаимосвязь между
пива
двумя переменными.
Столбиковая диаграмма
«Место проживания» и «Поддерживаемая партия»
Качественные
данные Ага
и качественные
данные
я
Провинци
Города Партия В
Партия Б
Партия А
Обычно,
Гм…
строя диаграмму,
одновременно
вычисляют
величину показателя,
отражающего
тесноту связи между
двумя переменными.
Такие данные
тоже можно
проанализировать
статистическим
методом?
(листает журнал)
Д 7000 12000
Е 15000 30000
данные
Ж 5000 10000
З 6000 15000
И 8000 20000
К 10000 18000
Для начала
построим Точечная диаграмма
диаграмму. Ага.
Расходы на одежду, йены
А теперь
Понятно. определим
Похоже, что тот, кто много тесноту связи.
тратит на косметику,
много тратит и на одежду.
В зависимости
от того, какие у нас
данные, различается Вот как…
и показатель.
Поехали! Спасите!
Если воспользоваться
компьютером, всё Коэффициент линейной
будет намного быстрее. корреляции = 0,9680.
Гм…
Примерно так.
Коэффициент
–1 =0
0,5
1
линейной
корреляции
Если же
Когда коэффициент коэффициент = 0,
корреляции положителен, то говорят
как в нашем случае, говорят, что «зависимость
«есть прямая зависимость», отсутствует».
а если отрицателен —
«обратная зависимость».
Поняла!
Примечание
Дада,
попробуем…
Сумма
Среднее
значение
Диаграмма
«Любимый бренд одежды» и «Возраст» Ну тогда
вычислим
корреляционное
отношение.
Следующим Ух ты!
этапом будет Похоже,
построение что есть
диаграммы. взаимосвязь!
Согласна!
Шаг 1
Вычислить суммы стандартных отклонений для каждого столбца таблицы:
(значение — среднее (значение – среднее (значение — среднее
значение в столбце значение в столбце значение в столбце
Benetton)2 Zara)2 O’STIN)2
Сумма 14 50 160
Шаг 2
Вычислить внутригрупповую дисперсию, показывающую как сильно
отличаются данные в каждой категории, как сумму STT + SCC + SBB:
Шаг 4
Вычислить корреляционное отношение по формуле:
180 180
––––––––– = ––– = 0,4455
224 + 180 404
Ура!!!
Ура!!!
Но,
если долго И так приятно
мучиться, получить ответ!
чтонибудь
получится…
Ру…Руи … До чего же ты
стала умной!
В качестве
награды
подарите мне Я пошутила!
сумочку
от Benetton
е)
шок Накануне
(в выдачи
зарплаты.
(устал)
Диаграмма
«Любимый бренд одежды» и «Возраст»
40 40
30 30 средн.
знач.
20 20
10 10
Benetton Zara O’STIN Benetton Zara O’STIN
(бормочет)
Не говори
ничего…
Шаг 1
Построить таблицу взаимной сопряжённости. Величины в клетках,
обведённых жирной чертой, называются эмпирическими частотами.
Шаг 2
Выполнить вычисления, как показано в следующей таблице. Величины
в обведённых клетках называются теоретическими частотами.
Шаг 3 Вычислить:
(Эмпирическая частота – Теоретическая частота)2
————————————————————————————
Теоретическая частота
Пол Способ признания в любви
респон Итого
дента по телефону по SMS при встрече
2 2
148 101 148 127
2
148 72
34 – 61 – 53 –
300 300 300
женский
148 72 148 01 148 127 148
300 300 300
2 2 2
152 72 152 101 152 127
38 – 40 – 74 –
мужской 300 300 300
152
152 72 152 101 152 127
300 300 300
Итого: 72 101 127 300
χ02
n ( min {кол
во строк в таблице; кол
во столбцов в таблице} – 1) ,
где
n — общее число единиц совокупности,
min {a;b} — из величин a и b надо взять меньшую.
Значит, коэффициент
корреляции Крамера
будет равен 0,1634, так?
Хватит…
Будет чтото
непонятно,
(ожила)
спроси.
!
рон ь
сто лас
А..
у)
ую верну
Ох!
в д ко по
руг
з
(ре
Странно,
на мгновение
Ямамото*сан
показался мне
симпатичным.
Таким образом,
можно сделать вывод, На сегодня всё.
что данные в этом примере
«очень слабо связаны».
(закрывает
книгу)
Понятно. Спасибо.
П
о
н
я
т
н
о
!
Ну,
в общемто,
да.
Шаг 1
Составим таблицу взаимной сопряжённости.
Предпочитаемый напиток
Обычно заказываемая
Итого
кухня Кофе Чай
Японская 43 33 76
Европейская 51 53 104
Китайская 29 41 70
Итого: 123 127 250
Шаг 2
Вычислим теоретические частоты.
76 123 76 127
Японская 76
250 250
70 123 70 127
Китайская 250 250 70
Упражнение 139
Шаг 3
Вычислим:
Эмпирическая частота – Теоретическая частота
————————————————————————————
Теоретическая частота
Шаг 5
Вычисляем коэффициент корреляции Крамера по формуле:
χ02
=
n ( min {кол
во строк в таблице; кол
во столбцов в таблице} – 1)
Упражнение 141
Выводы
• Перечисленные
свойства:
коэффициенты корреляции имеют следующие
Отсутствие
Значение какойлибо Переменные
Вид функции
коэффициента связи величины
распределения
корреляции между двумя максимально
вероятностей
переменными тесно связаны
max min величинами
Коэффициент
линейной –1 1 0 –1 или 1
корреляции
Корреляционное
0 1 0 1
отношение
Коэффициент
корреляции 0 1 0 1
Крамера
• Вуказанных
статистике не существует какогото определённого значения
коэффициентов корреляции, свыше которого
переменные считаются тесно связанными.
1
Эй!
1. Проверка гипотезы
Почему бы не посмотреть
Итак, на меня!!
сегодня
шнее
занятие…
(обижается)
Ох, извини.
Это новая форма? Да! Это образец ,
но Вам я покажу.
Ну как!
(крутится)
(юбка
шелестит)
Оо…
Тебе идёт. Спасибо.
Ну, что
мы будем
сегодня
проходить?
На прошлом уроке
мы изучали 300
Опр
о
коэффициент шко сили
льн
корреляции Крамера, Ка иков
при кой сп !
помнишь? вы знани особ А…,
пре я про признание
дпо в люб
чит
аетви в любви, да?
е?
Коэффициент
корреляции Крамера Руи, теперь Результат этого анкетирования
в том примере хорошенько основан всего лишь на данных, …
был равен 0,1634. подумай.
Мы сделали вывод, что
«связь очень слабая», так?
… полученных
от 300 школьников,
произвольно выбранных
Да, из всех школьников
так и было. Японии.
Понятно…
Поэтому, …
Это касается
не только данного примера.
Практически никогда
не удаётся определить
коэффициент корреляции
Крамера для всей
генеральной совокупности.
Но ведь наверняка
Довольно есть какието
туманное… статистические
методы?
Нет. К сожалению,
даже если очень хорошо Что?
владеть статистикой, Правда?
невозможно узнать
точный коэффициент
корреляции Крамера для
генеральной совокупности.
Это типа
И как это делается? экзамена
Это что, выход?
по английскому
языку?
Равен
0?
Используют
Конечно! метод анализа,
Поскольку можно получить который называется Хахаха…
объективную информацию «проверка
проверка гипотезы Нет, это совсем
о генеральной совокупности. о независимости». Я тебе другое.
уже говорил об этом.
Понятно.
Другими словами,
это способ анализа, Поняятно…
предполагающий
наличие взаимосвязи
между двумя переменными
в таблице взаимной
сопряжённости.
Проверка гипотезы
о независимости Опять этот χ
X22 !
называется также Ужасно…
проверкой критерия
согласия Пирсона χ2.
Шаг 1
Из генеральной совокупности, которой являются «школьники Японии»,
произвольно выбрали 300 человек.
Генеральная
совокупность
Выборочная
Выборка совокупность
Шаг 2
Среди выбранных 300 школьников провели анкетирование (см. стр. 127),
а затем рассчитали величину критерия согласия Пирсона.
Шаг 3
Выбранных 300 школьников «вернули» в генеральную совокупность.
Шаг 3
Шаг 1— Шаг 3 повторяли множество раз.
Функцией распределения критерия согласия Пирсона, полученной в этом исZ
следовании, является распределение хиZквадрат с числом степеней свободы,
равным 2, при условии, что коэффициент корреляции Крамера для генеральной
совокупности «все школьники Японии» = 0. Другими словами, если коэффициZ
ент корреляции Крамера для генеральной совокупности «все школьники ЯпоZ
нии» = 0, то критерий согласия Пирсона (χ02) имеет хиZквадратZраспределение
с числом степеней свободы, равным 2.
1. Способ вычисления критерия согласия Пирсона (χ02) см. на стр. 130—133.
2. О распределении хиZквадрат с числом степеней свободы 2 см. на стр. 100.
0,3
0,2
0,1
0
0,5 5,5 10,5 15,5
П
Другими словами, связи между
полом и способом признания
в любви не существует.
Возьмём анкеты
300 человек, выбранных
из генеральной совокупности
«все школьники Японии»…
… затем Анкета
следующие 300 человек,
затем следующие, …
и так много раз. Анкета
О, согласна!
(что*то ищет)
… позволяет сделать
Вывод ! более доступным
для восприятия
(звук фанфар) и понимания
конечный
результат,
или вывод,
ль комм или ответ.
о в ате ентат
ед ор
и ссл Но эти куклы не идут
ни в какое сравнение со мной!
Видишь ли,
объяснение материала в виде диалога, который
ведут, например, исследователь и комментатор, …
0
5,9915
Величина уже была вычислена и равняется 8,0091 (см. стр. 132).
Ну, как, не кажется ли вам, что величина слишком большая, хотя и вычисZ
лена на основе ответов, полученных от 300 человек, случайно выбранных
из генеральной совокупности. Если поразмыслить, учитывая комментарий,
данный на стр. 132, не естественно ли, что величина коэффициента корреляZ
ции Крамера для генеральной совокупности «все школьники Японии» >0?
Не только в этом примере, но всегда при проверке гипотеZ
зы о независимости следует придерживаться следующей
последовательности действий:
1) Сначала делают предположение, что коэффициент корZ
реляции Крамера для генеральной совокупности = 0.
2) Затем рассчитывают величину χ02 для выборочной совоZ
купности.
3) Если χ02 очень большой, делают вывод, что коэффициент
корреляции Крамера для генеральной совокупности > 0.
Это надо запомнить.
0
χ 02
Рис. 7.4. Критическая область при значении уровня значимости, равном 0,05
Критическая область
0
5,9915
Шаг 1
Определяем генеральную совокупность.
Пример.
При проведении проверки гипотезы о равенстве долей
в (двух) совокупностях (см. стр. 149) предполагалось,
что генеральными совокупностями являются «избира
тели, проживающие в городах и в сельской местности».
Ком При этом необходимо уточнить, что подразумевается
мен
тат под городом Токио и Осака? Или это столицы
ор
префектур? Решение этой проблемы остаётся
за исследователем, поскольку это его прерогатива —
определить, что будет представлять собой генеральная
совокупность при проверке. Если чётко не выделить
генеральную совокупность, при проведении любой
проверки можно оказаться в ситуации:
«Ой! Что же я хотел исследовать?!». Подобная ситуация
наблюдается довольно часто, поэтому следует быть
предельно внимательными.
Нулевая гипотеза:
Коэффициент корреляции Крамера
для генеральной совокупности = 0.
«Пол» и «способ признания в любви»
не связаны. ь
ател
дов
Альтернативная гипотеза: ле
Исс
Коэффициент корреляции Крамера
для генеральной совокупности > 0.
«Пол» и «способ признания в любви»
связаны.
ь
Проведём проверку гипотезы о независимости. ател
д ов
ле
Исс
Критическая область
0
5,9915 8,0091
Понятно….
Комментатор
Мне кажется,
Однако
можно сказать,
меня беспокоит
что нулевая гипотеза верна,
Шаг 7.
если величина статистического
критерия не входит
в критическую
область…
критическая область
критическая область
Она не входит
в критическую
Вот как?
область, да?..
нулевая
гипотеза Юми виновна
альтерна
тивная Юми невиновна
(постучал по столу
стопкой бумаги)
Юми,
это ужасно! Будем проводить
проверку этих двух гипотез.
Я же говорю, допустим…
Понятно...
У вас
Эйй…! есть
улики?
(бежит)
А!
Вот как… (что*то ?
вспомнила)
Так, но при
проведении
проверки …
… необходимо выстроить
нулевую и альтернативную
гипотезы.
На самом деле,
Что это за нулевая
довольно сложно объяснить
и альтернативная
в двух словах,
гипотезы?
что такое нулевая и
альтернативная гипотезы.
Ты же сказал,
что попозже объяснишь,
а я до сих пор так ничего
про них и не услышала..? Вот как?
О, это может …
… пригодиться на практике.
Понятно…
В качестве нулевых
А ещё, Руи, поняла ли ты, используют
что в качестве нулевой гипотезы утвердительные гипотезы,
используются утвердительные которые сложно доказать,
гипотезы, содержащие слова
«равно», «одинаково», а в качестве
альтернативных —
а в качестве альтернативных отрицательные гипотезы..
используются отрицательные … Да …
гипотезы со словами
«не …», «различно …»?
Мм…
вот как
Достаточно,
если ты поймёшь
только это.
… только
Вывод
на основании
о проверке можно
Гипотезы 1
сделать …
или Гипотезы 2 .
Про первую
я уже слышала, Что такое
а вот вторая — это Рзначение?
чтото новенькое.
В случае
проверки
гипотезы … то это вероятность
о независимости вот этой области.
Рзначение —…
Когда
стало возможным
вычисление Рзначения
с помощью Excel,
… вывод выводы, как правило,
о проверке делался делаются
на основании на основании
Гипотезы 1. Гипотезы 2.
О!
Нука, вспоминай
Говоришь с такой
уверенностью… пример с пудингом.
(кланяется)
И, знаешь,
Сначала например, таблица
мне было трудно, с результатами
но теперь анкетирования,
мне кажется, мне представляется
я довольно хорошо интересной.
понимаю статистику.
Хахаха…
То, что ты говоришь, почему бы и тебе, В общемто, да…
так радует меня. Руи, не заняться хотя моей
тем же, чем главной целью
занимаюсь я? было …
Я хочу
попробовать
другие способы Ну, я пошел.
анализа! Пока.
Ой, а
Игараси
сейчас …
Зачем же я столько
времени и сил угрохала
на эту статистику…?! Что?
Разве твой
интерес был
неискренним?
Он женат….
(в шоке)
Б
У
(бежит
в сторону
М
Ямамото*сан)
Ямамото)
Ой,
осторожно!
Все в порядке?
И их занятия продолжились …
… а может и нет.
5. Проверка гипотезы о независимости и гипотезы об однородности
Проверка гипотезы об однородности очень похожа на проверку гипотезы
о независимости. Ниже приводится пример такой проверки. Попробуйте
разобраться, в чём заключается разница между этими двумя проверками.
Упражнение
Женский журнал «PZgirls» решил провести опрос школьников на тему
«Какой способ признания в любви Вы предпочитаете:
– по телефону;
– по SMS;
– при встрече»?
Журнал выдвинул такую гипотезу:
Гипотеза:
пропорции ответов «по телефону» : «по SMS» : «при встрече» зависят
от пола респондентов.
Ответ
1 Определим генеральную Генеральной совокупностью будут
совокупность «жители Японии старше 20 лет»
2 Сформулируем Основная гипотеза: «вид обычно заказываемой кухни
нулевую и альтернативную и предпочитаемый напиток не связаны».
гипотезы Альтернативная гипотеза: «вид обычно заказываемой кухни
и предпочитаемый напиток взаимосвязаны».
3 Выбираем вид гипотезы Проведём проверку гипотезы о независимости.
Определим уровень Пусть уровень значимости равен 0,01.
4 значимости
5 Вычислим фактическое В этом упражнении будет проведена проверка гипотезы о
значение выбранного независимости. Следовательно, статистическим критерием
статистического критеZ будет являться критерий согласия Пирсона. Величина была
рия на основе данных вычислена ранее и равна 3,34839 (см. стр. 141)
выборочной совокупности
6 Проверим, входит ли Величина критерия согласия Пирсона, являющегося статистичесZ
значение вычисленного ким критерием, равна 3,3483. Так как уровень значимости α = 0,01,
на Шаге 5 статистиZ критическая область, как следует из таблицы распределения
ческого критерия хиZквадрат на стр. 103, больше 9,2104. Это значит, что значение
в критическую область статистического критерия не входит в критическую область.
7 Если значение статистичесZ Значение статистического критерия не входит в критическую
кого критерия входит в криZ область. Следовательно, нельзя утверждать, что нулевая
тическую область (Шаг 6), гипотеза: «вид обычно заказываемой кухни и предпочитаемый
делают вывод: «верна альZ напиток не связаны» ошибочна.
тернативная гипотеза».
Если нет — «нельзя
утверждать, что нулевая
гипотеза ошибочна».
Выводы 189
Приложение
Попробуем
вычислить
с помощью
Excel
1
В этой главе объясняется, как с помощью программы Excel:
1. Построить таблицу (ряд) распределения.
2. Вычислить среднее значение, медиану и стандартное отклонение.
3. Составить простую статистическую таблицу.
4. Вычислить нормированное отклонение и рассчитать TZпоказатель.
5. Вычислить вероятность стандартного нормального распределения.
6. Вычислить значение х при распределении хиZквадрат.
7. Вычислить коэффициент линейной корреляции.
8. Проверить гипотезу о независимости.
Файлы Excel можно загрузить по адресу http://www.dodeca.ru/books/33081.php.
Читателю, не имеющему опыта работы в Excel, рекомендуется сначала попробовать
вычислить среднее значение, медиану и стандартное отклонение (см. стр. 195).
1. Построение таблиц распределения
Используются данные со стр. 33.
1
Выберите ячейку J3.
3
Выберите Статистические в строке Категория, а затем ЧАСТОТА*
в графе Выберите функцию.
* FREQUENCY в английской версии Excel.
* AVERAGE в английской
версии Excel.
5
Вычисление закончено!
5
Вычисление
закончено!
10 Выберите ячейку F2 и «напишите» точно так же, как пишете текст в Word,
выражение =E2*10+50, а затем нажмите клавишу Enter.
11 Повторите Шаг 8.
0
z
Поэтому «напишите» в ячейке В3
точно так же, как пишете в Word, выражение [=B2Z0.5].
6 Вычисление закончено!
5 Вычисление закончено!
9 Вычисление закончено!
Проверьте, соответствует ли полученная величина РZзначению на стр. 177).
Син Такахаси
Занимательная статистика
Манга