Тема: елементи математичної статистики.
Мета уроку: ознайомити учнів із статистичними функціями програми LibreOfficeCalc. Формувати навички застосування різних стандартних функцій для розв'язку прикладних задач. Розвивати пізнавальний інтерес, навички аналізу та узагальнення.
Обладнання: ПК з встановленою ОС Linux Mint KDE.
Структура уроку
Хід уроку
1. Організаційний момент
Вітання з класом. Перевірка присутності і готовності учнів до уроку. Перевірка виконання домашнього завдання.
2. Актуалізація опорних знань
3. Вивчення нового матеріалу
Мотивація вивчення нового матеріалу
Слово «статистика» походить від латинського status — стан справ. В науку термін «статистика» запровадив німецький вчений Готфрід Ахенвалль в 1746 році. Статистичний збір даних виник з появою держави. Першою опублікованою статистичною інформацією вважають глиняні таблички Шумерского царства (III — II тисячоліття до н.е.). Проводилися переписи населення у прадавньому Китаї, здійснювалося порівняння військового потенціалу держав, проводився облік майна громадян у Прадавньому Римі тощо. Пізніше статистичні дослідження здійснювалися не лише для адміністративного керування на рівні держави, але й для діяльності окремого підприємства. У другій половині ХІХ — на початку ХХ століть сформувалася наукова дисципліна математична статистика. Дамо сучасне визначення статистики.
Статистика — наука, що збирає, обробляє і вивчає різні дані, пов'язані з різними явищами, процесами і подіями.
Табличний процесор має велику бібліотеку стандартних статистичних функцій, які дають змогу розв’язувати різні прикладні задачі і автоматизувати процес опрацювання статистичних даних. Далі на конкретних прикладах ми ознайомимося з можливостями табличного процесора автоматизувати опрацювання статистичних даних.
Розглянемо деякі поняття математичної статистики на конкретних прикладах з невеликою кількістю статистичних даних.
Найбільш зручним способом узагальнення статистичного матеріалу є побудова рядів розподілу.
Ряд розподілу (у статистиці) — впорядкований розподіл одиниць досліджуваної сукупності за якоюсь ознакою. Ряд розподілу складається з варіант і частот.
Варіанти — це окремі величини групувальної ознаки, які розташовані у певній послідовності.
Частоти — це числа, які показують, скільки разів певна величина ознаки зустрічається у сукупності.
Приклад 1. Є дані про тарифні розряди 60 працівників. Розподілити працівників за тарифним розрядом і побудувати ряд розподілу.
Розв'яжемо цю задачу за допомогою програми LibreOffice Calc. Для цього початкові дані занесемо у таблицю.
Для побудови ряду розподілу випишемо всі можливі значення тарифних розрядів у порядку зростання і підрахуємо кількість працівників у кожній групі. Величину поля Кількість працівників (частоти) обчислимо за допомогою стандартної математичної функції COUNTIF. Cпочатку, виберемо комірку, в якій буде підраховано кількість робітників з 1-м тарифним розрядом. Використаємо вказівку меню Вставка / Функція,
щоб викликати вікно діалогу Function Wizard. У цьому вікні вибираємо категорію Математичні
Вибираємо функцію COUNTIF і натискуємо кнопку Next.
У полі Діапазон вказуємо діапазон комірок, у яких записано величини тарифних розрядів усіх працівників, а у полі Критерій вказуємо адресу комірки, де знаходиться величина 1-го розряду.
Тиснемо кнопку Гаразд .
Далі копіюємо формулу у клітинки O3:O7 для підрахунку частот інших розрядів .
Після побудови ряду розподілу обчислимо величини відносних частот.
Відносна частота варіанти — це відношення її частоти до кількості елементів вибірки. В нашому випадку кожна величина частоти ділиться на 60. Відносна частота є зручною характеристикою для аналізу даних, бо показує співвідношення між окремими складовими вибірки.
Ряди розподілу поділяють на атрибутивні (якісні) й варіаційні (кількісні) залежно від характеру групувальної ознаки.
Атрибутивний ряд розподілу — ряд, у якому варіанти не подано числом. Інакше кажучи, групувальна ознака є якісною (атрибутивною). Наприклад, розподіли за фахом, за конфесійною чи етнічною приналежностями тощо.
Варіаційний ряд розподілу — ряд, у якому варіанти подано числом. Такі ряди поділяють на дискретні й інтервальні. У першому випадку варіанти є дискретними числами, а у другому — інтервалами групування.
У попередньому прикладі розглянуто побудову варіаційного дискретного ряду, варіанта якого є розрядом працівника.
Наступний приклад є прикладом інтервального варіаційного ряду, коли визначають межі «від» і «до» для значень ознаки, яку вивчають.
Приклад 2. Відомо такі дані про вартість основного капіталу у мільйонах гривень 50 фірм.
10,4 | 18,6 | 10,3 | 26,0 | 45,0 | 18,2 | 17,3 | 19,2 | 25,8 | 18,7 |
28,2 | 25,2 | 18,4 | 17,5 | 41,8 | 14,6 | 10,0 | 37,8 | 10,5 | 16,0 |
18,1 | 16,8 | 38,5 | 37,7 | 17,9 | 29,0 | 10,1 | 28,0 | 12,0 | 14,0 |
14,2 | 20,8 | 13,5 | 42,4 | 15,5 | 17,9 | 19,2 | 10,8 | 12,1 | 12,4 |
12,9 | 12,6 | 16,8 | 19,7 | 18,3 | 36,8 | 15,0 | 37,0 | 13,0 | 19,5 |
Встановити розподіл фірм за вартістю основного капіталу.
Щоб показати розподіл фірм за вартістю основого капіталу спочатку потрібно визначитися з кількістю груп, які хочемо виділити. Розглянемо, наприклад, поділ на 5 груп. Далі визначимо величину інтервалу у групі за такою формулою:
В нашому прикладі маємо: (45 – 10)/5 = 7.
Послідовним додаванням величини інтервалу до найменшої величини капіталу, отримаємо такі інтервали величин: 10–17; 17–24; 24–31; 31–38; 38–45.
Зауважимо, що величина, яка знаходиться на межі інтервалів, враховується у тій групі, де ця межа є верхньою.
Підрахувавши кількість фірм у кожній групі, отримаємо такий розподіл фірм за вартістю основного капіталу (у млн.грн.).
Вартість основного капіталу в млн.грн. | Кількість фірм (частота) | Накопичені частоти | Функція розподілу |
10–17 | 21 | 21 | 0,42 |
17–24 | 15 | 36 | 0,72 |
24–31 | 6 | 42 | 0,84 |
31–38 | 4 | 46 | 0,92 |
38–45 | 4 | 50 | 1 |
Запровадимо поняття накопиченої частоти.
Накопичена частота — це число, яке показує, скільки елементів у сукупності не перевищує задану величину.
В даному прикладі накопичені частоти визначають кількість фірм, які мають основний капітал, що лежить у межах від найменшої величини капіталу до деякої заданої величини. Наприклад, 36 фірм мають основний капітал вартістю від 10 до 24 млн. грн. Накопичені частоти обчислюють послідовним додаванням частот. У результаті в останній клітинці стовпчика Накопичені частоти маємо загальну кількість даних вибірки (в нашому прикладі 50).
На практиці зручно використовувати функцію розподілу. Ця функція визначає відносні накопичені частоти, тобто відношення накопичених частот до загальної кількості даних вибірки.
Розв’язання прикладу 2 за допомогою LibreOffice Calc має такий вигляд.
Клітина M2 містить формулу =Countif($A$2:$j$6;"<=17"),
клітина M3 містить формулу =Countif($A$2:$j$6;"<=24"), ...,
клітина M6 містить формулу =Countif($A$2:$j$6;"<=45").
Клітина N2 містить формулу =M2,
клітина N3 містить формулу =M3-M2 , ...,
клітина N6 містить формулу=M6-M5.
Клітина О2 містить формулу =M2/50,
клітина О3 містить формулу =M3/50, ...,
клітина О6 містить формулу =M6/50.
Таким чином, спочатку знайдено накопичені частоти за допомогою функції Countif, а потім обчислено частоти (кількість фірм, що належать конкретній групі).
Функція розподілу дає повне уявлення про вибірку статистичних даних. Але часто бажано вказати числові параметри, які характеризують основні риси вибірки даних. Користуючись цими параметрами, прагнуть стисло подати відомості про вибірку. Такі величини називають числовими характеристиками статистичного набору даних. До цих характеристик відносять найменшу величину, найбільшу величину, середнє, дисперсію, середнє квадратичне (стандартне) відхилення, моду.
Середнє значення вибірки — це середнє арифметичне усіх елементів вибірки.
Мода вибірки — величина, яка трапляється у вибірці найчастіше.
Дисперсія вибірки — середнє арифметичне квадратів відхилення даних вибірки від їх середнього значення — характеризує ступінь розсіювання набору даних від їх середнього.
Середнє квадратичне відхилення — це корінь квадратний із дисперсії.
Для обчислення цих характеристик є стандартні статистичні функції:
Для обчислення будь якої статистичної функції потрібно зробити таке:
Використати вказівку меню Вставка / Функція або натиснути кнопку Помічник з функцій.
У вікні діалогу Function Wizard вибрати категорію Статистичні.
Вибрати потрібну функцію. Наприклад, для обчислення середнього арифметичного основного капіталу фірм у прикладі 2 потрібно вибрати функцію AVERAGE і натиснути кнопку Далі.
У полі Число 1 вказати діапазон комірок, для даних з яких потрібно знайти середнє арифметичне.
Натиснути кнопку Ok і отримати результат.
4. Інструктаж з ТБ
5. Закріплення вивченого матеріалу
Завдання 1. Визначити статистичні характеристики набору даних довжини кроку людини при нормальній ходьбі. Дані взято на сайті
www.physionet.org/physiobank/database/umwdb/ у вигляді текстового файлу, що містить записи таких чисел. Дано 200 значень довжин кроків людини.
Розв’язання
Завантаживши середовище LibreOffice Calc, копіювати дані із текстового файлу в електронну таблицю (комірки В2:В222).
У комірках С2 і D2 обчислити відповідно найменшу і найбільшу величини кроку.
Використати розбиття діапазону величин довжини кроку (від найменшої до найбільшої) на 20 проміжків однакової довжини. Величину інтервалу визначити за формулою (D2–С2)/20.
(Для зручності подальших дій) у комірки Е2:Е22 ввести цілі числа від 0 до 21 включно.
У комірку F2 ввести формулу підрахунку правої межі інтервалу =$C$2+($D$2-$C$2)/20*E2 і скопіювати її у клітини F3:F22.
У комірку G2 ввести формулу підрахунку (емпіричної) функції розподілу =Countif(B$2:B$221;"<=1,053"), скопіювати її y клітини G3:G22 і починаючи з клітинки G3 у формулі відредагувати значення правої межі інтервалу.
Для підрахунку (емпіричної) густини (відносної частоти) у комірку H2 ввести формулу =G2; у комірку H3 ввести формулу =G3-G2 і цю формулу скопіювати її у клітини H4:H22.
У комірку I2 ввести формулу підрахунку кількості кроків (частоти) в окремому інтервалі =H2*200 і скопіювати її у клітини І3:І22.
У комірку J2 ввести формулу підрахунку середньої довжини кроку =AVERAGE(B2:B221).
У комірку K2 ввести формулу підрахунку дисперсії довжини кроку =VAR(B2:B221).
У комірку L2 ввести формулу підрахунку середнього квадратичного відхилення довжини кроку =STDEV(B2:B221).
У комірку M2 ввести формулу підрахунку моди довжини кроку =MODE(B2:B221).
Звірити отримані результати з такою таблицею
Побудувати графік густини функції розподілу у вигляді гістограми. Кожний стовпчик гістограми визначає відносну кількість кроків, які належать окремому інтервалу. Алгоритм побудови гістограми такий:
Використати вказівку меню Вставка / Діаграма для виклику вікна діалогу Майстер діаграм або натиснути кнопку Діаграма на панелі інструментів.
У вікні діалогу Майстер діаграм вибрати тип діаграми Гістограма й натиснути кнопку Далі.
Для введення даних у вікні діалогу Майстер діаграм натиснути кнопку Виберіть діапазон даних
і виділити величини густини функції розподілу разом з назвою стовпчика.
Після цього у вікні діалогу Майстер діаграм
натиснути кнопку Далі.
Біля поля Категорії натиснути кнопку Виберіть діапазон даних
і виділіть комірки, що відповідають значенням групувальної ознаки (стовпчик «Права межа інтервалу»).
У вікні діалогу Майстер діаграм
натиснути кнопку Далі.
Побудуємо графік функції розподілу.
Використати вказівку меню Вставка / Діаграма для виклику вікна діалогу Майстер діаграм.
Вибрати тип діаграми Лінії.
У поле Діапазон даних
вводимо дані із комірок, що відповідають функції розподілу (дані виділяються разом з назвою стовпчика).
У вікні діалогу Майстер діаграм натиснути кнопку Далі.
У поле Категорії
вводимо дані, що відповідають значенням групувальної ознаки (Права межа інтервалу).
У вікні діалогу Майстер діаграм натисyнути кнопку Далі.
Форматувати графік і натиснути кнопку Завершити.
6. Підбиття підсумків уроку
Виставлення оцінок.
7. Домашнє завдання
Визначити статистичні характеристики набору даних довжини кроку людини при повільній ходьбі. Провести статистичний аналіз даних, як це було зроблено в задачі 1. Провести порівняльний аналіз статистичних харатеристик набору даних довжини кроків людини при нормальній і повільній ходьбі.
Текст упорядкувала Маципура Ніна Іванівна, вчитель Українського колежу ім.В.О.Сухомлинського, Дніпровського району міста Києва, під час виконання випускної роботи на курсах підвищення кваліфікації з 15.10.2012 по 21.12.2012.