Критерій Хі-квадрат: перевірка гіпотези про рівність параметрів біноміального розподілу - файл n1.doc

Критерій Хі-квадрат: перевірка гіпотези про рівність параметрів біноміального розподілу
Скачать все файлы (750.5 kb.)

Доступные файлы (1):
n1.doc751kb.01.02.2014 16:46скачать

n1.doc

  1   2   3

Розглянуто теоретичні основи перевірки статистичних гіпотез. Показано застосування критерію для перевірки гіпотези про рівність параметрів двох біноміальних розподілів.


У програмі , написаній на мові С# , наведено приклад реалізації перевірки гіпотези про рівність параметрів двох біноміальних розподілів.
Зміст

Вступ 4

1. Поняття статистичної гіпотези і статистичного критерію. 5

1.1 Статистичний критерій. 5

1.2 Приклади математичних формулювань найпоширеніших

статистичних гіпотез. 7

2. Критерій згоди Пірсона для перевірки простої гіпотези. 9

3. Критерій згоди Пірсона для перевірки складної гіпотези. 12

4. Гіпотеза про рівність параметрів двох біноміальних розподілів. 14

5. Розв’язок задачі. 16

6. Опис програми. 18

Висновок 20

Список використаної літератури 21

Додаток 1

Додаток2

Вступ.

Термін “статистика” походить від латинського слова “статус” (status) – стан.

Математична статистика – це прикладна математична дисципліна, предметом якої є розробка методів статистичного спостереження і аналізу статистичних даних, і яка ґрунтується на поняттях і методах теорії ймовірності.

Основна задача математичної статистики - задача про методи перевірки статистичних гіпотез.

У розділі 1 означено статистичну гіпотезу і статистичний критерій , а також

наведено приклади математичних формулювань найпоширеніших статистичних гіпотез.

У розділах 2 і 3 описано критерій згоди Пірсона для перевірки

простої та складної гіпотези відповідно.

У розділі 4 описано критерій згоди Пірсона для перевірки гіпотези про рівність параметрів двох біноміальних розподілів , а також наведено приклад його застосування .

У розділі 5 наведено розв’язок задачі з конкретними даними , а у розділі 6 -

детальний опис програми , написаної на мові С# , і результат її виконання .

У Додатку1 міститься текст програми , а в Додатку2 – таблиця “Розподіл Пірсона”.


  1. Поняття про статистичну гіпотезу.

1.1 Статистичний критерій.

Статистичною гіпотезою (або просто гіпотезою) Н називається довільне припущення про вигляд або властивості розподілу випадкових величин, що спостерігаються в експерименті.

Статистична гіпотеза Н називається простою, якщо вона однозначно визначає розподіл випадкових величин, що спостерігаються в експерименті. У протилежному випадку ця гіпотеза називається складною.

Гіпотеза, яку перевіряють, називається нульовою (або основною) і позначається .

Поряд з гіпотезою часто розглядають одну або кілька альтернативних (конкуруючих) гіпотез, які прийнято позначати .

Статистичним критерієм (або просто критерієм) перевірки гіпотези називається правило, згідно з яким гіпотеза приймається або відхиляється.

Звичайно критерій будується за допомогою критичної множини.

Критичною множиною називається така підмножина множини всіх можливих значень (підмножина вибіркового простору X) вибірки з - розподілу випадкової величини , яка спостерігається в експерименті, що при гіпотеза відхиляється, а в протилежному випадку приймається.

Для побудови критичної множини звичайно використовують спеціально підібрану статистику , яку називають статистикою критерію. Як правило, критична область має такий вигляд: або , або або , де - реалізація вибірки . Числа називаються критичними точками.

Розглянемо тепер помилки першого і другого роду.

Помилка, яка полягає в тому, що гіпотеза відхиляється, коли вона справедлива, називається помилкою першого роду.
Помилка, яка полягає в тому, що гіпотеза приймається, коли вона несправедлива, називається помилкою другого роду.

Число, що обмежує зверху ймовірність помилки першого роду, називається рівнем значущості і позначається через .

Звичайно - це числа 0,1; 0,05; 0,01 і т.д.

Ймовірність помилки другого роду позначається через . Якщо існує тільки одна альтернативна гіпотеза , то

.

Критична область вибирається так, щоб ймовірність помилки першого роду не перевищувала заданого рівня значущості і при цьому ймовірність помилки другого роду була мінімальною.

Ймовірність відхилити нульову гіпотезу , коли справедлива альтернативна гіпотеза називається потужністю критерію.

1.2 Приклади математичних формулювань найпоширеніших статистичних гіпотез.

Приклад 1. (гіпотеза про вигляд розподілу). Нехай проводиться п незалежних спостережень над деякою випадковою величиною з невідомою функцією розподілу . Нульова гіпотеза може мати вигляд , де функція повністю задана (проста гіпотеза), або , де - деяка сукупність функцій розподілу (складна гіпотеза). Звичайно задається в параметричному вигляді: . Наприклад, спостерігається випадкова величина що набуває три значення 0, 1, 2, і треба перевірити просту гіпотезу або складну гіпотезу , де - сукупність всіх біноміальних розподілів з параметрами і . У всіх цих випадках - це гіпотеза про вигляд розподілу спостережуваної випадкової величини.

Приклад 2. (гіпотеза однорідності). Проведено -серій незалежних спостережень, результати яких такі: (), . Постає питання про підставу розглядати ці дані як результати спостережень над однією і тією самою випадковою величиною, тобто що закон розподілу спостережень від серії до серії не змінювався. Якщо це так, то кажуть, що статистичні дані однорідні. Нехай - функція розподілу (взагалі кажучи, невідома) спостережень і-ї серії, . Тоді задача полягає в перевірці гіпотези однорідності

.

Приклад 3 . (гіпотеза незалежності). В експерименті спостерігається -вимірна випадкова величина невідомою функцією розподілу і є підстави стверджувати, що компоненти - незалежні випадкові величини. В цьому випадку треба перевірити гіпотезу незалежності



де - відповідні одновимірні функції розподілу компонент .

Приклад 4. (гіпотеза випадковості). Результати експерименту описуються п-вимірною випадковою величиною з невідомою функцією розподілу ,(). Завдання полягає втому, чи можна розглядати як випадкову вибірку з розподілу деякої випадкової величини, тобто чи є компоненти , незалежними і однаково розподіленими? У цьому випадку треба перевірити гіпотезу випадковості



де - деяка одновимірна функція розподілу.

У всіх попередніх прикладах формулюється тільки одна гіпотеза і треба перевірити, чи узгоджуються статистичні дані з цією гіпотезою, чи вони її відхиляють. Якщо - це гіпотеза про вигляд функції розподілу, то відповідні критерії називають критеріями згоди (узгодженості).

Найвідомішими критеріями перевірки гіпотези про вигляд розподілу є критерій Колмогорова, критерій та критерій Мізеса.

Оскільки на практиці знаходженнч статистик Колмогорова та Мізеса вимагає багато обчислень, то будемо використовувати інший критерій -, окільки його можна використовувати для довільних розподілів.


  1. Критерій згоди Пірсона для перевірки простої гіпотези

Розглядається вибірка з розподілу з невідомою функцією розподілу , про яку висунута проста гіпотеза , де гіпотетична теоретична функція розподілу є довільною. Треба перевірити за реалізацією вибірки вибірки , чи узгоджуються статистичні дані з гіпотезою , чи відхиляють цю гіпотезу при заданому рівні значущості .

Для перевірки цієї гіпотези К.Пірсон запропонував таку схему:

1. (Групування даних). Область значень випадкової величини розбивають на певну кількість - інтервалів розбиття , що не перетинаються, тобто , , . Це робиться так, щоб кількість елементів реалізації вибірки що попадають в інтервал задовольняла умову , .

  1. (Теоретичні ймовірності). Використовуючи гіпотетичну теоретичну функцію розподілу , обчислюють ймовірності ,. У цьому випадку повинна виконуватись умова , що дає обмеження на об'єм вибірки п. Якщо , то об'єднують сусідні інтервали розбиття.

  2. (Статистика критерію). За статистику, що характеризує відхилення статистичних даних (відносних частот — ) від відповідних гіпотетичних теоретичних значень (ймовірностей ), приймають випадкову величину



де , - випадкові величини.

Точний розподіл випадкової величини , якщо справедлива гіпотеза , тобто розподіл , складний і незручний для обчислення критичної межі при заданому рівні значущості . Але відомо, що для достатньо великих п статистика , якщо справедлива, має простий граничний розподіл, який не залежить від гіпотези , тобто від чисел , про що свідчить теорема (Пірсона).

Теорема (Пірсона). Якщо , то



На практиці достатнє наближення є при . Але достатньо, щоб п вибиралось з умови , . Отже, за реалізацією вибірки визначається у вигляді



де числа обчислюються за вибіркою х в пункті 1.


  1. (Критична область). При заданому рівні значущості критична область задається у вигляді



Це обумовлюється тим, що у випадку справедливості при , бо при відносні частоти - відповідних ймовірностей подій, .

Далі, оскільки при заданому згідно з попередньою теоремою 2 для достатньо великих п

то



і - квантиль розподілу.

Отже, гіпотеза при заданому відхиляється, якщо

Приклад.

При п=4040 підкиданнях монети Бюффон отримав =2048 випадань "герба" і =1992 випадань "решки". Треба перевірити, використовуючи критерій , чи сумісні ці дані з гіпотезою про те, що монета була симетричною, тобто що ймовірність випадання герба при заданому рівні значущості =0,05.

Для цього позначимо через , кількість випадань герба при одному підкиданні монети. У цьому випадку задача зводиться до того, що за спостережуваними даними потрібно перевірити просту гіпотезу або (монета симетрична). Тоді згідно зі схемою, що запропонована в критерії , отримаємо:

  1. Область значень , розбивається на дві окремі точки {=1}={випав герб (Г)}=, {=0}={випала решка (Р)}= , де =2048, =1992. Зазначимо, що > 5, і=1,2.

  2. , , де = 4040= 2020>10, і=1,2.



  3. За таблицею -розподілу при =0,05, =2 знаходимо

=3,841.

Отже, гіпотеза про те, що монета симетрична, приймається, тобто при рівні значущості =0,95 не суперечить експериментальним даним згідно з критерієм .
  1   2   3
Учебный текст
© perviydoc.ru
При копировании укажите ссылку.
обратиться к администрации