Хи-квадрат-распоред

Од Википедија — слободната енциклопедија
Прејди на прегледникот Прејди на пребарувањето

Хи Квадрат распоред[уреди | уреди извор]

Во теоријата за веројатност и статистиката, хи квадрат распоредот со υ степени на слобода е распоред на збирот од квадратите на n независни нормални случајни променливи. Тоа е еден од најшироко употребуваните распореди на веројатност во дедуктивната статистика, на пример, во тестирање на хипотези или во донесување заклучок за интервалите на доверба. Хи квадратниот распоред е посебен случај на гама распоредот, и уште се нарекува Пирсонов распоред и централен хи квадратен распоред.[1][2]

Дефиниција[уреди | уреди извор]

Ако x1,x2……,xn се независни, стандардни, нормални променливи, тогаш збирот на нивните квадрати е распореден според хи квадрат распоредот со υ степени на слобода. [3]
Врската меѓу варијансата на примерокот со таа на популацијата е прикажана во χ2. Соодносот помеѓу варијансата на примерокот (S2) помножен со n-1, и варијансата на популацијата (σ2) е распоредот χ2, ако популацијата од која се извлечени вредностите има нормален распоред.[4]

Карактеристики[уреди | уреди извор]

Ако примерокот е добиен од нормален распоред, вредноста во заградите е всушност z-вредност. Така χ2 е збир на квадрираните z-вредности. [5]
Доколку одблиску се разгледа формулата:
1. Прво, овој распоред не може да има вредност помала од 0. Тоа е така бидејќи s2 и σ2 се квадрирани и големината на примерокот е позитивен интеграл. Оттаму, опсегот на било која варијабла на хи квадрат е од 0 до, теоретски, бесконечност.
2. Средината на хи квадрат распоред е едноставно n-1, бројот на степени на слобода.
3. Формата на овој распоред е дефинитивно асиметрична. Поради тоа што опсегот е ограничен на левата страна со 0 и неограничен на десната страна, неговата форма е искривена надесно. Искривеноста е значителна кога бројот на степени на слобода е мал, но истата се намалува како што степените на слобода се зголемуваат.[6]
4. Коефициент на асиметрија:

Распоредот е асиметричен. За υ -> ∞ распоредот станува симетричен.


5. Коефициент на сплоснатост:

За υ -> ∞ распооредот ја достигнува нормалната висина.[7]


Определување на степените на слобода[уреди | уреди извор]


Распоредот е дефиниран само за позитивни вредности, бидејќи варијансите се сите позитивни вредности. Пример за функција на густина на веројатност е покажан во горниот графикон. Функцијата на густина е асиметрична со издолжена позитивна опашка. Можеме да карактеризираме одреден член од фамилијата на хи квадрат распореди со единствен параметар познат како степени на слобода, означен со υ. Хи квадрат распоредот со υ степени на слобода ќе се означува како χ2υ. Средината и варијансата на овој распоред се еднакви на бројот на степени на слобода и на два пати по бројот на степени на слобода.
Е(χ2υ) = υ и Var (χ2υ) = 2υ Со користење на овие резултати за средината на варијансата на хи квадрат распоредот, наоѓаме дека:

А за да ја добиеме варијансата на s на квадрат имаме:


Можеме да ги користиме својствата за да ја најдеме варијансата на распоредот на примерокот за варијансата на примерокот кога матичната популација е нормална. Параметарот υ на хи квадрат распоредот се нарекува степени на слобода. За да помогнеме да се разбере концептот на степени на слобода, прво земете дека варијансата на примерокот е збир на квадратите на n вредности од обликот (xi - x̅)2. Овие n вредности не се независни бидејќи нивниот збир е нула. Оттука ако знаеме n-1 од вредностите (xi - x̅)2 :

Бидејќи можеме да ја одредиме n-тата големина ако ги знаеме преостанатите n-1 големини, велиме дека има n-1 степени на слобода – независни вредности – за пресметување на s2. Во спротивно, ако µ беше непозната, можевме да ја пресметаме оценетата вредност на σ2 со користење на големините (x1 – M), (x2 – M), … , (xn – M) при што секоја од нив е независна. Во тој случај би имале n степени на слобода од n независни опсервации на примерокот, xi. Меѓутоа М не е позната и мораме да ја користиме нејзината оценета вредност за да ја пресметаме оценката на σ2. Како резултат на тоа, еден степен на слобода е изгубен во пресметување на средината на примерокот, и имаме n-1 степени на слобода за s2.

Наоѓање на вредностите на хи квадрат распоредот[уреди | уреди извор]

За многу примени кои ја вклучуваат варијансата на популацијата треба да ги најдеме вредностите на кумулативниот распоред на χ2, особено горните и долните опашки на распоредот. На пример:
P( x̅210) < K) = 0.05
P( x̅210) > K) = 0.05
За оваа цел, табеларно е прикажан распоредот на χ2 случајната променлива во таблицата. Во оваа таблица степените на слобода се дадени во левата колона, а критичните вредности за υ за различни нивоа на веројатност се означени во другите колони. Така, за 10 степени на слобода, вредноста за долниот интервал е 3,94. Овој резултат е добиен со одење до редот 10 степени на слобода во левата колона и потоа со читање до колоната со наслов веројатност 0,950 на десно од влезовите на овие колони. χ2 вредноста е 3,94. Слично на тоа, за горниот 0,05 интервал, вредноста на К е 18,31. Овој резултат е добиен со одење до редот 10 степени на слобода во левата колона и потоа со читање до колоната со наслов веројатност 0,50 на десно од влезовите на овие колони. χ2 вредноста е 18,31.
P( x̅210) < 3,94) = 0.05
P( x̅210) < 18,31) = 0.05[8]

Донесување заклучок[уреди | уреди извор]

Со оглед на тоа дека има многу статистички ситуации каде распоредот на популацијата јасно не е нормален, употребата на χ2 распоредот за да се донесат заклучоци за σ2 (или индиректно за σ) во вакви случаи е несоодветна. Како резултат на ова, нашата способност да донесуваме заклучоци за популацијата или варијансата може да биде сериозно ограничена. Како може да се определи дали употребата на овој метод е соодветна? Добра идеја е се направи хистограм на примерокот, ако примерокот е доволно голем за да овозможи значајни информации. Ако хистограмот очигледно не е нормален ( ако е значајно искривен), тогаш овој хи квадрат метод треба да се избегне. Ако примерокот е премал за да овозможи значајни информации, мора да се потпреме на субјективната проценка базирана на нашето личното познавање за распоредот на популацијата.[9]

Примена[уреди | уреди извор]

χ2 распоредот, како и секој друг распоред, објаснува како случајната променлива се однесува. Распоредот кажува кои се најверојатните вредности на случајната променлива (каде има најмногу простор под кривата), и кои се најмалку веројатните вредности на случајната променлива (каде има најмалку простор под кривата).[10] Хи квадратниот распоред е употребуван во повеќето статистички софтверски пакети, главно затоа што можат да се претставуваат табеларно.[11] Најмногу се користи во областа на непараметарските тестови односно кај Хи-квадрат тестот. Всушност се применува за испитување на значајноста на разликите помеѓу емпириските и теоретските фреквенции, односно помеѓу стварните и теоретските вредностина еден или повеќе белези. [12]
Понекогаш во статистичките анализи, истражувачот е повеќе заинтересиран за варијансата на популацијата отколку средината на популацијата или пропорцијата на популацијата. На пример, на снабдувачите кои сакаат да стекнат повисок статус во својата работа или оние кои сакаат да ги задржат договорите со своите купувачи,често им се бара да ја прикажат редукцијата на варијацијата на деловите со кои ги снабдуваат клиентите. Тестовите се спроведени врз примероци со цел да се утврди големината на варијацијата и да се определи дали се исполнуваат целите кога станува збор за намалување на варијабилитетот. Проценувањето на варијацијата е важно во многу различни ситуации во бизнисот. На пример, варијациите меѓу читањата кај авионскиот висиномер мора да бидат минимални. Не е доволно да се знае дека, просечно, определен бренд на висиномер ја прикажува вистинската надморска височина. Исто така, важно е разликата меѓу инструментите да биде мала. Така што, мерењето на варијацијата на висинометарот е критично. Деловите кои се вградуваат во моторите мора точно да се вклопуваат константно. Широкиот варијабилитет меѓу деловите може да резултира со дел кој е премногу голем за да го собере или да е премногу мал што ќе резултира со преголема толеранција, што предизвикува вибрации.[13]

Наводи[уреди | уреди извор]

  1. Милтон Абрамовиц; Ирене А. Стегун - Прирачник за математички функции со форули, графици и табели (1965)
  2. Н.Л. Џонсон; С.Коц; Н. Балакришнан - Континуирани едноваријантни распореди(1994)
  3. Александер Муд; Френлин А. Грејбил, Дуан К. Боес - Вовед во стастистичката теорија(1974)
  4. Кен Блек – Бизнис статистика за современо донесување одлуки(2008)
  5. Дејвид Е. Гробнер, Патрик В. Шенон, Филип К. Фрај, Кент Д. Смит -Бизнис статистика од аспект на донесување одлуки
  6. Џорџ К. Канавос, Дон М. Милер – Вовед во модерната бизнис статистика(1993)
  7. Славе Ристески и Драган Тевдовски – Статистика за бизнис и економија(2010)
  8. Пол Њуболд, Вилијам Л. Карлсон, Бети Торн - Статистика
  9. Џорџ К. Канавос, Дон М. Милер – Вовед во модерната бизнис статистика(1993)
  10. Мерлин К. Пелоси, Тереза М. Сандифер - Правење бизнис статистика со Excel; податоци, постапка и донесување одлуки
  11. Џорџ К. Канавос, Дон М. Милер – Вовед во модерната бизнис статистика(1993)
  12. Славе Ристески и Драган Тевдовски – Статистика за бизнис и економија(2010)
  13. Кен Блек – Бизнис статистика за современо донесување одлуки(2008)