Хи квадрат тест

Од Википедија — слободната енциклопедија
Прејди на прегледникот Прејди на пребарувањето

Xи- квадрат тест

Хи квадрат тестот спаѓа во групата на непараметарските тестови. Овој тест е еден од постарите статистички тестови. Тестот го разработил Карл Пирсон во 1900-тите години, па познат е и под називот Пирсонов тест. Тестовите кои се засновани на х2 распоредот опфаќаат цела низа проблеми кои можат да се однесуваат на модалитетите на еден или повеќе белези. Постапката наречена хи-квадрат тест се употребува во повеќето случаеви ако се работи за квалитативни податоци или ако појавата значајно отстапува од нормалата. Хи-квадрат тестот е многу практичен тест кој може особено да послужи кога сакаме да утврдиме дали некоја добиена фрекфренција отстапува од фрекфенцијата која ја очекуваме со одредена хипотеза. Кај овај тест истотака истражуваме дали постои поврзаност помеѓу две варијабли и тој ја покажува веројатноста на поврзаност, како и хомогеност на популацијата. Со други зборови кога се испитуваат два белега X и Y обично се поставува нултата хипотеза за нивната независност, при тестирањето на независноста на принципите на класификација, х2 тестот треба да покаже дали модалитетите на белезите класифицирани по одредени критериуми се зависни или независни. Така на пример, може да се тестира: Зависност на сообраќајните прекршоци од староста на возачите, Завинсост на работниците според распоредот на платите и должината на работиот стаж, Зависност на времето на задоцнување од должината на работниот стаж итн. Тестот на независноста овозможува донесување одлука во врска со прифаќањето или неприфаќањето на нултата хипотеза т.е. постоење или непостоење значајна разлика помеѓу емпириските и очекуваните фрекфенции според еден или друг критериум. Постојат два вида на хи – квадрат тестови

Хи квадрат тест во облик на распоред

Тоа е нај тест кој треба да покаже дали емпирискиот распоред статистички значајни се разликува од теоретскиoт. х² тестот во облик на распоред се заснова на разликата помеѓу емпириските фреквенции на модалитетите (fi) и очекуваните фреквенции на тие модалитети (fit) аналогно на нивниот претпоставен распоред. Со хипотезата треба да се специфицира очекуваниот распоред (биномен,униформален,нормален),а тестот треба да покаже дали емпирискиот распоред на примерокот значајно се разликува од очекуваниот. Најпроста хипотеза е за униформален распоред. (иста френквенција за сите модалитети)


  реализирана вредност Х²=∑_(i=1)^r  ((fi-〖fi〗^(t)²))/〖fi〗^t       
  fi-емпириска фрекфренција
  fit-очекувана (теоретска)фрекфренција
  степени на слобода V= r-m-1  
  r-број на модалитети на белегот  
  m-параметар на распоред  
  критична вредност  x²α;v1 
  α-ниво на значајност


x² статистиката на тестот се применува на податоците кои можат да се сведат на апсолутни фреквенции.

Кога Х²α;v1 критичната вредност е поголема од реализирана вредност се прифаќа Ho

Н0 : Емпирскиот распоред е униформен

кога Х² реализирана вредност е поголема од критичната се прифаќа H1

Н1 : Емпирискиот распоред не е униформен


Пример: Бројот на гледачи на ФК Вардар на последните четири натпревари се движел на следниот начин:



Fudbal.png






На ниво на значајност од 0.01 да се испита дали може да се испита хипотезата дека бројот на гледачи на ФК Вардар по натпревари има униформен распоред.

Н0 : Емпирскиот распоред е униформен (бројот на гледачи на Вар дар е ист за сите натпревари)

Н1 : Емпирискиот распоред не е униформен / статистички значајно се разликува

X2α;r-1= X20.01;4-1= 11.345 критична вредност

Х²=∑_(i=1)^r ((fi-〖fi〗^(t)²))/〖fi〗^t= 19.99 реализирана вредност

X2 >X2α;v односно 19.99 > 11.345

Grafik..png Н1 се прифаќа, а тоа значи дека емпирискиот распоред не е униформен(бројот на гледачи на натпреварите на Вардар се разликува по натпревари).





Хи квадрат тест на независност на модалитетите на два белега

При тестирањето на независноста на принципите на класификација, х² тестот треба да покаже дали модалитетите на белезите класифицирани со пределени критериуми се зависни или независни. За тестирање на независноста користиме табели на контингенција. Табели на контингенција се табели каде се презентирани емпириските фреквенции (fij) за ij-та комбинација на модалитетите на два белега, кои треба да се споредат со очекуваните фреквенции (fij^t) со цел да се изврши тестирање на независнос


  реализирана вреедност х²=∑_(i=1)^r ∑_(j=1)^k  ((fij-〖fij〗^(t)²))/〖fij〗^t   
  критична вредност x²α;v1 
  степени на слобода V=(r-1)(k-1)
  r- модалитети на еден белег
  к- модалитети на другиот белег


Кога Х²α;v1 критичната вредност е поголема од реализирана вредност се прифаќа Ho

H0: Модалитетите на белезите се независни

Кога Х² реализирана вредност е поголема од критичната се прифаќа H1

Н1: Модалитетите на белегзите се зависни



За мерење на интензитетот на зависност на набљудуваните модалитети се користи коефициент на контингенција (С)

C=√(x²/(n+x²)) 0<x²<1


Cmax= √((r-1)/r)- aко r=k

Табела на контингенција Пример:

Tabela na kontingencija.png

Fij..png



H0 : Модалитетите на двата белега се независни (разликите во полот не влијаат),полот не влијае во бараните карактеристики.

Н1:Модалитетите на двата белега се зависни (разликите во полот влијаат), мажите и жените имаат различни барани карактеристики.


Х2=∑_(i=1)^r ∑_(j=1)^k ((fij-〖fij〗^(t)²))/〖fij〗^t =20,65

X2α;(r-1)( k-1)=7.8

X2 > X2α;v односно 20,65 > 7,8

H1 се прифаќа, модалитетите на двата белега се зависни.

.


   Мали очекувани фрекфренции

Кога ќе се случи очекуваната фреквенција (〖fij〗^t) да е помала од 5, треба да се изврши прегрупирање на податоците- спојување на два модалитети со мали фреквенции во еден модалитет Кога примерокот е доволно голем, очекуваната фреквенција може да биде помала од 5, па дури и помала од 1.


== Наводи == Статистика за бизнис и економија - Славе Ристески, Драган Тевдовски Скопје 2010 http://www.presek.si/12/731-Pisanski-test.pdf