Z-тест

Од Википедија — слободната енциклопедија
Прејди на: содржини, барај

Z-тестот е вид на статистички тест за кој распоредот на тест статистиката под нултата хипотеза може да се поистовети со нормалната распределба. Тоа е така,бидејќи според централната гранична теорема,многу тест статистики се приближно нормално распределени за големите примероци.За секое ниво на значајност,Z-тестот има определена критична вредност ( на пример 1.96 за 5% ниво на значајност).Z-тестот најчесто се применува доколку големината на примерокот е голема,а популационата варијанса позната. Доколку големината на примерокот е помала од 30,а варијансата не е позната,тогаш употребата на Студентовиот t-распоред би била посоодветна.

Употреба на тестирање[уреди]

Терминот Z-тест често се употребува за споредување на средната вредност на збир на мерења во однос на дадена константа. Ако набљудуваните податоци X1, ..., Xn се (i) коваријансни, (ii) имаат заедничка средна вредност μ, и имаат заедничка варијанса σ2, тогаш набљудуваниот примерок во просек има средна вредност μ и варијанса σ2 / n.

Кога се користи Z-тест за максимални можни проценки важно е да се има во предвид дека нормалните приближувања може да бидат лоши ако големината на примерокот не е доволно голема. Иако нема едноставно, универзално правило кое наведува која големина на примерокот е најсоодветна за да се користи Z-тест, симулацијата може да даде добра идеја за тоа дали Z-тестот е соодветен за дадентата ситуација.

Z-тестовите се употребуваат кога може да се тврди дека статистиката на тестот следи нормален распоред во рамките на нултата хипотеза. Многу непараметарски тест статистики како U-статистика се нормални за доволно голем примерок и оттаму често се вршат Z-тестовите.

Услови[уреди]

За да може Z-тестот да биде применлив,мора да бидат исполнети неколку услови.Одредени параметри мора да се знаат или да се проценат со висока точност ( пример параметар-стандардна девијација во тест примерок).Z-тестот се фокусира на еден параметар и ги третира сите непознати параметри како фиксни вредности .Меѓутоа доколку примерокот не е доволно голем за да разумно ги оправда овие проценки,тогаш нити Z-тестот не би се сметал за релевантен.

Статистичкиот тест треба да биде нормално распределен.Генерално,за да централната гранична теорема биде издржана,тестот мора нормално да варира.Постојат голем број статистички анализи дали е оправдана употребата на тестот,доколку распределбата е приближно нормална.Доколку отстапувањето е големо,тогаш Z-тестот не треба да се употребува.

Пример[уреди]

Да претпоставиме дека во одреден географски регион , средната вредност и стандардната девијација на резултатите на тестот по математика се 100 поени и 12 поени ретроспективно. Наш интерес се резултатите на 55 ученици во одредено училиште кои добиле среден резултат од 96 поени.Се поставува прашање,дали овој среден резултат може да се смета за значително понизок од регионалниот ?

За да одговориме,најпрво ке започнеме со пресметување на стандардната грешка на средината:

\mathrm{\sigma_\bar{x}}\ = \frac{\sigma}{\sqrt n} = \frac{12}{\sqrt{55}} = \frac{12}{7.42} = 1.62 \,\!

Следно,го пресметуваме z резултатот. Z резултатот ни ги покажува стандардните отстапувања на индивидуалниот резултат над или под средната вредност. Кога се користи Z тестот,сепак, ние не го споредуваме индивидуалниот резултат со средната големина на популацијата. Наместо тоа ние ја споредуваме средната големина на примерокот со средната големина на популацијата.

z = \frac{{\bar{x}} -M_0} \mathrm{\sigma_\bar{x}}\ = \frac{96 - 100}{1.62} = -2.47 \,\!

Во овој пример ние ја третираме средната вердност на популацијата и варијансата која што ни е позната, кои ке бидат соодветни доколку сите ученици во регионот беа тестирани, или ако беше искористен голем прост случаен примерок за да се процени средната големина на популацијaта и варијансата со минимален ризик на грешка.

Училишниот среден резултат е 96, кој што е -2,47 стандардни грешки од средната големина на популацијата (100). Погледнете го z резултатот во табелата на стандардниот нормален распоред и ке ја најдете веројатноста за набљудуваната стандардна нормална вредност под -2,47 изнесува приближно 0,5-0,4932=0,0068

Ова е еднострана p-вредност на нултата хипотеза дека 55 студенти се споредливи со прост случаен примерок од популацијата од сите решавачи на тестот. На двостраниот тест p-вредноста е приближно на 0,014.

Друг начин е дека со веројатност од 1-0,014=0,986 простиот случаен примерок од 55 студенти ке има среден резултат на тестот во рамките на 4 единици на средната големина на популацијата. Ние исто така можеме да кажеме дека со 98,6% доверба ја одбиваме нултата хипотеза дека 55 решавачи на тестот се споредливи со простиот случаен примерокот од популацијата на решавачи на тест.

Z-тестот ни кажува дека 55 студенти имаат невообичаено ниска средна вредност на резултатите од тестот во споредба со повеќе прости случајни примероци со слична големина на популацијата на решавачите на тестот. Недостатокот на оваа анализа е тоа дека не смета дали ефектот од 4 поени е значаен. Ако наместо за училиштето, ние пресметавме за подрегионот кој содржи 900 ученици чиј среден резултат бил 99, ќе се добиа речиси истиот z резултат и p-вредност. Ова покажува дека ако големината на примерокот е доволно голема, многу мали разлики во нултата вредност може да бидат статистички значајни. За понатамошна дискусија на ова прашање погледнете за тестирање на статистички хипотези.

Литература[уреди]

  • Ристески Славе, Тевдовски Драган (2010): „Статистика за бизнис и економија“, четврто издание, Скопје: Економски факултет – Скопје.
  • Sherri L. Jackson Jacksonville University: Research Methods and Statistics: A Critical Thinking Approach, 4th Edition.
  • Sprinthall, Richard C. Basic Statistical Analysis: Seventh Edition, copyright 2003, Pearson Education Group.

Надворешни врски[уреди]