"Statistikat"

Testimi i hipotezave Chi-Square në Statistikë

Lidhja e marrëdhënieve midis veçorive kategorike

Testi Chi-square është një test joparametrik në testimin e hipotezave për të njohur lidhjen e dy veçorive kategorike në të dhënat ose rekordet dy variante. Testet joparametrike janë teste pa shpërndarje sepse bazohen në një numër shumë më të vogël supozimesh, prandaj nuk shpërndahet normalisht. Kur variabla e synuar nuk tregon shpërndarje normale, mund të shihet objektivi është në rendor ose në nominal dhe ekzistimi i vlerave të jashtme. Testi Chi-square gjithashtu deklaroi se varianca e një kampioni është disi e barabartë me popullsinë nga e cila është marrë kampioni. Kjo është arsyeja pse quhet hipoteza për variancën e popullsisë.

Për të testuar nëse një variabël kategorik është i lidhur ose ka një efekt në një vlerë tjetër kategorike, ne kontrollojmë hipotezën mbi këto dy kushte të paraqitura më poshtë:

H0: Dy ndryshore kategorike janë të pavarura nga njëra-tjetra.

H1: Dy ndryshore kategorike nuk janë të pavarura nga njëra-tjetra.

H0 dhe H1 janë përkatësisht hipoteza zero dhe hipoteza alternative.

Pas testimit, nëse mësojmë se duhet të hedhim poshtë hipotezën zero, atëherë duhet të pranojmë hipotezën alternative që thotë se të dyja të dhënat kategorike kanë një nivel të lidhjes. Testi kryhet në p-vlera që përcaktojnë nëse p-vlera është më e vogël se 0,05, atëherë të dyja kategorike vlerat kanë një lidhje të fortë dhe nëse p-vlera është më shumë se 0.05, atëherë ato janë të pavarura.

Formula për Chi-Square është paraqitur më poshtë:

Shpërndarja e chi-katrorit e quajtur është shpërndarja katrore Z, dhe diagrami i chi-katrorit është paraqitur më poshtë:

Ky test është vetëm në të dhëna kategorike si gjinia (mashkull, femër), ngjyra (e kuqe, jeshile, portokalli, etj.) dhe kategori të tjera binare.

Shumë nxënës ende nuk dinë shumë gjëra në rrugën e tyre të të mësuarit dhe ne gjithmonë përpiqemi të marrim njohuri në një mënyrë të thjeshtë dhe kuptimplote. Pema e mëposhtme do t'ju japë një sugjerim të vogël se si të zgjidhni një test për të dhënat e dyfishta.

Ne do të marrim një shembull të preferencës midis akullores dhe çokollatës tek të rriturit dhe fëmijët. Dy hipotezat janë dhënë më poshtë:

  • Mosha dhe preferenca për akullore dhe çokollatë janë të pavarura.
  • Mosha dhe preferenca për akullore dhe çokollatë nuk janë të pavarura.

Merrni parasysh tabelën për analizë, siç tregohet më poshtë:

Hapi tjetër për të shtuar rreshtin dhe kolonën për të bërë një pjesëtim me totalin.

Tani kemi edhe vlerën e vëzhguar edhe vlerën e pritur. Ne do të llogarisim vlerën chi-square për secilën qelizë duke zbatuar formulën që pamë më sipër.

Pas shtimit të të gjitha vlerave, vlera e përgjithshme e katrorit chi është tani 4.102. Epo, kjo vlerë chi-katrore është e ngjashme me testin z. Tani për të marrë vlerën kritike të katrorit chi me një shkallë lirie. DOF është një më pak se numri i përgjithshëm i rreshtave dhe kolonave totale.

Në një rresht, ne kemi dy rreshta dhe dy kolona gjithashtu. Pra, DOF do të jetë siç tregohet më poshtë:

DOF = (rresht-1)*(kolona-1) = (2–1)*(2–1) = 1

Pasi të njohim shkallën e lirisë, mund të llogarisim vlerën kritike të katrorit chi me ndihmën e vlerës alfa. Vlera alfa është vlera që vjen pas zgjedhjes së besimit të intervalit.

Vlera Alfa mund të zgjedhë nga kjo tabelë, siç tregohet në foto.

Kur shohim tabelën chi-square me një vlerë alfa 5%, vlerat kritike vijnë në 3,84. Ne mund t'i vëzhgojmë këto vlera përmes një fotografie të shpërndarjes chi-square.

Mund të shohim se vlera chi-square është më e madhe se vlera kritike. Pra, ne duhet të hedhim poshtë hipotezën zero. Gjithashtu, nëse shohim se nëse zgjedhim vlerën alfa në 1%, vlera kritike vjen 6.64. P-vlera është midis 5% dhe 1% do të thotë nëse kemi një rajon të rëndësisë është 5%, atëherë përsëri duhet të hedhim poshtë hipotezën zero. Por, nëse vlera alfa 1%, vlera chi-katrore është më e vogël se kritike, atëherë duhet të pranojmë hipotezën zero.

Llojet e testit Chi-Square

  • Test për pavarësinë (Testi chi-katror me dy drejtime): I mirë për shoqërimin e vlerave kategorike.
  • Testi për mirësinë e përshtatjes (Testi chi-katror me një drejtim): Vlerat e vëzhguara mirë për t'u kontrolluar ndryshojnë nga vlera teorike.

Përfundim:

Testi Chi-square është shumë i mirë kur kemi veçori të kategorive në një grup të dhënash.

Më kontaktoni në "LinkedIn" tim. Më dërgoni me postë në [email protected].

Artikuj të rekomanduar

  1. "NLP - Zero në Hero me Python"

2. Strukturat e të dhënave Python Llojet dhe objektet e të dhënave

3. MySQL: Zero në Hero