SPSS-i në praktikë - Teknikat Statistikore me Shumë Ndryshore

50 %
50 %
Information about SPSS-i në praktikë - Teknikat Statistikore me Shumë Ndryshore

Published on June 18, 2016

Author: kujtimhameli

Source: slideshare.net

1. 0 SPSS-i NË PRAKTIKË TEKNIKAT STATISTIKORE ME SHUMË NDRYSHORE Prof. Dr. Sheref KALLAJXHË 2016

2. SPSS-i NË PRAKTIKË TEKNIKAT STATISTIKORE ME SHUMË NDRYSHORE EDITOR: Prof. Dr. ŞEREF KALAYCI PËRKTHYES: KUJTIM HAMELI BOTIMI 6 2016

3. APLIKIMET ME SPSS TEKNIKAT STATISTIKORE ME SHUMË NDRYSHORE AUTORËT Kapitulli: Kapitulli: Prof. Dr. Şeref Kalaycı 12, 13 Ligj. Engin Küçüksille 9, 10 Ndih.Doç.Dr. Belma Ak 3, 4 Ndih.Doç.Dr. Meltem Karaatlı 1 Ndih.Doç.Dr. Hidayet Ü. Keskin 8 Ndih.Doç.Dr. Eda Ü. Çiçek 2 Ndih.Doç.Dr. Aliye Kayış 11, 15 Ndih.Doç.Dr. Ömer L. Antalyalı 7 Ligj. Nezihe Uçar 14 Ligj. Doç.Dr. Hakan Demirgil 5 Asis. Hul. Onur Sungur 6 EDITOR Prof. Dr. Şeref Kalaycı Botimi i gjashtë 2014 Përkthyer 2015 Edituar 2016

4. i FJALA E PËRKTHYESIT Falendërimet i takojnë Zotit të Madh që ma lehtësoi dhe më shtoi durimin gjatë kryerjes së këtij punimi. Respektin tim ia shfaq dy më të dashurve të mi, prindërve, të cilët janë motivimi im më i madh për çdo punë. Falenderoj të gjithë ata që kanë kontribuar në kompletimin dhe dizajnimin e këtij libri. Duke parë mungesën e literaturës rreth këtij programi dhe nevoja e përdorimit për këtë program, mora vetëiniciativën për të dhënë një kontribut literaturës shqipe duke përkthyer këtë libër, i cili përmban analizat statistikore më të përdorura për hulumtim në shkencat shoqërore. I nderuar hulumtues! Ky libër i mrekullueshëm rreth programit SPSS (Statistical Package for the Social Sciences) i punuar nga një grup profesorësh të Turqisë, do të të ndihmoj për të kryer analizat statistikore në program hap pas hapi përmes fotografive si dhe bën interpretimin e rezultateve të përfituara nga analizat. Ky libër është dizajnuar në mënyrë të tillë që çdo kush i cili nuk ka njohuri rreth SPSS-it, do të jetë në gjendje që të kryej vetë një analizë në programin SPSS. Me shpresën se ky libër do t’iu shërbej gjatë kryerjes së hulumtimeve tuaja, ju lë me prezencën e analizave në vazhdim dhe programit të mirënjohur SPSS. Për çdo vërejtje, koment apo sugjerim, mund të më shkruani në email adresën time. Kujtim Hameli kujtimhameli4@gmail.com 25.07.2015, Stamboll

5. ii PARATHËNIE Në ditët e sotme mund të kryhen shumë lehtë shumë analiza statistikore përmes kompjuterëve dhe programeve të sofistikuara që në të kaluarën ishte e pamundur për t’u bërë. Në këtë kontekst, teknikat statistikore themelore dhe me shumë ndryshore përdoren mjaft në universitetet tona nga studentët hulumtues, përmes paketave të ndryshme. Dhe ne për këtë arsye kemi përgatitur punimin që keni në duar duke përdorur programin e mirënjohur SPSS në shtetin tonë, për t’iu ndihmuar në aplikimin dhe interpretimin e rezultateve të teknikave statistikore themelore dhe me shumë ndryshore. Karakteristika më e rëndësishme e librit është aplikimi i metodës së mësimit aktiv. Pra, edhe ai i cili nuk ka njohuri të mjaftueshme në nivelin e duhur rreth programit SPSS dhe statistikës, me anë të librit tonë do të mund të mësojë se si mund t’i bëj analizat e dëshiruara dhe si të i interpretojë rezultatet e përfituara. Ideja e shkruarjes së librit filloi nga bisedat me kolegët e mi (nga autorët e librit ligjëruesit dhe asistentët e hulumtimit) se përgatitja e një libri me aplikime në lidhje me tema metodologjike do të ishte shumë i dobishëm për një audiencë të gjerë si për akademikët, hulumtuesit dhe studentët dhe se edhe ata do të jepnin kontribut në përgatitjen e këtij libri. Përveç kësaj, libri mori formën përfundimtare nga kontributet e shokëve e mi të ndershëm të punës (Abdullah Eroğlu, Ali Sait Albayrak, Aliye Kayış) me përgatitjen e kapitujve të tyre. Kapitujt janë shkruar në mënyrë që mund të lexohen ndaras. Për këtë arsye, në libër janë përsëritur disa gjëra. Një i cili ka njohuri themelore të statistikës, nuk ka nevojë që të lexojë kapitujt e mëparshëm për leximin e çfarëdo kapitulli. Mendimet dhe rekomandimet tuaja rreth këtij libri që menduam të jetë i dobishëm për një audiencë të gjerë, i presim në email adresën tonë. Në bazë të rekomandimeve do të provojmë që t’a bëjmë sa më të dobishëm për ju. Prof. Dr. Sheref KALLAJXHË kalayci61@yahoo.com

6. iii

7. iv PËRMBAJTJA FJALA E PËRKTHYESIT i PARATHËNIE ii PËRMBAJTJA iv 1.RREGULLIMI DHE PARAQITJA E TË DHËNAVE.......................................................... 1 1. ORGANIZIMI I TË DHËNAVE......................................................................................... 1 2. Shembull Aplikimi............................................................................................................... 1 3. KOMENTIMI I TABELAVE TË KRIJUARA NË LIDHJE ME RREGULLIMIN E TË DHËNAVE DHE PARAQITJEN E TYRE ................................................................................ 4 4. ANALIZA E VLERAVE EKSTREME (OUTLIERS)...................................................... 11 4.1. Shembull Aplikimi ..................................................................................................... 12 5. SHQYRTIMI I TË DHËNAVE QË MUNGOJNË ........................................................... 17 5.1. Shembull Aplikimi ..................................................................................................... 17 6. PLOTËSIMI I MUNGESËS SË TË DHËNAVE.............................................................. 32 2. STATISTIKAT PËRSHKRUESE......................................................................................... 37 1. MATËSIT E TENDECËS QENDRORE .............................................................................. 37 1.1. Mesatarja Aritmetike...................................................................................................... 37 1.2. Mediana (Mesorja) ......................................................................................................... 38 1.3. Moda............................................................................................................................... 38 2. MATËSIT E DEVIJIMIT NGA MESATARJA ................................................................... 39 2.1. Varianca ......................................................................................................................... 39 2.2. Devijimi Standart ........................................................................................................... 40 3. MATËSIT E DEVIJIMEVE NGA NORMALJA ................................................................. 40 3.1. Shpërndarja Normale Për Një Ndryshore....................................................................... 40 3.1.1. Shembull Aplikimi.................................................................................................. 41 3.2. Ngushtësia...................................................................................................................... 46 3.3. Pjerrësia.......................................................................................................................... 46 4. Shembull Aplikimi............................................................................................................. 47

8. v 3. TESTIMI I HIPOTEZAVE ................................................................................................... 52 1. PËRCAKTIMI I HIPOTEZAVE........................................................................................... 52 1.1. Hipoteza Zero (Null Hypothesis)................................................................................... 52 1.2. Hipoteza Alternative (Alternative Hypothesis).............................................................. 52 2. TESTET STATISTIKORE.................................................................................................... 53 3. TESTET NJË DHE DY ANËSORE ..................................................................................... 53 4. GABIMI I LLOJIT TË PARË DHE TË DYTË .................................................................... 55 5. NIVELI I RËNDËSISË (α) DHE INTERVALI I BESIMIT (1-α) ....................................... 55 6. MADHËSIA E MOSTRËS ................................................................................................... 57 6.1. Shembull Aplikimi......................................................................................................... 57 4. TESTET PARAMETRIKE ................................................................................................... 60 1. SUPOZIMET E TESTEVE PARAMETRIKE...................................................................... 60 2. Testi T.................................................................................................................................... 61 2.1. Test T i dy Mostrave të Pavarura (Indepedent-Samplest t-Test) ................................... 62 2.1.1. Shembull Aplikimi.................................................................................................. 62 2.2. Testi T i dy Mostrave të Varura (Paired Samples t-Test) .............................................. 65 2.2.1. Shembull Aplikimi.................................................................................................. 65 2.3. Testi T i një Mostre(One-Sample t-Test)....................................................................... 68 2.3.1. SHEMBULL APLIKIMI........................................................................................ 68 3. TESTI-Z................................................................................................................................. 70 3.1. Testi Z një Mostërsh....................................................................................................... 70 3.1.1. Shembull Aplikimi.................................................................................................. 71 3.2. Testi Z dy Mostrash........................................................................................................ 71 3.2.1. Shembull Aplikimi.................................................................................................. 72 4. ANALIZA E VARIANCËS (ANOVA)................................................................................ 72 5. TESTET JO PARAMETRIKE (NON – PARAMETRIC) TË TESTIMIT TË HIPOTEZAVE............................................................................................................................ 74 1. TESTI KATRORI-KI............................................................................................................ 75 1.1. Testi i Përshtatshmërisë i Katrorit-Ki dhe Shembull Aplikimi...................................... 75

9. vi 1.2. Testi i Pavarësisë i Katrorit-Ki dhe Shembull Aplikimi ................................................ 80 1.3. Testi i Homogjenitetit i Katrorit-Kit dhe Shembull Aplikimi........................................ 86 2. TESTI RUNS DHE SHEMBULL APLIKIMI...................................................................... 89 3. TESTI MAN-WHITNEY U DHE SHEMBULL APLIKIMI ............................................... 93 4. TESTI WALD-WOLFOWITZ DHE SHEMBULL APLIKIMI........................................... 95 5. TESTI WILCOXON SIGNED RANK DHE SHEMBULL APLIKIMI............................... 98 6. TESTI KRUSKAL-WALLIS DHE SHEMBULL APLIKIMI ........................................... 102 7. TESTI FRIEDMAN DHE SHEMBULL APLIKIMI.......................................................... 104 8. KORRELACIONI SPEARMAN’S RANK ORDER DHE SHEMBULL APLIKIMI ....... 107 6. ANALIZA E KORRELACIONIT....................................................................................... 111 1. KOEFICIENTI I KORRELACIONIT TË PEARSONIT.................................................... 112 2. KOEFICIENTI I KORRELACIONIT TË PJESSHËM ...................................................... 113 3. MATËSIT E TJERË TË LIDHJES ..................................................................................... 113 3.1. PHI ............................................................................................................................... 113 3.2. Korrelacioni Rendor i Spearmanit................................................................................ 113 3.3. Koeficienti i Normalitetit ............................................................................................. 114 3.4. ETA.............................................................................................................................. 114 4. Shembull Aplikimi .............................................................................................................. 114 5. Shembull Aplikimi 2 ........................................................................................................... 118 5.1. Metoda Bivariate.......................................................................................................... 119 5.2. Metoda e Pjesshme (Partial)......................................................................................... 122 5.3. Metoda Distances ......................................................................................................... 124 7. ANALIZA E VARIANCËS (ANOVA – MANOVA)......................................................... 128 1. HYRJE................................................................................................................................. 128 2. ANOVA NJË DREJTIMSHE ............................................................................................. 131 2.1. Shembull Aplikimi....................................................................................................... 131 2.2. Daljet e SPSS-it dhe Interpretimi................................................................................. 135 3. ANOVA DY DREJTIMSHE............................................................................................... 140

10. vii 3.1. Shembull Aplikimi....................................................................................................... 140 3.2. Daljet e SPSS-it dhe Interpretimi................................................................................. 148 4. MANOVA NJË DREJTIMSHE.......................................................................................... 157 4.1. Shembull Aplikimi....................................................................................................... 157 4.2. Daljet e SPSS-it dhe Interpretimi................................................................................. 161 5. MANOVA DY DREJTIMSHE........................................................................................... 170 5.1. Shembull Aplikimi....................................................................................................... 170 5.2. Daljet e SPSS-it dhe Interpretimi................................................................................. 174 8. ANALIZA E KOVARIANCËS ........................................................................................... 198 1. AVANTAZHET E APLIKIMIT TË ANALIZËS SË KOVARIANCËS ........................... 199 2. FUSHAT E PËRDORIMIT TË ANALIZËS SË KOVARIANCËS................................... 199 3. SUPOZIMET E ANALIZËS SË KOVARIANCËS ........................................................... 200 4. Shembull Aplikimi .............................................................................................................. 201 4.1. Hyrja e të Dhënave dhe Testimi i Supozimeve............................................................ 201 4.2. Aplikimi i Analizës së Kovariancës............................................................................. 207 9. REGRESIONI I THJESHTË LINEAR.............................................................................. 214 1. MODELI I REGRESIONIT TË THJESHTË LINEAR ...................................................... 214 2. PARAMETRAT E PARASHIKUARA (VLERËSUARA) ................................................ 214 3. Shembull Aplikimi .............................................................................................................. 215 3.1. Formimi i Modelit dhe Parashikimi i Parametrave...................................................... 216 3.2. Interpretimi i Parametrave............................................................................................ 216 4. PARASHIKIMI ME MODELIN E REGRESIONIT.......................................................... 216 4.1. Shembull Aplikimi....................................................................................................... 217 4.2. Të Dalurat nga SPSS dhe Interpretimi ......................................................................... 219

11. viii 10. MODELI I REGRESIONIT TË SHUMËFISHTË LINEAR......................................... 222 1. MODELI.............................................................................................................................. 222 2. TESTIMI I HIPOTEZAVE NË MODELIN E REGRESIONIT TË SHUMËFISHTË LINEAR...................................................................................................................................... 222 3. KOEFICIENTI I PËRCAKTIMIT ...................................................................................... 223 4. ZGJEDHJA E NDRYSHOREVE TË MODELIT............................................................... 223 4.1. Metoda Enter................................................................................................................ 223 4.2. Metoda e Shtimit të Ndryshoreve (Forward Selection) ............................................... 223 4.3. Funksioni i Elemnimit të Ndryshoreve (Backward Selection)..................................... 224 4.4. Metoda e Shtimit dhe Largimit të Ndryshoreve (Stepwise Selection)......................... 224 5. Shembull Aplikimi .............................................................................................................. 224 6. Daljet e SPSS-it dhe Interpretimi ........................................................................................ 232 11. MODELI I REGRESIONIT PROBIT (PROBIT REGRESSION MODELS) ............. 237 1. HYRJE............................................................................................................................. 237 2. ANALIZA PROBIT NË SPSS ........................................................................................ 238 3. KOEFICIENTËT PROBIT.............................................................................................. 241 4. Shembull Aplikimi........................................................................................................... 242 12. ANALIZA FAKTORIALE ................................................................................................ 258 1. FAZAT E ANALIZËS FAKTORIALE .............................................................................. 258 1.1. Vlerësimi i Përshtatshmërisë së Setit të të Dhënave për Analizën Faktoriale ............. 258 1.2. Përfitimi i Faktorëve..................................................................................................... 259 1.3. Rotacioni i Faktorëve ................................................................................................... 260 1.4. Emërimi i Faktorëve..................................................................................................... 260 2. Shembull Aplikimi .............................................................................................................. 260 3. Të Dalurat nga SPSS-i dhe Interpretimi Për Analizën Faktoriale....................................... 266 3.1. Vlerësimi i Përshtatshmërisë së Setit të të Dhënave Për Analizën Faktoriale ............. 266 3.2. Përcaktimi i Numrit të Faktorëve................................................................................. 267 3.3. Variancat e Përbashkëta të Ndryshoreve...................................................................... 268 3.4. Faza e Rotacionit.......................................................................................................... 269

12. ix 3.5. Emërimi i Faktorëve..................................................................................................... 270 3.6. Rezultatet Faktoriale .................................................................................................... 271 13. ANALIZA DISKRIMINUESE (DISCRIMINANT ANALYSIS)................................... 273 1. QËLLIMET E PËRDORIMIT TË ANALIZËS DISKRIMINUESE.................................. 273 2. SUPOZIMET E ANALIZËS DISKRIMINUESE............................................................... 273 3. MADHËSIA E DUHUR E SETIT TË TË DHËNAVE PËR ANALIZËN DISKRIMINUESE ..................................................................................................................... 274 4. SHEMBULL APLIKIMI..................................................................................................... 274 5. DALJET E SPSS-it DHE INTERPRETIMI PËR ANALIZËN DISKRIMINUESE.......... 282 5.1. VLERËSIMI I SUPOZIMEVE TË ANALIZËS DISKRIMINUESE ......................... 282 5.2. VLERËSIMI I RËNDËSISË SË FUNKSIONEVE TË NDARJES (DISRCRIMINANT) 283 5.3. VLERËSIMI I RËNDËSISË SË NDRYSHOREVE TË PAVARURA NË ANALIZËN E DISKRIMINIMIT................................................................................................................ 284 5.4. FUNKSIONI I DISKRIMINIMIT DHE INTERPRETIMI ......................................... 285 5.5. VLERËSIMI I RËNDËSISË SË ANALIZËS SË DISKRIMINIMIT......................... 286 14. ANALIZA E GRUPIMIT (CLUSTER ANALYSIS)....................................................... 290 1. PROCESI I VENDIMMARRJES PËR ANALİZËN E GRUPIMIT .................................. 291 1.1. Qëllimet e Analizës së Grupimit.................................................................................. 294 1.2. Plani i Hulumtimit në Analizën e Grupimit ................................................................. 294 1.3. Matjet e Ngjashmërive ................................................................................................. 294 1.4. Matjet e Korrelacionit .................................................................................................. 297 1.5. Matjet e Distancës ........................................................................................................ 298 1.6. Matja e Partneriteteve................................................................................................... 301 1.7. Standardizimi i të Dhënave .......................................................................................... 301 1.8. Supozimet e Analizës së Grupimit............................................................................... 302 1.9. Zgjedhja e një Algoritmi të Grupimit........................................................................... 302 1.10. Grupimi Hierarkik .................................................................................................... 303 1.11. Përcaktimi i Numrit të Grupeve................................................................................ 303

13. x 1.12. Koeficientët e Distancës ........................................................................................... 304 1.13. Grafiku i Pemës ........................................................................................................ 304 1.14. Grupimi Johiearkik................................................................................................... 305 1.15. Rregullimi i Analizës së Grupimit............................................................................ 306 1.16. Interpretimi i Grupeve .............................................................................................. 307 1.17. Vlefshmëria dhe Profili i Grupeve............................................................................ 307 2. Shembull Aplikimi .............................................................................................................. 308 2.1. Analiza e Grupimit Hiearkik........................................................................................ 308 2.2. Analiza e Grupimit Johiearkik ..................................................................................... 318 15. ANALIZA E BESUESHMËRISË (RELIABILITY ANALYSIS).................................. 327 1. SUPOZIMET E ANALIZËS SË BESUESHMËRISË........................................................ 328 2. ANALIZAT DHE TESTET NË LIDHJE ME MATËSIT .................................................. 328 3. MODELET E PËRDORURA NË ANALIZËN E BESUESHMËRISË............................. 329 3.1. Modeli Alfa (α) (Cronbach Alpha Coefficient) ........................................................... 329 3.2. Modeli Ndarës Mëdysh (Split Half)............................................................................. 330 3.3. Modeli Guttman ........................................................................................................... 330 3.4. Modeli Paralel .............................................................................................................. 330 3.5. Modeli Strikt Paralel .................................................................................................... 330 4. Shembull Aplikimi .............................................................................................................. 331 5. Shembull Aplikimi .............................................................................................................. 334

14. 1.RREGULLIMI DHE PARAQITJA E TË DHËNAVE

15. 1 RREGULLIMI DHE PARAQITJA E TË DHËNAVE 1. ORGANIZIMI I TË DHËNAVE Përpara se të fillohet me analizat statistikore, gjëja e parë që duhet të bëj një hulumtues është rregullimi i të dhënave të punimit. Në qoftë se punohet me numër të madh të të dhënave është e dobishme që të shikohet forma e të dhënave dhe pikat e lakimit përmes tabelave të shpërndarjes së frekuenacave dhe grafiqeve të ndryshme. Më tej, ky stil është një shfaqje dhe siguron paraqitjen e të dhënave në një mënyrë më të qartë në qoftë se punohet me shumë ndryshore. Në punimet statistikore në mënyrë për zbatimin e shumë analizave, shpërndarja e të dhënave duhet të jetë normale apo afër normales. Për të parë shpërndarjen e të dhënave, përdoren grafiqe të ndryshme si histogrami, grafiku handle box, grafiku detrended normal, leaves branches etj. Po ashtu përdoren edhe testet Kolmogrov Smirnov dhe Shapiro Wilks. 2. Shembull Aplikimi Duke përdorur vlerat mujore të indeksit të IMKB-100 si ndryshore të varur dhe vlerat mujore të interesit të thesarit si ndryshore e pavarur, do të bëhet shpjegimi i shpërndarjes dhe paraqitjes së të dhënave. Tabela 1: Të Dhënat Mujore Për Indeksin IMKB-100 dhe Normave të Interesit Për Bonot e Thesarit Indeksi i të dhënave për IMKB-100 Indeksi i të dhënave për IMKB- 100Normat e interesit për bonot e thesarit Indeksi i të dhënave për IMKB-100 Indeksi i të dhënave për IMKB- 100Normat e interesit për bonot e thesarit 2635,14 92,26 19206,00 34,36 2265,94 137,29 16206,00 40,47 2196,38 141,34 14466,00 44,82 2577,54 145,20 13870,00 35,59 2597,91 145,19 13132,06 33,44 2568,16 130,21 11350,30 36,04 3890,83 124,80 13538,44 38,00 4544,07 103,82 8747,68 41,00 5354,03 100,57 9437,21 41,01 5069,22 100,46 10685,07 64,93 4950,21 11,50 8791,60 124,21 5805,45 102,88 8022,72 193,71

16. 2 5018,28 115,17 12367,36 130,42 6071,12 112,09 10879,83 82,19 6509,92 109,21 11204,24 88,38 8459,48 94,63 9914,61 95,02 15208,78 94,64 9878,88 92,63 16715,00 38,20 7625,87 87,39 15946,00 42,09 9848,76 86,39 15920,00 39,21 11633,93 79,32 Në hapin 1, përmes Analyze zgjedhet Descriptive Statistics dhe pastaj Explore. Hapi 1: Dritarja Për Rregullimin e të Dhënave Në kutinë Dependent vendoset ndryshorja IMKB dhe në Label Cases By ndryshorja bonot e thesarit. Pas kësaj klikohet në tabin Statistics. Në këtë pjesë përzgjedhen Descriptives dhe Outliers dhe pastaj klikoket në butonin Continue.

17. 3 Hapi 2: Dritarja e Statistikave Përshkruese Pastaj klikohet butoni Plots. Te pjesa Boxplots përzgjedhet Factors levels together, te pjesa Descriptive përzgjedhen Stem-and-leaf dhe Histogram. Së fundi, përzgjedhet dhe Normality Plots with tests dhe klikohet në butonin Continue. Hapi 3: Dritarja e Grafiqeve

18. 4 3. KOMENTIMI I TABELAVE TË KRIJUARA NË LIDHJE ME RREGULLIMIN E TË DHËNAVE DHE PARAQITJEN E TYRE Tabela 2: Numri i të Dhënave Totale të Futura në Aplikim Cases Valid Missing Total N Percent N Percent N Percent imkb 40 100.0% 0 0.0% 40 100.0% Tabela 2 tregon se nga të dhënat e IMKB-së 40 të dhëna janë përdorur plotësisht. Në setin e të dhënave nuk ka aspak të dhëna mangu (missing value). Tabela 3: Statistikat Përshkruese Statistic Std. Error imkb Mean 9128.4505 746.38833 95% Confidence Interval for Mean Lower Bound 7618.7376 Upper Bound 10638.1634 5% Trimmed Mean 9020.9639 Median 9114.4050 Variance 22283821.307 Std. Deviation 4720.57426 Minimum 2196.38 Maximum 19206.00 Range 17009.62 Interquartile Range 7909.87 Skewness .205 .374 Kurtosis -.941 .733

19. 5 Një vrojtim numerik paraqet mesataren aritmetike të grupit pjesëtuar me numrin total të vrojtimeve në grup. Nëse shuma e devijimeve nga vlera mesatare e çdo vrojtimi pjestohet me numrin e vrojtimeve dhe duke marrë rrënjën katrore gjendet devijimi standard. Katrori i devijimit standart jep variancën. Në këtë tabelë shihen statistikat përshkruese në bazë të ndryshores së varur (IMKB). Sipas tabelës, mesatarja aritmetike e 40 të dhënave (IMKB) është gjetur si 9128,4505 dhe devijimi standart për 4720,57426. Po ashtu, me 95% besueshmëri, janë dhënë vlerat me limitet më të ulëta dhe më të larta (intervali i besueshmërisë), 7618,7376 dhe 10638,1634. Llogaritja e hapësirës që mbetet në mes të madhësisë së vlerësuar quhet “interval besueshmërie”. Mesatarja e këtyre të dhënave është 9020,9639. Mesatarja është vlerë e cila e ndan serinë e të dhënave në dy pjesë të barabarta. Vlerat minimale dhe maksimale të serisë së të dhënave janë 2196,38 dhe 19206,00. Në punimet statistikore shpërndarja më e përdorur është shpërndarja normale. Zakonisht, shumë ndodhi tregojnë shpërndarje normale. Për shembull, gjatësia e një grupi të studentëve tregon një shpërndarje normale. Shpërndarja normale është një shpërndarje e vazhdueshme dhe mesatarja e popullsisë µ, devijimi standart σ janë shpërndarje. Shpërndarja normale është simetrike. Forma e saj është lakore. Vlera më e lartë e shpërndarjes simetrike është e barabartë me mesataren dhe mesataren aritmetike të saj. Në këtë tabelë statistikat përshkruese më të rëndësishme janë matësit e kurtozës (kurtosis) dhe pjerrësisë (skewness). Këto vlera tregojnë se a janë shpërndarë të dhënat në mënyrë normale. Në rastet simetrike (lakore e drejtë), mesatarja aritmetike, teksa moda dhe mediana duke qenë të barabarta koeficienti i lakueshmërisë (skewness) do të jetë zero. Në qoftë se ky barazim prishet, shpërndarja do të deformohet. Me rritjen e deformimit moda dhe mesatarja atirmetike do të largohen nga njëra tjetra. Në qoftë se është më e madhe se mediana mesatare, shpërndarja e vlerave për njësi do të lëviz në të djathtë (devijim pozitiv). Në qoftë se është më e vogël se mediana mesatare, shpërndarja e të dhënave lëviz në të majtë (devijim negativ). Koeficienti i devijimit merr vlerat ndërmjet – ∞ dhe + ∞. Por kur në raste matësi i devijimit merr vlera prej ±3 (sipas disa gjykimeve ±2) pranohet si normale. Vlera në tabelë prej 0,204 është koeficienti i devijimit të Fisherit. Duke e pjestuar me gabimin standart të devijimit, nxirret vlera e devijimit. Koeficienti i devijimit standardizohet duke u pjestuar me gabimin e vet standart. Më vonë këto vlera kritike standarde krahasohen me vlerat në tabelë. Ky përfundim, mund të komentohet për nga aspekti i lakimit të shpërndarjes normale. Kjo vlerë e devijimit është e pranueshme në nivelin e rëndësisë (5% sipas nivelit të rëndësisë) ndërmjet vlerave 1,96 ose nën vlerat -1,96. Sepse, vlerat në shpërndarjen normale marrin pjesë në mes të devijimit standart mesatarisht ndërmjet +1,96 dhe -1,96. Në këtë rast kur koeficienti i devijimit 0,205 me gabim të devijimit standart 0 pjestohet me 374 (0,205/0,374) fitohet vlera prej 0,548. Kjo vlerë tregon që të dhënat

20. 6 janë të shpërndara afër normales sepse gjendet ndërmjet -1,96 dhe +1,96. Kur kjo vlerë është pozitive lakimi bëhet në të djathtë, kurse në rastin kur është negative lakohet në të majtë. Në rastin tonë për arsye se vlera e dalur është pozitive mund të thuhet se shpërndarja lakohet në të djathtë. Përveç kësaj, kjo gjë kuptohet edhe ngase grupi i të dhënave është më i madh se mesatarja aritmetike, gjë që shpërndarja ka prirje në të djathtë. Kurtoza tregon sa kurba e shpërndarjes normale. është e drejtë apo e shtypur Për një lakore të plotë, koeficienti i shtypjes është zero. Kur lakorja sipas normales është më e drejtuar, koeficienti i shtypjes është pozitiv. Kurse kur është negativ, lakorja është më e shtypur. Në tabelën 3, koeficienti i Fisherit është -0.941. Kur gabimi standart i lakimit të pjestohet me 0,733 (-0.941/0,733) gjendet vlera prej 1,284. Kjo vlerë për arsye se gjendet ndërmjet -1,96 dhe +1,96 mund të themi se lakorja nuk është e drejtë. Grafiqet janë paraqitje e të dhënave statistikore në mënyrë që të shihen me sy. Të dhënat statistikore nuk paraqiten vetëm me tabela apo numra. Për më tepër, grafiqet sigurojnë një paraqitje më të bukur të të dhënave për shqyrtuesin. Grafiqet më të përdorura janë histogrami dhe stem and leaf. Figura 1: Paraqitja e Histogramit Për Të Dhënat e Indeksit Të IMKB 100 Vijat e histogramit tregojnë se sa herë të dhënat nominale (klasifikuese) apo ordinale (rendore) përsëriten. Teksa boshti horizontal bën klasifikimet në mënyrë sistematike, vijat vertikale tregojnë frekuencat për secilën kategori dhe përqindjen që përfaqësojnë. Në qoftë se e shohim histogramin e të dhënave për IMKB, lakorja nuk është plotësisht simetrike dhe është e

21. 7 kthyer në të djathtë. Të qenurit plotësisht simetrike nënkupton që të dhënat janë plotësisht të shpërndara normal. Gjatë shqyrimit të të dhënave, një grafik tjetër i përdorur është edhe grafiku steam and leaf. Grafiku steam and leaf, i klasifikon të dhënat në të majtë, përbrenda një klase çdo vrojtim klasifikohet në të djahtë. Grafiku steam and leaf i përngjan histogramit, mirëpo histogrami për intervale të caktuara teksa paraqet numrin e rasteve përmes vijave në grafik, nuk mund të specifikojë detajet e vlerave në interval. Tabela 4: Tabela Stem and Leaf Për Indeksin e Të Dhënave Për IMKB 100 Frequency (Frekuencat) Stem & Leaf 7,00 0,222223 6,00 0,445555 3,00 0,667 8,00 0,88889999 5,00 1,0011 4,00 1,2333 4,00 1,4555 2,00 1,66 1,00 1,9 Stem width: 10000,00 Each leaf: 1 case (s) Për shembull, në tabelën e 4, rreshti i parë tregon që ekzistojnë 7 të dhëna të cilat fillojnë me 2000 dhe 3000.

22. 8 Figura 2: Grafiku i Shpërndarjes Normale Për Të Dhënat e IMKB Kur të bëhet analiza e normalitetit për të dhënat, përdoret grafiku i probabilitetit i cili paraqet të dhënat e vlerave të vrojtuara me atyre të pritura mbi një grafik. Në qoftë se popullimi i cili tregon një shpërndarje normale është marrë nga një pjesë, vlerat duhet të mblidhen në këtë drejtim apo përrreth. Po të shohim normalitetin e të dhënave për IMKB 100, për arsye se të dhënat janë të shpërndara në këtë drejtim, mund të themi se grupi i të dhënave është afër normales. Një grafik tjetër i normalitetit është grafiku me prirje më pak të normalitetit. Në figurën 3 shihet grafiku Detrended Normal Plot për të indeksin e të dhënave të IMKB 100.

23. 9 Figura 3: Grafiku Me Pak Prirje Normaliteti Për Indeksin e Të Dhënave Për IMKB 100 Në qoftë se një grup i të dhënave tregon shpërndarje normale dhe vlerat e shfaqura mbi zero tregojnë devijimin në grafikun (detrend) e probabilitetit, shpërndarja e pikave vertikalisht mbi boshtin “0” pa formuar ndonjë funksion me pikat përrreth është e rastësishme. Siç shihet në figurën 3 seti i të dhënave për IMKB është i shpërndarë afër normales. Metodë tjetër për kryerjen e analizës së normalitetit është edhe grafiku handle box. Në figurën 4 është paraqitur grafiku handle box për indeksin e të dhënave të IMKB.

24. 10 Figura 4: Diagrami Handle Box Për Të Dhënat e IMKB-së Diagrami Handle Box, është një prej llojeve të grafiqeve të statistikave përshkruese që bazohet në përqindje. Gjatësia e formës, paraqet hapësirën ndërmjet çerekëve. Pra, fillon me përqindjen e 25-të dhe mbaron me përqindjen e 75-të. Këto përqindje quhen Tugey’s Hings. Kutia jep informata rreth prirjes qendrore dhe përhapjes në 50% të shpërndarjes. Përmes mesatares është e mundur që të përcaktohet tendenca qendrore, kurse përmes gjatësisë së kutisë shpërndarja e vrojtimeve. Në qoftë se mesatarja gjendet nën vijën e qendrës, shpërndarja ka një lakim pozitiv, në qoftë se gjendet mbi lakim është negativ. Kurse nëse gjendet në mes tregon shpërndarjen normale të vendit të të dhënave. Siç shihet në figurën 4, në grafikun e handle box së indeksit së të dhënave të IMKB 100, të dhënat të cilat gjenden nën kuti janë të lakuara në të djathtë. Si dhe për shkak që nuk gjendet ndonjë e dhënë jashtë kutisë nuk ka vlera ekstreme (outliers). Tabela 5: Testi i Normalitetit Për Të Dhënat e IMKB Tests of Normality Kolmogorov-Smirnov a Shapiro-Wilk Statistic df Sig. Statistic df Sig. imkb .091 40 .200 * .958 40 .141 Grafiqet e normalitetit dhe grafiqet e tjera (histogrami, diagrami i kutisë dhe grafiku steam and leaf) na ndihmojnë për të i kuptuar disa pika. Por testi i normalitetit kuptohet duke i përdorur testin Kolmogrov-Smirnov dhe Shapiro Wilk. Kur numri i vrojtimeve është më i vogël se 29

25. 11 përdoret Shapiro-Wilk, kurse kur numri i vrojtimeve është më i madh se 29 përdoret Kolmogrov- Smirnov. Për shkak se numri i të dhënave tona është 40, do të përdoret testi Kolmogrov- Smirnov. Hipotezën null H0 dhe hipotezën alternative HA të këtij testi mund t’i shkruajmë si më poshtë: H0: Shpërndarja e të dhënave ndjek shpërndarjen normale. HA: Shpërndarja e të dhënave nuk ndjek shpërndarjen normale. Sipas nivelit të rëndësisë 5%, për shkak që vlera e të dy testeve (0,2 dhe 0,141) e indeksit të të dhënave të IMKB 100, janë më të mëdha se 5%, hipoteza H0 pranohet. Pra, mund të thuhet se të dhënat janë të shpërndara në mënyrë normale. 4. ANALIZA E VLERAVE EKSTREME (OUTLIERS) Gjatë analizës të setit së të dhënave, faza tjetër është hulumtimi për vlera ekstreme. Ekzistojnë dy arsye të rëndësishme për hulumtimin e vlerave ekstreme në setin e të dhënave: 1. Duke i zbuluar vlerat ekstreme, mund të bëhet nxjerrja e tyre nga seti i të dhënave për arsye se do të pengojnë përfitimin e rezultateve normale. 2. Vlerat ekstreme në të njëjtën kohë mund të jenë një burim informacioni. Pasi të zbulohen vlerat ekstreme, kërkohen arsyet e tyre. Vlerat ekstreme ndahen në dy lloje; vlera shumë ekstreme (extreme value) dhe vlera të veçanta (outlier value). Arsyet ekstreme mund të jenë këto: 1. Hyrja gabuese e të dhënave apo kodim i gabuar 2. Vrojtimi i rrallë i një rasti. Mund të ndërhyhet në dy mënyra me vlerat ekstreme:  Vlerat ekstreme mund të korrigjohen në fazën e pastrimit të të dhënave  Hulumtuesi mund të vendos për nxjerrjen e vlerave esktreme në bazë të rëndësisë së hulumtimit. Në qoftë se ka ndonjë vlerë ekstreme e cila është paraqitur për ndonjë arsye të panjohur, atëherë mund të nxirret nga seti i të dhënave.

26. 12 4.1. Shembull Aplikimi Më poshtë janë paraqitur orët shtesë të punës së bërë nga 20 punonjës. Tabela 6: Orët Shtesë të Punës të Punonjësve Punonjësi Ora 1 2 2 4 3 3 4 6 5 2 6 6 7 3 8 4 9 12 10 3 Punonjësi Ora 11 6 12 1 13 3 14 5 15 15 16 3 17 5 18 6 19 5 20 14 Për këto të dhëna mund të shohim se cilat vlera janë vlera ekstreme, pra cilët punonjës kanë punuar më shumë orë për nga punonjësit e tjerë. Për ta bërë këtë, siç u tregua në shembullin e mëparshëm, zgjedhet Analyze  Descriptive Statistics  Explore. Këtu, në pjesën Dependent bartet “ora”, kurse në pjesën Label Cases by “punonjësi”. Pastaj nga pjesa Statistics përzgjedhet Outliers. Në figurën e mëposhtme, në grafikun e kutisë mund të shihen vlerat shumë extreme (extreme values) dhe vlerat e veçanta (outlier values). Në këtë rast, mund të shihet se 15 punonjës kanë vlera shumë të larta ekstreme, pra punojnë më shumë orë për nga të tjerët. Mund të shihet se punonjësi i njëzet dhe nëntë kanë vlera ekstreme. Në të njëjtën kohë, mund të shihet se shpërndarja në kutinë e mëposhtme ka prirje në të djathtë. Figura 5: Diagrami i Kutisë për Orët Shtesë

27. 13 Tani të shohim histogramin dhe grafikun e normalitetit të këtyre vlerave. Figura 6: Histogrami i Orëve Shtesë të Punës Në grafikun e histogramit, po të shpërndaheshin të dhënat në mënyrë normale, do të duhej që pjerrësia të ishte simetrike, por nga grafiku shihet se është e lakuar pak në të djathtë. Figura 7: Grafiku i Normalitetit për Orët Shtesë të Punës

28. 14 Në figurën 7, mund të shihet se devijimet në drejtim të regresionit janë të shumta. Pra, shpërndarja nuk është plotësisht normale. Tabela 7: Testi i Normalitetit për Orët Shtesë të Punës Tests of Normality Kolmogorov-Smirnov a Shapiro-Ëilk Statistic df Sig. Statistic df Sig. ora .289 20 .000 .793 20 .001 a. Lilliefors Significance Correction Në analizën e normalitetit të të dhënave, H0 refuzohet ngaqë të dy testet janë më të vegjël se 5%. Pra, të dhënat nuk janë të shpërndara në mënyrë normale. Tani, të e kryejmë analizën përsëri duke i nxjerrur vlerat shumë ekstreme dhe vlerat e veçanta si dhe duke i ndryshuar disa vlera të tjera. Tabela 6: Orët Shtesë të Punës të Punonjësve pas Nxjerrjes së Vlerave Ekstreme Punonjësi Ora 1 1 2 3 3 4 4 2 5 5 6 3 7 4 8 2 10 1 Punonjësi Ora 11 5 12 3 13 4 14 3 16 1 17 1 18 4 19 3

29. 15 Figura 8: Histogrami për Orët e Punës Shtesë pas Nxjerrjes së Vlerave Ekstreme dhe Shumë Ekstreme Histogrami është plotësisht simetrik. Pra, të dhënat tani kanë formën plotësisht normale. Paraqitja e kutisë grafike plotësisht në mes, tregon që të dhënat ndjekin shpërndarjen normale. Figura 9: Diagrami i Kutisë Për Orët Shtesë të Punës pas Nxjerrjes së Vlerave Ekstreme dhe Shumë Ekstreme

30. 16 Përveç diagramit të kutisë, kur shikojmë grafikun e normalitetit (figura 9), mund të vërejmë se devijimet janë më të vogla nga vija e regresionit dhe se janë shumë afër shpërndarjes normale. Figura 9: Grafiku i Normalitetit për Orët Shtesë të Punës pas Nxjerrjes së Vlerave Ekstreme dhe Shumë Ekstreme Tabela 10: Testi i Normalitetit Për Orët Shtesë të Punës pas Nxjerrjes së Vlerave Ekstreme dhe Shumë Ekstreme Tests of Normality Kolmogorov-Smirnov a Shapiro-Ëilk Statistic df Sig. Statistic df Sig. ora .181 17 .140 .902 17 .073 a. Lilliefors Significance Correction Kur shikojmë testet e normalitetit, ngaqë që të dy janë më të mëdha se 5%, H0 pranohet. Pra, shpërndarja e të dhënave është normale.

31. 17 5. SHQYRTIMI I TË DHËNAVE QË MUNGOJNË Mungesa e të dhënave (missing values), me të vërtet është një situatë me të cilën mund të përballemi gjatë bërjes së çfarëdo analize. Për shembull, gjatë bërjes së një ankete, përgjegjësi mund t’a lë të zbrazët pyetjen në lidhje me të ardhurat. Përsëri, mund të që të mos i siguroni disa vlera të vrojtimeve në lidhje me disa ndryshore. Çfarë duhet bërë në të këtilla raste? Procesi i cili buron nga përgjegjësi apo jashtë tij dhe që i hap rrugën humbjes së të dhënave, quhet proces i mungesës së të dhënave. Parashikimi i procesit të mungesës së të dhënave që buron nga përgjegjësi është i pamundur. Në këtë situatë, hulumtuesi duhet të kërkojë se a ekziston ndonjë strukturë e cila e zbulon procesin e mungesës së të dhënave. Gjatë shqyrtimit të kësaj, hulumtuesi duhet të marrë në konsideratë dy pika të rëndësishme:  Të dhënat mangu a janë shpërndarë në mënyrë të rastësishme ndërmjet vrojtimeve apo është krijuar ndonjë strukturë e veçantë?  Duhet të hulumtohet se sa shpesh ndeshemi me të dhëna mangu. Disa hulumtues i largojnë nga grupi i të dhënave vrojtimet të cilat i hapin rrugë mungesës së të dhënave. Në këtë rast, ndonjëherë përveç që zvogëlohet në mënyrë të konsiderueshme numri i vrojtimeve, mund të ndikojë në mënyrë negative madhësinë e mjaftueshme të mostrës. Po ashtu, kjo do të ndikojë në mënyrë te konsiderueshme edhe besueshmërinë dhe rezultatet e hulumtimit. Prandaj, kur te përballemi me mungesë të të dhënave, mund të bëhen këto gjëra:  Mund të shtohen vlera të reja të vrojtimeve.  Përmes çasjeve të ndryshme statistikore provohet të gjendet zgjidhje për vlerat që mungojnë. Qëllimi i shqyrtimit të mungesës së të dhënave, është që kuptohet se në cilën ndryshore dhe në çfarë mase ekziston mungesë e të dhënave, të dhënat a mungojnë vetëm për një ndryshore apo edhe për tjetrën, në çfarë niveli do të ulet numri i vrojtimeve në qoftë se fshihet ndryshorja me mungesë të të dhënave. 5.1. Shembull Aplikimi Në tabelën e mëposhtë janë dhënë vlerat mujore të indeksit të IMKB-100 si ndryshore e varur dhe vlerat mujore të çmimit të arit të shtetit, indeksit të industrisë së prodhimit, normave të interesit të depozitave dhe të indeksit të çmimit të konsumatorëve si ndryshore të pavarura. Nga vlerat e 60 vrojtimeve, ekziston mungesë e disa vlerave.

32. 18 Tabela 10: Të Dhënat Përkatëse Të Shembullit IMKB-100 ARI SHTET. NOR. DEPOZ. INDUS. PRODH. IÇK 36,41 208333 37,26 68,5 3,8 , 212833 , 70 4,4 32,94 211503 35,96 79,6 5,2 33,08 208666 35,99 65 , , 206500 36,02 71,7 3,1 41,33 203500 36,21 71,5 1,4 53,84 , 36,24 62,5 -0,9 49,39 228250 36,27 67,9 2,5 50,85 , 36,37 79,5 8,7 45,7 232000 36,93 84,3 6,8 , 230000 37,77 , 5 32,56 236500 38,69 72,6 1,7 42,13 254750 40,01 63,6 , 51,03 272000 42,06 72,5 5,4 , 281000 45,97 81,9 4,4 35,54 , 48,35 66,5 6,6 36,26 311500 51,96 81,3 3,3 35,87 309750 52,13 , 3 30,41 355333 52,75 74,4 , 33,01 353333 53,82 72,8 4 , 356000 , 80,9 6,1 27,47 378000 57,9 85,1 6,6 40,58 390250 58,14 82,8 5,2 43,69 , , , 4,4 49,26 412200 57,38 76,8 9,4 36,64 440000 56,87 76,8 5 40,77 463750 , 82,1 4,9 36,86 476000 58,01 71,7 3,8 32,97 495600 58,43 80,6 0,9 44,07 , 58,42 72,3 0,5 42,64 531100 57,94 78,9 1,3 41,58 531666 57,06 74,8 , 39,76 , 57,12 85,4 7,4 36,43 566500 57,07 86,8 7,6 37,86 594000 57,54 83 4,9 40,04 614600 57,6 80,9 2,7 43,83 635250 57,66 79,4 5,3 59,24 659000 54,95 80,1 4 58,64 683000 52,74 79,5 4,8 , 718000 52,81 , 4,4

33. 19 IMKB-100 ARI SHTET. NOR. DEPOZ. INDUS. PRODH. IÇK 83,76 821250 52,83 83,2 4,7 107,79 876666 52,82 78,1 1,8 100,78 996666 52,82 85,8 4,9 123,57 1003750 52,83 77 2,7 150,8 964500 52,86 90,4 5,6 145,01 1022000 , 90,3 , 189,77 1126670 52,9 87,1 6,4 206,83 1197500 52,88 92,5 3,6 , 1366250 56,35 86,2 4,4 150,04 1543750 68,67 77,2 6 140,87 1930000 71,42 81 5,2 150,97 2476000 , 73,8 24,7 147,49 , 118,71 69,6 10 197,66 2555000 114,53 71,5 0,9 217,52 2551000 64,46 , 1,7 252,82 2610000 54,46 76,7 2 , 2870000 54,37 83,9 7,2 248,9 2982500 49,74 84,6 9,5 281,81 3030000 59,79 84,7 , 272,57 3064000 61,79 81,9 6,3 Duke shkuar tek Analyze, Missing Value Analyze në SPSS, mund të bëhet shqyrtimi i të dhënave që mungojnë.

34. 20 Hapi 1: Menyja e Missing Value Analyze Në pjesën Estimation, siç shihet më poshtë do të ndeshemi me 4 metoda. Më poshtë janë dhënë informata të përgjithshme rreth këtyre metodave.

35. 21 Hapi 2: Dritarja e Missing Value Analysis 1. Metoda Listwise (Metoda e Përdorjes së Vrojtimeve të Plota): Në këtë metodë, merren në konsideratë vetëm vrojtimet e plota. Vrojtimet mangu nuk merren në konsideratë. Kjo metodë për arsye se merr në konsideratë vrojtimet e plota sugjerohet të përdoret në rastet kur numri i të dhënave mangu është i vogël. Është një metodë e cila përdoret shumë. Përveç kësaj, struktura e të dhënave mangu, duhet të jetë plotësisht e rastësishme. 2. Metoda Pairwise: Kjo analizë përfshin ndryshoret të dhënat e të cilave janë të plota. 3. Metoda e Regresionit: Qëllimi i metodës së regresionit është që me ndihmën e një apo më shume ndryshoreve të pavarura të testohen vlerat e ndryshores së varur. Në metodën e regresionit, ndryshorja e varur është ndryshorja mangu e vëzhguar, kurse ndryshoret tjera janë të pavarura. Kjo metodë sugjerohet të përdoret veçanërisht në rastet kur numri i të dhënave mangu nuk është i madh. Për ta përdorur këtë metodë, lidhja ndërmjet ndryshores së varur dhe ndryshores së pavarur duhet të jetë shumë e fuqishme. 4. Metoda EM (Expectation-Maximization): Metoda EM, është një metodë dy fazash dhe e cila përsëritet. Faza E jep vlerësimet më të mira të mundshme për të dhënat që mungojnë, kurse faza M jep vlerësime në lidhje me mesataren, devijimin standart apo

36. 22 korrelacionin për të dhënat që mungojnë. Ky proces vazhdon deri në shkallën e zvogëlimt të papërfillshëm të ndryshimit në vlerat e parashikuara. Hapi 3: Dritarja e Missing Value Analysis Të gjitha ndryshoret barten në pjesën Quantitative Variables. Nga pjesa Estimation zgjedhet metoda Listwise sepse numri i plotë i vrojtimeve është më i madh se numri mangu i vrojtimeve. Pas kësaj, shkohet te përzgjedhjet Patterns dhe Descriptives. Pasi të jetë hyrë në përzgjedhjen Patterns etiketohen të gjitha zgjedhjet në pjesën Display. Në të njëjtën kohë, në pjesën Variables, të gjitha ndryshoret transferohen në pjesën Additional Information For. Pastaj klikohet në butonin Continue.

37. 23 Hapi 4: Dritarja Patterns Pas kësaj, shkojmë te përzgjedhja Descriptives. Edhe këtu etiketohen të gjitha alternativat dhe klikohet në butonin Continue.

38. 24 Hapi 5: Dritarja Descriptives Më poshtë do të shqyrtohen me radhë të gjitha të dalurat, mirëpo në fillim duhet të bëhet testi i rastësisë për mungesën e të dhënave. Në të dalurat statistikore, sa është e rëndësishme tërheqja e një mostre nga popullimi, po aq është e rëndësishme rastësia e të dhënave mangu në një mostër. Për të dhënë një numër konkluzionesh rreth popullimit, duhet që mostra të mirret në një madhësi të caktuar nga popullimi. Mundësia e zgjedhjes së njësive nga popullimi që do të përdoren në mostër duhet të jetë e njëjtë dhe zgjedhja e një njësie nuk duhet të ndikojë zgjedhjen e një njësie tjetër. Pra, secila njësi duhet të ketë probabilitet të barabartë për t’u zgjedhur nga popullimi. Kjo situatë quhet rastësi. Në strukturën e të dhënave, vrojtimet e një ndryshoreje mund të i ndajmë në dy grupe; në vrojtime të cilat kanë mungesë të të dhënave dhe të atyreve që nuk kanë mungesë. Për të hulumtuar se a ekziston një dallim i rëndësishëm për nga aspekti i vlerave të ndryshoreve tjera (të dy grupeve) bëhet testi T, ose ndryshoret reduktohen në dy forma; në ato që kanë mungesë të të dhënave dhe ato që nuk kanë mungesë të të dhënave. Për shembull, të supozojmë se jemi duke punuar në një mostër e cila ka dy ndryshore. Njëra ndryshore le të jetë shuma e qerasë (ndryshorja e varur) dhe ndryshorja tjetër le të jenë të ardhurat (ndryshorja e pavarur). Në ndryshoren e të ardhurave le të gjendet mungesë e vrojtimeve. Le të e ndajmë ndryshoren e të ardhurave në dy grupe; në vrojtime mangu dhe në vrojtime të plota dhe në secilin grup të hulumtojmë se a ka dallim ndërmjet mesatareve të qerasë. Në qoftë se në këto dy grupe ekziston një dallim jo i rëndësishëm në mesataret e qerasë, atëherë mund të thuhet se mungesa e të dhënave është e rastësishme. Në këtë situatë, shikohet koeficienti i korrelacionit të Pearsonit ndërmjet ndryshoreve. Në qoftë se korrelacioni është i ulët, mund të

39. 25 thuhet se ekziston rastësia në mungesën e të dhënave. Për këtë arsye, në fillim do të shqyrtohen testet T dhe matrica e korrelacionit. Hipotezat e rastësisë: H0: Ekziston rastësi në mungesën e të dhënave. HA: Nuk ekziston rastësi në mungesën e të dhënave. Në qoftë se pranohet hipoteza H0, mund të thuhet se ekziston rastësi në strukturën e të dhënave. Për t’a pranuar hipotezën H0, vlera e P-së (Sig.) duhet të jetë më e madhe se 5%. Sipas kësaj, për arsye vlerat e ndryshoreve të IÇK-së, indeksit të industrisë së prodhimit, çmimit të arit shtetëror, normat e interesit të depozitave dhe ndryshores së varur IMKB janë më të mëdha (vlerat e treguara me ngjyrë të zezë në tabelën e testit T të situatës së rastësisë) se vlera e P-së (sipas nivelit të rëndësisë 5%), hipoteza H0 refuzohet. Pra, mund të themi se ekziston rastësi në mungesën e të dhënave. Tabela 11: Tabela e Testit T të Situatës së Rastësisë Separate Variance t Tests a IMKB100 ari_shtetëror normat_depozitore industria_prodhimit IÇK IMKB100 t . .4 1.7 -.4 .1 df . 9.3 9.8 6.5 34.9 P(2-tail) . .675 .114 .731 .954 # Present 52 45 48 49 46 # Missing 0 8 6 6 8 Mean(Present) 87.7238 933501.9111 54.5696 78.0592 4.9174 Mean(Missing) . 780072.8750 47.2150 79.1000 4.8750 ari_shtetëror t 1.7 . -.5 1.7 -.2 df 14.6 . 5.2 5.8 7.4 P(2-tail) .102 . .648 .136 .823 # Present 45 53 48 49 47 # Missing 7 0 6 6 7 Mean(Present) 92.1422 910342.8113 53.0712 78.8510 4.8617 Mean(Missing) 59.3200 . 59.2017 72.6333 5.2429 normat_depozitore t -.2 .0 . -.4 -1.1 df 3.8 4.8 . 4.7 4.1 P(2-tail) .818 .992 . .724 .330 # Present 48 48 54 50 49 # Missing 4 5 0 5 5 Mean(Present) 87.1083 910783.0417 53.7524 78.0480 4.5041 Mean(Missing) 95.1100 906116.6000 . 79.4200 8.9000

40. 26 industria_prodhimit t -.2 -.1 .4 . 1.7 df 2.1 3.3 4.1 . 12.3 P(2-tail) .860 .940 .738 . .122 # Present 49 49 50 55 49 # Missing 3 4 4 0 5 Mean(Present) 87.0318 906926.9184 53.9092 78.1727 5.0347 Mean(Missing) 99.0267 952187.5000 51.7925 . 3.7000 IÇK t -.2 .0 1.0 .7 . df 5.7 5.8 6.0 5.5 . P(2-tail) .840 .981 .367 .519 . # Present 46 47 49 49 54 # Missing 6 6 5 6 0 Mean(Present) 86.6874 911611.7872 54.2251 78.5041 4.9111 Mean(Missing) 95.6700 900402.5000 49.1200 75.4667 . For each quantitative variable, pairs of groups are formed by indicator variables (present, missing). a. Indicator variables ëith less than 5% missing are not displayed. Ekzistencën e rastësisë mund ta shikojmë edhe përmes matricës së korrelacionit ndërmjet ndryshoreve. Tabela 12: Tabela e Matricës së Korrelacionit të Pearsonit Për Situatën e Rastësisë Listwise Correlations IMKB100 ari_shtetër or normat_de pozitore industria_p rodhimit IÇK IMKB100 1 ari_shtetëror .924 1 normat_depozitore .361 .531 1 industria_prodhimit .295 .188 .046 1 IÇK .130 .136 -.098 .440 1 Në këtë tabelë mund të shohim koeficientët e korrelacionit të Pearsonit. Korrelacionet e ulëta tregojnë rastësinë në strukturën e të dhënave mangu për secilën ndryshore. Në këtë tabelë, jashtë korrelacionit të krijuar ndërmjet ndryshores së varur IMKB dhe ndryshores së pavarur arit shtetëror (0,924), nuk mund të shihet ndonjë korrelacion i lartë. Kjo vlerë e lartë është normale sepse IMKB-100 është ndryshore e varur, kurse çmimi i arit shtetëror është ndryshore e pavarur. Për të ekzistuar rastësia, nuk duhet të ketë korrelacion të lartë ndërmjet dy ndryshoreve. Në këtë rast, mund të thuhet se procesi i të dhënave është i rastësishëm në shembullin tonë.

41. 27 Në tabelën 13, në pjesën Listwise janë llogaritur mesataret aritmetike duke i marrë në konsideratë vetëm vrojtimet e plota për të gjitha ndryshoret, kurse në pjesën All Values, janë llogaritur mesataret aritmetike duke i marrë në konsideratë të gjitha vlerat. Në qoftë se shikohen me kujdes mesataret, mund të vërejmë se nuk ekziston ndonjë dallim i rëndësishëm ndërmjet dy grupeve. Ndryshimet janë shumë të vogla. Edhe nga këtu mund të themi se struktura e mungesës së të dhënave është e rastësishme. Zaten, kjo qe përcaktuar nga testi T dhe matrica e korrelacionit se struktura e të dhënave mangu është e rastësishme në procesin e rastësisë. Tabela 13: Mesataret e Parashikuara Summary of Estimated Means IMKB100 ari_shtetëror normat_de pozitore industria_ prodhimit IÇK Listwise 89.3500 880133.4571 54.3411 79.4400 4.4343 All Values 87.7238 910342.8113 53.7524 78.1727 4.9111 Në tabelën e mëposhtme e cila përfshin numrin e plotë dhe mangu të vrojtimeve, janë dhënë numrat e të dhënave mangu dhe përqindjet për secilin vrojtim (në total 60 vrojtime). Teksa për vrojtimet e plota tregohen me hapësirë (bosh), mungesa e të dhënave është shfaqur me “S”. Vendet e shfaqura me “+”, tregojnë vlerat e mëdha ekstreme. Për shembull, në vrojtimin e parë nuk gjendet asnjë vlerë mangu, kurse në vrojtimin e dytë gjenden mangu 2 vrojtime dhe përqindja e tyre është 40.

42. 28 Tabela 14: Numrat e Vrojtimeve të Plota dhe Mangu Data Patterns (all cases) Case # Missing % Missing Missing and Extreme Value Patterns IMKB100 ari_shtetëro r normat_dep ozitore industria_pr odhimit IÇK 1 0 .0 2 2 40.0 S S 3 0 .0 4 1 20.0 S 5 1 20.0 S 6 0 .0 7 1 20.0 S 8 0 .0 9 1 20.0 S 10 0 .0 11 2 40.0 S S 12 0 .0 13 1 20.0 S 14 0 .0 15 1 20.0 S 16 1 20.0 S 17 0 .0 18 1 20.0 S 19 1 20.0 S 20 0 .0 21 2 40.0 S S 22 0 .0 23 0 .0 24 3 60.0 S S S 25 0 .0 26 0 .0 27 1 20.0 S 28 0 .0 29 0 .0 30 1 20.0 S 31 0 .0 32 1 20.0 S 33 1 20.0 S

43. 29 34 0 .0 35 0 .0 36 0 .0 37 0 .0 38 0 .0 39 0 .0 40 2 40.0 S S 41 0 .0 42 0 .0 43 0 .0 44 0 .0 45 0 .0 46 2 40.0 S S 47 0 .0 48 0 .0 49 1 20.0 S 50 0 .0 51 0 .0 52 1 20.0 + S + 53 1 20.0 S + 54 0 .0 + + 55 1 20.0 + S 56 0 .0 + 57 1 20.0 S + 58 0 .0 + 59 1 20.0 + S 60 0 .0 +

44. 30 Tabela 15: Struktura e Mungesës së të Dhënave Missing Patterns (cases with missing values) Case # Missing % Missing Missing and Extreme Value Patterns a industria_pr odhimit normat_dep ozitore IÇK ari_shtetëror IMKB100 4 1 20.0 S 13 1 20.0 S 19 1 20.0 S 32 1 20.0 S 59 1 20.0 S + 46 2 40.0 S S 27 1 20.0 S 52 1 20.0 S + + 21 2 40.0 S S 2 2 40.0 S S 5 1 20.0 S 49 1 20.0 S 15 1 20.0 S 57 1 20.0 + S 40 2 40.0 S S 11 2 40.0 S S 55 1 20.0 S + 18 1 20.0 S 7 1 20.0 S 16 1 20.0 S 53 1 20.0 + S 33 1 20.0 S 30 1 20.0 S 9 1 20.0 S 24 3 60.0 S S S Në tabelën e më sipërme, në rreshtin dhe në kolonën e fundit janë paraqitur vrojtimet dhe ndryshoret të cilat kanë më shumë mungesë të të dhënave. Vrojtimet e plota nuk janë paraqitur për të gjitha ndryshoret. Për shembull, në vrojtimin e pesëdhjetë e nëntë ka një mungesë të dhënash (IÇK), ka tri vrojtime të plota (indeksi i industrisë së prodhimit, normat e interesit të depozitave, ari shtetëror dhe IMKB100) dhe një nga këto vlera është ekstreme (ari shtetëror). Kurse në vrojtimin e njëzet e katër, ekzistojnë 3 të dhëna mangu (indeksi i industrisë së prodhimit, normat e interesit të depozitave dhe ari shtetëror) dhe ky vrojtim ka më së shumti

45. 31 mungesë të të dhënave. Vrojtimet mangu janë çmimi i arit shtetëror, normat e interesit të depozitave dhe indeksi i industrisë së prodhimit. Tabela 16: Struktura Tabelore e Mungesës së të Dhënave Tabulated Patterns Number of Cases Missing Patterns a Completeif... b IMKB100 c ari_shtetëror c normat_depozitore c industria_prodhimit c IÇK c industria_prod himit normat_depozi tore IÇK ari_shtetëror IMKB10035 35 89.3500 880133.4571 54.3411 79.4400 4.4343 5 X 40 85.8020 876083.0000 49.1200 72.5000 . 1 X X 43 145.0100 1022000.0000 . 90.3000 . 2 X 37 95.8700 1469875.0000 . 77.9500 14.8000 2 X X 43 . 284416.5000 . 75.4500 5.2500 4 X 39 . 1180937.5000 48.1775 80.9250 4.7750 2 X X 43 . 474000.0000 45.2900 . 4.7000 2 X 37 126.6950 1430375.0000 58.2950 . 2.3500 6 X 41 61.9250 . 59.2017 72.6333 5.3833 1 X X X 46 43.6900 . . . 4.4000 a. Variables are sorted on missing patterns. b. Number of complete cases if variables missing in that pattern (marked with X) are not used. c. Means at each unique pattern Në tabelën më lartë shihet struktura e mungesës së të dhënave. Për shembull, nga tabela shihet se ekzistojnë 35 vrojtime të plota. Përderisa vrojtimet e tjera janë të plota, vrojtimet mangu të IÇK-së janë 5. Kur të largohet ndryshorja e IÇK-së nga të dhënat, numri i vrojtimeve mbetet 40. Në të njëjtën mënyrë, ekziston mungesë e 1 vrojtimi për normat e interesit të depozitave dhe për IÇK-në. Në qoftë se ky vrojtim largohet nga këto dy ndryshore, atëherë numri i vrojtimeve të plota do të jetë 43. Më poshtë është dhënë tabela e fundit. Në këtë tabelë janë paraqitur përqindjet e mospajtimeve.

46. 32 Tabela 17: Përqindjet e Mospajtimeve Percent Mismatch of Indicator Variables. a,b industria_prodhimit normat_depozitore IÇK ari_shtetëror IMKB100 industria_prodhimit 8.33 normat_depozitore 15.00 10.00 IÇK 18.33 16.67 10.00 ari_shtetëror 16.67 18.33 21.67 11.67 IMKB100 15.00 16.67 23.33 25.00 13.33 The diagonal elements are the percentages missing, and the off-diagonal elements are the mismatch percentages of indicator variables. a. Variables are sorted on missing patterns. b. Indicator variables with less than 5% missing values are not displayed. Tabela e përqindjeve të mospajtimeve paraqet përqindjet e numrit të përgjithshëm të vrojtimeve për secilën ndryshore çift ku njëra nga ndryshoret ka vlera mangu kurse tjetra jo. Për shembull, numri i vrojtimeve mangu për ndonjërin nga IÇK apo industria e prodhimit është 11. Numri total i vrojtimeve është 60. Përqindja e mospajtimit të këtyre ndryshoreve është 18,33 (11/60). IMKB dhe ari shtetëror kanë përqindjen më të lartë të mospajtimit prej 25%. Veçanërisht në hulumtimet me shumë ndryshore mund të jetë e pamundur ndonjëherë që të sigurohen të dhëna të plota. Gjatë kryerjes së këtyre hulumtimeve, është shumë e rëndësishme që paraprakisht të përcaktohet shkalla e mungesës së të dhënave. Ndonjëherë mund të jetë e nevojshme që të nxirret nga analiza ndryshorja e cila ka mungesë të të dhënave. Mirëpo, kjo mund të ketë edhe një sërë rreziqesh. Numri i ndryshoreve do të ulet. Përpos kësaj, në qoftë se është një ndryshore me rëndësi dhe patjetër duhet të mbahet në hulumtim, atëherë rezultatet e aplikimit mund të jenë shumë të ndryshme. Në fillim, duhet të shqyrtohet rastësia e procesit të mungesës së të dhënave. Ky proces bëhet për të gjetur një çasje të problemit me mungesën e të dhënave. 6. PLOTËSIMI I MUNGESËS SË TË DHËNAVE Këtu do të bëjmë fjalë se si të i përfshijmë të dhënat mangu në analizë pa i larguar nga grupi i të dhënave në rastin kur të ndeshemi me këto të dhëna. Për t’a bërë këtë, në SPSS shkojmë te menyja Transform, Replace Missing Values. Më pas, do të hapet dritarja e më poshtme.

47. 33 Hapi 1: Menyja e Plotësimit të Mungesës së të Dhënave

48. 34 Hapi 2: Dritarja e Plotësimit për të Dhënat Mangu Në pjesën e metodave përzgjidhet sipas dëshirës. Series mean: Duke marrë mesataren e serive, zëvendësohen vendet e të dhënave mangu. Mean of nearby points: Në vendin e vrojtimit mangu vendoset vlera e mesatares aritmetike e marrë nga vlerat para dhe pas vrojtimit mungesë. Median of nearby points: Në vendin e vrojtimit mangu vendoset vlera e medianës e llogaritur nga vlerat nën dhe mbi vrojtimin mangu. Linear interpolation: Vlera e vrojtimit të plotë të fundit përpara vlerës mangu dhe vlera e vrojtimit të plotë të parë pas vlerës mangu vendosen në vendet ku ka mungesë. Në qoftë se vlerat e vrojtimit të parë dhe të fundit të

Add a comment

Related pages

www.scribd.com

www.scribd.com
Read more

Teza e Zgjidhur - scribd.com

SPSS-i Në Praktikë - Teknikat Statistikore Me Shumë Ndryshore. Hulumtimet e Marketingut, Ercan Gegez. Test ne Mikroekonomi
Read more

Teza e Zgjidhur - es.scribd.com

SPSS-i Në Praktikë - Teknikat Statistikore Me Shumë Ndryshore. Hulumtimet e Marketingut, Ercan Gegez. Test ne Mikroekonomi
Read more

Test ne Mikroekonomi - pt.scribd.com

Test ne Mikroekonomi, me detyra te mundshme qe mund te bijne ne provime. Browse. ... Në qoftë se kërkesa dhe oferta për produktin janë dhënë: ...
Read more

Test ne Mikroekonomi - es.scribd.com

Test ne Mikroekonomi, me detyra te mundshme qe mund te bijne ne provime. Navegar. ... Në qoftë se kërkesa dhe oferta për produktin janë dhënë: ...
Read more

Test ne Mikroekonomi - es.scribd.com

... me detyra te mundshme qe mund te bijne ne ... Çfarë niveli të produktit duhet të prodhojë kjo firmë në afat të shkurtër dhe me çfarë ...
Read more