Erinevate+arvtunnuste+korrelatsioon-+ja+regressioonanalüüs

code Töörühm:

Pärtel       partel (liider) Henry        jakoobimees Martin J     m_jakoobi Marianne     redmary Karmeli      karmeli1 Mattis       mattis_marjak Helen        helen89 code



Graafik kujutab õpilaste elukoha kauguse koolist (km) ja kooli jõudmiseks kuluva aja (min) vahelist seost. Iga punkt kujutab üht õpilast. Lineaarse korrelatsioonikordaja ruut ehk determinatsioonikordaja R2 näitab, kui suure osa ühe tunnuse hajuvusest saab kirjeldada teise tunnuse kaudu, seega on elukoha kauguse kaudu võimalik kirjeldada 56% kooli jõudmise aja hajuvusest. Korrelatsioonikordaja on 0,75 (R=0,75), mistõttu on tegemist üpris tugeva korrelatsiooniga. Võrrandi y=0,9548x + 19,451 järgi on võimalik arvutada prognoositav kooli jõudmise aeg (sõltuvalt elukoha kaugusest), kui asendada võrrandis x elukoha kaugusega km-s.



Joonisel on näha Gag'i 12 klasside õpilaste jalanumber ja pikkus. Iga punkt joonisel tähistab üht õpilast. Joonist vaadeldes saame täheldada, et tunnuste //Pikkus// ja //Jalanumber// vahel võiks olla järgmine seos: pikematel õpilastel on suuremad jalanumbrid. Antud korral on meil õpilaste jalanumber prognoositav tema pikkusest valemiga: Jalanumber=0,2775*Pikkus - 7,6895, kusjuures selline mudel võimaldab ära kirjeldada 71% tunnuse 'Jalanumber' hajuvusest.



Antud graafik kujutab magamisaja (h) ning elukoha kauguse (km) vahelist seost, kusjuures igale punktile ei pruugi vastata ainult üks isik. Enne diagrammi süüvimata võime püstitada hüpoteesi, mille kohaselt peaksid kaugemal elavad abituriendid magama vähem, kuna peavad ärkama kooli minemiseks varem. Kui nüüd tutvuda graafikuga, siis ilmneb fakt, et seos on äärmiselt nõrk e. praktiliselt puudub. Lineaarse korrelatsioonikordaja ruut ehk determinatsioonikordaja R² näitab, kui suure osa ühe tunnuse hajuvusest saab kirjeldada teise tunnusekaudu, seega on elukoha kauguse kaudu võimalik kirjeldada 0,37% magamiseaja hajuvusest. Korrelatsioonikordaja R= - 0,06, mille kohaselt on tegemist äärmiselt nõrga negatiivse korrelatsiooniga. Võrrand y=-0,0063x+6,8355 lubab arvutada magamisaja, kui asendada antud võrrandis tundmatu x elukoha kaugusega (km).



Antud graafikul on välja toodud magamiseks kulutatud aja ja vaba aja vaheline seos. Iga punkt joonisel kujutab ühte õpilast ja tema vaba aeg ja magamiseks kulutatud aega tundides. Enne diagrammiga tutvumist võiks eeldada, et inimesed, kellel on rohkem vaba aega ka magavad rohkem, kui antud andmete põhjal võib öelda, et seos on äärmiselt nõrk e. põhimõtteliselt puudub. Lineaarse korrelatsioonikordaja ruut r2=0,0002 näitab, et kui suure osa ühe tunnuse hajuvusest saab kirjeldada teise tunnuse kaudu e. vaba aja kaudu saab kirjeldada 0,002% magamise aja hajuvusest. Korrelatsioonikordaja r=0.009, mis näitab, et seos praktiliselt puudub.



Graafiku horisontaalteljel on toodud kooli jõudmise aeg minutites ning vertikaalteljel magamise aeg tundides. Iga punkt tähistab 1 või enamat õpilast. Enne graafikule vaatamist võiks eeldada, et õpilased, kellel läheb vähem aega kooli jõudmiseks, jääb selle võrra rohkem uneaega. Kuid andmeid ja graafikut uurides võib järeldada, et igal õpilasel on välja kujunenud oma isiklik rutiin, millal ta magama läheb ja millal kooli hakkab tulema. Korrelatsioon -0,0469 on väiksem absoluutväärtuselt kui 0,3 - seega on magamise aja ning kooli jõudmise aja vaheline statistiline sõltuvus peaaegu olematu.



Graafik kujutab Internetis viibitud aja ja magamisele kulutatud aja vahelist seost, kus igale punktile vastab üks või enam isikut. Algul võiks arvata, et kes viibib kauem Internetis sellel jääb vähem aega muudeks tegevusteks, sealhulgas ka magamiseks. Siiski näitab korrelatsioonikordaja R=-0,13, et Internetis viibitud aja ja magamisele kuluva aja vahel on seos väga nõrk. Determinatsioonikordaja Rˇ2=0,02 näitab, et Internetis viibitud aja kaudu on võimalik kirjeldada umbes 2% magamiseks kulunud aja hajuvusest. Võrrandi f(x)=-0,08x+6,96 kaudu oleks võimalik arvutada ligikaudne aeg, mis kulub magamiseks, kus x tähistab Internetis viibimiseks kulunud aega.



Eelnev tabel võtab kokku kõik küsitluses esinenud arvuliste vastuste korrelatsioonid. Tulemuste suurused on tabelis värviga eristatud: -1 lähenedes muutub kasti värv tumesinisemaks, 0 juures on valge ning +1 lähenedes muutub värvus oranžiks. Üllatuslikult on korrelatsiooni absoluutväärtus pikkuse ning perioodihinde vahel ligikaudselt võrdne korrelatsiooniga õppimise aja ning perioodihinde vahel. Mõlemad väärtused on siiski liiga väikesed, et väita mingi kindla seose olemasolu. Paar tugevat sõltuvust siiski leidub, need on pikkuse ning jala numbri ning kooli jõudmise aja ja elukoha kauguse vahel.