Intelligentsuse psühholoogia. René Mõttus
Чтение книги онлайн.
Читать онлайн книгу Intelligentsuse psühholoogia - René Mõttus страница 12
Muutes ülesannete kuju ja varieerides nende keerukust, õnnestus identifitseerida peamised võimete komponendid, mis on vajalikud seda sorti ülesannete edukaks lahendamiseks. Märkimisväärne on see, et analoogiaülesannete lahendamise kiirus ja täpsus korreleerus märkimisväärselt (r = 0,65) vastajate intelligentsusega tüüpilises IQ-testis (Sternberg & Gardner, 1983). Seega on Sternbergi meelest vähemalt ühe ülesannete tüübi korral võimalik üldine vaimne võimekus jagada üksikuteks komponentideks, mille täideviimise kiirus määrabki kogu ülesande lahendamise edukuse.
Robert Sternbergi võimetekomponentide eristamise meetodi kriitikud on juhtinud tähelepanu sellele, et niisugusel moel probleemilahendamise jupitamine võib tegelikult siiski olla üsna meelevaldne ning saadud komponendid on pigem tinglikud lõigud üldises probleemi lahendamise protsessis kui selge iseseisva sisuga protsessid. Näiteks on juhitud tähelepanu asjaolule, et kui samade inimeste probleemilahenduse komponendid eristada erinevat tüüpi ülesannetega, siis sooritus kahe erineva ülesandetüübi samades komponentides (nt ühise nimetaja leidmises) pole sugugi tugevamas korrelatsioonis kui sooritus kahe erineva ülesandetüübi eri komponentides (Deary, 2001). Seda võib tõesti pidada probleemiks. Nimelt oleks mõistlik eeldada, et inimeste sooritus sarnastes ülesannetes on vähemalt natuke tugevamas korrelatsioonis kui erinevates ülesannetes. Kui see nii pole, võib see tähendada, et tegelikult peegeldavad kõik komponendid täpselt ühte ja sama asja, näiteks üldist vaimset võimekust, millest tuleb põhjalikumalt juttu huljem.
Kahjuks ei ole sellist komponentideks lahutamist tehtud kõigi IQ-testides kasutatavate ülesannete puhul. Samuti ei ole õnnestunud koostada universaalset tabelit elementaarsetest vaimsetest operatsioonidest, mida kasutatakse vaimsete võimete testide erinevate ülesannete lahendamisel. Vajadus sellise tabeli järele on kindlasti olemas, kuid seda pole seni suudetud kokku panna.
MÕÕTMISTE KVALITEET JA PÕHIMÕTTED
Usaldusväärsus
Mõõdik on usaldusväärne vaid niisugusel juhul, kui täpselt sama asja mõõtes saadakse kahel korral sama mõõtmistulemus. Kui keegi tahab teada, kas kaalud on usaldusväärsed, siis ta mõõdab näiteks enda kehakaalu mitu korda. Kui kaal on hea, siis see annab igal mõõtmiskorral täpselt sama või vähemalt väga sarnase tulemuse. Kui mõõtmiskordade näidud erinevad oluliselt, siis võib arvata, et kaal on ebatäpne ning mõõtmistulemustes on ka viga, mida tuleb tõlgendamisel arvesse võtta.
Korduvtestimise usaldusväärsus. Rangelt võttes ongi mingi mõõdiku peamiseks usaldusväärsuse (reliaabluse) näitajaks korduvtestimistel saadud tulemuste sarnasus. Tihti nimetatakse seda usaldusväärsust testretest-reliaabluseks. Korduvtestimise usaldusväärsuse leidmiseks peavad testi täitjad tegema testi kahel korral võimalikult väikese ajalise vahega. Kordustestimise usaldusväärsuse mõõduks on korrelatsioon esimesel testimisel saadud skooride X2 ja teisel testimisel saadud skooride X2 vahel. Kui esimese testimise tulemuse puhul saadud tulemuste pingerida kordustestimisel sugugi ei muutu, siis on tegemist ideaalse mõõdikuga. Tegelikult pole muidugi peaaegu ükski mõõtevahend ideaalselt usaldusväärne, ei intelligentsuse ega muude psühholoogiliste, meditsiiniliste või muude mõõtmiste korral. See on paratamatu ning parim, mida me teha saame, on kokku leppida mõistliku usaldusväärsuse kriteeriumites ning püüda neid täita.
Tegelikult polnud Robert Sternberg sugugi esimene, kes ülesande komponentideks lahutamise ideele tuli. Üsna sarnaste ideedega tuli umbes 50 aastat enne teda välja intelligentsuse uurimise ajaloo üks peategelesi Charles Spearman. Ka Spearman pidas probleemilahendamise juures oluliseks järjestikust, etapiviisilist informatsiooni töötlemist. Spearmani poolt välja käiduna kandsid need nime noegeneetilised seadused (noegenetic laws) ning olid muuhulgas aluseks maatrikstüüpi ülesannetele nagu me võime neid näha näiteks Raveni maatriksites või Wechsleri testides.
Näiteks tüüpiline WISC-III kordustestimise usaldusväärsus on verbaalse ja sooritusliku intelligentsuse puhul 0,87 ja koguskoori puhul 0,91, kui kahe testimise vahel on ligikaudu kolm aastat (Canivez & Watkins, 1998). Usaldusväärsus on pisut väiksem, kui testivateks on madala vaimse võimekusega (IQ < 80) isikute rühm. Sellisel juhul on kogu Wechsleri testi usaldusväärsus 0,81 ringis (Whitaker, 2008), kuid isegi see on päris hea tulemus.
Kui pikk peaks olema vahemik kahe testimise vahel? Ilmselt on kolm aastat kordustestimise usaldusväärsuse leidmiseks liiga pikk ajavahemik. Kolme aastaga (eriti noorena või kõrges vanuses) võib üsna palju muutuda inimese endaga, kelle vaimseid võimeid mõõdetakse. Seega võib kordustestimise muutus peegeldada mitte üksnes mõõdiku viga, vaid ka reaalseid muutusi inimese teadmistes, oskustes ja võimetes. Terve mõistuse seisukohalt lähtudes võiks oletada, et üldjuhul paari nädala või kuuga inimene väga palju targemaks või rumalamaks ei muutu. Seega on mõistlik kordustestimise ajavahemik valida paarist nädalast paari kuuni. Liiga lühikese aja puhul võib olla probleemiks, et inimene mäletab oma eelmist sooritust ja saab sellega teisel korral mõnesuguse eelise. Teisalt, sama eelise saavad kõik, kes kordustestimises osalevad, nii et inimeste järjestuse võimalikku muutust see otseselt mõjutada ei tohiks. Samas pole intelligentsuse puhul kordustestimise aeg väga kriitiline, kuna inimeste pingeread intelligentsustestide skooride järgi on ajas väga püsivad. Näiteks oti koolilapsed, keda testiti 1932. aastal 11 aasta vanuses, tegid sama testi (Moray House Test) teist korda 66 aastat hiljem 1998. aastal. Kahe testimiskorral vaheline korrelatsioon oli selles valimis 0,66 (Deary, Whiteman, Starr, Whalley & Fox, 2004).
Sisereliaablus. Kuigi kordustestimine on parim viis mõõdiku usaldusväärsuse kontrollimiseks, on selle tegemine kulukas või tihti lausa võimatu. Niisugusel juhul püütakse ühe testimiskorra sees leida kinnitusi testi usaldusväärsusele. Näiteks võib kujutada ette, et kui jagame kogu testitavate valimi juhuslikult pooleks, siis esimene pool esindab esimest ja teine teist testimiskorda. Mitmed andetöötluse tarkvarad (nt SPSS/PASW, Statistica) sisaldavad statistilist protseduuri, mida nimetatakse split-half reliability. Mõistlik oletus on see, et usaldusväärne mõõdik annab juhuslikult poolitatud alavalimitel ühesuguse tulemuse.
Cronbachi alfa. Kõige sagedamini kasutatavaks testi usaldusväärsuse näitajaks on testi sisereliaabluse indeks ehk Cronbachi alfa. Selle indeksi mõtles välja Lee Cronbach (1951) iseloomustamaks testi küsimuste või ülesannete kooskõla. Cronbachi alfa on lülitatud enamikku andmetöötluse tarkvarapakettidesse ning seda pole keeruline ka käsitsi arvutada. Kõige läbipaistvam on Cronbachi alfa defineerimine küsimuste keskmise korrelatsiooni kaudu:
kus N on küsimuste arv testis ja ṝ – kõigi küsimuste paarikaupa korrelatsioonide keskmine. Seepärast ongi Cronbachi alfat arvutavates programmides lisaks alfale endale toodud ka küsimuste või ülesannete omavaheline keskmine korrelatsioon. Seega mõõdab Cronbachi alfa testi küsimuste (ülesannete) kooskõla, mis rangelt võttes ei näita siiski testi usaldusväärsust. Usaldusväärsuse üheks eelduseks on küll see, et üksikud küsimused mõõdavad sama asja – nt vaimset võimekust –, kuid Cronbachi alfa kõrge väärtus ei garanteeri veel, et esmakordse ja kordustestimise tulemused hästi kokku langeksid.
Näiteks Raveni kasvava raskusastmega maatriksite (RSPM) 60 ülesande sisereliaablus Eesti normvalimil on 0,88 (Pullmann, Allik & Lynn, 2004). Cronbachi alfa sõltub küsimuste või ülesannete arvust testis: mida rohkem on küsimusi või ülesandeid, seda suurem on alfa (eeldusel, et keskmine korrelatsioon küsimuste vahel ei muutu). Näiteks α = 0,88 vastav keskmine küsimuste vaheline korrelatsioon (60 küsimusega) RSPMis on tegelikult üsna madal (0,11). Et testi sisereliaablus oleks piisavalt kõrge, on tihti lihtsalt tarvis suurt hulka ülesandeid.
Mingit ranget eeskirja, kui kõrge peaks