1、效度是指所測(cè)量的與所要測(cè)量的心理特點(diǎn)之間符合的程度,或者簡(jiǎn)單地說(shuō)是指一個(gè)心理測(cè)驗(yàn)的準(zhǔn)確性。效度是科學(xué)測(cè)量工具最重要的必備條件。(1)一組測(cè)驗(yàn)分?jǐn)?shù)的總方差等于真實(shí)方差與誤差方差之和,而真實(shí)方差又可分為兩部分,即有關(guān)的方差和無(wú)關(guān)的但穩(wěn)定的方差,后者也就是所謂系統(tǒng)誤差帶來(lái)的方差(公式4-2)。
2、信度和效度的關(guān)系(1)信度是效度的必要而非充分條件:從方差分配公式:可以看出,增大,即效度高,信度的真方差()必然大,故信度必然高。當(dāng)信度高時(shí),即降低時(shí),是否增加還要看是否增減,因此效度不一定就高。效度高必然信度高,而信度高并不一定保證效度高,說(shuō)明信度高只是效度高的必然條件,并不是效度高的充分條件。(2)效度是受信度制約的
3、效度的性質(zhì):(1)a效度具有相對(duì)性:在評(píng)鑒測(cè)驗(yàn)的效度時(shí),必須考慮其目的與功能。只有所測(cè)的結(jié)果符合該測(cè)驗(yàn)的目,才能認(rèn)為它是個(gè)有效的測(cè)量工具。(2)效度具有連續(xù)性。測(cè)驗(yàn)效度通常用相關(guān)系數(shù)表示,它只有程度上的不同,而沒有“全有”或“全無(wú)”的區(qū)別。因此,我們?cè)u(píng)價(jià)一個(gè)測(cè)驗(yàn)時(shí),不應(yīng)該說(shuō)“有效”或“無(wú)效”,而應(yīng)該用效度較高或效度較低來(lái)評(píng)價(jià)。
效度的類型及評(píng)估方法
1、內(nèi)容效度:指的是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性,從而確定測(cè)驗(yàn)是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣。(名詞解釋)
(1)想編制有較高內(nèi)容效度的心理測(cè)驗(yàn):○1要對(duì)所測(cè)量的心理特性有個(gè)明確的概念,并劃定出哪些行為與這心理特性有關(guān),又比較密切。○2測(cè)驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。
(2)需要說(shuō)明的是,要求內(nèi)容效度的測(cè)驗(yàn),并不一定要求測(cè)驗(yàn)為同質(zhì)的。
2、內(nèi)容效度的評(píng)估方法:(1)專家判斷法:為了確定一個(gè)測(cè)驗(yàn)是否有內(nèi)容效度,最常用的方法是請(qǐng)有關(guān)專家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容的符合性作出判斷,看測(cè)驗(yàn)的題目是否代表規(guī)定的內(nèi)容。如果專家認(rèn)為測(cè)驗(yàn)題目代表了所測(cè)內(nèi)容,測(cè)驗(yàn)就是有內(nèi)容效度。由于這種估計(jì)效度的方法,是一個(gè)邏輯分析的過程,所以內(nèi)容效度有時(shí)也可稱為“邏輯效度”。(2)統(tǒng)計(jì)分析法:計(jì)算兩個(gè)評(píng)分者之間評(píng)定的一致性,雖然考察的是評(píng)分者的判斷信度,但由于來(lái)自兩個(gè)獨(dú)立的評(píng)判者,因此符合程度越高越能反映測(cè)驗(yàn)的內(nèi)容效度??藗惏秃仗岢?,內(nèi)容效度可由一組被試在獨(dú)立取得自同樣內(nèi)容范圍的兩個(gè)測(cè)驗(yàn)復(fù)本上得分之相關(guān)來(lái)作數(shù)量的估計(jì)。再測(cè)法也可用于內(nèi)容效度的評(píng)估。(3)經(jīng)驗(yàn)推測(cè)法:通過實(shí)踐來(lái)檢驗(yàn)效度。如果是隨著年齡的增加而增加,就可以推測(cè)該測(cè)驗(yàn)有內(nèi)容效度。
3、內(nèi)容效度與表面效度的關(guān)系:經(jīng)?;煜1砻嫘Ф仁怯赏庑袑?duì)測(cè)驗(yàn)作表面上的檢查確定的,它不反映測(cè)驗(yàn)實(shí)際測(cè)量的東西,只是指測(cè)驗(yàn)表面上看來(lái)好像是所要測(cè)的東西;內(nèi)容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對(duì)測(cè)驗(yàn)作評(píng)價(jià)建立的。雖然二者都是根據(jù)測(cè)驗(yàn)內(nèi)容作出的主觀判斷,但判斷的標(biāo)準(zhǔn)不同。前者只考慮題目與測(cè)量目的之間的明顯的、直接的關(guān)系,后者則考慮到題目與測(cè)量目的和內(nèi)容總體之間邏輯的微妙關(guān)系。如果測(cè)驗(yàn)內(nèi)容看起來(lái)與測(cè)量目標(biāo)和要作的決定不相干,就會(huì)使被試產(chǎn)生不配合、馬馬馬乎乎、應(yīng)付了事等反應(yīng),而影響測(cè)驗(yàn)的效度。相反,典型行為測(cè)驗(yàn)卻要求較低的表面效度。如果被試很容易從測(cè)驗(yàn)題目看出測(cè)驗(yàn)的目的,就可能產(chǎn)生反應(yīng)偏差(如掩飾等)。
構(gòu)想效度
1、構(gòu)想效度:1954年提出,有人翻譯為構(gòu)思效度,也有叫結(jié)構(gòu)效度。它是指測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上的構(gòu)想和特質(zhì)的程度,即測(cè)驗(yàn)的結(jié)果是否能證實(shí)或解釋某一理論的假設(shè)、術(shù)語(yǔ)或構(gòu)想,解釋的程度如何。
2、構(gòu)想效度的估計(jì)方法:(1)對(duì)測(cè)驗(yàn)本身的分析:對(duì)測(cè)驗(yàn)本身的分析:測(cè)驗(yàn)的內(nèi)容效度可以作為構(gòu)思效度的證據(jù);測(cè)驗(yàn)的同質(zhì)性指標(biāo)可以推斷測(cè)驗(yàn)是測(cè)量單一特質(zhì)還是測(cè)量多種特質(zhì),從而為評(píng)估測(cè)驗(yàn)構(gòu)思效度提供證據(jù);分析被試對(duì)題目的反應(yīng)特點(diǎn)也可以作為構(gòu)思效度的證據(jù)。(2)測(cè)驗(yàn)間的相互比較:相容效度是構(gòu)思效度的一個(gè)證據(jù)。區(qū)分效度是構(gòu)思效度的又一個(gè)證據(jù),一個(gè)有效的測(cè)驗(yàn)不僅應(yīng)與其他測(cè)量同一構(gòu)思的測(cè)驗(yàn)有關(guān),而且還必須與測(cè)量不同構(gòu)思的測(cè)驗(yàn)無(wú)相關(guān);因素分析法也是建立構(gòu)思效度的常用方法,通過對(duì)一組測(cè)驗(yàn)進(jìn)行因素分析,可以找到影響測(cè)驗(yàn)分?jǐn)?shù)的共同因素,這種因素可能就是我們要測(cè)量的心理特質(zhì)(構(gòu)思)。(3)效標(biāo)效度的研究證明:一個(gè)測(cè)驗(yàn)若效標(biāo)度理想,那么該測(cè)驗(yàn)所預(yù)測(cè)的效標(biāo)的性質(zhì)和種類就可以作為分析測(cè)驗(yàn)構(gòu)思效度的指標(biāo),另一種證實(shí)構(gòu)思效度的方法是心理特質(zhì)的發(fā)展變化。實(shí)驗(yàn)法和觀察法證實(shí):觀察實(shí)驗(yàn)前和實(shí)驗(yàn)后分?jǐn)?shù)的差異是驗(yàn)證構(gòu)思效度的方法。
效標(biāo)效度
1、效標(biāo)效度:又稱實(shí)證效度,反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)的有效性程度。被預(yù)測(cè)的行為是檢驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱效標(biāo)。由于這種效度是看測(cè)驗(yàn)對(duì)效標(biāo)預(yù)測(cè)如何,所以叫效標(biāo)效度。這種效度需在實(shí)踐中檢驗(yàn),所以又稱為實(shí)證效標(biāo)。
分類:根據(jù)效標(biāo)資料是否與測(cè)驗(yàn)分?jǐn)?shù)同時(shí)獲得,又可分為同時(shí)效度和預(yù)測(cè)效度兩類。同時(shí)效度即測(cè)驗(yàn)所得分?jǐn)?shù)可與效標(biāo)同時(shí)驗(yàn)證,通常與心理特征的評(píng)估及診斷有關(guān)。預(yù)測(cè)效度的效標(biāo)資料需要一段時(shí)間才可搜集到,通常用于選拔、分組。因?yàn)樾?biāo)資料在考試以后相隔一段時(shí)間才能獲得,所以高考的效標(biāo)是一種預(yù)測(cè)效標(biāo)。同時(shí)效標(biāo)和預(yù)測(cè)效標(biāo)意義上的差異,不是來(lái)源于時(shí)間,而是來(lái)自測(cè)驗(yàn)的目的。前者與用來(lái)診斷現(xiàn)狀的測(cè)驗(yàn)有關(guān),后者與預(yù)測(cè)將來(lái)結(jié)果的測(cè)驗(yàn)有關(guān)。
一個(gè)好的效標(biāo)必須具備以下條件:
1必須能地反映測(cè)驗(yàn)的目標(biāo),即效標(biāo)測(cè)量本身必須有效;
2效標(biāo)必須具有較高的信度,穩(wěn)定可靠,不隨時(shí)間等因素變化;
3效標(biāo)可以客觀地加以測(cè)量,可用數(shù)據(jù)或等級(jí)來(lái)表示;
4效標(biāo)的測(cè)量的方法很簡(jiǎn)單,省時(shí)省力,經(jīng)濟(jì)實(shí)用。
2、效標(biāo)和效標(biāo)測(cè)量:效標(biāo),即衡量測(cè)驗(yàn)有效性的參照標(biāo)準(zhǔn),指的是可以直接而且獨(dú)立測(cè)量的我們感興趣的行為。我們感興趣的行為,就是要預(yù)測(cè)的行為,這是一個(gè)總的觀念,故必須以可操作的測(cè)量來(lái)確定才有實(shí)際意義。因此有必要把效標(biāo)細(xì)分為兩個(gè)層次,其一是理論水平的“觀念效標(biāo)”,其二是操作定義水平的“效標(biāo)測(cè)量”。
3、常用的效標(biāo)包括:
1學(xué)業(yè)成就:如在校成績(jī)、學(xué)歷、有關(guān)的獎(jiǎng)勵(lì)和榮譽(yù)、教師對(duì)學(xué)生智力的評(píng)定等,常作為智力測(cè)驗(yàn)的效標(biāo),也可作為某些多重能力傾向測(cè)驗(yàn)和人格測(cè)驗(yàn)的效標(biāo)。
2實(shí)際工作表現(xiàn):是最滿意的效標(biāo)測(cè)量,為一般智力測(cè)驗(yàn)、人格測(cè)驗(yàn)和一些能力傾向測(cè)驗(yàn)的效標(biāo);
3特殊訓(xùn)練成績(jī)
4精神病診斷;
5等級(jí)評(píng)定:是觀察者根據(jù)測(cè)驗(yàn)欲測(cè)量的心理特質(zhì)在被試身上的表現(xiàn)而作出的一種個(gè)人判斷;
6效標(biāo)團(tuán)體的比較:即找出兩個(gè)在效標(biāo)表現(xiàn)上有差別的團(tuán)體,比較他們?cè)跍y(cè)驗(yàn)分?jǐn)?shù)上的差別;
7先前有效的測(cè)驗(yàn):一個(gè)新測(cè)驗(yàn)與先前有效的測(cè)驗(yàn)的相關(guān)也經(jīng)常作為效度檢驗(yàn)的證據(jù)。(簡(jiǎn)答)
效度的表示方法
1、相關(guān)法:效度系數(shù)是最常用的效度指標(biāo),尤其是效標(biāo)效度。它是以皮爾遜積差相關(guān)系數(shù)來(lái)表示的,主要反映測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的相關(guān)。當(dāng)測(cè)驗(yàn)成績(jī)是連續(xù)變量,而效標(biāo)資料是二分變量時(shí),計(jì)算效度系數(shù)可用點(diǎn)二列相關(guān)公式或二列相關(guān)公式;當(dāng)測(cè)驗(yàn)分?jǐn)?shù)為連續(xù)變量,效標(biāo)資料為等級(jí)評(píng)定時(shí),可用賈斯朋多系列相關(guān)公式計(jì)算。
2、區(qū)分法:是檢驗(yàn)測(cè)驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的一種方法。算出t值后,便可知道分?jǐn)?shù)的差異是否顯著。若差異顯著,說(shuō)明該測(cè)驗(yàn)?zāi)軌蛴行У貐^(qū)分由效標(biāo)定義的團(tuán)體,否則,測(cè)驗(yàn)是無(wú)效的。重疊百分比可以通過計(jì)算每一組內(nèi)得分超過(或低于)另一組平均數(shù)的人數(shù)百分比得出;另外,還可以計(jì)算兩組分布的共同區(qū)的百分比。重疊量越大,說(shuō)明兩組分?jǐn)?shù)差異越小,即測(cè)驗(yàn)的效度越差。
3、命中率法:是當(dāng)測(cè)驗(yàn)用來(lái)做取舍的依據(jù)時(shí),用其正確決定的比例作為效度指標(biāo)的一種方法。命中率的計(jì)算有兩種方法,一是計(jì)算總命中率,另一種是計(jì)算正命中率。
4、預(yù)期表法:是一種雙向表格,預(yù)測(cè)分?jǐn)?shù)排在表的左邊,效標(biāo)排在表的頂端。從左下至右上對(duì)角線上各百分?jǐn)?shù)字越大,而其它的百分?jǐn)?shù)字越小,表示測(cè)驗(yàn)的效標(biāo)效度越高;反之,數(shù)字越分散,則效度越低。
效度的應(yīng)用
1、預(yù)測(cè)誤差:效度系數(shù)的平方,統(tǒng)計(jì)學(xué)上稱這種指標(biāo)為決定系數(shù),表示測(cè)驗(yàn)正確預(yù)測(cè)或解釋的效標(biāo)的方差占總方差的比例。另一種表達(dá)方式是估計(jì)的標(biāo)準(zhǔn)誤,簡(jiǎn)寫為Sest,它是指所有具有某一測(cè)驗(yàn)分?jǐn)?shù)的被試其效標(biāo)分?jǐn)?shù)(Y)分布的標(biāo)準(zhǔn)差,也即預(yù)測(cè)誤差大小的估計(jì)值,(公式4-9)估計(jì)的標(biāo)注誤可如同其他標(biāo)準(zhǔn)誤一樣解釋。真正效標(biāo)分?jǐn)?shù)落在預(yù)測(cè)效標(biāo)分?jǐn)?shù)±1Sest的范圍內(nèi),有68%的可能性;落在預(yù)測(cè)效標(biāo)分?jǐn)?shù)±1.96Sest的范圍內(nèi),有95%的可能性;落在預(yù)測(cè)效標(biāo)分?jǐn)?shù)±2.58Sest的范圍內(nèi),有99%的可能性。
2、預(yù)測(cè)效標(biāo)分?jǐn)?shù):如果X與Y兩變量呈直線相關(guān),只要確定出二者間的回歸方程,就可以從一個(gè)變量推估出來(lái)另一個(gè)變量。在測(cè)驗(yàn)工作中,人們感興趣的是從測(cè)驗(yàn)分?jǐn)?shù)預(yù)測(cè)效標(biāo)成績(jī)。
3、預(yù)測(cè)效標(biāo)指數(shù):公式4-9中的又稱作無(wú)關(guān)系數(shù),以K表示之,K值大小表明預(yù)測(cè)源分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)無(wú)關(guān)的程度。(1-K)可作為預(yù)測(cè)效率的指數(shù),用E表示:E=100(1-K)(公式4-15)E值大小表明使用測(cè)驗(yàn)比盲目猜測(cè)能減少多少誤差。
測(cè)驗(yàn)本身的因素
1、測(cè)驗(yàn)題目的質(zhì)量
2、測(cè)驗(yàn)的長(zhǎng)度。(一般而言,增加測(cè)驗(yàn)的長(zhǎng)度通??梢蕴岣邷y(cè)驗(yàn)的信度,而信度又制約著效度,因此增加測(cè)驗(yàn)的長(zhǎng)度也能提高測(cè)驗(yàn)的效度。)
測(cè)驗(yàn)實(shí)施中的干擾因素
1、主試的影響因素。測(cè)驗(yàn)實(shí)施過程中主試的因素會(huì)影響效度。對(duì)于效標(biāo)效度,測(cè)驗(yàn)與效標(biāo)二者實(shí)施時(shí)間間隔時(shí)間越長(zhǎng),測(cè)驗(yàn)與效標(biāo)越容易受到很多機(jī)遇因素的影響,因此所求的相關(guān)必然很低。測(cè)驗(yàn)情鏡,如場(chǎng)地的布置、材料的準(zhǔn)備、測(cè)驗(yàn)場(chǎng)所有無(wú)噪音和其他干擾因素等也會(huì)影響到測(cè)驗(yàn)的效度。
2、被試的影響因素。被試在測(cè)驗(yàn)時(shí)的興趣、動(dòng)機(jī)、情緒、態(tài)度和身心狀況、健康狀態(tài)等都會(huì)影響測(cè)驗(yàn)的效度。(被試的反應(yīng)定勢(shì)也會(huì)降低測(cè)驗(yàn)的效度。)
樣本團(tuán)體的性質(zhì)
1、樣本團(tuán)體的異質(zhì)性。與信度系數(shù)一樣,如果其它條件相同,樣本團(tuán)體越同質(zhì),分?jǐn)?shù)分布范圍越小,測(cè)驗(yàn)效度就越低;樣本團(tuán)體越異質(zhì),分?jǐn)?shù)分布范圍越大測(cè)驗(yàn)效度就越高。(1)只以選拔上的被試為樣本團(tuán)體參加效度研究,降低了測(cè)驗(yàn)的效度。(2)選拔標(biāo)準(zhǔn)太高,樣本團(tuán)體的同質(zhì)性增高,降低了測(cè)驗(yàn)的效度。
2、干涉變量。樣本團(tuán)體的性質(zhì)對(duì)效度的影響還表現(xiàn)在:對(duì)于同性質(zhì)的團(tuán)體,同一測(cè)驗(yàn)的效度會(huì)有很大的不同。這些樣本團(tuán)體的特質(zhì)包括:年齡、性別、教育水平、智力、動(dòng)機(jī)、職業(yè)和任何有關(guān)的特征。由于這寫特征的影響,使得測(cè)驗(yàn)對(duì)于不同的團(tuán)體具有不同的預(yù)測(cè)能力,故測(cè)量學(xué)上稱這些特征為干涉變量。
吉賽利提出的如何找出干涉變量的一套方法:
①用回歸方程求得每個(gè)人的預(yù)測(cè)效標(biāo)分?jǐn)?shù),將該分?jǐn)?shù)與實(shí)際效標(biāo)分?jǐn)?shù)想比較,獲得差異分?jǐn)?shù)D.如果D的絕對(duì)值很大,說(shuō)明測(cè)驗(yàn)中可能存在干涉變量。
②根據(jù)樣本團(tuán)體的組成分析,找出對(duì)照組,分別計(jì)算效度,從而象上述關(guān)于出租汽車司機(jī)的例子一樣,找出干涉變量。
③對(duì)于欲測(cè)團(tuán)體,根據(jù)某些易見的干涉變量將其區(qū)分為預(yù)測(cè)性高和預(yù)測(cè)性低的兩個(gè)亞團(tuán)體。對(duì)于預(yù)測(cè)性高的團(tuán)體,獲得的測(cè)驗(yàn)效度會(huì)有所提高。
效標(biāo)的性質(zhì)
(1)效標(biāo)與測(cè)驗(yàn)分?jǐn)?shù)之間的關(guān)系是否線性關(guān)系是一個(gè)很重要的因素。皮爾遜劑差相關(guān)系數(shù)的前題是假設(shè)兩個(gè)變量的關(guān)系是線性的分布。
(2)效標(biāo)測(cè)量本身的可靠性如何亦是值得考慮的一個(gè)問題。
2、信度和效度的關(guān)系(1)信度是效度的必要而非充分條件:從方差分配公式:可以看出,增大,即效度高,信度的真方差()必然大,故信度必然高。當(dāng)信度高時(shí),即降低時(shí),是否增加還要看是否增減,因此效度不一定就高。效度高必然信度高,而信度高并不一定保證效度高,說(shuō)明信度高只是效度高的必然條件,并不是效度高的充分條件。(2)效度是受信度制約的
3、效度的性質(zhì):(1)a效度具有相對(duì)性:在評(píng)鑒測(cè)驗(yàn)的效度時(shí),必須考慮其目的與功能。只有所測(cè)的結(jié)果符合該測(cè)驗(yàn)的目,才能認(rèn)為它是個(gè)有效的測(cè)量工具。(2)效度具有連續(xù)性。測(cè)驗(yàn)效度通常用相關(guān)系數(shù)表示,它只有程度上的不同,而沒有“全有”或“全無(wú)”的區(qū)別。因此,我們?cè)u(píng)價(jià)一個(gè)測(cè)驗(yàn)時(shí),不應(yīng)該說(shuō)“有效”或“無(wú)效”,而應(yīng)該用效度較高或效度較低來(lái)評(píng)價(jià)。
效度的類型及評(píng)估方法
1、內(nèi)容效度:指的是測(cè)驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性,從而確定測(cè)驗(yàn)是否是所欲測(cè)量的行為領(lǐng)域的代表性取樣。(名詞解釋)
(1)想編制有較高內(nèi)容效度的心理測(cè)驗(yàn):○1要對(duì)所測(cè)量的心理特性有個(gè)明確的概念,并劃定出哪些行為與這心理特性有關(guān),又比較密切。○2測(cè)驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。
(2)需要說(shuō)明的是,要求內(nèi)容效度的測(cè)驗(yàn),并不一定要求測(cè)驗(yàn)為同質(zhì)的。
2、內(nèi)容效度的評(píng)估方法:(1)專家判斷法:為了確定一個(gè)測(cè)驗(yàn)是否有內(nèi)容效度,最常用的方法是請(qǐng)有關(guān)專家對(duì)測(cè)驗(yàn)題目與原定內(nèi)容的符合性作出判斷,看測(cè)驗(yàn)的題目是否代表規(guī)定的內(nèi)容。如果專家認(rèn)為測(cè)驗(yàn)題目代表了所測(cè)內(nèi)容,測(cè)驗(yàn)就是有內(nèi)容效度。由于這種估計(jì)效度的方法,是一個(gè)邏輯分析的過程,所以內(nèi)容效度有時(shí)也可稱為“邏輯效度”。(2)統(tǒng)計(jì)分析法:計(jì)算兩個(gè)評(píng)分者之間評(píng)定的一致性,雖然考察的是評(píng)分者的判斷信度,但由于來(lái)自兩個(gè)獨(dú)立的評(píng)判者,因此符合程度越高越能反映測(cè)驗(yàn)的內(nèi)容效度??藗惏秃仗岢?,內(nèi)容效度可由一組被試在獨(dú)立取得自同樣內(nèi)容范圍的兩個(gè)測(cè)驗(yàn)復(fù)本上得分之相關(guān)來(lái)作數(shù)量的估計(jì)。再測(cè)法也可用于內(nèi)容效度的評(píng)估。(3)經(jīng)驗(yàn)推測(cè)法:通過實(shí)踐來(lái)檢驗(yàn)效度。如果是隨著年齡的增加而增加,就可以推測(cè)該測(cè)驗(yàn)有內(nèi)容效度。
3、內(nèi)容效度與表面效度的關(guān)系:經(jīng)?;煜1砻嫘Ф仁怯赏庑袑?duì)測(cè)驗(yàn)作表面上的檢查確定的,它不反映測(cè)驗(yàn)實(shí)際測(cè)量的東西,只是指測(cè)驗(yàn)表面上看來(lái)好像是所要測(cè)的東西;內(nèi)容效度是由夠資格的判斷者(專家)詳盡地、系統(tǒng)地對(duì)測(cè)驗(yàn)作評(píng)價(jià)建立的。雖然二者都是根據(jù)測(cè)驗(yàn)內(nèi)容作出的主觀判斷,但判斷的標(biāo)準(zhǔn)不同。前者只考慮題目與測(cè)量目的之間的明顯的、直接的關(guān)系,后者則考慮到題目與測(cè)量目的和內(nèi)容總體之間邏輯的微妙關(guān)系。如果測(cè)驗(yàn)內(nèi)容看起來(lái)與測(cè)量目標(biāo)和要作的決定不相干,就會(huì)使被試產(chǎn)生不配合、馬馬馬乎乎、應(yīng)付了事等反應(yīng),而影響測(cè)驗(yàn)的效度。相反,典型行為測(cè)驗(yàn)卻要求較低的表面效度。如果被試很容易從測(cè)驗(yàn)題目看出測(cè)驗(yàn)的目的,就可能產(chǎn)生反應(yīng)偏差(如掩飾等)。
構(gòu)想效度
1、構(gòu)想效度:1954年提出,有人翻譯為構(gòu)思效度,也有叫結(jié)構(gòu)效度。它是指測(cè)驗(yàn)?zāi)軌驕y(cè)量到理論上的構(gòu)想和特質(zhì)的程度,即測(cè)驗(yàn)的結(jié)果是否能證實(shí)或解釋某一理論的假設(shè)、術(shù)語(yǔ)或構(gòu)想,解釋的程度如何。
2、構(gòu)想效度的估計(jì)方法:(1)對(duì)測(cè)驗(yàn)本身的分析:對(duì)測(cè)驗(yàn)本身的分析:測(cè)驗(yàn)的內(nèi)容效度可以作為構(gòu)思效度的證據(jù);測(cè)驗(yàn)的同質(zhì)性指標(biāo)可以推斷測(cè)驗(yàn)是測(cè)量單一特質(zhì)還是測(cè)量多種特質(zhì),從而為評(píng)估測(cè)驗(yàn)構(gòu)思效度提供證據(jù);分析被試對(duì)題目的反應(yīng)特點(diǎn)也可以作為構(gòu)思效度的證據(jù)。(2)測(cè)驗(yàn)間的相互比較:相容效度是構(gòu)思效度的一個(gè)證據(jù)。區(qū)分效度是構(gòu)思效度的又一個(gè)證據(jù),一個(gè)有效的測(cè)驗(yàn)不僅應(yīng)與其他測(cè)量同一構(gòu)思的測(cè)驗(yàn)有關(guān),而且還必須與測(cè)量不同構(gòu)思的測(cè)驗(yàn)無(wú)相關(guān);因素分析法也是建立構(gòu)思效度的常用方法,通過對(duì)一組測(cè)驗(yàn)進(jìn)行因素分析,可以找到影響測(cè)驗(yàn)分?jǐn)?shù)的共同因素,這種因素可能就是我們要測(cè)量的心理特質(zhì)(構(gòu)思)。(3)效標(biāo)效度的研究證明:一個(gè)測(cè)驗(yàn)若效標(biāo)度理想,那么該測(cè)驗(yàn)所預(yù)測(cè)的效標(biāo)的性質(zhì)和種類就可以作為分析測(cè)驗(yàn)構(gòu)思效度的指標(biāo),另一種證實(shí)構(gòu)思效度的方法是心理特質(zhì)的發(fā)展變化。實(shí)驗(yàn)法和觀察法證實(shí):觀察實(shí)驗(yàn)前和實(shí)驗(yàn)后分?jǐn)?shù)的差異是驗(yàn)證構(gòu)思效度的方法。
效標(biāo)效度
1、效標(biāo)效度:又稱實(shí)證效度,反映的是測(cè)驗(yàn)預(yù)測(cè)個(gè)體在某種情境下行為表現(xiàn)的有效性程度。被預(yù)測(cè)的行為是檢驗(yàn)效度的標(biāo)準(zhǔn),簡(jiǎn)稱效標(biāo)。由于這種效度是看測(cè)驗(yàn)對(duì)效標(biāo)預(yù)測(cè)如何,所以叫效標(biāo)效度。這種效度需在實(shí)踐中檢驗(yàn),所以又稱為實(shí)證效標(biāo)。
分類:根據(jù)效標(biāo)資料是否與測(cè)驗(yàn)分?jǐn)?shù)同時(shí)獲得,又可分為同時(shí)效度和預(yù)測(cè)效度兩類。同時(shí)效度即測(cè)驗(yàn)所得分?jǐn)?shù)可與效標(biāo)同時(shí)驗(yàn)證,通常與心理特征的評(píng)估及診斷有關(guān)。預(yù)測(cè)效度的效標(biāo)資料需要一段時(shí)間才可搜集到,通常用于選拔、分組。因?yàn)樾?biāo)資料在考試以后相隔一段時(shí)間才能獲得,所以高考的效標(biāo)是一種預(yù)測(cè)效標(biāo)。同時(shí)效標(biāo)和預(yù)測(cè)效標(biāo)意義上的差異,不是來(lái)源于時(shí)間,而是來(lái)自測(cè)驗(yàn)的目的。前者與用來(lái)診斷現(xiàn)狀的測(cè)驗(yàn)有關(guān),后者與預(yù)測(cè)將來(lái)結(jié)果的測(cè)驗(yàn)有關(guān)。
一個(gè)好的效標(biāo)必須具備以下條件:
1必須能地反映測(cè)驗(yàn)的目標(biāo),即效標(biāo)測(cè)量本身必須有效;
2效標(biāo)必須具有較高的信度,穩(wěn)定可靠,不隨時(shí)間等因素變化;
3效標(biāo)可以客觀地加以測(cè)量,可用數(shù)據(jù)或等級(jí)來(lái)表示;
4效標(biāo)的測(cè)量的方法很簡(jiǎn)單,省時(shí)省力,經(jīng)濟(jì)實(shí)用。
2、效標(biāo)和效標(biāo)測(cè)量:效標(biāo),即衡量測(cè)驗(yàn)有效性的參照標(biāo)準(zhǔn),指的是可以直接而且獨(dú)立測(cè)量的我們感興趣的行為。我們感興趣的行為,就是要預(yù)測(cè)的行為,這是一個(gè)總的觀念,故必須以可操作的測(cè)量來(lái)確定才有實(shí)際意義。因此有必要把效標(biāo)細(xì)分為兩個(gè)層次,其一是理論水平的“觀念效標(biāo)”,其二是操作定義水平的“效標(biāo)測(cè)量”。
3、常用的效標(biāo)包括:
1學(xué)業(yè)成就:如在校成績(jī)、學(xué)歷、有關(guān)的獎(jiǎng)勵(lì)和榮譽(yù)、教師對(duì)學(xué)生智力的評(píng)定等,常作為智力測(cè)驗(yàn)的效標(biāo),也可作為某些多重能力傾向測(cè)驗(yàn)和人格測(cè)驗(yàn)的效標(biāo)。
2實(shí)際工作表現(xiàn):是最滿意的效標(biāo)測(cè)量,為一般智力測(cè)驗(yàn)、人格測(cè)驗(yàn)和一些能力傾向測(cè)驗(yàn)的效標(biāo);
3特殊訓(xùn)練成績(jī)
4精神病診斷;
5等級(jí)評(píng)定:是觀察者根據(jù)測(cè)驗(yàn)欲測(cè)量的心理特質(zhì)在被試身上的表現(xiàn)而作出的一種個(gè)人判斷;
6效標(biāo)團(tuán)體的比較:即找出兩個(gè)在效標(biāo)表現(xiàn)上有差別的團(tuán)體,比較他們?cè)跍y(cè)驗(yàn)分?jǐn)?shù)上的差別;
7先前有效的測(cè)驗(yàn):一個(gè)新測(cè)驗(yàn)與先前有效的測(cè)驗(yàn)的相關(guān)也經(jīng)常作為效度檢驗(yàn)的證據(jù)。(簡(jiǎn)答)
效度的表示方法
1、相關(guān)法:效度系數(shù)是最常用的效度指標(biāo),尤其是效標(biāo)效度。它是以皮爾遜積差相關(guān)系數(shù)來(lái)表示的,主要反映測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)測(cè)量的相關(guān)。當(dāng)測(cè)驗(yàn)成績(jī)是連續(xù)變量,而效標(biāo)資料是二分變量時(shí),計(jì)算效度系數(shù)可用點(diǎn)二列相關(guān)公式或二列相關(guān)公式;當(dāng)測(cè)驗(yàn)分?jǐn)?shù)為連續(xù)變量,效標(biāo)資料為等級(jí)評(píng)定時(shí),可用賈斯朋多系列相關(guān)公式計(jì)算。
2、區(qū)分法:是檢驗(yàn)測(cè)驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的一種方法。算出t值后,便可知道分?jǐn)?shù)的差異是否顯著。若差異顯著,說(shuō)明該測(cè)驗(yàn)?zāi)軌蛴行У貐^(qū)分由效標(biāo)定義的團(tuán)體,否則,測(cè)驗(yàn)是無(wú)效的。重疊百分比可以通過計(jì)算每一組內(nèi)得分超過(或低于)另一組平均數(shù)的人數(shù)百分比得出;另外,還可以計(jì)算兩組分布的共同區(qū)的百分比。重疊量越大,說(shuō)明兩組分?jǐn)?shù)差異越小,即測(cè)驗(yàn)的效度越差。
3、命中率法:是當(dāng)測(cè)驗(yàn)用來(lái)做取舍的依據(jù)時(shí),用其正確決定的比例作為效度指標(biāo)的一種方法。命中率的計(jì)算有兩種方法,一是計(jì)算總命中率,另一種是計(jì)算正命中率。
4、預(yù)期表法:是一種雙向表格,預(yù)測(cè)分?jǐn)?shù)排在表的左邊,效標(biāo)排在表的頂端。從左下至右上對(duì)角線上各百分?jǐn)?shù)字越大,而其它的百分?jǐn)?shù)字越小,表示測(cè)驗(yàn)的效標(biāo)效度越高;反之,數(shù)字越分散,則效度越低。
效度的應(yīng)用
1、預(yù)測(cè)誤差:效度系數(shù)的平方,統(tǒng)計(jì)學(xué)上稱這種指標(biāo)為決定系數(shù),表示測(cè)驗(yàn)正確預(yù)測(cè)或解釋的效標(biāo)的方差占總方差的比例。另一種表達(dá)方式是估計(jì)的標(biāo)準(zhǔn)誤,簡(jiǎn)寫為Sest,它是指所有具有某一測(cè)驗(yàn)分?jǐn)?shù)的被試其效標(biāo)分?jǐn)?shù)(Y)分布的標(biāo)準(zhǔn)差,也即預(yù)測(cè)誤差大小的估計(jì)值,(公式4-9)估計(jì)的標(biāo)注誤可如同其他標(biāo)準(zhǔn)誤一樣解釋。真正效標(biāo)分?jǐn)?shù)落在預(yù)測(cè)效標(biāo)分?jǐn)?shù)±1Sest的范圍內(nèi),有68%的可能性;落在預(yù)測(cè)效標(biāo)分?jǐn)?shù)±1.96Sest的范圍內(nèi),有95%的可能性;落在預(yù)測(cè)效標(biāo)分?jǐn)?shù)±2.58Sest的范圍內(nèi),有99%的可能性。
2、預(yù)測(cè)效標(biāo)分?jǐn)?shù):如果X與Y兩變量呈直線相關(guān),只要確定出二者間的回歸方程,就可以從一個(gè)變量推估出來(lái)另一個(gè)變量。在測(cè)驗(yàn)工作中,人們感興趣的是從測(cè)驗(yàn)分?jǐn)?shù)預(yù)測(cè)效標(biāo)成績(jī)。
3、預(yù)測(cè)效標(biāo)指數(shù):公式4-9中的又稱作無(wú)關(guān)系數(shù),以K表示之,K值大小表明預(yù)測(cè)源分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)無(wú)關(guān)的程度。(1-K)可作為預(yù)測(cè)效率的指數(shù),用E表示:E=100(1-K)(公式4-15)E值大小表明使用測(cè)驗(yàn)比盲目猜測(cè)能減少多少誤差。
測(cè)驗(yàn)本身的因素
1、測(cè)驗(yàn)題目的質(zhì)量
2、測(cè)驗(yàn)的長(zhǎng)度。(一般而言,增加測(cè)驗(yàn)的長(zhǎng)度通??梢蕴岣邷y(cè)驗(yàn)的信度,而信度又制約著效度,因此增加測(cè)驗(yàn)的長(zhǎng)度也能提高測(cè)驗(yàn)的效度。)
測(cè)驗(yàn)實(shí)施中的干擾因素
1、主試的影響因素。測(cè)驗(yàn)實(shí)施過程中主試的因素會(huì)影響效度。對(duì)于效標(biāo)效度,測(cè)驗(yàn)與效標(biāo)二者實(shí)施時(shí)間間隔時(shí)間越長(zhǎng),測(cè)驗(yàn)與效標(biāo)越容易受到很多機(jī)遇因素的影響,因此所求的相關(guān)必然很低。測(cè)驗(yàn)情鏡,如場(chǎng)地的布置、材料的準(zhǔn)備、測(cè)驗(yàn)場(chǎng)所有無(wú)噪音和其他干擾因素等也會(huì)影響到測(cè)驗(yàn)的效度。
2、被試的影響因素。被試在測(cè)驗(yàn)時(shí)的興趣、動(dòng)機(jī)、情緒、態(tài)度和身心狀況、健康狀態(tài)等都會(huì)影響測(cè)驗(yàn)的效度。(被試的反應(yīng)定勢(shì)也會(huì)降低測(cè)驗(yàn)的效度。)
樣本團(tuán)體的性質(zhì)
1、樣本團(tuán)體的異質(zhì)性。與信度系數(shù)一樣,如果其它條件相同,樣本團(tuán)體越同質(zhì),分?jǐn)?shù)分布范圍越小,測(cè)驗(yàn)效度就越低;樣本團(tuán)體越異質(zhì),分?jǐn)?shù)分布范圍越大測(cè)驗(yàn)效度就越高。(1)只以選拔上的被試為樣本團(tuán)體參加效度研究,降低了測(cè)驗(yàn)的效度。(2)選拔標(biāo)準(zhǔn)太高,樣本團(tuán)體的同質(zhì)性增高,降低了測(cè)驗(yàn)的效度。
2、干涉變量。樣本團(tuán)體的性質(zhì)對(duì)效度的影響還表現(xiàn)在:對(duì)于同性質(zhì)的團(tuán)體,同一測(cè)驗(yàn)的效度會(huì)有很大的不同。這些樣本團(tuán)體的特質(zhì)包括:年齡、性別、教育水平、智力、動(dòng)機(jī)、職業(yè)和任何有關(guān)的特征。由于這寫特征的影響,使得測(cè)驗(yàn)對(duì)于不同的團(tuán)體具有不同的預(yù)測(cè)能力,故測(cè)量學(xué)上稱這些特征為干涉變量。
吉賽利提出的如何找出干涉變量的一套方法:
①用回歸方程求得每個(gè)人的預(yù)測(cè)效標(biāo)分?jǐn)?shù),將該分?jǐn)?shù)與實(shí)際效標(biāo)分?jǐn)?shù)想比較,獲得差異分?jǐn)?shù)D.如果D的絕對(duì)值很大,說(shuō)明測(cè)驗(yàn)中可能存在干涉變量。
②根據(jù)樣本團(tuán)體的組成分析,找出對(duì)照組,分別計(jì)算效度,從而象上述關(guān)于出租汽車司機(jī)的例子一樣,找出干涉變量。
③對(duì)于欲測(cè)團(tuán)體,根據(jù)某些易見的干涉變量將其區(qū)分為預(yù)測(cè)性高和預(yù)測(cè)性低的兩個(gè)亞團(tuán)體。對(duì)于預(yù)測(cè)性高的團(tuán)體,獲得的測(cè)驗(yàn)效度會(huì)有所提高。
效標(biāo)的性質(zhì)
(1)效標(biāo)與測(cè)驗(yàn)分?jǐn)?shù)之間的關(guān)系是否線性關(guān)系是一個(gè)很重要的因素。皮爾遜劑差相關(guān)系數(shù)的前題是假設(shè)兩個(gè)變量的關(guān)系是線性的分布。
(2)效標(biāo)測(cè)量本身的可靠性如何亦是值得考慮的一個(gè)問題。