教師考試教育學教育概論:學習評價手段(二)

字號:

一個高質(zhì)量的成績測試指標包括信度、效度、難度和區(qū)分度。
    (一)信度
    信度是指一個測驗所測結(jié)果的可靠性和穩(wěn)定性。如果一個測驗對同一組考生多次進行,或用另一組等值試題對同一組考生進行測驗,結(jié)果比較一致,比較穩(wěn)定,那么可以說這個測驗是高信度的,它客觀、準確地反映了學生的成績。
    影響測驗信度的因素主要是測驗的題量,試題對教學知識的覆蓋程度、分數(shù)的分布、試題指#教師資格考試# #教師考試教育學教育概論:學習評價手段(二)#和被試者的臨場狀態(tài)等。因此,提高測驗的信度首先要對試題進行精心的設(shè)計。適當加大題量,使試題能對科學知識點有較均勻的覆蓋;分布在每個小題上的分數(shù)要均勻;試題的指#教師資格考試# #教師考試教育學教育概論:學習評價手段(二)#要清楚、易懂;使學生有適當?shù)木o張度,但不要有太大的心理壓力。
    (二)效度
    效度是指一個測驗能夠正確地測出它所要測量的東西的程度。效度體現(xiàn)了測驗結(jié)果與測驗目標之間的相關(guān)程度,而測驗又是通過一定的測驗內(nèi)容來反映測驗結(jié)果與測驗目標之間的關(guān)系的,因此,提高測驗的效度要注意兩個層次的問題:一是測驗的目標要明確,是要考核學生對學科知識的掌握,還是要考核學生應用知識的能力、組織材料的能力、邏輯推理的能力;是要考核學生對于基礎(chǔ)知識、基本技能的掌握,還是要考核有關(guān)的能力,或者二者兼而有之。二是試題的設(shè)計要能有效地體現(xiàn)測驗目標。首先是題型的設(shè)計,客觀性試題一般用來考核學生對知識的掌握情況,非客觀性試題則主要用來考核學生對材料的組織能力,對知識的應用能力、邏輯推理能力、發(fā)散性思維能力等。其次是題目的編制,如果數(shù)學測驗的題目文字艱深,就會影響語文水平較差的學生的成績,就不能有效地測出學生的數(shù)學成績。
    檢驗測驗的效度和信度可通過求算效度系數(shù)、信度系數(shù)等量化指標進行。
    (三)難度
    難度是指試題的難易程度,是試題對學生的知識、能力水平適合程度的指標。難度值通常用答對該題的人數(shù)比例即來表示,它可以用下列公式計算:
    難度值的取值范圍是[0,1],難度值越大,意味著題目越容易;難度值越小,意味著題目越難。
    對試題難度的分析是一種很好的教學反饋。例如:一項對55人進行的數(shù)學測驗,其中第1,3,5,7,9題的和難度值統(tǒng)計如下:
    (P)=答對的人數(shù)(R)/考試總?cè)藬?shù)(N)
    表9-2試題難度值表
    題目 正確解答人數(shù) 難度值
    1 40 0.72
    3 44 0.8
    5 0 0
    7 55 1
    9 26 0.48
    從表9-2的結(jié)果可以看出,第5題太難,沒有一個人能正確解答,無法區(qū)分學生成績的優(yōu)劣,不能作為鑒別學生學業(yè)成績的試題。
    對這道題應當做進一步的分析。第7題則太容易,55人都答對了。如果是常模參照測驗則無法確定學生成績在群體中的位置,應該剔除此題。如果是目標參照測驗,則說明學生都掌握了與此題相關(guān)的教學內(nèi)容。第1題和第9題的難度比較適中,能對學生的成績進行區(qū)分。對于正態(tài)分布的成績而言,試題的平均難度應為 0.5左右,其中應當包括一些較易和較難的題。
    (四)區(qū)分度
    區(qū)分度是指試題對學生成績的區(qū)分程度,也就是試題對不同學生成績的鑒別程度。一般來說,試題應當有良好的區(qū)分度,以發(fā)現(xiàn)學生各自存在的問題,便于教師的教學回涉。標準化考試的區(qū)分度應當在0.3以上。
    難度和區(qū)分度是對試題分析的重要指標,也是兩個有著密切關(guān)系的因素。區(qū)分度的提高,主要是通過控制試題的難度達到的。如果題目太難,優(yōu)生和差生都答不出來,就沒有區(qū)分度;如果題目太容易,學生都能答出來,同樣沒有區(qū)分度。難度適中,區(qū)分度才高。在不同的考試中,對難度和區(qū)分度的要求是不同的。常模參照測驗要確定考生的相對等級,0.5的難度是的區(qū)分度;目標參照測驗或教師自編試題測驗,則應以教學目標為準,不分追求區(qū)分度而加大試題的難度。