數據特征的測度

字號:

數據特征的測度
     1.集中趨勢的測度
    眾數:一組數據中出現(xiàn)次數最多的變量值;它是一個位置代表值,特點是不受數據中極端值的影響
    中位數:是一組數據按一定順序排序后,處于中間位置上的數值。當數值個數為奇數時,取中間位置的數;當數值個數為偶數時,取中間位置兩個數的均值。
    它將全部數據等分成兩部分,也是一個位置代表值,其特點是不受極端值的影響,在研究收入分配時很有用
    單選(2004年試題):2003年,某市下轄六個縣的棉花種植面積按規(guī)模由小到大依次為800公頃、900公頃、1100公頃、1400公頃、1500公頃、3000公頃,這六個縣棉花種植面積的中位數是()公頃。
    A,1450
    B,1250
    C,1100
    D,1400
    答案:B
    解析:變量值一共有6個,偶數個,中位數為最中間兩個數的平均數,即第三和第四個數的平均數,為1/2*(1100+1400)= 1250。
    算術平均數:也稱均值,是全部數據的算術平均。它是集中趨勢的最主要測度值。
    簡單均值:等于所有數值相加之和 / 數值個數;加權均值:(各組組中值*各組頻數) / 頻數之和。
    均值是一組數據的重心所在,是數據誤差相互抵消后的必然結果,反映出事物必然性的數量特征。其缺點是容易受極端值的影響
    幾何平均數:將一組中n個數據連乘后再開n次方。是適用于特殊數據的一種平均數,主要用于計算比率或速度的平均。實踐中,主要用于計算社會經濟現(xiàn)象的平均發(fā)展速度
    2.離散程度的測度
    標準差:各變量與其均值離差平方和的平均數的平方根,它是數測量數據離散程度的最主要方法,也是實際中應用最廣泛的離散程度測度值。在對社會經濟現(xiàn)象進行分析是主要使用標準差。
    例:一組5個數據, 1、2、3、4、5,求其標準差。
    解:先求均值等于(1+2+3+4+5)/ 5 =3;
    再求離差,分別為:(1-3)=-2,(2-3)=-1,(3-3)=0,(4-3)=1,(5-3)=2。
    離差平方,分別為:4,1,0,1,4。離差平方和等于4+1+0+1+4=10
    離差平方和的平均數:10/5=2,所以方差為2
    把2開平方,即得標準差。
    離散系數:一組數據的標準差與其相應的均值之比,是測度數據離散程度的相對指標,其作用主要是用于比較不同組別數據的離散程度。
     上例中,離散系數等于2的平方根除以3。
    單選(2004年試題):某學校學生的平均年齡為20歲,標準差為3歲;該校教師的平均年齡為38歲,標準差為3歲。比較該校學生年齡和教師年齡的離散程度,則()
    A,學生年齡和教師年齡的離散程度相同
    B,教師年齡的離散程度大一些
    C,教師年齡的離散程度是學生年齡離散程度的1.9倍
    D,學生年齡的離散程度大一些
    答案:D
    解析:比較不同組別數據的離散程度應該用離散系數。學生年齡的離散系數為(3/20),教師年齡的離散系數為(3/38),學生年齡的離散系數要大一些。
    多選(2005年多選)下列數據特征的測度值中,易受極端值影響的有( )。
    A.加權算術平均數
    B.簡單算術平均數
    C.極差
    D.眾數
    E.中位數
    答案:ABC