數(shù)據特征的測度
1.集中趨勢的測度
眾數(shù):一組數(shù)據中出現(xiàn)次數(shù)最多的變量值;它是一個位置代表值,特點是不受數(shù)據中極端值的影響
中位數(shù):是一組數(shù)據按一定順序排序后,處于中間位置上的數(shù)值。當數(shù)值個數(shù)為奇數(shù)時,取中間位置的數(shù);當數(shù)值個數(shù)為偶數(shù)時,取中間位置兩個數(shù)的均值。
它將全部數(shù)據等分成兩部分,也是一個位置代表值,其特點是不受極端值的影響,在研究收入分配時很有用
單選(2004年試題):2003年,某市下轄六個縣的棉花種植面積按規(guī)模由小到大依次為800公頃、900公頃、1100公頃、1400公頃、1500公頃、3000公頃,這六個縣棉花種植面積的中位數(shù)是()公頃。
A,1450
B,1250
C,1100
D,1400
答案:B
解析:變量值一共有6個,偶數(shù)個,中位數(shù)為最中間兩個數(shù)的平均數(shù),即第三和第四個數(shù)的平均數(shù),為1/2*(1100+1400)= 1250。
算術平均數(shù):也稱均值,是全部數(shù)據的算術平均。它是集中趨勢的最主要測度值。
簡單均值:等于所有數(shù)值相加之和 / 數(shù)值個數(shù);加權均值:(各組組中值*各組頻數(shù)) / 頻數(shù)之和。
均值是一組數(shù)據的重心所在,是數(shù)據誤差相互抵消后的必然結果,反映出事物必然性的數(shù)量特征。其缺點是容易受極端值的影響
幾何平均數(shù):將一組中n個數(shù)據連乘后再開n次方。是適用于特殊數(shù)據的一種平均數(shù),主要用于計算比率或速度的平均。實踐中,主要用于計算社會經濟現(xiàn)象的平均發(fā)展速度
2.離散程度的測度
標準差:各變量與其均值離差平方和的平均數(shù)的平方根,它是數(shù)測量數(shù)據離散程度的最主要方法,也是實際中應用最廣泛的離散程度測度值。在對社會經濟現(xiàn)象進行分析是主要使用標準差。
例:一組5個數(shù)據, 1、2、3、4、5,求其標準差。
解:先求均值等于(1+2+3+4+5)/ 5 =3;
再求離差,分別為:(1-3)=-2,(2-3)=-1,(3-3)=0,(4-3)=1,(5-3)=2。
離差平方,分別為:4,1,0,1,4。離差平方和等于4+1+0+1+4=10
離差平方和的平均數(shù):10/5=2,所以方差為2
把2開平方,即得標準差。
離散系數(shù):一組數(shù)據的標準差與其相應的均值之比,是測度數(shù)據離散程度的相對指標,其作用主要是用于比較不同組別數(shù)據的離散程度。
上例中,離散系數(shù)等于2的平方根除以3。
單選(2004年試題):某學校學生的平均年齡為20歲,標準差為3歲;該校教師的平均年齡為38歲,標準差為3歲。比較該校學生年齡和教師年齡的離散程度,則()
A,學生年齡和教師年齡的離散程度相同
B,教師年齡的離散程度大一些
C,教師年齡的離散程度是學生年齡離散程度的1.9倍
D,學生年齡的離散程度大一些
答案:D
解析:比較不同組別數(shù)據的離散程度應該用離散系數(shù)。學生年齡的離散系數(shù)為(3/20),教師年齡的離散系數(shù)為(3/38),學生年齡的離散系數(shù)要大一些。
多選(2005年多選)下列數(shù)據特征的測度值中,易受極端值影響的有( )。
A.加權算術平均數(shù)
B.簡單算術平均數(shù)
C.極差
D.眾數(shù)
E.中位數(shù)
答案:ABC
1.集中趨勢的測度
眾數(shù):一組數(shù)據中出現(xiàn)次數(shù)最多的變量值;它是一個位置代表值,特點是不受數(shù)據中極端值的影響
中位數(shù):是一組數(shù)據按一定順序排序后,處于中間位置上的數(shù)值。當數(shù)值個數(shù)為奇數(shù)時,取中間位置的數(shù);當數(shù)值個數(shù)為偶數(shù)時,取中間位置兩個數(shù)的均值。
它將全部數(shù)據等分成兩部分,也是一個位置代表值,其特點是不受極端值的影響,在研究收入分配時很有用
單選(2004年試題):2003年,某市下轄六個縣的棉花種植面積按規(guī)模由小到大依次為800公頃、900公頃、1100公頃、1400公頃、1500公頃、3000公頃,這六個縣棉花種植面積的中位數(shù)是()公頃。
A,1450
B,1250
C,1100
D,1400
答案:B
解析:變量值一共有6個,偶數(shù)個,中位數(shù)為最中間兩個數(shù)的平均數(shù),即第三和第四個數(shù)的平均數(shù),為1/2*(1100+1400)= 1250。
算術平均數(shù):也稱均值,是全部數(shù)據的算術平均。它是集中趨勢的最主要測度值。
簡單均值:等于所有數(shù)值相加之和 / 數(shù)值個數(shù);加權均值:(各組組中值*各組頻數(shù)) / 頻數(shù)之和。
均值是一組數(shù)據的重心所在,是數(shù)據誤差相互抵消后的必然結果,反映出事物必然性的數(shù)量特征。其缺點是容易受極端值的影響
幾何平均數(shù):將一組中n個數(shù)據連乘后再開n次方。是適用于特殊數(shù)據的一種平均數(shù),主要用于計算比率或速度的平均。實踐中,主要用于計算社會經濟現(xiàn)象的平均發(fā)展速度
2.離散程度的測度
標準差:各變量與其均值離差平方和的平均數(shù)的平方根,它是數(shù)測量數(shù)據離散程度的最主要方法,也是實際中應用最廣泛的離散程度測度值。在對社會經濟現(xiàn)象進行分析是主要使用標準差。
例:一組5個數(shù)據, 1、2、3、4、5,求其標準差。
解:先求均值等于(1+2+3+4+5)/ 5 =3;
再求離差,分別為:(1-3)=-2,(2-3)=-1,(3-3)=0,(4-3)=1,(5-3)=2。
離差平方,分別為:4,1,0,1,4。離差平方和等于4+1+0+1+4=10
離差平方和的平均數(shù):10/5=2,所以方差為2
把2開平方,即得標準差。
離散系數(shù):一組數(shù)據的標準差與其相應的均值之比,是測度數(shù)據離散程度的相對指標,其作用主要是用于比較不同組別數(shù)據的離散程度。
上例中,離散系數(shù)等于2的平方根除以3。
單選(2004年試題):某學校學生的平均年齡為20歲,標準差為3歲;該校教師的平均年齡為38歲,標準差為3歲。比較該校學生年齡和教師年齡的離散程度,則()
A,學生年齡和教師年齡的離散程度相同
B,教師年齡的離散程度大一些
C,教師年齡的離散程度是學生年齡離散程度的1.9倍
D,學生年齡的離散程度大一些
答案:D
解析:比較不同組別數(shù)據的離散程度應該用離散系數(shù)。學生年齡的離散系數(shù)為(3/20),教師年齡的離散系數(shù)為(3/38),學生年齡的離散系數(shù)要大一些。
多選(2005年多選)下列數(shù)據特征的測度值中,易受極端值影響的有( )。
A.加權算術平均數(shù)
B.簡單算術平均數(shù)
C.極差
D.眾數(shù)
E.中位數(shù)
答案:ABC