對統(tǒng)計數據特征的測度,主要從三個方面進行:一是分布的集中趨勢,反映各數據向其中心值靠攏或聚集的程度;二是分布的離散程度,反映各數據遠離其中心值的趨勢;三是分布的偏態(tài)和峰度,反映數據分布的形狀。
一、 集中趨勢的測度
集中趨勢是指一組數據向某一中心值靠攏的傾向,測度集中趨勢也就是尋找數據一般水平的代表值或中心值。集中趨勢的測度,主要包括位置平均數和數值平均數。位置平均數是指按數據的大小順序或出現(xiàn)頻數的多少確定的集中趨勢的代表值,主要有眾數、中位數等;數值平均數是指根據全部數據計算出來的平均數,主要有算術平均數、幾何平均數等。
(一) 眾數
眾數是一組數據中出現(xiàn)頻數最多的那個數值,用M0表示。
例如,一家連鎖店超市的10個分店某月的銷售額(單位:萬元)分別為:
61 65 73 78 80 80 80 80 96 97
這10個分店月銷售額的眾數為M0=80萬元
用眾數反映集中趨勢,非常直觀,不僅適用于品質數據,也適用于數值型數據。眾數是一個位置代表值,不受極端值的影響,抗干擾性強。
(二) 中位數
把一組數據按從小到大的順序進行排列,位置居中的數值叫做中位數,用Me表示。
未分組數據計算中位數時,要先對數據進行排序,然后確定中位數的位置,其公式為:
中位數位置=(n+1)/2,式中n為數據的個數。最后確定中位數的具體數值。
當n為奇數時,中間位置上的數就是該數列的中位數;
當n為偶數時,是中間位置上兩個數的平均數。
例如,某地級市下轄9個縣,每個縣的面積如下(單位:平方公里),計算該市下轄縣面積的中位數:
1455 2019 912 1016 1352 1031 2128 1075 2000
首先,將上面的數據排序,結果如下:
912 1016 1031 1075 1352 1455 2000 2019 2128
中位數位置=(9+1)/2=5,中位數為1352,即Me=1352(平方公里)
如上題中,行政區(qū)劃調整后,該市現(xiàn)在下轄10個縣,該市下轄縣的面積(單位:平方公里)從小到大依次為:
912 1000 1016 1031 1075 1352 1455 2000 2019 2128
則中位數=(10+1)/2=5.5,Me=(1075+1352)/2=1213.5(平方公里)
中位數主要用于順序數據,也適用于數值型數據,但不適用于分類數據。中位數也是一個位置代表值,不受極端值的影響,抗干擾性強。
一、 集中趨勢的測度
集中趨勢是指一組數據向某一中心值靠攏的傾向,測度集中趨勢也就是尋找數據一般水平的代表值或中心值。集中趨勢的測度,主要包括位置平均數和數值平均數。位置平均數是指按數據的大小順序或出現(xiàn)頻數的多少確定的集中趨勢的代表值,主要有眾數、中位數等;數值平均數是指根據全部數據計算出來的平均數,主要有算術平均數、幾何平均數等。
(一) 眾數
眾數是一組數據中出現(xiàn)頻數最多的那個數值,用M0表示。
例如,一家連鎖店超市的10個分店某月的銷售額(單位:萬元)分別為:
61 65 73 78 80 80 80 80 96 97
這10個分店月銷售額的眾數為M0=80萬元
用眾數反映集中趨勢,非常直觀,不僅適用于品質數據,也適用于數值型數據。眾數是一個位置代表值,不受極端值的影響,抗干擾性強。
(二) 中位數
把一組數據按從小到大的順序進行排列,位置居中的數值叫做中位數,用Me表示。
未分組數據計算中位數時,要先對數據進行排序,然后確定中位數的位置,其公式為:
中位數位置=(n+1)/2,式中n為數據的個數。最后確定中位數的具體數值。
當n為奇數時,中間位置上的數就是該數列的中位數;
當n為偶數時,是中間位置上兩個數的平均數。
例如,某地級市下轄9個縣,每個縣的面積如下(單位:平方公里),計算該市下轄縣面積的中位數:
1455 2019 912 1016 1352 1031 2128 1075 2000
首先,將上面的數據排序,結果如下:
912 1016 1031 1075 1352 1455 2000 2019 2128
中位數位置=(9+1)/2=5,中位數為1352,即Me=1352(平方公里)
如上題中,行政區(qū)劃調整后,該市現(xiàn)在下轄10個縣,該市下轄縣的面積(單位:平方公里)從小到大依次為:
912 1000 1016 1031 1075 1352 1455 2000 2019 2128
則中位數=(10+1)/2=5.5,Me=(1075+1352)/2=1213.5(平方公里)
中位數主要用于順序數據,也適用于數值型數據,但不適用于分類數據。中位數也是一個位置代表值,不受極端值的影響,抗干擾性強。