第十二章 資料的統(tǒng)計分析
資料分析包括統(tǒng)計分析、邏輯和理論分析。統(tǒng)計分析又分為:描述性統(tǒng)計、推論性統(tǒng)計。
一 統(tǒng)計分析的必要性與特點
1、統(tǒng)計分析是運用統(tǒng)計學(xué)方法對調(diào)查得到的數(shù)據(jù)資料進行定量分析,以揭示事物內(nèi)在的數(shù)量關(guān)系、規(guī)律和發(fā)展趨勢。它是人們認識社會現(xiàn)象的重要手段。
2、定性預(yù)測:根據(jù)事實,運用經(jīng)驗和判斷能力,邏輯思維方法進行的預(yù)測。
3、定量預(yù)測:根據(jù)數(shù)據(jù)、統(tǒng)計資料,運用統(tǒng)計分析方法進行的預(yù)測。
4、統(tǒng)計分析的必要性表現(xiàn)在一下幾個方面:
(1)統(tǒng)計分析的方法可以為我們的研究提供一種清晰準確的形式化語言
(2)統(tǒng)計分析是進行科學(xué)預(yù)測,探索未來的重要方法
(3)新的調(diào)查方法和技術(shù)要求運用統(tǒng)計分析的方法
5、統(tǒng)計分析的特點:
(1)統(tǒng)計分析要以定性分析為基礎(chǔ)(定性分析要為定量分析規(guī)定方向)
(2)統(tǒng)計分析方法必須和其他分析方法結(jié)合運用
(3)統(tǒng)計分析有一套專門的方法和技術(shù)
二 集中量數(shù)分析
1、集中量數(shù)(集中趨勢):是一組數(shù)據(jù)的代表值,代表著現(xiàn)象的一般水平。用以說明某一社會現(xiàn)象的一般狀態(tài)或平均狀態(tài)。
2、集中量數(shù)對不同層次的變量描述應(yīng)使用不同的統(tǒng)計量:
(1)對定類變量,用“眾數(shù)”
(2)對定序變量,用“中位數(shù)”
(3)對定距變量,用“算術(shù)平均數(shù)”,也可以用“中位數(shù)”
3、集中量數(shù)的作用:
(1)說明某一社會現(xiàn)象在一定條件下,其數(shù)量的一般水平
(2)對于在不同空間的同類現(xiàn)象進行比較
(3)對一定社會現(xiàn)象在不同時間中的變化進行比較
(4)分析某些社會現(xiàn)象之間的依存關(guān)系
4、眾數(shù)是指在一組數(shù)據(jù)中重復(fù)次數(shù)最多的標志值。
計算:
(1)單項分組數(shù)據(jù)資料計算眾數(shù)的方法比較簡單,一般采用直接觀察法即可
書本328頁,表12-3 直接觀察出現(xiàn)次數(shù)最多的標志值是30,即某村青年文化程度的眾數(shù)是小學(xué)文化程度
(2)計算組距分組資料的眾數(shù),一種是組中值法,另一種是摘補法
L+U
組中值法:眾數(shù)= 2 ,L、U分別代表出現(xiàn)次數(shù)最多組的組上限和組下限。
計算眾數(shù)是要有條件的。只有在總體單位數(shù)量較多并且有明顯集中趨勢的資料才能計算眾數(shù)。
5中位數(shù)(位置平均數(shù))是把調(diào)查到的資料按照標志值的大小順序排列,處于中央位置的標志值表示中間位置的平均數(shù)。
計算:
(1)原始數(shù)據(jù)計算中位數(shù)
n+1
中位數(shù)位次= 2 n代表總體單位數(shù)。按中位數(shù)位次找出這個標志值就是中位數(shù)。
(2)單項分組資料計算中位數(shù)
n+1
中位數(shù)位次= 2 然后順著累計次數(shù)找到中位數(shù)位次值所在的組,該組的標志值就是中位數(shù)
(3)組距分組資料計算中位數(shù)
a先用 Sf 公式確定中位數(shù)所在組的位置,然后用下限公式計算中位數(shù)的值
2
b下限公式:
Md為中位數(shù),L為中位數(shù)所在組的下限,fm為中位數(shù)所在組的次數(shù),cfm-1為中位數(shù)所在組以下的累積次數(shù),Sf為累計數(shù),i為中位數(shù)所在組的組距。
6算術(shù)平均數(shù)是以總體各單位數(shù)值之和除以總體單位總數(shù)的商。
計算:
(1)簡單算術(shù)平均數(shù)的計算
(2)加權(quán)算術(shù)平均數(shù)的計算(單項分組資料求算術(shù)平均數(shù)的計算)
當(dāng)使用第二手資料的統(tǒng)計表計算平均數(shù)的時候,要用加權(quán)平均數(shù)法進行計算
其中f為權(quán)數(shù),即變量在總體中出現(xiàn)的次數(shù)。書本325頁
(3)組距分組資料計算算術(shù)平均數(shù)
a:先計算出組中距
下組距+上組距
Xmid= 2
b:
書本326頁。
三 離中量數(shù)分析
1、離中量數(shù)(差異量數(shù))用以說明調(diào)查對象在某一變量上的分散程度或差異幅度。
2、離中量數(shù)的作用:
(1)描述一組數(shù)據(jù)的差異情況
(2)對集中量數(shù)的代表性作補充說明,差異量數(shù)越小,集中量數(shù)的代表性越大
3、常用的離中量數(shù)有:異眾比率、四分位差、標準差。
4、相對差異量數(shù):離散系數(shù)、標準分數(shù)
四 相關(guān)與回歸分析
1、相關(guān)和回歸可分為單相關(guān)、一元回歸和多元相關(guān)、多元回歸
2、雙變量相關(guān)分析的作用是探尋兩個變量間的相關(guān)關(guān)系,不涉及兩個變量間有無因果關(guān)系,只是對客觀事務(wù)的一種描述。相關(guān)關(guān)系是一種非完全確定的關(guān)系,它只表示事物間的相互依存關(guān)系。雙變量間關(guān)系的精確度量通常使用相關(guān)系數(shù),定距變量是用皮爾遜系數(shù)(r),r的取值范圍-1~+1,r=0是不相關(guān),r絕對值=1是完全相關(guān)。r的大小分高度相關(guān)、中度相關(guān)、低度相關(guān)。
3、散點圖的六種圖形:
(1) 強正相關(guān) (2)弱正相關(guān) (3)強負相關(guān) (4)弱負相關(guān) (5)非線形相關(guān) (6)沒有相關(guān)關(guān)系或極弱的相關(guān)關(guān)系
4、回歸分析的作用是精確預(yù)測自變量的變化后因變量會改變多少,前提是兩變量有相關(guān)關(guān)系。從本質(zhì)上說回歸分析具有推理的性質(zhì),可以進行預(yù)測。是一種因果關(guān)系但不同于相關(guān)關(guān)系的雙向性,它是單向的,這種因果關(guān)系不能顛倒。
5、回歸方程式表示為:y=a+bx
五 推論統(tǒng)計
1、描述性統(tǒng)計是依據(jù)樣本資料計算樣本的統(tǒng)計值
2、推論統(tǒng)計研究如何將樣本的統(tǒng)計值推論為總體的參數(shù)值。
3、推論統(tǒng)計主要有兩種方法,即區(qū)間估計和假設(shè)檢驗。
習(xí)題
1、統(tǒng)計分析方法不僅是對客觀現(xiàn)象數(shù)量關(guān)系描述的工具,還是進行科學(xué)抽象的思維方法。它使人們能夠發(fā)現(xiàn)靠直覺不能領(lǐng)悟到的規(guī)律,進行準確的科學(xué)預(yù)測。
2、統(tǒng)計分析包括:
(1)描述性統(tǒng)計:說明由樣本資料所表示的事物內(nèi)在的數(shù)量特征和數(shù)量關(guān)系
(2)推論性統(tǒng)計:的目的是根據(jù)樣本資料對總體進行推理
3、統(tǒng)計分析還可以分為單變量分析、雙變量分析和多變量分析。
4、統(tǒng)計分析的數(shù)字成果是運用數(shù)學(xué)模型來描述、解釋、預(yù)測社會現(xiàn)象。
5、單變量分析是要描述一個現(xiàn)象的分布狀態(tài)的集中趨勢(或一般狀態(tài))和離中趨勢(或差異狀態(tài))。
6、中位數(shù)可以用于定距變量和定序變量的計算
7、中位數(shù)主要應(yīng)用于非數(shù)值的定序測量資料中,因為社會調(diào)查中有許多資料屬于定序測量,所要它的應(yīng)用比算術(shù)平均數(shù)更為廣泛,這正是它的長處。
8、通常把概率不超過0.05或0.01的事件當(dāng)作“小概率事件”,也稱為顯著性水平。
9、集中量數(shù)、離中量數(shù)、相關(guān)量數(shù)、回歸量數(shù)都屬于描述性統(tǒng)計內(nèi)容。
10、可以表明原始數(shù)據(jù)在總體分布中相對位置的是標準分數(shù)
資料分析包括統(tǒng)計分析、邏輯和理論分析。統(tǒng)計分析又分為:描述性統(tǒng)計、推論性統(tǒng)計。
一 統(tǒng)計分析的必要性與特點
1、統(tǒng)計分析是運用統(tǒng)計學(xué)方法對調(diào)查得到的數(shù)據(jù)資料進行定量分析,以揭示事物內(nèi)在的數(shù)量關(guān)系、規(guī)律和發(fā)展趨勢。它是人們認識社會現(xiàn)象的重要手段。
2、定性預(yù)測:根據(jù)事實,運用經(jīng)驗和判斷能力,邏輯思維方法進行的預(yù)測。
3、定量預(yù)測:根據(jù)數(shù)據(jù)、統(tǒng)計資料,運用統(tǒng)計分析方法進行的預(yù)測。
4、統(tǒng)計分析的必要性表現(xiàn)在一下幾個方面:
(1)統(tǒng)計分析的方法可以為我們的研究提供一種清晰準確的形式化語言
(2)統(tǒng)計分析是進行科學(xué)預(yù)測,探索未來的重要方法
(3)新的調(diào)查方法和技術(shù)要求運用統(tǒng)計分析的方法
5、統(tǒng)計分析的特點:
(1)統(tǒng)計分析要以定性分析為基礎(chǔ)(定性分析要為定量分析規(guī)定方向)
(2)統(tǒng)計分析方法必須和其他分析方法結(jié)合運用
(3)統(tǒng)計分析有一套專門的方法和技術(shù)
二 集中量數(shù)分析
1、集中量數(shù)(集中趨勢):是一組數(shù)據(jù)的代表值,代表著現(xiàn)象的一般水平。用以說明某一社會現(xiàn)象的一般狀態(tài)或平均狀態(tài)。
2、集中量數(shù)對不同層次的變量描述應(yīng)使用不同的統(tǒng)計量:
(1)對定類變量,用“眾數(shù)”
(2)對定序變量,用“中位數(shù)”
(3)對定距變量,用“算術(shù)平均數(shù)”,也可以用“中位數(shù)”
3、集中量數(shù)的作用:
(1)說明某一社會現(xiàn)象在一定條件下,其數(shù)量的一般水平
(2)對于在不同空間的同類現(xiàn)象進行比較
(3)對一定社會現(xiàn)象在不同時間中的變化進行比較
(4)分析某些社會現(xiàn)象之間的依存關(guān)系
4、眾數(shù)是指在一組數(shù)據(jù)中重復(fù)次數(shù)最多的標志值。
計算:
(1)單項分組數(shù)據(jù)資料計算眾數(shù)的方法比較簡單,一般采用直接觀察法即可
書本328頁,表12-3 直接觀察出現(xiàn)次數(shù)最多的標志值是30,即某村青年文化程度的眾數(shù)是小學(xué)文化程度
(2)計算組距分組資料的眾數(shù),一種是組中值法,另一種是摘補法
L+U
組中值法:眾數(shù)= 2 ,L、U分別代表出現(xiàn)次數(shù)最多組的組上限和組下限。
計算眾數(shù)是要有條件的。只有在總體單位數(shù)量較多并且有明顯集中趨勢的資料才能計算眾數(shù)。
5中位數(shù)(位置平均數(shù))是把調(diào)查到的資料按照標志值的大小順序排列,處于中央位置的標志值表示中間位置的平均數(shù)。
計算:
(1)原始數(shù)據(jù)計算中位數(shù)
n+1
中位數(shù)位次= 2 n代表總體單位數(shù)。按中位數(shù)位次找出這個標志值就是中位數(shù)。
(2)單項分組資料計算中位數(shù)
n+1
中位數(shù)位次= 2 然后順著累計次數(shù)找到中位數(shù)位次值所在的組,該組的標志值就是中位數(shù)
(3)組距分組資料計算中位數(shù)
a先用 Sf 公式確定中位數(shù)所在組的位置,然后用下限公式計算中位數(shù)的值
2
b下限公式:
Md為中位數(shù),L為中位數(shù)所在組的下限,fm為中位數(shù)所在組的次數(shù),cfm-1為中位數(shù)所在組以下的累積次數(shù),Sf為累計數(shù),i為中位數(shù)所在組的組距。
6算術(shù)平均數(shù)是以總體各單位數(shù)值之和除以總體單位總數(shù)的商。
計算:
(1)簡單算術(shù)平均數(shù)的計算
(2)加權(quán)算術(shù)平均數(shù)的計算(單項分組資料求算術(shù)平均數(shù)的計算)
當(dāng)使用第二手資料的統(tǒng)計表計算平均數(shù)的時候,要用加權(quán)平均數(shù)法進行計算
其中f為權(quán)數(shù),即變量在總體中出現(xiàn)的次數(shù)。書本325頁
(3)組距分組資料計算算術(shù)平均數(shù)
a:先計算出組中距
下組距+上組距
Xmid= 2
b:
書本326頁。
三 離中量數(shù)分析
1、離中量數(shù)(差異量數(shù))用以說明調(diào)查對象在某一變量上的分散程度或差異幅度。
2、離中量數(shù)的作用:
(1)描述一組數(shù)據(jù)的差異情況
(2)對集中量數(shù)的代表性作補充說明,差異量數(shù)越小,集中量數(shù)的代表性越大
3、常用的離中量數(shù)有:異眾比率、四分位差、標準差。
4、相對差異量數(shù):離散系數(shù)、標準分數(shù)
四 相關(guān)與回歸分析
1、相關(guān)和回歸可分為單相關(guān)、一元回歸和多元相關(guān)、多元回歸
2、雙變量相關(guān)分析的作用是探尋兩個變量間的相關(guān)關(guān)系,不涉及兩個變量間有無因果關(guān)系,只是對客觀事務(wù)的一種描述。相關(guān)關(guān)系是一種非完全確定的關(guān)系,它只表示事物間的相互依存關(guān)系。雙變量間關(guān)系的精確度量通常使用相關(guān)系數(shù),定距變量是用皮爾遜系數(shù)(r),r的取值范圍-1~+1,r=0是不相關(guān),r絕對值=1是完全相關(guān)。r的大小分高度相關(guān)、中度相關(guān)、低度相關(guān)。
3、散點圖的六種圖形:
(1) 強正相關(guān) (2)弱正相關(guān) (3)強負相關(guān) (4)弱負相關(guān) (5)非線形相關(guān) (6)沒有相關(guān)關(guān)系或極弱的相關(guān)關(guān)系
4、回歸分析的作用是精確預(yù)測自變量的變化后因變量會改變多少,前提是兩變量有相關(guān)關(guān)系。從本質(zhì)上說回歸分析具有推理的性質(zhì),可以進行預(yù)測。是一種因果關(guān)系但不同于相關(guān)關(guān)系的雙向性,它是單向的,這種因果關(guān)系不能顛倒。
5、回歸方程式表示為:y=a+bx
五 推論統(tǒng)計
1、描述性統(tǒng)計是依據(jù)樣本資料計算樣本的統(tǒng)計值
2、推論統(tǒng)計研究如何將樣本的統(tǒng)計值推論為總體的參數(shù)值。
3、推論統(tǒng)計主要有兩種方法,即區(qū)間估計和假設(shè)檢驗。
習(xí)題
1、統(tǒng)計分析方法不僅是對客觀現(xiàn)象數(shù)量關(guān)系描述的工具,還是進行科學(xué)抽象的思維方法。它使人們能夠發(fā)現(xiàn)靠直覺不能領(lǐng)悟到的規(guī)律,進行準確的科學(xué)預(yù)測。
2、統(tǒng)計分析包括:
(1)描述性統(tǒng)計:說明由樣本資料所表示的事物內(nèi)在的數(shù)量特征和數(shù)量關(guān)系
(2)推論性統(tǒng)計:的目的是根據(jù)樣本資料對總體進行推理
3、統(tǒng)計分析還可以分為單變量分析、雙變量分析和多變量分析。
4、統(tǒng)計分析的數(shù)字成果是運用數(shù)學(xué)模型來描述、解釋、預(yù)測社會現(xiàn)象。
5、單變量分析是要描述一個現(xiàn)象的分布狀態(tài)的集中趨勢(或一般狀態(tài))和離中趨勢(或差異狀態(tài))。
6、中位數(shù)可以用于定距變量和定序變量的計算
7、中位數(shù)主要應(yīng)用于非數(shù)值的定序測量資料中,因為社會調(diào)查中有許多資料屬于定序測量,所要它的應(yīng)用比算術(shù)平均數(shù)更為廣泛,這正是它的長處。
8、通常把概率不超過0.05或0.01的事件當(dāng)作“小概率事件”,也稱為顯著性水平。
9、集中量數(shù)、離中量數(shù)、相關(guān)量數(shù)、回歸量數(shù)都屬于描述性統(tǒng)計內(nèi)容。
10、可以表明原始數(shù)據(jù)在總體分布中相對位置的是標準分數(shù)