2010年統(tǒng)計(jì)師考試復(fù)習(xí)要點(diǎn):數(shù)據(jù)描述

字號:

-
    數(shù)據(jù)描述
    復(fù)習(xí)要點(diǎn)
    本章重點(diǎn)介紹如何簡單地利用統(tǒng)計(jì)圖表和少數(shù)數(shù)據(jù)來概括某些事物的基本特征。
    一、定性數(shù)據(jù)的圖表展示
    定性效據(jù)包括分類數(shù)據(jù)和順序數(shù)據(jù),通常可以用頻數(shù)分布表和圖形來描述。
    1.生成頻數(shù)分布表
    定性數(shù)據(jù)本身就是對事物的一種分類,因此,只要先把所有的類別都列出來,然后統(tǒng)計(jì)出每一類別的頻數(shù),就得到一張頻數(shù)分布表。頻數(shù)分布表中落在某一特定類別的數(shù)據(jù)個(gè)數(shù)稱為頻數(shù)。通過頻數(shù)分布可以觀察不同類型數(shù)據(jù)的分布情況。
    注意運(yùn)用Excel生成頻數(shù)分布表的過程。
    2.定性數(shù)據(jù)的圖形表示
    (1)餅圖:又稱圓餅圖、圓形圖等,它是利用圓形及圓內(nèi)扇形面積來表示數(shù)值大小的圖形。餅圖主要用于總體中各組成部分所占比重的研究。
    (2)條形圖:條形圖是用寬度相同的條形的高度或長度來表述數(shù)據(jù)多少的圖形,用于觀察不同類別數(shù)據(jù)的多少或分布情況.繪制時(shí),各類別可以放在縱抽,也可以故在橫軸。
    (3)環(huán)形圖:環(huán)形圖可以用來比較不同變量之間的結(jié)構(gòu)差異。
    二、定量數(shù)據(jù)用圖表展示.
    1.生成頻數(shù)分布表
    生成定量數(shù)據(jù)的頻數(shù)分布表時(shí),首先,要對數(shù)據(jù)進(jìn)行分組。以能夠適當(dāng)觀察數(shù)據(jù)的分布特征為準(zhǔn)。一般的分組個(gè)數(shù)在5—15之間。
    其次,要確定組距。所謂組距是指每個(gè)組變量值中的值與最小值之差。若將值稱為上限,最小值稱為下限,則組距等于上限與下限之差,即“組距=上限一下限”。確定組距,一是要考慮各組的劃分是否能區(qū)分總體肉部各個(gè)組成部分的性質(zhì)差別,二是要能準(zhǔn)確地清晰地反映總體單位的分布特征。
    在確定組距時(shí),在研究的現(xiàn)象變動(dòng)比較均勻的情況下,可以采用等距分組;而當(dāng)研究的現(xiàn)象變動(dòng)很不均勻時(shí),一般采用不等距分組。
    最后,統(tǒng)計(jì)出各組的頻數(shù)及頻數(shù)分布表。在統(tǒng)計(jì)各組頻數(shù)時(shí),恰好等于某一組的組,則采取上限不在內(nèi)的原則,即將該頻數(shù)計(jì)算在與下限相同的組內(nèi)。
    2。定量數(shù)據(jù)的圖形表示
    (1)直方圖:用橫坐標(biāo)代袁變量分組,縱坐標(biāo)代表各變量值出現(xiàn)的頻數(shù),這樣,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方同。
    (2)折線圖:折線圖是利用線段的升降來說明顯向變動(dòng)的一種統(tǒng)計(jì)圖,它主要朋于表示現(xiàn)象在現(xiàn)象的分配情況、現(xiàn)象在時(shí)間上的變化和兩個(gè)現(xiàn)象之間的依存關(guān)系等。
    (3)散點(diǎn)圖:散點(diǎn)圖也可以反映兩個(gè)變量的關(guān)系。
    應(yīng)特別注意各種圖表的生成方式和運(yùn)用。
    三、用統(tǒng)計(jì)表來表示數(shù)據(jù)
    統(tǒng)計(jì)表是一種用密集的形式歸納數(shù)據(jù)的方法。它主要是利用行和列中的數(shù)據(jù)來表述現(xiàn)象特征。人們利用統(tǒng)計(jì)表主要出于兩種目的:一是在文章中使用它以支持自己的觀點(diǎn);二是利用它組織數(shù)據(jù)。
    統(tǒng)計(jì)表一般由五個(gè)部分組成,即表頭、行標(biāo)題;列標(biāo)題、數(shù)字資料和表外附加構(gòu)成。
    表頭應(yīng)該放在表的上方,它說明的是表的主要內(nèi)容;
    行標(biāo)題和列標(biāo)題一般放在表的第一行和第一列,它表示的是所研究的問題類別的名稱和指標(biāo)名稱;
    表的其余部分是具體的數(shù)字資料:
    表外附加通常放在統(tǒng)計(jì)表的下方,用來說明資料來源、指標(biāo)注釋和必要的說明等內(nèi)容。
    通常情況下,統(tǒng)計(jì)表的左右兩邊不能封口。
    四、用數(shù)字來概括數(shù)據(jù)
    針對一組數(shù)據(jù)的分布特征,可以從兩個(gè)方面來考查它:一是該組數(shù)據(jù)的集中趁勢,即該組數(shù)據(jù)的數(shù)值向其中心值的靠攏程度。二是該組數(shù)據(jù)的離散程度,它反映的是該組數(shù)據(jù)的各個(gè)數(shù)值遠(yuǎn)離其中心值的趨勢和程度。這兩個(gè)方面反映了數(shù)據(jù)分布特征的不同側(cè)面,從不同視角來分析統(tǒng)計(jì)數(shù)據(jù),以達(dá)到分析和運(yùn)用統(tǒng)計(jì)數(shù)據(jù)的目的。
    1.定性數(shù)據(jù)的數(shù)字特征
    對定性數(shù)據(jù)的集中趨勢常用的方法就是計(jì)算比例、百分比、中位數(shù)和眾數(shù)。
    中位數(shù),是數(shù)據(jù)按照大小排列之后位于中間的那個(gè)數(shù)(如果樣本重為奇數(shù)),或者中間兩個(gè)數(shù)目的平均(如果樣本重為偶數(shù))。
    眾數(shù),就是數(shù)據(jù)中出現(xiàn)次教或出現(xiàn)頻率最多的數(shù)值,在定性數(shù)據(jù)中,由于記錄的是頻數(shù),因此眾數(shù)用得多些。
    2.定量數(shù)據(jù)的數(shù)字特征
    常用的反映定量數(shù)據(jù)特征的統(tǒng)計(jì)量有:
    反映數(shù)據(jù)集中趁勢的水平度量:平均數(shù)、中位數(shù)、眾數(shù)和分位數(shù)等;
    反映數(shù)據(jù)離散程度的差異度量:極差、四分位差、標(biāo)準(zhǔn)差和方差。
    (1)水平的度量   平均數(shù)也稱為均值,是把某一組數(shù)據(jù)進(jìn)行算術(shù)平均,用以表述某一事物的平均水平,它在統(tǒng)計(jì)中叫做均值。注意簡單平均數(shù)和加權(quán)平均數(shù)的應(yīng)用。中位數(shù)和眾數(shù)的應(yīng)用比較簡單,結(jié)合前邊概念學(xué)習(xí)即可。
    (2)差異的度量
    極差又稱全距,是一組數(shù)據(jù)中最夫的標(biāo)志值和最小的標(biāo)志值之差。它的特點(diǎn)是簡單 直觀,但是容易受數(shù)據(jù)中極端值的影響,因此,不能準(zhǔn)確地描述數(shù)據(jù)的分散程度。
    方差是將各個(gè)變量值和其均值離差平方的品軍數(shù),它反映了樣本中各個(gè)觀測值到其均值的平均離散程度。標(biāo)準(zhǔn)差是方差的平方根,它更具量綱性,而且與變量值的計(jì)量單位相同,使用的范同更廣泛。
    離散系數(shù)也稱為便變異系數(shù)、標(biāo)準(zhǔn)差系數(shù),足將一組數(shù)據(jù)的標(biāo)準(zhǔn)差除以其均值,用來測度離散程度的相對數(shù)。
    標(biāo)準(zhǔn)分?jǐn)?shù)也稱作標(biāo)準(zhǔn)化值或Z分?jǐn)?shù),是變量值與其平均數(shù)的離差除以標(biāo)準(zhǔn)差后的值,用以測定某一數(shù)據(jù)在該組數(shù)據(jù)中的相對位置。