數(shù)據(jù)庫系統(tǒng)1-1:數(shù)據(jù)處理的三個領(lǐng)域

字號:

數(shù)據(jù)處理是指對信息進(jìn)行收集、整理、存儲、加工及傳播等一系列活動的總和,其基本目的是從大量的、雜亂無章的甚至是難于理解的數(shù)據(jù)中,提煉、抽取人們所需要的有價值、有意義的數(shù)據(jù)(信息),借以作為決策的依據(jù)。數(shù)據(jù)的組織、存儲、檢查和維護等工作是數(shù)據(jù)處理的基本環(huán)節(jié),這些工作一般統(tǒng)稱為數(shù)據(jù)管理。
    數(shù)據(jù)表示信息,信息反應(yīng)事物的客觀狀態(tài),事物、信息、數(shù)據(jù)三者之間互為聯(lián)系。從事物的狀態(tài)到表示該狀態(tài)的數(shù)據(jù),經(jīng)歷了三個領(lǐng)域,這就是現(xiàn)實世界、信息世界和計算機世界。
    1. 現(xiàn)實世界 現(xiàn)實世界是存在人們頭腦之外的客觀世界,由客觀事物及其聯(lián)系組成。
    (1) 事物 現(xiàn)實世界的事物可以是實際存在的人和物,例如,張三、李四、人民大會堂、黃山迎客松等;也可以是抽象的事物和事物間的聯(lián)系,例如,操作系統(tǒng)、數(shù)據(jù)庫系統(tǒng)概論等課程,或者借閱圖書、購物等。
    (2) 事物類 每一事物類由隸屬于該類的具體事物組成,是同類事物的集合,例如,張三、李四等組成“人”這一事物類,而操作系統(tǒng)、數(shù)據(jù)庫系統(tǒng)概論等組成“課程”事物類。
    (3) 特性 每一個事物具有它自己的特性,例如,對張三來說,有姓名/張三、性別/男、身高/1.72米、體重/60公斤等。特性有名和值之分。具有相同特性的事物屬于一個事物類。
    2. 信息世界 信息世界是對現(xiàn)實世界的抽象和描述。與現(xiàn)實世界對應(yīng)的概念是:
    (1) 實體(Entity) 現(xiàn)實世界中客觀存在并且可以相互區(qū)分的事物在信息世界稱為實體。
    (2) 實體集(Entity Set) 現(xiàn)實世界中的事物類,在信息世界中就叫實體集,是同類實體的集合。
    (3) 屬性(Attribute) 現(xiàn)實世界中事物的特性就是實體的屬性。屬性也有名和值的區(qū)分,屬性名用來劃分實體所屬的實體集,而屬性值則是某個實體在該屬性下的具體表現(xiàn)。屬性值的集合稱為屬性的域(Domain)。
    (4) 實體標(biāo)識符(Identification) 用于和同類實體相互區(qū)分的屬性集合(不含多余的屬性)稱為實體標(biāo)識符。
    3. 數(shù)據(jù)世界 在數(shù)據(jù)世界(計算機世界)中,與信息世界幾個概念相對應(yīng)的分別是:
    (1) 記錄實例值(Record occurrence)  簡稱記錄,表示實體?!?BR>    (2) 文件(File) 是記錄的集合。
    (3) 字段(Field)或數(shù)據(jù)項(Data Item) 它對應(yīng)信息世界的屬性。、
    (4) 關(guān)鍵字(Key) 它對應(yīng)信息世界的實體標(biāo)識符。
    4.記錄的型與值
    文件中的一條記錄實例是對應(yīng)于一個特定實體的數(shù)據(jù)項值的有序集合,稱為記錄實例值,簡稱記錄。而組成記錄的各個數(shù)據(jù)項的名稱和排列順序稱為記錄的型,記錄的型確定了記錄的格式,同一個文件下的各條記錄都對應(yīng)同一個格式,所以記錄的型描述實體集的整體特征,一個記錄型對應(yīng)于一個實體集。而記錄值也就是記錄型的實例值。