第1章 數(shù)據(jù)庫系統(tǒng)的基本概念
1. 數(shù)據(jù)處理的基本問題是數(shù)據(jù)的組織/存儲(chǔ)/檢索/維護(hù)/加工利用這些正是數(shù)據(jù)庫系統(tǒng)所要解決的問題.
2. 信息:是現(xiàn)實(shí)世界各種事物的存在特征、運(yùn)動(dòng)形態(tài)以及不同事物間的相互聯(lián)系等諸要素在人腦中的抽象反映,進(jìn)而形成抽象概念。信息源于客觀事物,而后通過眾加工處理再控制客觀事物,從而達(dá)到認(rèn)識(shí)世界、改造世界的目的。
3. 人類社會(huì)活動(dòng)的三大要素能源、物質(zhì)、信息.
4. 數(shù)據(jù):本質(zhì)上是對(duì)信息的一種符號(hào)化表示,即用一定的符號(hào)表示信息。符號(hào)是收人為而定,在計(jì)算機(jī)上通常使用0和1這兩個(gè)符號(hào)。
5. 信息與數(shù)據(jù)的關(guān)系:二者既有聯(lián)系又有區(qū)別,數(shù)據(jù)是信息的載體,而信息是數(shù)據(jù)的內(nèi)涵。同一信息可以有不同的數(shù)據(jù)表示形式;而同一數(shù)據(jù)也可能有不同的解釋。數(shù)據(jù)處理本質(zhì)上就是信息處理。
6. 數(shù)據(jù)處理(過程):當(dāng)把信息表示成數(shù)據(jù)后,這些數(shù)據(jù)便被人們賦予了特定的含義,反映了現(xiàn)實(shí)世界事物的存在特性的變化狀態(tài)。由于現(xiàn)實(shí)世界事物往往是相互關(guān)聯(lián)的,基于這一事實(shí),可以從已知數(shù)據(jù)出發(fā),參照相關(guān)數(shù)據(jù),進(jìn)行加工計(jì)算,產(chǎn)生出一些新的數(shù)據(jù)。這新的數(shù)據(jù)又表示出新的信息,可以作為某種決策的依據(jù)。上述整個(gè)過程,就叫做數(shù)據(jù)處理。
7. 數(shù)據(jù)管理:數(shù)據(jù)的收集、整理、組織、存儲(chǔ)、查詢、維護(hù)和傳送等各種操作是數(shù)據(jù)處理的基本環(huán)節(jié),是任何數(shù)據(jù)處理任務(wù)必有的共性部分。
8. 數(shù)據(jù)管理技術(shù)發(fā)展的三個(gè)階段:(1)自由管理階段,50年代。本階段的主要特點(diǎn),1)數(shù)據(jù)不保存;2)程序與數(shù)據(jù)合在一起,因而數(shù)據(jù)沒有獨(dú)立性,程序沒有彈性,要修改數(shù)據(jù)必須修改程序;3)程序員必須自己編程實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)、存取方法和輸入輸出,迫使程序員直接與物理設(shè)備打交道,加大了程序設(shè)計(jì)難度,編程效率低;4)數(shù)據(jù)面向應(yīng)用,這意味著即使多個(gè)沒程序用到相同數(shù)據(jù),也得各自定義,數(shù)據(jù)不僅高度冗余,而且不能共享。(2)文件系統(tǒng)階段,60年代。這一階段特點(diǎn),1)數(shù)據(jù)可長期保存在磁盤上;2)數(shù)據(jù)的物理結(jié)構(gòu)與邏輯結(jié)構(gòu)有了區(qū)別,兩者之間由文件管理系統(tǒng)進(jìn)行轉(zhuǎn)換,而因程序與數(shù)據(jù)之間有物理上的獨(dú)立性,即數(shù)據(jù)在存儲(chǔ)上的改變不一定會(huì)影響到程序,這可使程序員不多地考慮數(shù)據(jù)存放地址,而把精力放在算法上;3)文件系統(tǒng)提供了數(shù)據(jù)存取方法,但當(dāng)數(shù)據(jù)的物理結(jié)構(gòu)改變時(shí),仍需修改程序;4)數(shù)據(jù)不再發(fā)球某個(gè)特定程序,在一定程度上可以共享。缺陷,1)文件是面向特定用途設(shè)計(jì)的,有一個(gè)應(yīng)用就有一個(gè)文件相對(duì)應(yīng)。而程序員是基于文件編制的,導(dǎo)致程序仍然與文件相互依存。文件變動(dòng),程序就要修改;2)數(shù)據(jù)冗余大,文件之間缺乏聯(lián)系,有可能造成同樣數(shù)據(jù)在不同文件中重復(fù)存儲(chǔ);3)數(shù)據(jù)可能發(fā)生矛盾,同一數(shù)據(jù)出現(xiàn)在不同文件中,稍有不慎就可能造成同一數(shù)據(jù)在不同文件中不一樣;4)數(shù)據(jù)聯(lián)系弱,不同文件缺乏聯(lián)系就不能反映現(xiàn)實(shí)世界事物之間的自然聯(lián)系,這是文件方式的弊端。(3)數(shù)據(jù)庫系統(tǒng)階段,60年代后期。這一階段的特點(diǎn),1)數(shù)據(jù)結(jié)構(gòu)化,數(shù)據(jù)庫是存儲(chǔ)在磁盤等外部直接存取設(shè)備中的數(shù)據(jù)集合,是按一定的數(shù)據(jù)結(jié)構(gòu)組織起來的;2)數(shù)據(jù)共享,數(shù)據(jù)庫中的數(shù)據(jù)是考慮所有用戶的數(shù)據(jù)需求、面向整個(gè)系統(tǒng)組織的,不同用戶所使用的數(shù)據(jù)可以重疊,同一部分?jǐn)?shù)據(jù)也可為多用戶共享;3)減少了數(shù)據(jù)冗余,在數(shù)據(jù)庫方式下,用戶所使用的數(shù)據(jù)庫管理系統(tǒng)從數(shù)據(jù)庫中映射出來的邏輯文件,它取自于數(shù)據(jù)庫中的某個(gè)子集,并非獨(dú)立存在,從而減少了數(shù)據(jù)冗余;4)有較高的數(shù)據(jù)獨(dú)立性,數(shù)據(jù)獨(dú)立是數(shù)據(jù)庫技術(shù)努力追求的目標(biāo),其好處是數(shù)據(jù)存儲(chǔ)方式的改變不會(huì)影響到應(yīng)用程序;5)提供了用戶接口,在數(shù)據(jù)庫系統(tǒng)中,數(shù)據(jù)庫管理系統(tǒng)作為用戶與數(shù)據(jù)庫的接口,提供了數(shù)據(jù)庫定義、數(shù)據(jù)庫運(yùn)行、數(shù)據(jù)庫維護(hù)和數(shù)據(jù)庫安全性、完整性等控制功能,此外還支持某種程序設(shè)計(jì)語言,并沒有專門的數(shù)據(jù)操作語言,為用戶編程提供了方便。
9. 文件:是操作系統(tǒng)管理數(shù)據(jù)的基本單位,是若干記錄的集合。可以命名,通過文件名以記錄為單位存取數(shù)據(jù)。
10. 數(shù)據(jù)項(xiàng):描述事物性質(zhì)的最小數(shù)據(jù)單位。
11. 記錄:若干數(shù)據(jù)項(xiàng)的集合,一個(gè)記錄能表達(dá)一個(gè)具體事物。
12. 數(shù)據(jù)獨(dú)立有兩個(gè)含義:即物理數(shù)據(jù)獨(dú)立性和邏輯數(shù)據(jù)獨(dú)立性。MC所謂物理數(shù)據(jù)獨(dú)立性,是指數(shù)據(jù)庫物理結(jié)構(gòu)(包括數(shù)據(jù)的組織和存儲(chǔ)/存取方式/外部存儲(chǔ)設(shè)備等)發(fā)生改變時(shí),不會(huì)影響到邏輯結(jié)構(gòu),而用戶使用的是邏輯數(shù)據(jù),所以不必改動(dòng)程序。MC所謂邏輯數(shù)據(jù)獨(dú)立性,是指數(shù)據(jù)庫全局邏輯發(fā)生改變時(shí),用戶也不需改動(dòng)程序,就像數(shù)據(jù)庫并沒發(fā)生變化一樣。
13. 文件系統(tǒng)與數(shù)據(jù)庫系統(tǒng)之間的主要區(qū)別:文件系統(tǒng)中的文件之間不存在聯(lián)系,因而從總體上看數(shù)據(jù)是沒有結(jié)構(gòu)的,而數(shù)據(jù)庫中的文件是相互聯(lián)系著的,并在總體上遵從一定的結(jié)構(gòu)形式。數(shù)據(jù)庫正是通過文件之間的聯(lián)系反映現(xiàn)實(shí)世界事物的自然聯(lián)系。
14. 數(shù)據(jù)庫( DB):數(shù)據(jù)庫是存儲(chǔ)在磁盤等外部直接存取設(shè)備上的數(shù)據(jù)集合,是按一定的數(shù)據(jù)結(jié)構(gòu)組織起來的,是一個(gè)結(jié)構(gòu)化的數(shù)據(jù)集合,主要是通過綜合各個(gè)用戶的文件,除去不必要的冗余,使之相互聯(lián)系所形成的數(shù)據(jù)結(jié)構(gòu)。
15. 數(shù)據(jù)系統(tǒng)組成:由數(shù)據(jù)庫、支持?jǐn)?shù)據(jù)庫運(yùn)行的軟硬件、數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫管理員和應(yīng)用程序等相互獨(dú)立而又相互聯(lián)系的若干部分所組成。(1)軟件,主要指數(shù)據(jù)庫管理系統(tǒng)(DBMS);(2)數(shù)據(jù)庫管理員(DBA),的職責(zé)是維護(hù)和管理數(shù)據(jù)庫,使之始終處于狀態(tài)??梢?,在數(shù)據(jù)庫系統(tǒng)組成中還包括人的成分。
1. 數(shù)據(jù)處理的基本問題是數(shù)據(jù)的組織/存儲(chǔ)/檢索/維護(hù)/加工利用這些正是數(shù)據(jù)庫系統(tǒng)所要解決的問題.
2. 信息:是現(xiàn)實(shí)世界各種事物的存在特征、運(yùn)動(dòng)形態(tài)以及不同事物間的相互聯(lián)系等諸要素在人腦中的抽象反映,進(jìn)而形成抽象概念。信息源于客觀事物,而后通過眾加工處理再控制客觀事物,從而達(dá)到認(rèn)識(shí)世界、改造世界的目的。
3. 人類社會(huì)活動(dòng)的三大要素能源、物質(zhì)、信息.
4. 數(shù)據(jù):本質(zhì)上是對(duì)信息的一種符號(hào)化表示,即用一定的符號(hào)表示信息。符號(hào)是收人為而定,在計(jì)算機(jī)上通常使用0和1這兩個(gè)符號(hào)。
5. 信息與數(shù)據(jù)的關(guān)系:二者既有聯(lián)系又有區(qū)別,數(shù)據(jù)是信息的載體,而信息是數(shù)據(jù)的內(nèi)涵。同一信息可以有不同的數(shù)據(jù)表示形式;而同一數(shù)據(jù)也可能有不同的解釋。數(shù)據(jù)處理本質(zhì)上就是信息處理。
6. 數(shù)據(jù)處理(過程):當(dāng)把信息表示成數(shù)據(jù)后,這些數(shù)據(jù)便被人們賦予了特定的含義,反映了現(xiàn)實(shí)世界事物的存在特性的變化狀態(tài)。由于現(xiàn)實(shí)世界事物往往是相互關(guān)聯(lián)的,基于這一事實(shí),可以從已知數(shù)據(jù)出發(fā),參照相關(guān)數(shù)據(jù),進(jìn)行加工計(jì)算,產(chǎn)生出一些新的數(shù)據(jù)。這新的數(shù)據(jù)又表示出新的信息,可以作為某種決策的依據(jù)。上述整個(gè)過程,就叫做數(shù)據(jù)處理。
7. 數(shù)據(jù)管理:數(shù)據(jù)的收集、整理、組織、存儲(chǔ)、查詢、維護(hù)和傳送等各種操作是數(shù)據(jù)處理的基本環(huán)節(jié),是任何數(shù)據(jù)處理任務(wù)必有的共性部分。
8. 數(shù)據(jù)管理技術(shù)發(fā)展的三個(gè)階段:(1)自由管理階段,50年代。本階段的主要特點(diǎn),1)數(shù)據(jù)不保存;2)程序與數(shù)據(jù)合在一起,因而數(shù)據(jù)沒有獨(dú)立性,程序沒有彈性,要修改數(shù)據(jù)必須修改程序;3)程序員必須自己編程實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)結(jié)構(gòu)、存取方法和輸入輸出,迫使程序員直接與物理設(shè)備打交道,加大了程序設(shè)計(jì)難度,編程效率低;4)數(shù)據(jù)面向應(yīng)用,這意味著即使多個(gè)沒程序用到相同數(shù)據(jù),也得各自定義,數(shù)據(jù)不僅高度冗余,而且不能共享。(2)文件系統(tǒng)階段,60年代。這一階段特點(diǎn),1)數(shù)據(jù)可長期保存在磁盤上;2)數(shù)據(jù)的物理結(jié)構(gòu)與邏輯結(jié)構(gòu)有了區(qū)別,兩者之間由文件管理系統(tǒng)進(jìn)行轉(zhuǎn)換,而因程序與數(shù)據(jù)之間有物理上的獨(dú)立性,即數(shù)據(jù)在存儲(chǔ)上的改變不一定會(huì)影響到程序,這可使程序員不多地考慮數(shù)據(jù)存放地址,而把精力放在算法上;3)文件系統(tǒng)提供了數(shù)據(jù)存取方法,但當(dāng)數(shù)據(jù)的物理結(jié)構(gòu)改變時(shí),仍需修改程序;4)數(shù)據(jù)不再發(fā)球某個(gè)特定程序,在一定程度上可以共享。缺陷,1)文件是面向特定用途設(shè)計(jì)的,有一個(gè)應(yīng)用就有一個(gè)文件相對(duì)應(yīng)。而程序員是基于文件編制的,導(dǎo)致程序仍然與文件相互依存。文件變動(dòng),程序就要修改;2)數(shù)據(jù)冗余大,文件之間缺乏聯(lián)系,有可能造成同樣數(shù)據(jù)在不同文件中重復(fù)存儲(chǔ);3)數(shù)據(jù)可能發(fā)生矛盾,同一數(shù)據(jù)出現(xiàn)在不同文件中,稍有不慎就可能造成同一數(shù)據(jù)在不同文件中不一樣;4)數(shù)據(jù)聯(lián)系弱,不同文件缺乏聯(lián)系就不能反映現(xiàn)實(shí)世界事物之間的自然聯(lián)系,這是文件方式的弊端。(3)數(shù)據(jù)庫系統(tǒng)階段,60年代后期。這一階段的特點(diǎn),1)數(shù)據(jù)結(jié)構(gòu)化,數(shù)據(jù)庫是存儲(chǔ)在磁盤等外部直接存取設(shè)備中的數(shù)據(jù)集合,是按一定的數(shù)據(jù)結(jié)構(gòu)組織起來的;2)數(shù)據(jù)共享,數(shù)據(jù)庫中的數(shù)據(jù)是考慮所有用戶的數(shù)據(jù)需求、面向整個(gè)系統(tǒng)組織的,不同用戶所使用的數(shù)據(jù)可以重疊,同一部分?jǐn)?shù)據(jù)也可為多用戶共享;3)減少了數(shù)據(jù)冗余,在數(shù)據(jù)庫方式下,用戶所使用的數(shù)據(jù)庫管理系統(tǒng)從數(shù)據(jù)庫中映射出來的邏輯文件,它取自于數(shù)據(jù)庫中的某個(gè)子集,并非獨(dú)立存在,從而減少了數(shù)據(jù)冗余;4)有較高的數(shù)據(jù)獨(dú)立性,數(shù)據(jù)獨(dú)立是數(shù)據(jù)庫技術(shù)努力追求的目標(biāo),其好處是數(shù)據(jù)存儲(chǔ)方式的改變不會(huì)影響到應(yīng)用程序;5)提供了用戶接口,在數(shù)據(jù)庫系統(tǒng)中,數(shù)據(jù)庫管理系統(tǒng)作為用戶與數(shù)據(jù)庫的接口,提供了數(shù)據(jù)庫定義、數(shù)據(jù)庫運(yùn)行、數(shù)據(jù)庫維護(hù)和數(shù)據(jù)庫安全性、完整性等控制功能,此外還支持某種程序設(shè)計(jì)語言,并沒有專門的數(shù)據(jù)操作語言,為用戶編程提供了方便。
9. 文件:是操作系統(tǒng)管理數(shù)據(jù)的基本單位,是若干記錄的集合。可以命名,通過文件名以記錄為單位存取數(shù)據(jù)。
10. 數(shù)據(jù)項(xiàng):描述事物性質(zhì)的最小數(shù)據(jù)單位。
11. 記錄:若干數(shù)據(jù)項(xiàng)的集合,一個(gè)記錄能表達(dá)一個(gè)具體事物。
12. 數(shù)據(jù)獨(dú)立有兩個(gè)含義:即物理數(shù)據(jù)獨(dú)立性和邏輯數(shù)據(jù)獨(dú)立性。MC所謂物理數(shù)據(jù)獨(dú)立性,是指數(shù)據(jù)庫物理結(jié)構(gòu)(包括數(shù)據(jù)的組織和存儲(chǔ)/存取方式/外部存儲(chǔ)設(shè)備等)發(fā)生改變時(shí),不會(huì)影響到邏輯結(jié)構(gòu),而用戶使用的是邏輯數(shù)據(jù),所以不必改動(dòng)程序。MC所謂邏輯數(shù)據(jù)獨(dú)立性,是指數(shù)據(jù)庫全局邏輯發(fā)生改變時(shí),用戶也不需改動(dòng)程序,就像數(shù)據(jù)庫并沒發(fā)生變化一樣。
13. 文件系統(tǒng)與數(shù)據(jù)庫系統(tǒng)之間的主要區(qū)別:文件系統(tǒng)中的文件之間不存在聯(lián)系,因而從總體上看數(shù)據(jù)是沒有結(jié)構(gòu)的,而數(shù)據(jù)庫中的文件是相互聯(lián)系著的,并在總體上遵從一定的結(jié)構(gòu)形式。數(shù)據(jù)庫正是通過文件之間的聯(lián)系反映現(xiàn)實(shí)世界事物的自然聯(lián)系。
14. 數(shù)據(jù)庫( DB):數(shù)據(jù)庫是存儲(chǔ)在磁盤等外部直接存取設(shè)備上的數(shù)據(jù)集合,是按一定的數(shù)據(jù)結(jié)構(gòu)組織起來的,是一個(gè)結(jié)構(gòu)化的數(shù)據(jù)集合,主要是通過綜合各個(gè)用戶的文件,除去不必要的冗余,使之相互聯(lián)系所形成的數(shù)據(jù)結(jié)構(gòu)。
15. 數(shù)據(jù)系統(tǒng)組成:由數(shù)據(jù)庫、支持?jǐn)?shù)據(jù)庫運(yùn)行的軟硬件、數(shù)據(jù)庫、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)庫管理員和應(yīng)用程序等相互獨(dú)立而又相互聯(lián)系的若干部分所組成。(1)軟件,主要指數(shù)據(jù)庫管理系統(tǒng)(DBMS);(2)數(shù)據(jù)庫管理員(DBA),的職責(zé)是維護(hù)和管理數(shù)據(jù)庫,使之始終處于狀態(tài)??梢?,在數(shù)據(jù)庫系統(tǒng)組成中還包括人的成分。