ORACLE索引聚簇表的數(shù)據(jù)加載

字號:


    一:首先介紹一下索引聚簇表的工作原理:
    聚簇是指:如果一組表有一些共同的列,則將這樣一組表存儲在相同的數(shù)據(jù)庫塊中;聚簇還表示把相關(guān)的數(shù)據(jù)存儲在同一個(gè)塊上。利用聚簇,一個(gè)塊可能包含多個(gè)表的數(shù)據(jù)。概念上就是如果兩個(gè)或多個(gè)表經(jīng)常做鏈接操作,那么可以把需要的數(shù)據(jù)預(yù)先存儲在一起。聚簇還可以用于單個(gè)表,可以按某個(gè)列將數(shù)據(jù)分組存儲。
    更加簡單的說,比如說,EMP表和DEPT表,這兩個(gè)表存儲在不同的segment中,甚至有可能存儲在不同的TABLESPACE中,因此,他們的數(shù)據(jù)一定不會在同一個(gè)BLOCK里。而我們有會經(jīng)常對這兩個(gè)表做關(guān)聯(lián)查詢,比如說:select * from emp,dept where emp.deptno = dept.deptno .仔細(xì)想想,查詢主要是對BLOCK的操作,查詢的BLOCK越多,系統(tǒng)IO就消耗越大。如果我把這兩個(gè)表的數(shù)據(jù)聚集在少量的BLOCK里,查詢效率一定會提高不少。
    比如我現(xiàn)在將值deptno=10的所有員工抽取出來,并且把對應(yīng)的部門信息也存儲在這個(gè)BLOCK里(如果存不下了,可以為原來的塊串聯(lián)另外的塊)。這就是索引聚簇表的工作原理。
    二:創(chuàng)建過程。
    索引聚簇表是基于一個(gè)索引聚簇(index cluster)創(chuàng)建的。里面記錄的是各個(gè)聚簇鍵。聚簇鍵和我們用得做多的索引鍵不一樣,索引鍵指向的是一行數(shù)據(jù),聚簇鍵指向的是一個(gè)ORACLE BLOCK。我們可以先通過以下命令創(chuàng)建一個(gè)索引簇。
    SQL> conn scott/tiger
    已連接。
    SQL> desc dept
    名稱 是否為空? 類型
    ----------------------------------------- -------- ----------------------------
    DEPTNO NOT NULL NUMBER(2)
    DNAME VARCHAR2(14)
    LOC VARCHAR2(13)
    SQL> create cluster emp_dept_cluster
    2 ( deptno number(2) )
    3 size 1024
    4 /
    簇已創(chuàng)建。
    這個(gè)名字可以用戶定義,不一定叫deptno,數(shù)據(jù)類型必須和需要使用這個(gè)聚簇的數(shù)據(jù)類型一致NUMBER(2)。在這里最關(guān)鍵的一個(gè)參數(shù)是size。這個(gè)選項(xiàng)原來告訴Oracle:我們希望與每個(gè)聚簇鍵值關(guān)聯(lián)大約1024字節(jié)的數(shù)據(jù)(1024對于一般的表一條數(shù)據(jù)沒問題),Oracle會在用這個(gè)數(shù)據(jù)庫塊上設(shè)置來計(jì)算每個(gè)塊最 多能放下多少個(gè)聚簇鍵。假設(shè)塊大小為8KB,Oracle會在每個(gè)數(shù)據(jù)庫塊上放上最多7個(gè)聚簇鍵,也就是說,對應(yīng)部門10、20、30、40、50、60和70的數(shù)據(jù)會放在一個(gè)塊上,一旦插入部門80,就會使用一個(gè)新塊。存放的數(shù)據(jù)是和插入順序相關(guān)的。
    因 此,SIZE測試控制著每塊上聚簇鍵的最大個(gè)數(shù)。這是對聚簇空間利用率影響最大的因素。如果把這個(gè)SIZE設(shè)置得太高,那么每個(gè)塊上的鍵就會很少(單位BLOCK可以存的聚簇鍵就少了),我們會不必要地使用更多的空間。如果設(shè)置得太低,又會導(dǎo)致數(shù)據(jù)過分串鏈(一個(gè)聚簇鍵不夠存放一條數(shù)據(jù)),這又與聚簇本來的目的不符,因?yàn)榫鄞卦臼菫榱税阉邢嚓P(guān)數(shù)據(jù)都存儲在一個(gè)塊上。
    向聚簇中放數(shù)據(jù)之前,需要先對聚簇建立索引??梢袁F(xiàn)在就在聚簇中創(chuàng)建表,但是由于我們想同時(shí)創(chuàng)建和填充表,而有數(shù)據(jù)之前必須有一個(gè)聚簇索引,所以我們先來建立聚簇索引。