2020年計(jì)算機(jī)軟件水平考試考點(diǎn)解析:數(shù)據(jù)挖掘

字號(hào):


    2020年計(jì)算機(jī)軟件水平考試備考正在進(jìn)行中,為了方便考生及時(shí)有效的備考,那么,為您精心整理了2020年計(jì)算機(jī)軟件水平考試考點(diǎn)解析:數(shù)據(jù)挖掘,供大家的參考和學(xué)習(xí)。如想獲取更多計(jì)算機(jī)軟考的模擬題及備考資料,請(qǐng)關(guān)注的更新。
    
    2020年計(jì)算機(jī)軟件水平考試考點(diǎn)解析:數(shù)據(jù)挖掘
    廣義上說,任何從數(shù)據(jù)庫中挖掘信息的過程都叫做數(shù)據(jù)挖掘。從這點(diǎn)看來,數(shù)據(jù)挖掘就是BI。但從技術(shù)術(shù)語上說,數(shù)據(jù)挖掘(Data Mining)指的是:源數(shù)據(jù)經(jīng)過清洗和轉(zhuǎn)換等成為適合于挖掘的數(shù)據(jù)集。數(shù)據(jù)挖掘在這種具有固定形式的數(shù)據(jù)集上完成知識(shí)的提煉,最后以合適的知識(shí)模式用于進(jìn)一步分析決策工作。從這種狹義的觀點(diǎn)上,我們可以定義:數(shù)據(jù)挖掘是從特定形式的數(shù)據(jù)集中提煉知識(shí)的過程。數(shù)據(jù)挖掘往往針對(duì)特定的數(shù)據(jù)、特定的問題,選擇一種或者多種挖掘算法,找到數(shù)據(jù)下面隱藏的規(guī)律,這些規(guī)律往往被用來預(yù)測、支持決策。
    現(xiàn)舉一個(gè)關(guān)聯(lián)銷售的案例。美國的超市有這樣的系統(tǒng):當(dāng)你采購了一車商品結(jié)賬時(shí),售貨員小姐掃描完了你的產(chǎn)品后,計(jì)算機(jī)上會(huì)顯示出一些信息,然后售貨員會(huì)友好地問體:我們有一種一次性紙杯正在促銷,位于F6貨架上,您要購買嗎?這句話絕不是一般的促銷。因?yàn)橛?jì)算機(jī)系統(tǒng)早就算好了,如果你的購物車中有餐巾紙、大瓶可樂和沙拉,則86%的可能性你要買一次性紙杯。結(jié)果是你說:“啊,謝謝你,我剛才一直沒找到紙杯。”
    這不是什么神奇的科學(xué)算命,而是利用數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則算法實(shí)現(xiàn)的系統(tǒng)。
    每天,新的銷售數(shù)據(jù)會(huì)進(jìn)入挖掘模型,與過去N天的歷史數(shù)據(jù)一起被挖掘模型處理,得到當(dāng)前最有價(jià)值的關(guān)聯(lián)規(guī)則。同樣的算法,分析網(wǎng)上書店的銷售業(yè)續(xù),計(jì)算機(jī)可以發(fā)現(xiàn)產(chǎn)品之間的關(guān)聯(lián)以及關(guān)聯(lián)的強(qiáng)弱。