數(shù)據(jù)挖掘技術(shù)在物流業(yè)中的應(yīng)用研究

字號:

隨著信息時代數(shù)據(jù)量的劇增,深化物流管理的方法是在其中引入數(shù)據(jù)挖掘技術(shù),充分合理的利用數(shù)據(jù)挖掘技術(shù),可以進行市場預(yù)測和分析,這必將為正確的決策奠定堅實的基礎(chǔ)。本文介紹數(shù)據(jù)挖掘技術(shù)的概念及方法,并結(jié)合物流企業(yè)的管理,闡述數(shù)據(jù)挖掘技術(shù)在物流企業(yè)中的具體應(yīng)用。
     1.引 言
     物流需求的個性化、多樣化和集成化,要求物流服務(wù)企業(yè)必須不斷改進和優(yōu)化企業(yè)的運作流程,開發(fā)出具有針對性的物流服務(wù),以適應(yīng)物流市場發(fā)展的變化。數(shù)據(jù)挖掘技術(shù),以其強大關(guān)聯(lián)、分類、預(yù)測等功能,可將物流企業(yè)運營過程中產(chǎn)生的信息數(shù)據(jù)進行有效整合處理,為物流企業(yè)的決策提供依據(jù)。
     2.數(shù)據(jù)挖掘技術(shù)
     數(shù)據(jù)挖掘又稱為基于數(shù)據(jù)庫的知識發(fā)現(xiàn),是從大量的、不完全的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、潛在有用的信息和知識的過程。它不僅僅局限于對數(shù)據(jù)的查詢和訪問,主要在于找出數(shù)據(jù)之間的潛在聯(lián)系。從企業(yè)角度看,數(shù)據(jù)挖掘是一種企業(yè)信息處理技術(shù),特點是對企業(yè)數(shù)據(jù)庫中的數(shù)據(jù)進行抽取、轉(zhuǎn)換、分析等,從中提取可用于輔助企業(yè)決策的關(guān)鍵數(shù)據(jù)。數(shù)據(jù)挖掘的目標是從大量數(shù)據(jù)中,發(fā)現(xiàn)隱藏于其后的規(guī)律或數(shù)據(jù)間的關(guān)系,從而服務(wù)于決策。數(shù)據(jù)挖掘方法有很多種,其中比較典型的有關(guān)聯(lián)分析、序列模式分析、分類分析、聚類分析等。
     (1)關(guān)聯(lián)分析
     數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。若兩個或多個變量的取值之問存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)分析即利用關(guān)聯(lián)規(guī)則進行數(shù)據(jù)挖掘,而關(guān)聯(lián)規(guī)則是描述事物之間同時出現(xiàn)的規(guī)律的知識模式,關(guān)聯(lián)分析的目的是為挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系。
     (2)序列模式分析
     序列模式分析和關(guān)聯(lián)分析相似,他把數(shù)據(jù)之問的關(guān)聯(lián)性與時間性聯(lián)系起來,為了發(fā)現(xiàn)序列模式,不僅需要知道事件是否發(fā)生,而且需要確定事件發(fā)生的時間。其目的也是為了挖掘數(shù)據(jù)之間的聯(lián)系,但序列模式分析的側(cè)重點在于分析數(shù)據(jù)問的前后或因果關(guān)系。
     (3)分類分析
     分類分析就是分析樣本數(shù)據(jù)庫中的數(shù)據(jù),為每個類別做出準確的描述建立分析模型或挖掘出分類規(guī)則,然后用這個分類規(guī)則對其他記錄進行分類,能夠把數(shù)據(jù)集中的數(shù)據(jù)映射到某個給定的類上,其輸入集是一組記錄集合和幾種標記。
     (4)聚類分析
     與分類分析不同,聚類分析法的輸入集是一組未標定的記錄,也就是說此時輸入的記錄還沒有進行任何分類。其目的是根據(jù)一定的規(guī)則,合理地劃分記錄集合,使組之間的差別盡可能大,組內(nèi)的差別盡可能小。
     3.數(shù)據(jù)挖掘技術(shù)在物流企業(yè)中的應(yīng)用
     現(xiàn)代物流信息系統(tǒng)是一個龐大復(fù)雜的系統(tǒng),特別是全程物流,包括運輸、倉儲、配送、搬運、包裝和物流再加工等諸多環(huán)節(jié),每個環(huán)節(jié)信息流量十分巨大。以往物流企業(yè)主要利用信息的有效溝通、快速傳達、物流運作調(diào)控和輔助決策的功能,而很少挖掘信息中的有用數(shù)據(jù)。但隨著市場競爭的加劇、企業(yè)精細化管理愿望的增強以及先進技術(shù)方法的開發(fā)應(yīng)用,對信息中的數(shù)據(jù)進行挖掘利用已成為物流企業(yè)贏取客戶、增加利潤、提升自身競爭力的有效途徑。
     3.1 數(shù)據(jù)倉庫的建立
     數(shù)據(jù)倉庫作為數(shù)據(jù)挖掘的基礎(chǔ),不同于傳統(tǒng)的聯(lián)機事務(wù)處理系統(tǒng),它具有面向主題的、集成的、不可更新以及隨時間變化的特性。各個聯(lián)機事務(wù)處理系統(tǒng)作為數(shù)據(jù)倉庫的原始數(shù)據(jù)源,以文件方式提供企業(yè)在日?;顒又惺占陌ǘㄘ泦巍⒋尕泦?、應(yīng)付帳、交易條款、客戶情況等在內(nèi)的大量數(shù)據(jù)資料和報表。同時還有大量的外部信息等數(shù)據(jù)。數(shù)據(jù)倉庫通過ETL過程(抽取、轉(zhuǎn)換和加載)處理這些接口文件,并且按不同的主題域組織、存儲和管理這些客戶數(shù)據(jù)。通過數(shù)據(jù)倉庫接口,對數(shù)據(jù)倉庫中的數(shù)據(jù)進行聯(lián)機分析和數(shù)據(jù)挖掘。在建立完成企業(yè)級的信息數(shù)據(jù)倉庫之后,可以基于這個數(shù)據(jù)倉庫平臺進行數(shù)據(jù)挖掘工作。
     3.2 物流企業(yè)中的數(shù)據(jù)挖掘
     一般來講,數(shù)據(jù)挖掘在物流企業(yè)中可以應(yīng)用在以下幾方面:
     1)市場預(yù)測
     產(chǎn)品在進入市場后,并不會永遠保持銷量。一般來講,隨著時間的推移,產(chǎn)品會遵守銷量變化的模式,經(jīng)歷四個階段,即導(dǎo)入期、增長期、成熟期和衰退期。在各個階段,產(chǎn)品的生產(chǎn)要求和實物分撥策略是不同的。如在導(dǎo)入期,產(chǎn)品逐步得到市場的認可,銷售量可能會快速的增長,這時需要提前的生產(chǎn)計劃、生產(chǎn)作業(yè)安排以及適合的庫存和運輸策略,指導(dǎo)企業(yè)的生產(chǎn),合理地控制庫存和安排運輸。數(shù)據(jù)挖掘可以作為市場預(yù)測的手段,通過聚類和預(yù)測工具,達到上述目的。
     2)物流中心的選擇
     物流中心(流通中心、配送中心)選址問題即求解運輸成本、變動處理成本和固定成本等之和為最小的最小化問題。
     物流中心選址,需要考慮到中心點數(shù)量和中心點如何分布等情況。針對這一問題,可以用數(shù)據(jù)挖掘中的分類樹方法來加以解決。分類樹 (classification)的目標是連續(xù)的劃分數(shù)據(jù),使依賴變量的差別。分類樹的真正的目的是將數(shù)據(jù)分類(classify)到不同組或分支中,在依賴變量的值上建立劃分。用分類樹的方法解決這個問題時,通常需要以下四個方面的數(shù)據(jù):1)中心點的位置;2)每個中心點的業(yè)務(wù)需求量;3)備選點的位置;4)在中心點和備選點之間的距離。
     通過分類樹的方法,不僅確定了中心點的位置,同時也確定每年各個地址問物品的運輸量,使整個企業(yè)必要的銷售量得到保證。企業(yè)的長期折現(xiàn)的總成本也會達到最小值。
     3)優(yōu)化配送路徑
     配送路徑是個典型的非線性問題,它一直影響著物流企業(yè)配送效率的提高。在許多配送體系中,管理人員需要采取有效的配送策略以提高服務(wù)水平、降低貨運費用。其中要考慮車輛的路徑問題,車輛路徑問題是為一些車輛確定一些客戶的路徑,每一客戶只能被訪問一次,且每條路徑上的客戶需求量之和不能超過車輛的承載能力。其次還應(yīng)考慮到車輛的利用能力,如果車輛在運輸過程中的空載率過高或整車的承載力未完全利用,這些無疑會增加企業(yè)的運輸成本;另外涉及到車輛的運輸能力,就必須考慮到貨品的規(guī)格大小和利潤價值的大小。
     數(shù)據(jù)挖掘中的遺傳算法為配送路徑的優(yōu)化提供了新的工具,它可以把在局部優(yōu)化時的路線繼承下來,應(yīng)用于整體,而其他剩余的部分則結(jié)合區(qū)域周圍的剩余部分 (即非遺傳的部分)進行優(yōu)化。如此下去,逐漸把其他的區(qū)域并入優(yōu)化的范疇,最后擴展到整體,模型得出的信息即可用來決策輸出,即根據(jù)每次配送顧客數(shù)量的不同、顧客位置的不同,以及相應(yīng)訂貨量的不同,輸出本次送貨線路車輛調(diào)度的動態(tài)優(yōu)化方案。
     4)合理安排商品的倉儲
     商品的合理儲位對于倉容利用率、儲存搬運分揀效率的提高具有重要的意義。對于商品量大、出貨頻率快的物流中心來講,商品儲位就意味著工作效率和效益,要真正解決好這個問題,數(shù)據(jù)挖掘是必不可少的。
     如何合理安排貨品的存儲、壓縮貨品的存儲成本正成為現(xiàn)代物流管理者不斷思考的問題,對于貨品的存放問題,哪些貨品放在一起可以提高揀貨效率?哪些貨品放在一起卻達不到這樣的效果呢?可以利用以往的商品流動數(shù)據(jù),采取數(shù)據(jù)挖掘中的關(guān)聯(lián)模式來分析解決這個問題。
     關(guān)聯(lián)模式分析的目的就是為了挖掘出隱藏在數(shù)據(jù)間的相互關(guān)系,即通過量化的數(shù)字,描述A類產(chǎn)品的出現(xiàn)對B類產(chǎn)品的出現(xiàn)有多大影響,可以用四個屬性來描述關(guān)聯(lián)規(guī)則:
     ??尚哦龋涸诋a(chǎn)品集A出現(xiàn)的前提下,B出現(xiàn)的概率
     。支持度:產(chǎn)品集A、B同時出現(xiàn)的概率
     。期望可信度:產(chǎn)品集B出現(xiàn)的概率
     。作用度可信度:對期望可信度的比值
     通過上述關(guān)聯(lián)分析可以得出一個關(guān)于同時購買商品的簡單規(guī)則,從而來決定這兩種貨品在貨架上的配置,可以戰(zhàn)略性的布置貨品在倉庫中的位置,以促進交叉銷售和某類交易模式。
     5)顧客價值分析
     根據(jù)市場營銷的原則,對待不同類型的顧客所提供的服務(wù)水平也應(yīng)該有所不同的。通過分析客戶對物流服務(wù)的應(yīng)用頻率、持續(xù)性等指標來判別客戶的忠誠度,通過對交易數(shù)據(jù)的詳細分析來鑒別哪些是物流企業(yè)希望保持的客戶,通過挖掘找到流失客戶的共同特征,就可以在那些具有相似特征的客戶還未流失之前進行針對性的彌補。
     6)物流需求預(yù)測
     物流企業(yè)規(guī)劃和控制物流活動需要準確估計供應(yīng)鏈中所處理的產(chǎn)品和服務(wù)的數(shù)量,這些估計主要采用預(yù)測和推算的方式。數(shù)據(jù)挖掘可以對物流活動中的產(chǎn)品和服務(wù)類型隨時問變化的規(guī)律和趨勢進行建模描述。時間趨勢分析可以對現(xiàn)有商品在時間上的變化找出趨勢,然后確定需要注意和開發(fā)商品的類型。空間趨勢分析可以根據(jù)地理位置的變化找到趨勢,然后確定以往重點發(fā)展的區(qū)域,這對于物流企業(yè)長遠的發(fā)展也是至關(guān)重要的。
     4.結(jié)束語
     數(shù)據(jù)挖掘技術(shù)已經(jīng)在商業(yè)、金融業(yè)、保險業(yè)、電信業(yè)等多個領(lǐng)域開始得到應(yīng)用,取得了令人滿意的效果。我國物流企業(yè)在數(shù)據(jù)挖掘應(yīng)用方面還處于起步階段,經(jīng)驗不足,應(yīng)用實踐在國內(nèi)物流企業(yè)中還并不多見。但隨著數(shù)據(jù)挖掘應(yīng)用研究的深入開展,以及物流企業(yè)追求運營績效愿望的增強,將會有越來越多的物流企業(yè)引入數(shù)據(jù)挖掘,為各物流企業(yè)在激烈的競爭中掌握主動,在未來的發(fā)展中提供更廣闊的空間,發(fā)揮重要的作用,數(shù)據(jù)挖掘在物流企業(yè)管理中將會有更加廣闊的前景。