數據挖掘技術在物流業中的應用研究
2009-11-18 23:05:00 來源:網絡 編輯:56885 關注度:摘要:... ...
隨著信息時代數據量的劇增,深化物流管理的最有效方法是在其中引入數據挖掘技術,充分合理的利用數據挖掘技術,可以進行市場預測和分析,這必將為正確的決策奠定堅實的基礎。本文介紹數據挖掘技術的概念及方法,并結合物流企業的管理,闡述數據挖掘技術在物流企業中的具體應用。
1 引 言
物流需求的個性化、多樣化和集成化,要求物流服務企業必須不斷改進和優化企業的運作流程,開發出具有針對性的物流服務,以適應物流市場發展的變化。數據挖掘技術,以其強大關聯、分類、預測等功能,可將物流企業運營過程中產生的信息數據進行有效整合處理,為物流企業的決策提供依據。
2 數據挖掘技術
數據挖掘又稱為基于數據庫的知識發現,是從大量的、不完全的、模糊的、隨機的實際應用數據中,提取隱含在其中的、潛在有用的信息和知識的過程。它不僅僅局限于對數據的查詢和訪問,主要在于找出數據之間的潛在聯系。從企業角度看,數據挖掘是一種企業信息處理技術,特點是對企業數據庫中的數據進行抽取、轉換、分析等,從中提取可用于輔助企業決策的關鍵數據。數據挖掘的目標是從大量數據中,發現隱藏于其后的規律或數據間的關系,從而服務于決策。數據挖掘方法有很多種,其中比較典型的有關聯分析、序列模式分析、分類分析、聚類分析等。
(1)關聯分析
數據關聯是數據庫中存在的一類重要的可被發現的知識。若兩個或多個變量的取值之問存在某種規律性,就稱為關聯。關聯分析即利用關聯規則進行數據挖掘,而關聯規則是描述事物之間同時出現的規律的知識模式,關聯分析的目的是為挖掘出隱藏在數據間的相互關系。
(2)序列模式分析
序列模式分析和關聯分析相似,他把數據之問的關聯性與時間性聯系起來,為了發現序列模式,不僅需要知道事件是否發生,而且需要確定事件發生的時間。其目的也是為了挖掘數據之間的聯系,但序列模式分析的側重點在于分析數據問的前后或因果關系。
(3)分類分析
分類分析就是分析樣本數據庫中的數據,為每個類別做出準確的描述建立分析模型或挖掘出分類規則,然后用這個分類規則對其他記錄進行分類,能夠把數據集中的數據映射到某個給定的類上,其輸入集是一組記錄集合和幾種標記。
(4)聚類分析
與分類分析不同,聚類分析法的輸入集是一組未標定的記錄,也就是說此時輸入的記錄還沒有進行任何分類。其目的是根據一定的規則,合理地劃分記錄集合,使組之間的差別盡可能大,組內的差別盡可能小。
3 數據挖掘技術在物流企業中的應用
現代物流信息系統是一個龐大復雜的系統,特別是全程物流,包括運輸、倉儲、配送、搬運、包裝和物流再加工等諸多環節,每個環節信息流量十分巨大。以往物流企業主要利用信息的有效溝通、快速傳達、物流運作調控和輔助決策的功能,而很少挖掘信息中的有用數據。但隨著市場競爭的加劇、企業精細化管理愿望的增強以及先進技術方法的開發應用,對信息中的數據進行挖掘利用已成為物流企業贏取客戶、增加利潤、提升自身競爭力的有效途徑。
3.1 數據倉庫的建立
數據倉庫作為數據挖掘的基礎,不同于傳統的聯機事務處理系統,它具有面向主題的、集成的、不可更新以及隨時間變化的特性。各個聯機事務處理系統作為數據倉庫的原始數據源,以文件方式提供企業在日常活動中收集的包括定貨單、存貨單、應付帳、交易條款、客戶情況等在內的大量數據資料和報表。同時還有大量的外部信息等數據。數據倉庫通過ETL過程(抽取、轉換和加載)處理這些接口文件,并且按不同的主題域組織、存儲和管理這些客戶數據。通過數據倉庫接口,對數據倉庫中的數據進行聯機分析和數據挖掘。在建立完成企業級的信息數據倉庫之后,可以基于這個數據倉庫平臺進行數據挖掘工作。
3.2 物流企業中的數據挖掘
一般來講,數據挖掘在物流企業中可以應用在以下幾方面:
1)市場預測
產品在進入市場后,并不會永遠保持最高銷量。一般來講,隨著時間的推移,產品會遵守銷量變化的模式,經歷四個階段,即導入期、增長期、成熟期和衰退期。在各個階段,產品的生產要求和實物分撥策略是不同的。如在導入期,產品逐步得到市場的認可,銷售量可能會快速的增長,這時需要提前的生產計劃、生產作業安排以及適合的庫存和運輸策略,指導企業的生產,合理地控制庫存和安排運輸。數據挖掘可以作為市場預測的手段,通過聚類和預測工具,達到上述目的。
2)物流中心的選擇
物流中心(流通中心、配送中心)選址問題即求解運輸成本、變動處理成本和固定成本等之和為最小的最小化問題。
物流中心選址,需要考慮到中心點數量和中心點如何分布等情況。針對這一問題,可以用數據挖掘中的分類樹方法來加以解決。分類樹 (classification)的目標是連續的劃分數據,使依賴變量的差別最大。分類樹的真正的目的是將數據分類(classify)到不同組或分支中,在依賴變量的值上建立最強劃分。用分類樹的方法解決這個問題時,通常需要以下四個方面的數據:1)中心點的位置;2)每個中心點的業務需求量;3)備選點的位置;4)在中心點和備選點之間的距離。
通過分類樹的方法,不僅確定了中心點的位置,同時也確定每年各個地址問物品的運輸量,使整個企業必要的銷售量得到保證。企業的長期折現的總成本也會達到最小值。
3)優化配送路徑
配送路徑是個典型的非線性問題,它一直影響著物流企業配送效率的提高。在許多配送體系中,管理人員需要采取有效的配送策略以提高服務水平、降低貨運費用。其中要考慮車輛的路徑問題,車輛路徑問題是為一些車輛確定一些客戶的路徑,每一客戶只能被訪問一次,且每條路徑上的客戶需求量之和不能超過車輛的承載能力。其次還應考慮到車輛的利用能力,如果車輛在運輸過程中的空載率過高或整車的承載力未完全利用,這些無疑會增加企業的運輸成本;另外涉及到車輛的運輸能力,就必須考慮到貨品的規格大小和利潤價值的大小。
數據挖掘中的遺傳算法為配送路徑的優化提供了新的工具,它可以把在局部優化時的最優路線繼承下來,應用于整體,而其他剩余的部分則結合區域周圍的剩余部分 (即非遺傳的部分)進行優化。如此下去,逐漸把其他的區域并入優化的范疇,最后擴展到整體,模型得出的信息即可用來決策輸出,即根據每次配送顧客數量的不同、顧客位置的不同,以及相應訂貨量的不同,輸出本次送貨線路車輛調度的動態優化方案。
4)合理安排商品的倉儲
商品的合理儲位對于倉容利用率、儲存搬運分揀效率的提高具有重要的意義。對于商品量大、出貨頻率快的物流中心來講,商品儲位就意味著工作效率和效益,要真正解決好這個問題,數據挖掘是必不可少的。
如何合理安排貨品的存儲、壓縮貨品的存儲成本正成為現代物流管理者不斷思考的問題,對于貨品的存放問題,哪些貨品放在一起可以提高揀貨效率?哪些貨品放在一起卻達不到這樣的效果呢?可以利用以往的商品流動數據,采取數據挖掘中的關聯模式來分析解決這個問題。
關聯模式分析的目的就是為了挖掘出隱藏在數據間的相互關系,即通過量化的數字,描述A類產品的出現對B類產品的出現有多大影響,可以用四個屬性來描述關聯規則:
·可信度:在產品集A出現的前提下,B出現的概率
·支持度:產品集A、B同時出現的概率
·期望可信度:產品集B出現的概率
·作用度可信度:對期望可信度的比值
通過上述關聯分析可以得出一個關于同時購買商品的簡單規則,從而來決定這兩種貨品在貨架上的配置,可以戰略性的布置貨品在倉庫中的位置,以促進交叉銷售和某類交易模式。
5)顧客價值分析
根據市場營銷的原則,對待不同類型的顧客所提供的服務水平也應該有所不同的。通過分析客戶對物流服務的應用頻率、持續性等指標來判別客戶的忠誠度,通過對交易數據的詳細分析來鑒別哪些是物流企業希望保持的客戶,通過挖掘找到流失客戶的共同特征,就可以在那些具有相似特征的客戶還未流失之前進行針對性的彌補。
6)物流需求預測
物流企業規劃和控制物流活動需要準確估計供應鏈中所處理的產品和服務的數量,這些估計主要采用預測和推算的方式。數據挖掘可以對物流活動中的產品和服務類型隨時問變化的規律和趨勢進行建模描述。時間趨勢分析可以對現有商品在時間上的變化找出趨勢,然后確定需要注意和開發商品的類型。空間趨勢分析可以根據地理位置的變化找到趨勢,然后確定以往重點發展的區域,這對于物流企業長遠的發展也是至關重要的。
4 結束語
數據挖掘技術已經在商業、金融業、保險業、電信業等多個領域開始得到應用,取得了令人滿意的效果。我國物流企業在數據挖掘應用方面還處于起步階段,經驗不足,應用實踐在國內物流企業中還并不多見。但隨著數據挖掘應用研究的深入開展,以及物流企業追求運營績效愿望的增強,將會有越來越多的物流企業引入數據挖掘,為各物流企業在激烈的競爭中掌握主動,在未來的發展中提供更廣闊的空間,發揮重要的作用,數據挖掘在物流企業管理中將會有更加廣闊的前景。