數(shù)據(jù)挖掘在電子商務中的應用
時間:2022-01-01 09:37:51
導語:數(shù)據(jù)挖掘在電子商務中的應用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
1數(shù)據(jù)挖掘的概念及其過程
1.1數(shù)據(jù)挖掘
數(shù)據(jù)挖掘,即在數(shù)據(jù)庫中的信息發(fā)現(xiàn),是指在大量的、不完整的、模糊的、有噪音的和隨機的數(shù)據(jù)中,提取出潛在的、不為人知的、同時又是非常有用的知識和信息的過程。數(shù)據(jù)挖掘是一項應用技術廣泛的交叉學科,它聚集了眾多不同領域的知識,例如人工智能、可視化、數(shù)據(jù)庫、數(shù)理統(tǒng)計等。從始至終數(shù)據(jù)挖掘技術都是面向應用領域,不僅是對于特定數(shù)據(jù)庫的簡單檢索查詢,還包括對數(shù)據(jù)的不同層面、不同角度的統(tǒng)計、分析、推理和綜合,以此得到問題的求解,以及發(fā)現(xiàn)事件之間的聯(lián)系,還有對未發(fā)生活動的預測。另外數(shù)據(jù)挖掘技術在存在大量數(shù)據(jù)積累的電子商務行業(yè)有著廣泛的應用,是現(xiàn)代商務企業(yè)發(fā)展的不二選擇。
1.2數(shù)據(jù)挖掘的過程
1.2.1數(shù)據(jù)預處理
在實際情況中,企業(yè)獲得的數(shù)據(jù)具有不完整性、模糊性和冗余性,所以數(shù)據(jù)挖掘技術針對的不是已得到的數(shù)據(jù),而是潛在的數(shù)據(jù)信息,并通過預處理技術獲得簡潔、準確的數(shù)據(jù)。預處理的工作分為三步,數(shù)據(jù)合并、數(shù)據(jù)選擇和數(shù)據(jù)清洗。先將多個數(shù)據(jù)庫和文件中的數(shù)據(jù)進行合并,然后選擇適合分析的數(shù)據(jù)信息集合,最后剔除無關記錄,并將各個文件轉換成方便數(shù)據(jù)挖掘的格式。
1.2.2模式發(fā)現(xiàn)
這個階段就是利用挖掘計算技術挖掘出有用的、潛在的、新穎的、可以理解的知識和信息。像關聯(lián)分析、聚類分析、路徑選擇、序列分析等都可以用于Web的挖掘技術。
1.2.3模式分析
這個階段是將模式發(fā)現(xiàn)中沒有用的模式和規(guī)則過濾掉。通過技術分析,得到有效的結論。常用關聯(lián)規(guī)則、序列等手段。
2數(shù)據(jù)挖掘技術的方法
2.1關聯(lián)分析
所謂的關聯(lián)分析,就是利用數(shù)據(jù)間相互關聯(lián)的規(guī)則進行數(shù)據(jù)挖掘,為的是挖掘數(shù)據(jù)間潛在的聯(lián)系規(guī)則。比如,在進行關聯(lián)分析時,能發(fā)現(xiàn)類似哪些產品更受客戶的歡迎、為什么、產品優(yōu)勢有哪些、有多少客戶會再次購買等問題。
2.2序列模式分析
這個過程和第一個關聯(lián)分析有些類似,但主要任務是發(fā)現(xiàn)數(shù)據(jù)間的前后順序聯(lián)系,比如在這段時間里,企業(yè)先銷售出x產品,隨后銷售y產品,然后是z產品,所以就形成x-y-z的銷售序列,出現(xiàn)頻率較高,進而對其進行分析。序列模式分析工作方向是:在指定的交易數(shù)據(jù)庫中,找出按照時間排布的交易集,發(fā)現(xiàn)其中的高頻序列,從而進行下一個步驟。
2.3分類分析
假設有一個數(shù)據(jù)庫和一組互相區(qū)別的標記,利用特殊標記數(shù)據(jù)庫中的每一個數(shù)據(jù),這樣的數(shù)據(jù)庫被叫做訓練集或者實例數(shù)據(jù)庫。分類分析就是利用分析標記數(shù)據(jù)庫中的每一個數(shù)據(jù),對每個類別建立分析模型或做出精準的描述或者挖掘出分析模型,然后利用分類模式對數(shù)據(jù)庫中的數(shù)據(jù)進行分類分析。
2.4聚類分析
聚類分析所根據(jù)的分類規(guī)則主要取決于聚類分析工具。不同的聚類方法,對于同樣的記錄集合會有不同的劃分結果。聚類分析針對的未分類的記錄,而且所有記錄適合分成幾類,事先也不知情,然后依據(jù)一定的分類規(guī)則,分析記錄數(shù)據(jù),確定每一個數(shù)據(jù)所對應的類別。
3數(shù)據(jù)挖掘技術在電子商務中的應用
3.1優(yōu)化企業(yè)資源
企業(yè)盈利的關鍵是節(jié)約成本,利用數(shù)據(jù)挖掘技術可以找到企業(yè)消耗資源的關鍵點和各種活動的投入與產出比例,進而為企業(yè)提供科學合理的調整方案,例如資源循環(huán)利用、降低庫存等方法。通過數(shù)據(jù)挖掘技術,企業(yè)可以預先知道市場上的商業(yè)信息,使企業(yè)把握市場動態(tài),創(chuàng)造更多的盈利。
3.2管理客戶資料
俗話說知己知彼,百戰(zhàn)不殆。對于企業(yè)來說,了解客戶是至關重要的,比如客戶是男是女、愛好是什么、職業(yè)是什么等,從而根據(jù)不同客戶需求,改善網(wǎng)絡結構,推出個性化網(wǎng)頁,吸引更多的客戶對本企業(yè)的關注。例如對電子商務網(wǎng)站的網(wǎng)站流量進行分析。人們在點擊或者是訪問某一個網(wǎng)站的同時,就將個人對網(wǎng)站內容的反饋信息反映了出來,用戶點擊了哪一個鏈接,在哪個網(wǎng)頁中停留的時間最長,采用了哪個搜索的項目或者是總共使用的瀏覽時間等信息都會被保存在網(wǎng)站中,將這些信息保存下來,進行數(shù)據(jù)分析,能夠有效的確定用戶的訪問特點以及產品特征,從而提高電子商務信息提供的精確性。
3.3評估商業(yè)信譽
一個企業(yè)若是沒有良好的商業(yè)信譽做基礎,一切都是空口說白話。所以建立有效的商業(yè)評估制度就成了重中之重。利用數(shù)據(jù)挖掘技術對企業(yè)營銷進行追蹤,開展資產評估、發(fā)展?jié)摿︻A測以及利潤收益分析,建立完善的安全系統(tǒng),對企業(yè)商譽安全進行保障,可以有效的預防和解決信用風險,提高企業(yè)信譽度。例如,商品售賣出去,要進行科學有效的跟蹤,了解客戶用后體驗,對客戶使用產品情況進行追蹤式分析,開展科學合理的資產評估,不斷發(fā)展?jié)撛谟脩趔w驗,通過客戶的反饋信息進行綜合性分析,提高客戶滿意度,提高商家的信用。
3.4確定異常事件
在商業(yè)領域中,確定異常事件具有十分重要的商業(yè)價值。在企業(yè)經營時間里,經常會有異常事件發(fā)生,例如話費拖欠、客戶流失、信用卡欺詐等,通過數(shù)據(jù)挖掘技術中的異常點分析可以十分準確快速地發(fā)現(xiàn)異常點,使企業(yè)及時修整系統(tǒng),減少不必要損失。例如,當客戶將商品加入購物車后,對沒有付款的原因進行科學合理的分析,從而確定要催付的客戶群體。這種催付的行為在一定程度上可能會打擾到客戶,所以需要準確的分析其真正的原因。例如客戶沒有付款的主要原因為:遺忘、沖動消費不想買了、貨比三家,發(fā)現(xiàn)更好地商品、支付發(fā)生故障等。這個時候就需要商家對號入座,確定是否要進行客戶催付。這就需要數(shù)據(jù)挖掘技術發(fā)揮自身的優(yōu)勢,進行數(shù)據(jù)分析,提出相應的解決方案。在催付時間的選擇上,根據(jù)數(shù)據(jù)挖掘技術的分析通常情況下理論上在第三天進行催付是最為合理的,因為在第二天有不少會自發(fā)付款的客戶。同時還需要考慮到女性消費者沖動購物的習慣,過了這個沖動期就不容易再購買。所以實際上要在客戶下單的第二天進行催付最為合理。在擬定催付內容的時候需要科學分析客戶一天各個時間段的情緒變化,減少客戶對商家的排斥與厭煩的心理。
4結語
隨著網(wǎng)絡技術的不斷發(fā)展,電子商務已經成為現(xiàn)如今經濟發(fā)展的主要方式。數(shù)據(jù)挖掘技術是電子商務發(fā)展的重要手段。利用數(shù)據(jù)挖掘可以幫助企業(yè)從大量的繁雜的數(shù)據(jù)中發(fā)現(xiàn)潛在的規(guī)律,找到有效的信息,以此指導企業(yè)調整經營策略,提高企業(yè)聲譽,獲得更有利的競爭能力。
作者:邢玉鳳 單位:云南經濟管理學院