數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的運(yùn)用

時間:2022-12-31 09:31:42

導(dǎo)語:數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的運(yùn)用一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的運(yùn)用

1數(shù)據(jù)挖掘技術(shù)的來源

1.1數(shù)據(jù)挖掘的產(chǎn)生的緣由

人們通常會在平時的生活中遇到大大小小類似的狀況,比如商場會將具有關(guān)聯(lián)性的商品放在一起、保險公司會設(shè)計出精致的理賠條款等,這些數(shù)據(jù)信息的挖掘是傳統(tǒng)數(shù)據(jù)分析工具難以完成的。隨著科技的發(fā)展,信息量不斷擴(kuò)大,人們希望通過對數(shù)據(jù)的挖掘獲得有價值的信息。由此數(shù)字挖掘技術(shù)便應(yīng)運(yùn)而生,并成為一種綜合性的數(shù)據(jù)分析技術(shù)。

1.2數(shù)據(jù)挖掘技術(shù)的功能分類

1.2.1分類方面

在對事物的具體描述工程中對描述對象的具體屬性以及主要特性等進(jìn)行不同方式的組類,比如在劃分網(wǎng)絡(luò)上的文章的過程中,主要是根據(jù)其中內(nèi)容的關(guān)鍵詞語為根本依據(jù)進(jìn)行劃分、整理。

1.2.2聚類方面

針對被分析事物中所隱藏的深層內(nèi)容進(jìn)行有效的識別、認(rèn)知,同時根據(jù)這些深層內(nèi)容把被分析事物劃分為不同的類別。比如在商場對商品進(jìn)行聚類的同時,要針對“用戶喜歡什么樣的促銷模式”這種問題進(jìn)行全面的考量,并且將購物習(xí)慣性思維較為相近的用戶劃分在一起,依照不同的習(xí)慣性思維將商品有效的劃分為不同的類別,并且要針對不同類型的用戶所喜歡的促銷模式進(jìn)行具體的深入調(diào)查和研究工作。

1.2.3關(guān)聯(lián)規(guī)則方面

在某一對象在出現(xiàn)某種狀況的同時會相應(yīng)的引發(fā)其他對象發(fā)生相似狀況的密切聯(lián)系屬于關(guān)聯(lián)規(guī)則。比如在商場購買面包的用戶同時購買牛奶的幾率性就格外大,并且每一天購買面包的用戶里面又有幾個是同時購買牛奶的,其中所占的比例到底是多少,這些問題都是可以根據(jù)關(guān)聯(lián)規(guī)則的支持程度以及可信程度來進(jìn)行實際、具體的描繪的。但是序列規(guī)則卻是縱向思維下的聯(lián)系模式,和關(guān)聯(lián)規(guī)則的聯(lián)系模式大大不同。

1.2.4預(yù)測方面

要想提高預(yù)測的高效性能就必須要對預(yù)測模型進(jìn)行有效的構(gòu)建。預(yù)測的主要任務(wù)在于對分析對象的發(fā)展規(guī)則進(jìn)行高效的分析處理,并且能夠?qū)⑵浒l(fā)展趨勢進(jìn)行預(yù)測性的研究分析,比如針對電子商務(wù)未來的發(fā)展趨勢而做出的相關(guān)分析工作和預(yù)測工作。

1.2.5偏差的檢測工作方面

在描述分析極少數(shù)的對象和個別案例的同時,對其深層面的原因以及規(guī)則進(jìn)行具體的研究分析工作。例如銀行在開展近一百萬筆的金錢交易業(yè)務(wù)中,總會個別的存在著近五百筆的金錢欺詐案例,所以銀行就需要針對業(yè)務(wù)經(jīng)營的穩(wěn)定性發(fā)展而采取相關(guān)的對策,針對這五百筆的金錢欺詐案例所包含的內(nèi)在要素進(jìn)行具體的分析發(fā)現(xiàn),使得銀行在經(jīng)營過程中的風(fēng)險性降到最低。在這一過程中需要被關(guān)注的則是:在數(shù)據(jù)挖掘技術(shù)中的各種功能并不是單一性的存在的,其中存在著必然性的聯(lián)系,因此在開展數(shù)據(jù)挖掘的分析過程時,一定要對其中的內(nèi)在聯(lián)系進(jìn)行分析,進(jìn)而將數(shù)據(jù)挖掘技術(shù)的高效功能進(jìn)行最大程度的發(fā)揮。

2數(shù)據(jù)挖掘技術(shù)的主要工具以及運(yùn)行方式

2.1數(shù)據(jù)挖掘技術(shù)運(yùn)行的主要方式

第一,數(shù)據(jù)挖掘在運(yùn)行過程中需要對大量的信息數(shù)據(jù)進(jìn)行處理分析,同時這也是數(shù)據(jù)挖掘技術(shù)得以產(chǎn)生的主要原因;第二,數(shù)據(jù)的不完全性是必然存在的,其主要的特征就在于其隨機(jī)方面以及噪音方面,同時其信息數(shù)據(jù)的組織結(jié)構(gòu)也是繁瑣復(fù)雜,維數(shù)過于大;第三,數(shù)據(jù)挖掘技術(shù)是各種不同領(lǐng)域的科學(xué)性知識的整合,其中針對數(shù)學(xué)以及計算機(jī)、統(tǒng)計學(xué)等各方面進(jìn)行了全面系統(tǒng)的應(yīng)用,是各個領(lǐng)域的交叉內(nèi)容。其中普及程度最為廣泛的算法以及模型主要劃分為以下幾方面:

2.1.2傳統(tǒng)的統(tǒng)計方式

在常用的統(tǒng)計方式中應(yīng)用程度較為普及的主要是抽樣技術(shù),在分析處理大量的信息數(shù)據(jù)的過程中,并沒有可能以及必要性來對全部的信息數(shù)據(jù)進(jìn)行具體的分析,因此要充分的結(jié)合理論性的指導(dǎo)內(nèi)容來將抽樣技術(shù)逐漸的科學(xué)合理化。之后再對多元統(tǒng)計分析方式以及因子分析方式、回歸分析方式、聚類分析方式和時間序列的分析方式等進(jìn)行逐一的整合,并加以應(yīng)用。

2.1.3可視化技術(shù)的應(yīng)用

在直觀表現(xiàn)信息數(shù)據(jù)主要特性的過程中充分的結(jié)合圖標(biāo)的形式,尤其是直方圖的直觀表達(dá),在這一過程中所需要應(yīng)用的描述統(tǒng)計方式也是極其豐富多元化,其中可視化技術(shù)的高效應(yīng)用現(xiàn)階段中的關(guān)鍵問題在于如何將高維數(shù)據(jù)實現(xiàn)最大程度的可視化。

2.1.4決策樹

決策樹主要是對大量的數(shù)據(jù)庫根據(jù)相關(guān)規(guī)則進(jìn)行有效的歸納,將樹狀圖進(jìn)行構(gòu)建,一般情況下都會在分類工作和預(yù)測工作中得到高效的應(yīng)用。其中CART、CHAID、ID3、C4.5、C5.O等計算方法都是在這一工作過程中應(yīng)用頻率最高的。

2.1.5神經(jīng)網(wǎng)絡(luò)方面

神經(jīng)網(wǎng)絡(luò)技術(shù)可以針對人們的神經(jīng)元功能進(jìn)行高效率的模擬實現(xiàn),同時針對輸入層以及隱藏層、輸出層等方面經(jīng)過,使得能夠直觀的調(diào)整、計算相關(guān)的信息數(shù)據(jù),使得其計算結(jié)果精確度能夠得到全面性的提高,常常用在分類方面以及回歸方面。

2.1.6遺傳算法方面

遺傳算法主要是根據(jù)自然進(jìn)化的相關(guān)理論知識為重要基礎(chǔ),進(jìn)一步的優(yōu)化對基因的聯(lián)合以及突變、選擇等進(jìn)行高效的模擬。

2.1.7關(guān)聯(lián)規(guī)則的挖掘計算方法

關(guān)聯(lián)規(guī)則通常情況下是根據(jù)數(shù)據(jù)之間聯(lián)系的規(guī)則性內(nèi)容進(jìn)行具體的分析,其中對大型數(shù)據(jù)的項集進(jìn)行計算和充分的利用大數(shù)據(jù)項集來將其中的關(guān)聯(lián)性規(guī)則形成,是關(guān)聯(lián)規(guī)則中主要的兩大過程。同時粗集計算方法以及模糊集合計算方法、最近鄰計算方法和BayesianBeliefNetords等也都是關(guān)聯(lián)規(guī)則挖掘算法中最為常見的計算方法。

3數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的各項應(yīng)用實際案例

用戶是在進(jìn)行電子商務(wù)活動中數(shù)據(jù)挖掘的主要分析對象。數(shù)據(jù)挖掘技術(shù)能夠?qū)⒂脩糁g的共性以及個性方面的知識進(jìn)行有效的分析研究,同時能夠?qū)⑵渲R內(nèi)容中的必然性和偶然性以及獨(dú)立性和關(guān)聯(lián)性、現(xiàn)實性和預(yù)測性等進(jìn)行高效率的發(fā)現(xiàn)。并且這些知識的發(fā)現(xiàn)層次和概念也是完全不同的,可以從微觀層面逐一地上升到宏觀層面,并且可以對用戶的消費(fèi)行為進(jìn)行直觀的統(tǒng)計分析,尤其是在其消費(fèi)心理以及消費(fèi)能力、消費(fèi)動機(jī)、消費(fèi)需求、消費(fèi)潛能等方面的統(tǒng)計、分析更為精確。使得電子商務(wù)的經(jīng)營人員可以充分的結(jié)合這些分析內(nèi)容來開展相關(guān)的決策工作,使得消費(fèi)人員的需求能夠得到最大程度的滿足。

3.1分類方法和預(yù)測方法在電子商務(wù)中的高效應(yīng)用

分類工作在電子商務(wù)的活動過程中占據(jù)著關(guān)鍵性的地位,同時其應(yīng)用頻率也是最高的。分工工作的主要任務(wù)就是在于將分類函數(shù)以及分類模型等進(jìn)行高效的構(gòu)建,一般情況下都被稱為“分類器”。其中統(tǒng)計法以及機(jī)器學(xué)習(xí)法、神經(jīng)網(wǎng)絡(luò)法是分類器中經(jīng)常會用到的構(gòu)建方法,這些不同的方法可以將信息數(shù)據(jù)庫中的相關(guān)數(shù)據(jù)項目映射到指定的類別中,增加預(yù)測工作中的便利性大大的增強(qiáng),在這一基礎(chǔ)之上能夠?qū)ξ磥淼男畔?shù)據(jù)進(jìn)行行之有效的分析。

3.2聚類分析方法在電子商務(wù)中的高效應(yīng)用

聚類可以針對組類中的個體根據(jù)類似性的規(guī)律將其進(jìn)行科學(xué)合理的劃分。對于電子商務(wù)而言,針對用戶的有效聚類能夠強(qiáng)有力的支持市場化的細(xì)分理論規(guī)律。但是傳統(tǒng)模式下的市場細(xì)分理論在對市場策略的具體制定過程中依然占據(jù)著關(guān)鍵性的地位,市場細(xì)分可以借助不同類別的用戶群體進(jìn)而細(xì)分市場,其主要任務(wù)就在于將同一范圍內(nèi)的用戶個體以及市場進(jìn)行最大程度的拉近工作,同時使得不同領(lǐng)域內(nèi)的個體之間的區(qū)別逐漸地增大,因而能夠借助聚類分析方法來對用戶群體的主要特性進(jìn)行高效的劃分,使得用戶在使用電子商務(wù)互聯(lián)網(wǎng)站的過程中可以享受到個性化的優(yōu)質(zhì)服務(wù)。其中統(tǒng)計法以及機(jī)器學(xué)習(xí)法、神經(jīng)網(wǎng)絡(luò)法等都屬于聚類分析方法的具體范疇之內(nèi)。

3.3數(shù)據(jù)抽取方法在電子商務(wù)中的高效應(yīng)用

和傳統(tǒng)模式下的商務(wù)活動相比較而言,電子商務(wù)活動充斥著各種不穩(wěn)定的因素。比如用戶群體的消費(fèi)心理以及消費(fèi)能力等方方面面,因此數(shù)據(jù)挖掘技術(shù)的關(guān)鍵任務(wù)就是在于要從海量的信息數(shù)據(jù)中尋找出有具體價值意義、有序的相關(guān)數(shù)據(jù)。其中數(shù)據(jù)抽取方法是其中的關(guān)鍵方式之一,能夠從廣泛的視角中對數(shù)據(jù)進(jìn)行高效的分析整合,因此其主要的針對目標(biāo)就在于電子商務(wù)活動過程中的用戶群體的信息數(shù)據(jù)化大倉庫。并且在具體的運(yùn)作過程中計算量過于高,可以將其中的結(jié)果進(jìn)行提前的計算并進(jìn)行有效的存儲工作,增強(qiáng)工作過程中的工作質(zhì)量。

3.4數(shù)據(jù)挖掘技術(shù)在電子商業(yè)中的具體應(yīng)用案例

第一,數(shù)據(jù)挖掘技術(shù)可以應(yīng)用與電子商業(yè)營銷中。市場營銷就是以對市場進(jìn)行細(xì)分為基礎(chǔ)的,按照營銷學(xué)的相關(guān)理論可知,消費(fèi)者現(xiàn)在的消費(fèi)行為將決定他們以后的消費(fèi)趨勢。因此,要收集大量和消費(fèi)者行為有關(guān)的數(shù)據(jù)信息,并要對這些數(shù)據(jù)信息進(jìn)行進(jìn)一步的處理,主要的工序包括對數(shù)據(jù)信息進(jìn)行分類、分析研究以及再加工等。首先,根據(jù)產(chǎn)品的銷售情況和消費(fèi)者對產(chǎn)品需求的反饋信息對產(chǎn)品的生命周期進(jìn)行分析;其次,是對市場進(jìn)行細(xì)分。需要使用到客戶聚類分析法,找出客戶之間的關(guān)系,即有何相同的消費(fèi)行為。根據(jù)客戶群對市場進(jìn)行進(jìn)一步的細(xì)分。然后,進(jìn)行產(chǎn)品定價。產(chǎn)品定價需要使用關(guān)聯(lián)分析,主要分析消費(fèi)者對于某些品牌的忠誠度、價格接受情況等。最后,就是進(jìn)行營銷。根據(jù)上述的工作結(jié)果確定最終的營銷策略;第二,數(shù)據(jù)挖掘技術(shù)可以應(yīng)用在電子商務(wù)廣告宣傳方面。所有瀏覽網(wǎng)絡(luò)廣告的客戶都有可能成為潛在的客戶,所以很多商家都選擇在網(wǎng)絡(luò)上做廣告。但選擇做廣告的網(wǎng)絡(luò)平臺就需要使用到數(shù)據(jù)挖掘技術(shù)。一方面要選擇點(diǎn)擊率比較高的網(wǎng)站,另一個方面還要選擇具有針對性的網(wǎng)站。而這些數(shù)據(jù)信息都被保存在數(shù)據(jù)庫中,需要利用專業(yè)的數(shù)據(jù)挖掘知識對其進(jìn)行加工處理使之成為有價值的信息。

4總結(jié)

隨著現(xiàn)代化信息高新技術(shù)的高效發(fā)展,電子商務(wù)的出現(xiàn)是必然性的趨勢推動而生成的,其代表了未來的商業(yè)運(yùn)作的主要形式。因此要將信息網(wǎng)絡(luò)化的基礎(chǔ)設(shè)備的建設(shè)進(jìn)一步的加強(qiáng),將企業(yè)中的電子商務(wù)化活動進(jìn)行正確積極的推動,同時將電子商務(wù)中的安全運(yùn)行機(jī)制以及物流配送的機(jī)制進(jìn)行進(jìn)一步的改善,使得電子商務(wù)的發(fā)展環(huán)境能夠被優(yōu)化,進(jìn)而將企業(yè)的管理方式進(jìn)行改革創(chuàng)新工作,推動企業(yè)的進(jìn)步發(fā)展。

作者:周穎 單位:江蘇省宜興中等專業(yè)學(xué)校