電子商務(wù)挖掘技術(shù)運用
時間:2022-06-27 08:31:22
導(dǎo)語:電子商務(wù)挖掘技術(shù)運用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
目前隨著電子商務(wù)經(jīng)濟環(huán)境的逐漸發(fā)展完善,企業(yè)從傳統(tǒng)意義上的區(qū)域內(nèi)銷售,到跨地域限制的全球銷售,從原料選購、產(chǎn)品宣傳、銷售、貨款結(jié)算及售后服務(wù)一系列環(huán)節(jié)都在網(wǎng)絡(luò)上進行。這樣,網(wǎng)站是電子商務(wù)中最為重要的介質(zhì)。網(wǎng)站對用戶的吸引程度直接決定了企業(yè)發(fā)展。為了使企業(yè)不斷壯大,不斷提升企業(yè)競爭力,企業(yè)決策者開始搭建獨具創(chuàng)新的,更具個性化的,更能吸引客戶的一流的信息化網(wǎng)站,其中個性化特征是各企業(yè)追捧的方式之一。如何從眾多數(shù)據(jù)中抽取出個性化的數(shù)據(jù),就運行到了數(shù)據(jù)挖掘技術(shù)。本文將對數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用做重點介紹。
1數(shù)據(jù)挖掘概念
數(shù)據(jù)挖掘(DataMining)是一種信息轉(zhuǎn)化的過程,將各種無律的、非完整的、雜亂無章的、隨機的信息中經(jīng)過各種方式轉(zhuǎn)化成我們需要的、有用的信息。Web數(shù)據(jù)挖掘(WebDataMining)是將數(shù)據(jù)挖掘技術(shù)應(yīng)用到Web網(wǎng)頁中。即從Web各種活動信息中分析提取出有用的隱藏信息,在一定程度上利用數(shù)據(jù)挖掘技術(shù)提取出有用的知識來幫助企業(yè)和用戶更好地從網(wǎng)站中得到各自所需要的信息。
2Web數(shù)據(jù)挖掘的分類
Web數(shù)據(jù)挖掘大概可以分為三大類:Web頁面信息挖掘(WebContentMining)、Web用戶記錄挖掘(WebUsageMining)、Web結(jié)構(gòu)挖掘(WebStructureMining)。Web頁面信息挖掘是指從頁面的內(nèi)容中或者網(wǎng)頁描述中收集有用信息進行挖掘,根據(jù)類型不同,可以分為文本挖掘、圖片挖掘和視頻挖掘等。Web用戶記錄挖掘是當(dāng)用戶訪問頁面時,記錄用戶訪問頁面的信息,根據(jù)用戶在頁面的停留時間,訪問的產(chǎn)品等等進行信息挖掘,運用一些數(shù)學(xué)方法建立用戶興趣和關(guān)注模型,不斷的跟蹤用戶完善模型,預(yù)計猜測用戶行為,從而可以對用戶進行分類,為不同用戶量身制作自身最感興趣的產(chǎn)品信息,從而對不同用戶動態(tài)更新個性化產(chǎn)品展示和相關(guān)廣告,取得利益最大化。Web結(jié)構(gòu)挖掘是指從Web網(wǎng)頁之間的關(guān)聯(lián)性進行挖掘,如分析一個網(wǎng)頁鏈接和被鏈接數(shù)量來建立Web自身鏈接的結(jié)構(gòu)模式。將相似產(chǎn)品網(wǎng)頁歸類,將關(guān)聯(lián)產(chǎn)品進行整合。使得用戶非常容易的找到相關(guān)產(chǎn)品,類似產(chǎn)品的信息。
3電子商務(wù)中Web數(shù)據(jù)挖掘的步驟
數(shù)據(jù)挖掘的步驟:確定數(shù)據(jù)挖掘的對象,確定電子商務(wù)網(wǎng)站應(yīng)用主題,確定網(wǎng)站業(yè)務(wù)對象;其次收集數(shù)據(jù)源,數(shù)據(jù)的真實性、全面性直接影響到后續(xù)工作。數(shù)據(jù)源主要有服務(wù)器端/客戶端數(shù)據(jù)、中間數(shù)據(jù)等;收集完數(shù)據(jù)后,需要對其進行預(yù)處理,一般包括用戶識別、格式化等階段,刪除無用無關(guān)的信息,以提高挖掘效率;之后運用機器學(xué)習(xí)及其數(shù)學(xué)統(tǒng)計方法對這些數(shù)據(jù)進行挖掘和分析,找到相同想去的用戶群,對用戶群構(gòu)建興趣模型。最后用已知的數(shù)據(jù)對興趣模型進行反復(fù)測試和不斷分析,再次應(yīng)用興趣模型得到最終挖掘的信息。具體步驟如圖1所示。下面對幾個重要步驟進行更詳盡的分析。
3.1電子商務(wù)中Web數(shù)據(jù)挖掘的數(shù)據(jù)源選定
在電子商務(wù)中,Web數(shù)據(jù)源的選定的準(zhǔn)確性、全面性直接關(guān)系到整個數(shù)據(jù)挖掘流程,所謂重中之重。這些數(shù)據(jù)都有量大類多的特點,歸納一下主要有以下幾種數(shù)據(jù),如圖2所示。①日志數(shù)據(jù)。當(dāng)用戶訪問網(wǎng)頁時,Web網(wǎng)頁會記錄一些日志文件,這些文件通常以文本形式存儲在服務(wù)器上,比如cookies日志文件、錯誤日志文件等。②用戶喜好信息。指的是用戶經(jīng)常訪問的一些產(chǎn)品信息,用戶感興趣的產(chǎn)品等等。③搜索查詢數(shù)據(jù)。這類數(shù)據(jù)是電子商務(wù)網(wǎng)站中比較常見的而且很典型的數(shù)據(jù)。當(dāng)用戶用Web網(wǎng)頁中的搜索引擎搜索需要的產(chǎn)品信息或廣告信息時,Web網(wǎng)頁需要記錄必要的搜索信息,保存到服務(wù)器上,這些數(shù)據(jù)對之后數(shù)據(jù)挖掘建模有重要作用。④在線瀏覽,用戶購買信息。產(chǎn)品瀏覽量信息,用戶購買信息等等。⑤產(chǎn)品信息。各個產(chǎn)品的屬性信息。⑥客戶端的客戶信息數(shù)據(jù)。即用戶注冊登錄時,存儲到數(shù)據(jù)庫中的姓名,職業(yè),email等等信息。在Web的數(shù)據(jù)挖掘中,用戶注冊的ID等信息需要和一些搜索查詢數(shù)據(jù)信息結(jié)合起來使用,用來提高數(shù)據(jù)挖掘的精準(zhǔn)度,使得能夠更進一步地了解具體客戶的具體需求。
3.2Web數(shù)據(jù)挖掘如何建立數(shù)據(jù)模型
一般情況下,運用Web數(shù)據(jù)挖掘可以在站點上挖掘出來的興趣模型有以下幾種:①分析頻繁路徑??梢愿鶕?jù)一個Web站點中最頻繁的網(wǎng)頁路徑得到重要的網(wǎng)頁,從而根據(jù)這一信息對網(wǎng)頁結(jié)構(gòu)進行改進。②序列模式分析。序列模式分析即在有序的時間戳事務(wù)集中,尋找那些“一些事務(wù)跟隨另一些事務(wù)”的序列事務(wù)模式。如購買自行車的客戶中,有70%的客戶會在一個月之內(nèi)購買打氣筒。③聚類分析。聚類分析可以對Web網(wǎng)站中的用戶進行分類,找到具有相似需求的客戶??梢詫@類客戶進行針對性的區(qū)別服務(wù)。如發(fā)送特定產(chǎn)品的銷售郵件及其推薦產(chǎn)品。對電子商務(wù)來說,將客戶分類可以對市場細分理論提供更加有力的理論數(shù)據(jù)支持。④關(guān)聯(lián)規(guī)則。可以找到用戶購買產(chǎn)品的相關(guān)性。如筆記本需要有好多配件,有耳機,麥克,電源,電池,鼠標(biāo),鍵盤膜等等其他構(gòu)件。利用這些相關(guān)性,可以更好的設(shè)計具體產(chǎn)品頁面的關(guān)聯(lián)產(chǎn)品信息,實施有效的市場策略,增加交叉產(chǎn)品的銷售額,能夠讓用戶快速找到所需要的產(chǎn)品信息。⑤異常檢測。異常檢測的前提是假設(shè)入侵者行為有別于正常用戶的行為。根據(jù)這一前提,建立用戶正常活動的活動檔案,將當(dāng)前用戶的活動行為與活動檔案相比較,當(dāng)發(fā)現(xiàn)有別于統(tǒng)計規(guī)律時,認(rèn)為該行為可能是“入侵”行為。
4結(jié)論
隨著電子商務(wù)的發(fā)展,電子商務(wù)領(lǐng)域正在迅速地擴大。由于電子商務(wù)的跨地域性,信息快速獲取性等等特點,各大企業(yè)競相開展電子商務(wù)模式。運用Web數(shù)據(jù)挖掘技術(shù),可以對電子商務(wù)中的各種繁雜的無頭緒的信息進行整合、刪選、歸并及其分析處理,從而更好地反饋到網(wǎng)站供用戶訪問。數(shù)據(jù)挖掘技術(shù)把這些高深復(fù)雜的數(shù)學(xué)統(tǒng)計方法、人工智能等技術(shù)封裝起來,使人們不用自己掌握這些技術(shù)也能完成同樣的功能,將更多的時間和精力放在自己所要解決的問題上,使得企業(yè)利益快速達到最大化。