數(shù)據(jù)挖掘應(yīng)用于電子商務(wù)中存在問(wèn)題

時(shí)間:2022-02-10 11:22:00

導(dǎo)語(yǔ):數(shù)據(jù)挖掘應(yīng)用于電子商務(wù)中存在問(wèn)題一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

數(shù)據(jù)挖掘應(yīng)用于電子商務(wù)中存在問(wèn)題

網(wǎng)絡(luò)的發(fā)展帶動(dòng)了電子商務(wù)市場(chǎng)的繁榮,大量的商品、信息在現(xiàn)有的網(wǎng)絡(luò)平臺(tái)上得以交易,大大簡(jiǎn)化了傳統(tǒng)的交易方式,節(jié)約了時(shí)間,提高了效率,但電子市場(chǎng)繁榮背后隱藏的問(wèn)題,也成為人們關(guān)注的焦點(diǎn),突出表現(xiàn)在海量信息的有效利用上,如何更加有效的管理利用潛在信息,使他們的最大效用得以發(fā)揮,成為人們現(xiàn)在研究的重點(diǎn),數(shù)據(jù)挖掘技術(shù)的產(chǎn)生,在一定程度上解決了這個(gè)問(wèn)題,但它也存在著問(wèn)題,需要不斷改善。

數(shù)據(jù)挖掘(DataMining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的原始數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。或者說(shuō)是從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)有用的知識(shí)(KDD),并進(jìn)行數(shù)據(jù)分析、數(shù)據(jù)融合(DataFusion)以及決策支持的過(guò)程。數(shù)據(jù)挖掘是一門廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域的研究者,尤其是數(shù)據(jù)庫(kù)、人工智能、數(shù)理統(tǒng)計(jì)、可視化、并行計(jì)算等方面的學(xué)者和工程技術(shù)人員。

數(shù)據(jù)挖掘技術(shù)在電子商務(wù)的應(yīng)用

1找到潛在客戶

在對(duì)Web的客戶訪問(wèn)信息的挖掘中,利用分類技術(shù)可以在Internet上找到未來(lái)的潛在客戶。使用者可以先對(duì)已經(jīng)存在的訪問(wèn)者根據(jù)其行為進(jìn)行分類,并依此分析老客戶的一些公共屬性,決定他們分類的關(guān)鍵屬性及相互間關(guān)系。對(duì)于一個(gè)新的訪問(wèn)者,通過(guò)在Web上的分類發(fā)現(xiàn),識(shí)別出這個(gè)客戶與已經(jīng)分類的老客戶的一些公共的描述,從而對(duì)這個(gè)新客戶進(jìn)行正確的分類。然后從它的分類判斷這個(gè)新客戶是有利可圖的客戶群還是無(wú)利可圖的客戶群,決定是否要把這個(gè)新客戶作為潛在的客戶來(lái)對(duì)待??蛻舻念愋痛_定后,可以對(duì)客戶動(dòng)態(tài)地展示W(wǎng)eb頁(yè)面,頁(yè)面的內(nèi)容取決于客戶與銷售商提供的產(chǎn)品和服務(wù)之間的關(guān)聯(lián)。若為潛在客戶,就可以向這個(gè)客戶展示一些特殊的、個(gè)性化的頁(yè)面內(nèi)容。

2實(shí)現(xiàn)客戶駐留

在電子商務(wù)中,傳統(tǒng)客戶與銷售商之間的空間距離已經(jīng)不存在,在Internet上,每一個(gè)銷售商對(duì)于客戶來(lái)說(shuō)都是一樣的,那么使客戶在自己的銷售站點(diǎn)上駐留更長(zhǎng)的時(shí)間,對(duì)銷售商來(lái)說(shuō)則是一個(gè)挑戰(zhàn)。為了使客戶在自己的網(wǎng)站上駐留更長(zhǎng)的時(shí)間,就應(yīng)該全面掌握客戶的瀏覽行為,知道客戶的興趣及需求所在,并根據(jù)需求動(dòng)態(tài)地向客戶做頁(yè)面推薦,調(diào)整Web頁(yè)面,提供特有的一些商品信息和廣告,以使客戶滿意,從而延長(zhǎng)客戶在自己的網(wǎng)站上的駐留的時(shí)間。

3改進(jìn)站點(diǎn)的設(shè)計(jì)

數(shù)據(jù)挖掘技術(shù)可提高站點(diǎn)的效率,Web設(shè)計(jì)者不再完全依靠專家的定性指導(dǎo)來(lái)設(shè)計(jì)網(wǎng)站,而是根據(jù)訪問(wèn)者的信息特征來(lái)修改和設(shè)計(jì)網(wǎng)站結(jié)構(gòu)和外觀。站點(diǎn)上頁(yè)面內(nèi)容的安排和連接就如超級(jí)市場(chǎng)中物品的貨架擺布一樣,把具有一定支持度和信任度的相關(guān)聯(lián)的物品擺放在一起有助于銷售。網(wǎng)站盡可能做到讓客戶輕易地訪問(wèn)到想訪問(wèn)的頁(yè)面,給客戶留下好的印象,增加下次訪問(wèn)的機(jī)率。

4進(jìn)行市場(chǎng)預(yù)測(cè)

通過(guò)Web數(shù)據(jù)挖掘,企業(yè)可以分析顧客的將來(lái)行為,容易評(píng)測(cè)市場(chǎng)投資回報(bào)率,得到可靠的市場(chǎng)反饋信息。不僅大大降低公司的運(yùn)營(yíng)成本,而且便于經(jīng)營(yíng)決策的制定。

數(shù)據(jù)挖掘在應(yīng)用中面臨的問(wèn)題

1數(shù)據(jù)挖掘分析變量的選擇

數(shù)據(jù)挖掘的基本問(wèn)題就在于數(shù)據(jù)的數(shù)量和維數(shù),數(shù)據(jù)結(jié)構(gòu)顯的非常復(fù)雜,數(shù)據(jù)分析變量即是在數(shù)據(jù)挖掘中技術(shù)應(yīng)用中產(chǎn)生的,選擇合適的分析變量,將提高數(shù)據(jù)挖掘的效率,特別適用于電子商務(wù)中大量商品以及用戶信息的處理。

針對(duì)這一問(wèn)題,我們完全可以用分類的方法,分析出不同信息的屬性以及出現(xiàn)頻率進(jìn)而抽象出變量,運(yùn)用到所選模型中,進(jìn)行分析。

2數(shù)據(jù)抽取的方法的選擇

數(shù)據(jù)抽取的目的是對(duì)數(shù)據(jù)進(jìn)行濃縮,給出它的緊湊描述,如求和值、平均值、方差值、等統(tǒng)計(jì)值、或者用直方圖、餅狀圖等圖形方式表示,更主要的是他從數(shù)據(jù)泛化的角度來(lái)討論數(shù)據(jù)總結(jié)。數(shù)據(jù)泛化是一種把最原始、最基本的信息數(shù)據(jù)從低層次抽象到高層次上的過(guò)程??刹捎枚嗑S數(shù)據(jù)分析方法和面向?qū)傩缘臍w納方法。

在電子商務(wù)活動(dòng)中,采用維數(shù)據(jù)分析方法進(jìn)行數(shù)據(jù)抽取,他針對(duì)的是電子商務(wù)活動(dòng)中的客戶數(shù)據(jù)倉(cāng)庫(kù)。在數(shù)據(jù)分析中經(jīng)常要用到諸如求和、總計(jì)、平均、最大、最小等匯集操作,這類操作的計(jì)算量特別大,可把匯集操作結(jié)果預(yù)先計(jì)算并存儲(chǔ)起來(lái),以便用于決策支持系統(tǒng)使用

3數(shù)據(jù)趨勢(shì)的預(yù)測(cè)

數(shù)據(jù)是海量的,那么數(shù)據(jù)中就會(huì)隱含一定的變化趨勢(shì),在電子商務(wù)中對(duì)數(shù)據(jù)趨勢(shì)的預(yù)測(cè)尤為重要,特別是對(duì)客戶信息以及商品信息合理的預(yù)測(cè),有利于企業(yè)有效的決策,獲得更多地利潤(rùn)。但如何對(duì)這一趨勢(shì)做出合理的預(yù)測(cè),現(xiàn)在還沒(méi)有統(tǒng)一標(biāo)準(zhǔn)可尋,而且在進(jìn)行數(shù)據(jù)挖掘過(guò)程中大量數(shù)據(jù)形成文本后格式的非標(biāo)準(zhǔn)化,也給數(shù)據(jù)的有效挖掘帶來(lái)了困難。

針對(duì)這一問(wèn)題的產(chǎn)生,我們?cè)陔娮由虅?wù)中可以應(yīng)用聚類分析的方法,把具有相似瀏覽模式的用戶集中起來(lái),對(duì)其進(jìn)行詳細(xì)的分析,從而提供更適合、更令用戶滿意的服務(wù)。聚類分析方法的優(yōu)勢(shì)在于便于用戶在查看日志時(shí)對(duì)商品及客戶信息有全面及清晰的掌控,便于開發(fā)和執(zhí)行未來(lái)的市場(chǎng)戰(zhàn)略,包括自動(dòng)給一個(gè)特定的顧客聚類發(fā)送銷售郵件,為一個(gè)顧客聚類動(dòng)態(tài)地改變一個(gè)特殊的站點(diǎn)等,這無(wú)論對(duì)客戶和銷售商來(lái)說(shuō)都是有意義。

4數(shù)據(jù)模型的可靠性

數(shù)據(jù)模型包括概念數(shù)據(jù)模型、邏輯數(shù)據(jù)模型、物理模型。數(shù)據(jù)挖掘的模型目前也有多種,包括采集模型、處理模型及其他模型,但無(wú)論哪種模型都不是很成熟存在缺陷,對(duì)數(shù)據(jù)模型不同采用不同的方式應(yīng)用??赡墚a(chǎn)生不同的結(jié)果,甚至差異很大,因此這就涉及到數(shù)據(jù)可靠性的問(wèn)題。數(shù)據(jù)的可靠性對(duì)于電子商務(wù)來(lái)說(shuō)尤為重要作用。

針對(duì)這一問(wèn)題,我們要保障數(shù)據(jù)在挖掘過(guò)程中的可靠性,保證它的準(zhǔn)確性與實(shí)時(shí)性,進(jìn)而使其在最后的結(jié)果中的準(zhǔn)確度達(dá)到最高,同時(shí)在應(yīng)用模型過(guò)程中要盡量全面的分析問(wèn)題,避免片面,而且分析結(jié)果要由多人進(jìn)行評(píng)價(jià),從而最大限度的保證數(shù)據(jù)的可靠性。

5數(shù)據(jù)挖掘涉及到數(shù)據(jù)的私有性和安全性

大量的數(shù)據(jù)存在著私有性與安全性的問(wèn)題,特別是電子商務(wù)中的各種信息,這就給數(shù)據(jù)挖掘造成了一定的阻礙,如何解決這一問(wèn)題成為了技術(shù)在應(yīng)用中的關(guān)鍵。

為此相關(guān)人員在進(jìn)行數(shù)據(jù)挖掘過(guò)程中一定要遵守職業(yè)道德,保障信息的機(jī)密性。

6數(shù)據(jù)挖掘結(jié)果的不確定性

數(shù)據(jù)挖掘結(jié)果具有不確定性的特征,因?yàn)橥诰虻哪康牟煌宰詈笸诰虻慕Y(jié)果自然也會(huì)千差萬(wàn)別,以因此這就需要我們與所要挖掘的目的相結(jié)合,做出合理判斷,得出企業(yè)所需要的信息,便于企業(yè)的決策選擇。進(jìn)而達(dá)到提高企業(yè)經(jīng)濟(jì)效益,獲得更多利潤(rùn)的目的。

數(shù)據(jù)挖掘可以發(fā)現(xiàn)一些潛在的用戶,對(duì)于電子商務(wù)來(lái)說(shuō)是一個(gè)不可或缺的技術(shù)支持,數(shù)據(jù)挖掘的成功要求使用者對(duì)期望解決問(wèn)題的領(lǐng)域有深刻的了解,數(shù)據(jù)挖掘技術(shù)在一定程度上解決了電子商務(wù)信息不能有效利用的問(wèn)題,但它在運(yùn)用過(guò)程中出現(xiàn)的問(wèn)題也亟待人們?nèi)ソ鉀Q。相信數(shù)據(jù)挖掘技術(shù)的改進(jìn)將推進(jìn)電子商務(wù)的深入發(fā)展。

參考文獻(xiàn):

[1]胡迎松,寧海霞.一種新型的Web挖掘數(shù)據(jù)采集模型[J].計(jì)算機(jī)工程與科學(xué),2007

[2]章寒雁,楊瑞珍.數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的研究與應(yīng)用[J].計(jì)算機(jī)與網(wǎng)絡(luò),2007

[3]董德民.面向電子商務(wù)的Web使用挖掘及其應(yīng)用研究[J].中國(guó)管理信息化,2006

[4]尹中強(qiáng).電子商務(wù)中的Web數(shù)據(jù)挖掘技術(shù)應(yīng)用[J].計(jì)算機(jī)與信息技術(shù),2007