數(shù)據(jù)挖掘提取知識及有用信息論文
時(shí)間:2022-05-15 06:41:00
導(dǎo)語:數(shù)據(jù)挖掘提取知識及有用信息論文一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
編者按:本文主要從前言;數(shù)據(jù)挖掘方法在商業(yè)信息中應(yīng)用的規(guī)則;數(shù)據(jù)挖掘技術(shù)在商業(yè)信息中的應(yīng)用;結(jié)束語進(jìn)行論述。其中,主要包括:商業(yè)信息的增長速度呈現(xiàn)指數(shù)上升、數(shù)據(jù)挖掘技術(shù)在商業(yè)中的應(yīng)用主要基于AI、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等技術(shù)、商業(yè)信息泛化、簡約和特征提取規(guī)則、商業(yè)信息分類技術(shù)規(guī)則、商業(yè)信息的聚類規(guī)則、商業(yè)信息的關(guān)聯(lián)規(guī)則、數(shù)據(jù)挖掘技術(shù)在電子商務(wù)網(wǎng)站數(shù)據(jù)中的應(yīng)用、數(shù)據(jù)挖掘技術(shù)可以用在金融領(lǐng)域的應(yīng)用、數(shù)據(jù)挖掘技術(shù)在企業(yè)市場營銷中的應(yīng)用、電信業(yè)交叉銷售和提升銷售解決方案、預(yù)測哪些客戶最具有流失的傾向以及影響客戶流失的關(guān)鍵因素等,具體請?jiān)斠姟?/p>
0前言
隨著現(xiàn)代商業(yè)經(jīng)濟(jì)和信息技術(shù)的發(fā)展,商業(yè)信息的增長速度呈現(xiàn)指數(shù)上升,積累了海量的、以不同形式存儲的商業(yè)數(shù)據(jù)資料,原有的決策支持系統(tǒng)(DSS)和領(lǐng)導(dǎo)執(zhí)行系統(tǒng)(EIS)已不能滿足需要,這時(shí)出現(xiàn)數(shù)據(jù)挖掘技術(shù),它能夠去粗存精、去偽存真,從海量的商業(yè)信息中提取知識和有用信息的技術(shù)?,F(xiàn)代信息技術(shù)處理商業(yè)信息經(jīng)過一定的發(fā)展,逐步形成現(xiàn)在的商業(yè)數(shù)據(jù)挖掘技術(shù)。
1.?dāng)?shù)據(jù)挖掘方法在商業(yè)信息中應(yīng)用的規(guī)則
數(shù)據(jù)挖掘技術(shù)在商業(yè)中的應(yīng)用主要基于AI、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等技術(shù),高度自動(dòng)化地分析商業(yè)原始數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,預(yù)測客戶的行為,幫助商業(yè)決策者調(diào)整市場策略,減少風(fēng)險(xiǎn),做出正確的決策,體現(xiàn)一種決策支持過程。
1.1商業(yè)信息泛化、簡約和特征提取規(guī)則。商業(yè)信息泛化是為了商業(yè)數(shù)據(jù)更好的理解和掌握,將其具體一般的數(shù)據(jù)信息抽象到較高層次的過程;商業(yè)信息簡約是為了采用一定的手段對信息進(jìn)行描述;商業(yè)信息特征是找出這些信息的共同特征,尋找信息的通用性特征式。
1.2商業(yè)信息分類技術(shù)規(guī)則。商業(yè)信息分類是按照一組商業(yè)信息對象的特征給出信息對象劃分的過程。其目的是學(xué)會一個(gè)分類函數(shù)或分類模型,該模型能把數(shù)據(jù)庫的數(shù)據(jù)信息項(xiàng)映射到給定類別中的某一個(gè)。
1.3商業(yè)信息的聚類規(guī)則。聚類規(guī)則是識別一組信息對象的內(nèi)在規(guī)則,從而將對象分組,構(gòu)成相似的對象類,從而找出數(shù)據(jù)信息的分布規(guī)律,并進(jìn)一步去發(fā)現(xiàn)隱含在一組混雜的數(shù)據(jù)信息集里的分類規(guī)則。聚類是把一組個(gè)體按照相似性歸類,即"物以類聚"。使屬于同一類別的個(gè)體之間的距離盡可能小,而不同類別的個(gè)體間的距離盡可能大。
1.4商業(yè)信息的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的商業(yè)數(shù)據(jù)挖掘已經(jīng)從單一概念層次的關(guān)聯(lián)規(guī)則發(fā)展到多概念層次的關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)。關(guān)聯(lián)規(guī)則是如下的一種規(guī)則:"我們在研究大型商場的顧客在購買上衣和褲子的時(shí)候,發(fā)現(xiàn)其中在這些顧客中有10%的顧客同時(shí)買了帽子(上衣+褲子+帽子),這就形成簡單的關(guān)聯(lián)規(guī)則。除了具有上述關(guān)聯(lián)規(guī)律,還有時(shí)間或序列上的規(guī)律,在不同的時(shí)間(春夏秋冬)所購的衣服、褲子以及帽子是不相同的,并且不同層次或者不同年齡的人所購商品又有一定的規(guī)律性。
2.?dāng)?shù)據(jù)挖掘技術(shù)在商業(yè)信息中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)是目前在商業(yè)信息處理中應(yīng)用的比較多的一項(xiàng)技術(shù),為了在商業(yè)領(lǐng)域中對海量數(shù)據(jù)庫和大量復(fù)雜信息中提取有價(jià)值的知識,進(jìn)一步提高信息的利用率,對公司及時(shí)制定相應(yīng)的對策有非常重要的意義,在這里,討論幾個(gè)主要商業(yè)行業(yè)中的商業(yè)信息處理。
2.1數(shù)據(jù)挖掘技術(shù)在電子商務(wù)網(wǎng)站數(shù)據(jù)中的應(yīng)用
隨著Web技術(shù)的發(fā)展,電子商務(wù)網(wǎng)站正在成為現(xiàn)在商家的必爭之地。如何讓電子商務(wù)網(wǎng)站有效益要想有效益就必須吸引客戶,增加能帶來效益的客戶忠誠度。電子商務(wù)網(wǎng)站每天都可能有上百萬次的在線交易,生成大量的記錄文件和登記表,如何對這些數(shù)據(jù)進(jìn)行分析和挖掘,充分了解客戶的喜好、購買模式,甚至是客戶一時(shí)的沖動(dòng),設(shè)計(jì)出滿足于不同客戶群體需要的個(gè)性化網(wǎng)站,進(jìn)而增加其競爭力,幾乎變得勢在必行。若想在競爭中生存進(jìn)而獲勝,就要比您的競爭對手更了解客戶。
在對網(wǎng)站進(jìn)行數(shù)據(jù)挖掘時(shí),所需要的數(shù)據(jù)主要來自于兩個(gè)方面:一方面是客戶的背景信息,此部分信息主要來自于客戶的登記表;而另外一部分?jǐn)?shù)據(jù)主要來自瀏覽者的點(diǎn)擊流,此部分?jǐn)?shù)據(jù)主要用于考察客戶的行為表現(xiàn)。但有的時(shí)候,客戶對自己的背景信息十分珍重,不肯把這部分信息填寫在登記表上,這就會給數(shù)據(jù)分析和挖掘帶來不便。在這種情況之下,就不得不從瀏覽者的表現(xiàn)數(shù)據(jù)中來推測客戶的背景信息,進(jìn)而再加以利用。就分析和建立模型的技術(shù)和算法而言,網(wǎng)站的數(shù)據(jù)挖掘和原來的數(shù)據(jù)挖掘差別并不是特別大,很多方法和分析思想都可以運(yùn)用。所不同的是網(wǎng)站的數(shù)據(jù)格式有很大一部分來自于點(diǎn)擊流,和傳統(tǒng)的數(shù)據(jù)庫格式有區(qū)別。因而對電子商務(wù)網(wǎng)站進(jìn)行數(shù)據(jù)挖掘所做的主要工作是數(shù)據(jù)準(zhǔn)備。
2.2數(shù)據(jù)挖掘技術(shù)可以用在金融領(lǐng)域的應(yīng)用
金融事務(wù)需要搜集和處理大量數(shù)據(jù),對這些數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)其數(shù)據(jù)模式及特征,然后可能發(fā)現(xiàn)某個(gè)客戶、消費(fèi)群體或組織的金融和商業(yè)興趣,并可觀察金融市場的變化趨勢。
數(shù)據(jù)挖掘在銀行信息中的應(yīng)用。商業(yè)銀行業(yè)務(wù)的利潤和風(fēng)險(xiǎn)是共存的。為了保證最大的利潤和最小的風(fēng)險(xiǎn),必須對賬戶進(jìn)行科學(xué)的分析和歸類,并進(jìn)行信用評估,利用數(shù)據(jù)挖掘工具,可以根據(jù)客戶的消費(fèi)模式預(yù)測何時(shí)為客戶提供何種產(chǎn)品。銀行如何讓一家新開的銀行網(wǎng)點(diǎn)實(shí)現(xiàn)快速贏利呢?銀行結(jié)合了GPS推理信息系統(tǒng)和商業(yè)智能應(yīng)用系統(tǒng),在銀行的客戶信息中,詳細(xì)記錄有客戶的常駐地,并且,當(dāng)銀行客戶到該銀行網(wǎng)點(diǎn)辦理業(yè)務(wù)時(shí),銀行商業(yè)智能系統(tǒng)將自動(dòng)記錄客戶的操作信息,以及銀行網(wǎng)點(diǎn)地址信息。經(jīng)過大量的記錄,客戶的常駐地到銀行網(wǎng)點(diǎn)的行動(dòng)路線,將被通過數(shù)據(jù)分析而得出。大量的客戶路線得出后,我們可能會發(fā)現(xiàn),某個(gè)地區(qū)進(jìn)行銀行業(yè)務(wù)操作的客戶特別多,但他們附近沒有銀行網(wǎng)點(diǎn),而是要到離他們較遠(yuǎn)的地方去辦理,于是銀行就決定在這個(gè)地區(qū)開辦一個(gè)銀行網(wǎng)點(diǎn)。
數(shù)據(jù)挖掘在證券信息中的應(yīng)用。上市公司定期公布的財(cái)務(wù)報(bào)告具有很強(qiáng)的信息含量,但是當(dāng)期會計(jì)盈余數(shù)據(jù)的信息會在披露前后在股票市價(jià)中迅速得以體現(xiàn)。因此對于中長期投資者來說,重要的是預(yù)見未來。質(zhì)地優(yōu)良且未來具有較高盈利增長能力的公司是中長期投資者(包括普通投資者,證券投資基金和券商)普遍關(guān)注的對象,因?yàn)橹挥羞@類公司才能給投資者帶來持續(xù)的回報(bào)。而財(cái)務(wù)報(bào)告包含了大量描述公司經(jīng)營狀況的數(shù)據(jù)。這些數(shù)據(jù)應(yīng)能為投資者提供關(guān)于公司未來盈利能力的信息。對于中長期投資者而言,需要做的就是利用這些信息挖掘出未來能夠具有較高盈利水平同時(shí)又具有較好的成長性公司。采用數(shù)據(jù)挖掘技術(shù)來發(fā)掘這些財(cái)務(wù)報(bào)告中是否包含關(guān)于公司未來盈利情況的信息,獲得較精確的預(yù)測效果,選出的投資組合能否獲得超額收益,這對于投資者來說是非常重要的。
2.3數(shù)據(jù)挖掘技術(shù)在企業(yè)市場營銷中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)在企業(yè)市場營銷中得到了比較普遍的應(yīng)用,它是以市場營銷學(xué)的市場細(xì)分原理為基礎(chǔ),其基本假定是"消費(fèi)者過去的行為是其今后消費(fèi)傾向的最好說明"。通過收集、加工和處理涉及消費(fèi)者消費(fèi)行為的大量信息,確定特定消費(fèi)群體或個(gè)體的興趣、消費(fèi)習(xí)慣、消費(fèi)傾向和消費(fèi)需求,進(jìn)而推斷出相應(yīng)消費(fèi)群體或個(gè)體下一步的消費(fèi)行為,然后以此為基礎(chǔ),對所識別出來的消費(fèi)群體進(jìn)行特定內(nèi)容的定向營銷,這與傳統(tǒng)的不區(qū)分消費(fèi)者對象特征的大規(guī)模營銷手段相比,大大節(jié)省了營銷成本,提高了營銷效果,從而為企業(yè)帶來更多的利潤。這些來自各種渠道的數(shù)據(jù)信息被組合,應(yīng)用超級計(jì)算機(jī)、并行處理、神經(jīng)元網(wǎng)絡(luò)、模型化算法和其他信息處理技術(shù)手段進(jìn)行處理,從中得到商家用于向特定消費(fèi)群體或個(gè)體進(jìn)行定向營銷的決策信息。4數(shù)據(jù)挖掘技術(shù)在民用通信部門中的應(yīng)用
我國各種民用通信用得最多的國家之一,為了分析出那一類收費(fèi)對應(yīng)那類層次的人群,我們就可以利用數(shù)據(jù)挖掘技術(shù),把當(dāng)前電信消費(fèi)者的數(shù)據(jù)進(jìn)行收集、分析、總結(jié),制定出有效的管理辦法,這既有利于公司又有利于客戶的優(yōu)惠政策,這樣能夠及時(shí)發(fā)現(xiàn)問題,減少顧客流失,為通信公司挽回?fù)p失。數(shù)據(jù)挖掘在通信部門中體現(xiàn)在三個(gè)方面:(1)客戶挽留解決方案;(2)電信業(yè)客戶細(xì)分解決方案;(3)電信業(yè)交叉銷售和提升銷售解決方案。這三個(gè)項(xiàng)目的實(shí)施,可以為民用通信部門解決三個(gè)決策問題:第一,預(yù)測哪些客戶最具有流失的傾向以及影響客戶流失的關(guān)鍵因素,通過預(yù)制的分析模型提供"流失記分"幫助識別風(fēng)險(xiǎn)客戶,在客戶流失之前采取針對性措施來挽留他們。第二,根據(jù)客戶可能的行為和潛在的盈利性對客戶進(jìn)行分類,制定更準(zhǔn)確的產(chǎn)品組合、更準(zhǔn)確的產(chǎn)品介紹和產(chǎn)品捆綁服務(wù)。第三,從現(xiàn)有客戶中識別出有可能接受交叉銷售和提升銷售的客戶人選,評估客戶過去的購買模式,預(yù)測客戶下一步可能購買什么。
3.結(jié)束語
隨著數(shù)據(jù)挖掘技術(shù)和現(xiàn)代商業(yè)技術(shù)的不斷發(fā)展,商業(yè)管理者已經(jīng)認(rèn)識到數(shù)據(jù)挖掘技術(shù)能從原始數(shù)據(jù)中挖掘潛在的巨大商業(yè)價(jià)值和所蘊(yùn)含的科學(xué)知識。隨著數(shù)據(jù)挖掘技術(shù)不斷應(yīng)用到商業(yè)信息領(lǐng)域中,這將激發(fā)數(shù)據(jù)挖掘技術(shù)的潛力,進(jìn)一步推進(jìn)數(shù)挖掘技術(shù)在商業(yè)信息中的應(yīng)用
熱門標(biāo)簽
數(shù)據(jù)分析論文 數(shù)據(jù)挖掘論文 數(shù)據(jù)管理論文 數(shù)據(jù)安全論文 數(shù)據(jù)庫論文 數(shù)據(jù)誤差 數(shù)據(jù)統(tǒng)計(jì) 數(shù)據(jù)挖掘總結(jié) 數(shù)據(jù)采集 數(shù)據(jù)分析 心理培訓(xùn) 人文科學(xué)概論