機器學習技術(shù)在數(shù)據(jù)挖掘中商業(yè)應用

時間:2022-11-06 05:17:52

導語:機器學習技術(shù)在數(shù)據(jù)挖掘中商業(yè)應用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

機器學習技術(shù)在數(shù)據(jù)挖掘中商業(yè)應用

【摘要】現(xiàn)如今,數(shù)據(jù)挖掘中機器學習技術(shù)應用非常廣泛,遍及金融、醫(yī)療等領(lǐng)域,這就要求企業(yè)應該提升自身辨別方法和技術(shù)優(yōu)劣的能力,面對不同的環(huán)境,選擇應用與任務相匹配的數(shù)據(jù)挖掘技術(shù)。本篇文章首先對機器學習技術(shù)的界說作了簡述,其后對機器學習技術(shù)在數(shù)據(jù)挖掘任務的商業(yè)應用作了兩點詳細的研究,以期促進企業(yè)的可持續(xù)發(fā)展。

【關(guān)鍵詞】機器學習技術(shù);數(shù)據(jù)挖掘;商業(yè)應用

隨著科學技術(shù)的發(fā)展,存在于數(shù)據(jù)挖掘領(lǐng)域的機器學習技術(shù)憑借其強大的數(shù)據(jù)處理能力和在商業(yè)領(lǐng)域上巨大的應用潛力越發(fā)得到數(shù)據(jù)挖掘領(lǐng)域?qū)W術(shù)界以及商界的廣泛關(guān)注。因此,對機器學習技術(shù)在數(shù)據(jù)挖掘中的商業(yè)應用進行探究有著十分重要的現(xiàn)實意義。

1機器學習技術(shù)的界說

通過自動化的計算方法來獲取知識的學習就是機器學習。人工智能研究中,機器學習占據(jù)著十分重要的位置。可被稱作真正的智能系統(tǒng),一定具有非常強悍的學習能力,由此可得出,以往的大多數(shù)系統(tǒng)都不能稱作智能系統(tǒng)。比如,不能進行錯誤的自我校正;不能經(jīng)過經(jīng)驗改良系統(tǒng)性能;不能自發(fā)的取得和找尋系統(tǒng)所需的大量知識。這些系統(tǒng)的推理都是演繹推理,缺少歸納推理,這使得僅能在最大程度上證明已知的定理和事實,不可能有新的發(fā)現(xiàn)。這個局限隨著人工智能發(fā)展的逐漸深化變得更加明顯。在此種情況下,機器學習技術(shù)已然是人工智能的研究重心之一。其應用廣布人工智能領(lǐng)域的智能機器人、自然語言理解等分支。

2機器學習技術(shù)在數(shù)據(jù)挖掘任務的商業(yè)應用

2.1機器學習技術(shù)的分類

機器學習可依據(jù)不同的推理方法,劃分為歸納、分析式以及非符號這三種學習方式。在例子存在的空間中,歸納學習的系統(tǒng)利用一般操作和特殊操作的方法對給出的正、反這兩種有關(guān)于某個概念的集合例子進行在空間中的搜查和檢索,還要進行經(jīng)過學習傾向標準的抉擇過程,最終得到這個關(guān)于某概念的一般描述。這是從特殊到一般的推理,可稱做從事實出發(fā)來進行理論的最終建立過程。學習進程一般由大量的專業(yè)領(lǐng)域知識的運用來驅(qū)動,是分析式學習的一個特點。此時實力已在特定的知識背景環(huán)境中得到大量的考察,不再是無關(guān)特征的、單純的幾何,對學習結(jié)果進行了傾向影響的消除。其還可劃分為類比、基于案例以及解釋這三種學習方式。網(wǎng)絡神經(jīng)與算法基因都屬于非符號學習的范疇,將學習行為在數(shù)值層次中體現(xiàn)是其主要的特點。博斯和馬哈帕特拉將機器學習技術(shù)在數(shù)據(jù)挖掘中的應用,作了下述五種歸類。

2.1.1歸納推理

依據(jù)各不相同的特征,應用決策樹進行數(shù)據(jù)分類。應選擇一個可作為因變量的變量在數(shù)據(jù)源中,再應用組間差別擴大與組內(nèi)差異差別縮小的統(tǒng)計方法進行變量的分組,找尋對因變量影響最大的預測變量,此時可將該變量作為決策樹中的一個節(jié)點來設置。決策樹的優(yōu)點是直觀,缺點是其分支隨著數(shù)據(jù)復雜向的提升會逐漸增多,這使管理變得困難。強大的大數(shù)據(jù)集處理能力,任務的適于預測和分類性,解釋簡易的結(jié)果,技術(shù)實施的簡易性于一體。

2.1.2神經(jīng)網(wǎng)絡

由與人腦神經(jīng)元類似的節(jié)點來構(gòu)成,是一個多層的網(wǎng)絡結(jié)構(gòu),通過隱藏節(jié)點將輸入和輸出這兩個節(jié)點連接起來而構(gòu)成。將凡是通過和到達該節(jié)點進行信號輸入的進行加權(quán)所得出的加權(quán)和該節(jié)點的信號輸入總量。該網(wǎng)絡的學習方式是將樣本的歷史數(shù)據(jù)進行大量和反復性的訓練,在此期間,可通過數(shù)學方法——學習規(guī)則使節(jié)點進行數(shù)據(jù)的匯總與轉(zhuǎn)化,并進行鏈接節(jié)點權(quán)值的調(diào)節(jié)。其有互相間相連的輸入、中間以及輸出這三種層次構(gòu)成,網(wǎng)絡工作中的絕大部分由多節(jié)點構(gòu)成的中間層來完成。對分析數(shù)據(jù)的執(zhí)行結(jié)果進行輸出是輸出層的主要工作。可進行復雜性問題的精確性預測是該網(wǎng)絡的優(yōu)點。但是其存在著大數(shù)據(jù)集的處理效率過低的缺點,使用該方法的用戶需具備大量的專業(yè)知識。

2.1.3事例推理

關(guān)于問題的描述和解決辦法是每個事例都具備的內(nèi)容。問題提出之后,學習系統(tǒng)會進行匹配性事例和解決辦法的尋找。較強的污染與缺失數(shù)據(jù)處理能力是其優(yōu)點,常適用于存有大量數(shù)據(jù)的領(lǐng)域。

2.1.4遺傳算法

是一種優(yōu)化組合方法,基于生物進化的適者生存思想,有繁殖、雜交以及變異這三個基本的操作過程。個體適應度的計算都源于繁殖操作過程。進行信息某一部分的交換過程稱為變異操作過程。通過某一部分信息隨機改變得到的新個體屬于變異操作過程。最有個體的特色,往往得益于重復性的變異操作。易于集成較強的污染與缺失數(shù)據(jù)處理能力是其優(yōu)點,但使用該方法的用戶需具備大量的專業(yè)知識。

2.1.5歸納性邏輯程序

用一級邏輯屬性來進行概念的描述與定義。先對正、負兩面的例子進行定義,其后對新例子的等級進行劃分。強大的大數(shù)據(jù)集處理能力和理解容易的模型是其優(yōu)點,但使用該方法的用戶需具備大量的專業(yè)知識。這五種方法由上到下依次是商業(yè)應用最廣泛的歸納推理方法。

2.2機器學習技術(shù)在數(shù)據(jù)挖掘任務的應用

博斯和馬哈帕特拉將機器學習技術(shù)在數(shù)據(jù)挖掘中的商業(yè)應用歸結(jié)為下述四種任務類型:

2.2.1分類

比如,從商業(yè)數(shù)據(jù)庫中,應用數(shù)據(jù)挖掘進行有效信息的挖掘,依據(jù)統(tǒng)一偏好或是年貢獻估計額等標準來進行全部客戶的分類。

2.2.2預測

比如,當顧客有貸款的需要時,銀行系統(tǒng)應在第一時間對其的信用狀況進行審查,應用機器學習技術(shù),就可在日常中對存在于數(shù)據(jù)庫中的源數(shù)據(jù)進行不斷的學習和修正,得出的信息也就是最具參考性的。

2.2.3關(guān)聯(lián)

潛存于實體間或?qū)傩蚤g的聯(lián)系規(guī)律進行關(guān)聯(lián)性的分析。第四,偵察。進行異?,F(xiàn)象、模式以及離群數(shù)據(jù)的尋找,并對決策給出起支持作用的解釋,是其主要目的。

3結(jié)束語

總的來說,很多領(lǐng)域都應用到了數(shù)據(jù)挖掘中機器學習技術(shù),這就要求企業(yè)應該知曉不同方法和技術(shù)的優(yōu)劣,面對不同的環(huán)境,選擇應用與任務相匹配的數(shù)據(jù)挖掘技術(shù)。本篇文章首先對機器學習技術(shù)的界說作了簡述,其后對機器學習技術(shù)在數(shù)據(jù)挖掘任務的商業(yè)應用中機器學習技術(shù)的分類和機器學習技術(shù)在數(shù)據(jù)挖掘任務的應用這兩點作了詳細的研究,以期促進企業(yè)的可持續(xù)發(fā)展。

參考文獻

[1]朱天元.機器學習算法在數(shù)據(jù)挖掘中的應用[J].數(shù)字技術(shù)與應用,2017(03):166-166.

[2]張紹成,孫時光,曲洋等.大數(shù)據(jù)環(huán)境下機器學習在數(shù)據(jù)挖掘中的應用研究[J].遼寧大學學報(自然科學版),2017,44(01):15-17.

作者:張昊澤 單位:大連海事大學