大數(shù)據(jù)挖掘及應(yīng)用探究

時(shí)間:2022-01-07 10:22:49

導(dǎo)語:大數(shù)據(jù)挖掘及應(yīng)用探究一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

大數(shù)據(jù)挖掘及應(yīng)用探究

摘要:隨著社會(huì)經(jīng)濟(jì)和科學(xué)技術(shù)的不斷發(fā)展、網(wǎng)絡(luò)時(shí)代的到來,信息化網(wǎng)絡(luò)技術(shù)在人們的日常生活中也開始普及,近年來很多IT行業(yè)專業(yè)術(shù)語變得流行起來,其中大數(shù)據(jù)一詞走進(jìn)了普通大眾視野中。在信息化網(wǎng)絡(luò)技術(shù)不斷發(fā)展的時(shí)代背景下,人們?cè)谌粘I钪兴佑|到的各項(xiàng)數(shù)據(jù)不斷增加,而如何從各項(xiàng)數(shù)據(jù)中分析、提取出所需要的數(shù)據(jù)信息,提高社會(huì)總體生產(chǎn)力以及工作效率,是現(xiàn)今各企業(yè)、政府部門重點(diǎn)關(guān)注的問題。本文對(duì)大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘工作進(jìn)行探究分析,深入研究大數(shù)據(jù)技術(shù)的應(yīng)用范圍。

關(guān)鍵詞:大數(shù)據(jù)時(shí)代;數(shù)據(jù)挖掘;應(yīng)用探究;信息化技術(shù)

在網(wǎng)絡(luò)信息化普及推廣的時(shí)代背景下,人們的生活方式發(fā)生了巨大的變化,生活方式比以往更加便捷化與智能化。而隨著電子商務(wù)行業(yè)的蓬勃發(fā)展,例如,淘寶、京東等網(wǎng)絡(luò)電子商務(wù)購物平臺(tái)的興起、壯大,傳統(tǒng)實(shí)體經(jīng)濟(jì)逐漸萎縮。然而在社會(huì)總體經(jīng)濟(jì)結(jié)構(gòu)的重要組成部分逐漸從實(shí)體經(jīng)濟(jì)變?yōu)榫W(wǎng)絡(luò)經(jīng)濟(jì)的總體時(shí)代背景下,用戶的消費(fèi)記錄信息、個(gè)人資料信息和隱私信息等數(shù)據(jù)已成為當(dāng)今各企業(yè)中重要的數(shù)據(jù)統(tǒng)計(jì)方向。在此背景下,數(shù)據(jù)信息資源的重要性已經(jīng)不亞于社會(huì)公共資源、自然資源等傳統(tǒng)資源的社會(huì)地位和重要程度。

1大數(shù)據(jù)的起源以及大數(shù)據(jù)與數(shù)據(jù)挖掘的基本概念

1.1大數(shù)據(jù)一詞的起源。大數(shù)據(jù)一詞最早被全球著名企業(yè)咨詢公司麥肯錫提出,在早期普遍被金融業(yè)、通訊業(yè)以及生物學(xué)等各領(lǐng)域所運(yùn)用。近年來,大數(shù)據(jù)開始被普遍提及并逐漸走入主流大眾的視野中。大數(shù)據(jù)一詞曾在美國白宮政府官網(wǎng)網(wǎng)頁中被詳細(xì)解讀。由此可見在新時(shí)代背景中,大數(shù)據(jù)對(duì)各行業(yè)領(lǐng)域所造成的深遠(yuǎn)影響,正如同哈佛大學(xué)社會(huì)學(xué)教授加里•金曾說:“大數(shù)據(jù)時(shí)代的到來是一場各個(gè)領(lǐng)域之間的新的量化革命?!?.2大數(shù)據(jù)以及數(shù)據(jù)挖掘的基本概念。1.2.1大數(shù)據(jù)的基本概念。大數(shù)據(jù)一詞最早被麥肯錫公司提出,該公司對(duì)大數(shù)據(jù)一詞的詳細(xì)解釋為:“隨著社會(huì)的逐漸發(fā)展,數(shù)據(jù)在每一個(gè)專業(yè)領(lǐng)域以及職能范圍中都起著愈加重要的生產(chǎn)作用,而由于人們對(duì)數(shù)據(jù)的挖掘手段變得逐漸完善、運(yùn)用方式逐漸靈活,這也預(yù)示著新一波的社會(huì)生產(chǎn)率的增長以及消費(fèi)者盈余浪潮的到來?!倍谇靶┠?,美國白宮針對(duì)大數(shù)據(jù)技術(shù)浪潮開展了一項(xiàng)技術(shù)扶持發(fā)展計(jì)劃,該計(jì)劃啟動(dòng)資金高達(dá)兩億美元。截至2015年,全球數(shù)據(jù)庫所統(tǒng)計(jì)、采集數(shù)據(jù)總量已達(dá)到2.7ZB。而根據(jù)相關(guān)專家的深入分析得知,全球數(shù)據(jù)庫的數(shù)據(jù)總量還會(huì)根據(jù)時(shí)間推移而不斷增長。1.2.2數(shù)據(jù)挖掘的基本概念。數(shù)據(jù)挖掘,又名為數(shù)據(jù)勘探。作為一項(xiàng)新的技術(shù)概念,最早于上世紀(jì)晚期被首次提出。數(shù)據(jù)挖掘技術(shù)主要受眾方向和范圍為人工商業(yè)行業(yè)。數(shù)據(jù)挖掘的主要內(nèi)容為在龐雜繁多的總體數(shù)據(jù)中,提取、分析相對(duì)待開采價(jià)值度較高的數(shù)據(jù)信息。在商業(yè)領(lǐng)域的具體應(yīng)用中,通過在整體相關(guān)信息數(shù)據(jù)庫中,提取、分析相對(duì)潛在商業(yè)價(jià)值度較高的數(shù)據(jù),從而不斷簡化數(shù)據(jù),為商業(yè)活動(dòng)提供必要的數(shù)據(jù),推動(dòng)商業(yè)發(fā)展。

2數(shù)據(jù)挖掘技術(shù)具體分析

2.1數(shù)據(jù)挖掘技術(shù)的類別。2.1.1數(shù)據(jù)挖掘技術(shù)的分類技術(shù)。數(shù)據(jù)挖掘技術(shù)的分類技術(shù)是指在總體數(shù)據(jù)信息中尋找出兩個(gè)特質(zhì)相符合的數(shù)據(jù)樣本組成一組,數(shù)據(jù)依據(jù)技術(shù)設(shè)定的具體規(guī)定進(jìn)行類別區(qū)分,將總體數(shù)據(jù)信息中的數(shù)據(jù)樣本劃分到特定類別中。例如,將某一組數(shù)據(jù)樣本劃分到消費(fèi)者具體類別中,進(jìn)而調(diào)查、分析消費(fèi)者的各項(xiàng)數(shù)據(jù),評(píng)判消費(fèi)者的消費(fèi)潛力以及消費(fèi)意愿。以某家超級(jí)市場為例,運(yùn)用數(shù)據(jù)挖掘技術(shù)深入調(diào)查分析消費(fèi)者的總體購買潛力和消費(fèi)意愿,挑選出總體商品中消費(fèi)者消費(fèi)潛力、消費(fèi)意愿皆符合的商品,在掌握具體數(shù)據(jù)的情況下,導(dǎo)購人員針對(duì)性對(duì)消費(fèi)者進(jìn)行推銷,極大地提高了超級(jí)市場的銷售綜合和銷售效率。2.1.2數(shù)據(jù)挖掘技術(shù)的聚類技術(shù)。數(shù)據(jù)挖掘技術(shù)的聚類技術(shù)是指根據(jù)各數(shù)據(jù)之間存在的重合程度,將數(shù)據(jù)劃分為不同等級(jí),以此建立數(shù)據(jù)等級(jí)劃分歸類體系制度,從而使得每個(gè)等級(jí)制度中所采集數(shù)據(jù)互相之間存在極高重合度與相似度。在不同數(shù)據(jù)等級(jí)中,所歸類的數(shù)據(jù)之間存在著極大的差異性和低重復(fù)度。數(shù)據(jù)挖掘聚類技術(shù)普遍應(yīng)用于市場營銷工作中,常見技術(shù)使用用途為:維系與潛在顧客之間的緊密關(guān)聯(lián)、挖掘潛在顧客、分析計(jì)算預(yù)售商品的大體銷量等。2.1.3數(shù)據(jù)挖掘技術(shù)的關(guān)聯(lián)技術(shù)。數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)技術(shù)是指在挖掘的各分組數(shù)據(jù)中,分析、講解其數(shù)據(jù)之間的具體規(guī)則。通俗地講,在數(shù)據(jù)挖掘工作中,將數(shù)據(jù)挖掘、對(duì)照分組后,其中某一組數(shù)據(jù)中出現(xiàn)的某些問題以及選項(xiàng)致使其他分組數(shù)據(jù)受到一定程度的影響,造成一些預(yù)估外的變化,從而在各組數(shù)據(jù)中蘊(yùn)藏的相關(guān)原理也因此顯露出來。例如,在一家保險(xiǎn)公司中,銷售人員在與潛在消費(fèi)顧客增進(jìn)關(guān)系時(shí),通過運(yùn)用數(shù)據(jù)挖掘關(guān)聯(lián)技術(shù),從該公司的數(shù)據(jù)資料庫中挖掘潛在消費(fèi)顧客的總體數(shù)據(jù),深入分析其中各組數(shù)據(jù)之間的關(guān)聯(lián)性,挖掘出蘊(yùn)含商業(yè)價(jià)值較高以及有利于銷售人員提高工作效率的相關(guān)數(shù)據(jù)。此外,企業(yè)靈活運(yùn)用數(shù)據(jù)挖掘關(guān)聯(lián)技術(shù),還可以挖掘出影響市場經(jīng)濟(jì)走向的潛在因素信息,這也極大地提高了企業(yè)的產(chǎn)品價(jià)格定位、預(yù)售商品預(yù)估、總體營業(yè)額預(yù)估以及潛在客戶方向等預(yù)估方案的準(zhǔn)確性與合理性。2.2大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘技術(shù)特征。在大數(shù)據(jù)時(shí)代背景下,數(shù)據(jù)挖掘技術(shù)被社會(huì)各行業(yè)領(lǐng)域普遍應(yīng)用,在發(fā)揮其重要功效以及提高社會(huì)總體生產(chǎn)力的同時(shí),隨著相關(guān)人員的深入研究,也發(fā)現(xiàn)了數(shù)據(jù)挖掘技術(shù)的幾點(diǎn)技術(shù)特征。2.2.1數(shù)據(jù)挖掘技術(shù)的流行性較高。在數(shù)據(jù)挖掘技術(shù)中,相比較數(shù)據(jù)的傳統(tǒng)技術(shù)模式來說,數(shù)據(jù)的流動(dòng)性有著顯著的提升,而隨著數(shù)據(jù)流動(dòng)性的提升,數(shù)據(jù)的分析、提取、儲(chǔ)存工作效率也在一定程度上得到了相應(yīng)的提升,提高了整體運(yùn)行效率。在大數(shù)據(jù)時(shí)代背景下,由于數(shù)據(jù)信息總體數(shù)量激增,數(shù)據(jù)挖掘工作對(duì)流動(dòng)速度有著較高的要求。然而,在傳統(tǒng)數(shù)據(jù)技術(shù)模式下,數(shù)據(jù)的流動(dòng)性能較差,無法滿足時(shí)代的整體技術(shù)要求。2.2.2數(shù)據(jù)挖掘技術(shù)的種類繁多。隨著社會(huì)的高速發(fā)展,信息網(wǎng)絡(luò)技術(shù)的普遍應(yīng)用,使得大數(shù)據(jù)時(shí)代到來。大數(shù)據(jù)時(shí)代背景下,人們?cè)谏钪幸苍絹碓揭蕾嚫黝愔悄茉O(shè)備與互聯(lián)網(wǎng)系統(tǒng),從而增加了數(shù)據(jù)挖掘技術(shù)的挖掘種類?,F(xiàn)如今,在數(shù)據(jù)挖掘技術(shù)的數(shù)據(jù)來源種類中,相較于傳統(tǒng)數(shù)據(jù)來源以外,還不斷出現(xiàn)新的數(shù)據(jù)來源類型。2.2.3數(shù)據(jù)挖掘技術(shù)的數(shù)據(jù)處理數(shù)量較大。在大數(shù)據(jù)時(shí)代背景下,隨著社會(huì)各項(xiàng)數(shù)據(jù)總體數(shù)量的不斷激增,各行業(yè)領(lǐng)域以及人們?nèi)粘I钪兴a(chǎn)生的數(shù)據(jù)不斷增多,相應(yīng)的數(shù)據(jù)挖掘技術(shù)所需處理的數(shù)據(jù)總量也不斷增加。2.2.4數(shù)據(jù)挖掘技術(shù)的數(shù)據(jù)平均低價(jià)值度。隨著大數(shù)據(jù)時(shí)代的到來,社會(huì)數(shù)據(jù)總量激增,相應(yīng)的在總體數(shù)據(jù)中,相對(duì)潛在價(jià)值較高的數(shù)據(jù)分布密度不斷降低,總體數(shù)據(jù)價(jià)值度的平均值逐漸降低。因此,增加了數(shù)據(jù)挖掘技術(shù)的工作難度,數(shù)據(jù)挖掘技術(shù)很難實(shí)現(xiàn)預(yù)估效率。

3大數(shù)據(jù)時(shí)代背景下,數(shù)據(jù)挖掘技術(shù)的應(yīng)用情況

3.1數(shù)據(jù)挖掘技術(shù)在市場營銷領(lǐng)域中的應(yīng)用。在數(shù)據(jù)挖掘技術(shù)實(shí)際推廣中,市場營銷領(lǐng)域是最早全面運(yùn)用數(shù)據(jù)挖掘技術(shù)的行業(yè)領(lǐng)域,在實(shí)際運(yùn)行過程中,不但深入挖掘潛在顧客的消費(fèi)意愿、消費(fèi)能力,而且顯著提高了相關(guān)產(chǎn)品的銷售效率。當(dāng)下,數(shù)據(jù)挖掘技術(shù)在市場營銷整體領(lǐng)域中的實(shí)際應(yīng)用從實(shí)體購物中,逐漸蔓延至如保險(xiǎn)等其他商業(yè)活動(dòng)中,提高了社會(huì)整體經(jīng)濟(jì)發(fā)展,增加了總體生產(chǎn)力。3.2數(shù)據(jù)挖掘技術(shù)在科研領(lǐng)域中的應(yīng)用。數(shù)據(jù)挖掘技術(shù)在商業(yè)活動(dòng)中發(fā)揮重要作用外,在科研工作中也體現(xiàn)了相應(yīng)工作價(jià)值。在科研工作實(shí)際工作過程中,靈活地運(yùn)用數(shù)據(jù)挖掘技術(shù),可以從數(shù)據(jù)庫中分析、挖掘出相應(yīng)發(fā)展變化規(guī)律,以此輔助科技研發(fā)工作的有序開展。3.3數(shù)據(jù)挖掘技術(shù)在金融領(lǐng)域中的應(yīng)用。在金融領(lǐng)域?qū)嶋H工作中,由于有著接觸相應(yīng)數(shù)據(jù)量較多、計(jì)算工作量較大的特性,金融行業(yè)對(duì)于數(shù)據(jù)挖掘技術(shù)的依賴程度相較于其他行業(yè)領(lǐng)域來說較高。數(shù)據(jù)挖掘技術(shù)的靈活運(yùn)用,可以深入研究、發(fā)現(xiàn)各項(xiàng)數(shù)據(jù)之間的關(guān)聯(lián)性、差異性以及內(nèi)在規(guī)律,從而清晰掌握市場動(dòng)向。數(shù)據(jù)挖掘技術(shù)在金融領(lǐng)域中的具體工作內(nèi)容為預(yù)估市場動(dòng)態(tài)、分析數(shù)據(jù)規(guī)律等。3.4數(shù)據(jù)挖掘技術(shù)在醫(yī)療領(lǐng)域中的應(yīng)用。在醫(yī)療領(lǐng)域中,許多嚴(yán)重疾病的治愈方法都嚴(yán)重依賴數(shù)據(jù)分析工作,例如白血病。白血病需要移植配套骨髓,而相適應(yīng)的骨髓數(shù)據(jù)分析采集工作則需要大量計(jì)算各項(xiàng)數(shù)據(jù),數(shù)據(jù)計(jì)算量不足的問題是當(dāng)下白血病治愈工作的主要制約因素。因此,在醫(yī)療領(lǐng)域中,數(shù)據(jù)挖掘技術(shù)的靈活運(yùn)用,顯著提高了整體醫(yī)療領(lǐng)域的工作效率。

4總結(jié)

綜上所述,隨著大數(shù)據(jù)時(shí)代的到來,各行業(yè)領(lǐng)域都面臨著一場改革風(fēng)波。而這場風(fēng)波,既是一次時(shí)代挑戰(zhàn),更是一次時(shí)代機(jī)遇。各行業(yè)從業(yè)者要牢牢抓緊歷史機(jī)遇,在實(shí)際工作中靈活運(yùn)用數(shù)據(jù)挖掘技術(shù),不但能顯著提高工作效率、工作質(zhì)量,謀求新的發(fā)展,而且增加了社會(huì)總體生產(chǎn)力,迎來新一輪社會(huì)總體消費(fèi)激增浪潮。

參考文獻(xiàn):

[1]張凱萍.大數(shù)據(jù)時(shí)代背景下數(shù)據(jù)挖掘技術(shù)的應(yīng)用探討[J].赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版),2018(8):52-54.

[2]盧盛繼.大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)與應(yīng)用[J].數(shù)碼世界,2017(2):44.

[3]孫勤紅,沈鳳仙.大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘及應(yīng)用[J].電子技術(shù)與軟件工程,2016(6):204.

作者:于晶 單位:北京城市網(wǎng)鄰信息技術(shù)有限公司