數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中運用
時間:2022-11-06 05:08:32
導語:數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中運用一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:新時期背景下,社會經(jīng)濟發(fā)展速度明顯加快,有關經(jīng)濟的數(shù)據(jù)與信息內(nèi)容不斷累積,在海量數(shù)據(jù)當中有效地提取價值程度較高的信息,借助數(shù)據(jù)信息的提取與分析,為經(jīng)濟發(fā)展提供了有價值的參考依據(jù)。其中,數(shù)據(jù)挖掘技術(shù)就可以在數(shù)據(jù)庫當中找到一定價值的隱藏事件,在人工智能、預測以及統(tǒng)計等諸多科學技術(shù)的作用下,能夠為經(jīng)濟決策奠定堅實基礎。文章將數(shù)據(jù)挖掘技術(shù)作為重點研究對象,闡述其在經(jīng)濟統(tǒng)計中的具體應用,希望有所幫助。
關鍵詞:數(shù)據(jù)挖掘技術(shù);經(jīng)濟統(tǒng)計;應用
經(jīng)濟數(shù)據(jù)本身的發(fā)展性以及信息量的龐大性都十分明顯,所以作為統(tǒng)計數(shù)據(jù)工作人員在使用數(shù)據(jù)信息的時候,僅被局限在數(shù)據(jù)數(shù)字信息分析以及使用方面,并未對數(shù)據(jù)信息當中所蘊含的重要統(tǒng)計資料展開深入地挖掘。針對數(shù)據(jù)挖掘技術(shù)而言,其屬于全新統(tǒng)計方法,最明顯的優(yōu)勢就是可以橫向與縱向地開發(fā)信息數(shù)據(jù),并且在實踐中實現(xiàn)了研究領域的延伸,能夠進一步挖掘數(shù)據(jù)信息,并在基礎數(shù)據(jù)中獲取價值性較高的數(shù)據(jù)信息,并為社會統(tǒng)計數(shù)據(jù)工作的開展提供有價值的參考依據(jù)。
一、數(shù)據(jù)挖掘技術(shù)概述
(一)基本內(nèi)涵
通過對數(shù)據(jù)挖掘技術(shù)的應用,可以集中整合并深度處理數(shù)據(jù)信息,確保深層次開發(fā)項目優(yōu)化更加全面,實現(xiàn)系統(tǒng)升級。而在實踐操作方面,數(shù)據(jù)挖掘技術(shù)即可在相對復雜的數(shù)據(jù)庫當中對數(shù)據(jù)信息進行提取,以實現(xiàn)集中整合與分析的目標,并在大量數(shù)據(jù)信息當中對數(shù)據(jù)信息實用性展開深入挖掘。近年來,在經(jīng)濟活動逐漸頻繁的背景下,信息量不斷增加,組成結(jié)構(gòu)更加復雜,以上是原生態(tài)信息最明顯的特征。所以,為了綜合管理信息價值,必須針對其實施精細化研究,以免信息的價值被限制亦或是浪費。如果信息與數(shù)據(jù)價值得不到發(fā)揮,必然會對牽制數(shù)據(jù)信息統(tǒng)計工作產(chǎn)生不利的影響。在這種情況下,處理數(shù)據(jù)的過程中,各部門將數(shù)據(jù)挖掘技術(shù)進入其中,并系統(tǒng)化地分析雜亂原始數(shù)據(jù)信息,最終整合成具備現(xiàn)實意義的數(shù)據(jù)形態(tài),全面優(yōu)化數(shù)據(jù)提取的效果與應用的效果,并對其實施深入加工與綜合處理,進一步升級數(shù)據(jù)挖掘的水平。
(二)優(yōu)勢所在
對數(shù)據(jù)挖掘技術(shù)進行應用的過程中,可以收集并整理數(shù)據(jù)信息,有效地落實數(shù)據(jù)的深層次分析。首先,數(shù)據(jù)挖掘技術(shù)的有效性相對明顯,因技術(shù)結(jié)構(gòu)屬于深加工技術(shù),且目的性明顯,特別是在實際應用的范圍之內(nèi),可以統(tǒng)計并解讀長期累積的數(shù)據(jù)信息,以保證使用人員可以對數(shù)據(jù)深層次意義以及使用價值形成系統(tǒng)化地了解?,F(xiàn)階段,對數(shù)據(jù)實踐應用方面,不僅可以高效管理累積經(jīng)濟數(shù)據(jù)信息,同樣可以通過多個角度分析既有經(jīng)濟數(shù)據(jù)應用的目的性。站在經(jīng)濟數(shù)據(jù)管理方面層面,既有信息統(tǒng)計單元與數(shù)據(jù)分類都屬于基礎環(huán)節(jié),可以對科學化以及系統(tǒng)化歸類要求整合并科學化地分析混亂數(shù)據(jù)庫信息內(nèi)容,保證統(tǒng)計數(shù)據(jù)管理高效性以及使用的便利性得以全面優(yōu)化。在此基礎上,針對經(jīng)濟數(shù)據(jù)處理與再加工過程,數(shù)據(jù)統(tǒng)計以及分析的主要目標就是重新加工原有數(shù)據(jù)所組成的內(nèi)容,保證數(shù)據(jù)價值有效發(fā)揮的基礎上,為管理人員實際的需求提供最大化地經(jīng)濟統(tǒng)計數(shù)據(jù)服務。
其次,數(shù)據(jù)挖掘技術(shù)并非是單純分析數(shù)據(jù)的工具,同樣也能夠與使用主體的信息需求相適應?,F(xiàn)階段,國內(nèi)各部門在運作過程中都會形成諸多經(jīng)濟統(tǒng)計信息,而信息內(nèi)容也是經(jīng)營人員作出經(jīng)濟管理決策不可或缺的基礎條件。因為管理部門所涉獵的經(jīng)濟領域與經(jīng)營管理范圍存在一定的差異,且經(jīng)濟管控的權(quán)限也不同,在這種情況下,要求各部門能夠與自身狀況相互結(jié)合,構(gòu)建系統(tǒng)處理體系與數(shù)據(jù)解讀的方式。伴隨數(shù)據(jù)信息量的不斷增加,數(shù)據(jù)統(tǒng)計系統(tǒng)與處理信息途徑的要求也隨之提高,需要保證數(shù)據(jù)被換算成多元化呈現(xiàn)方式,進而在計算方式與信息來源等方面,實現(xiàn)信息評估可靠程度的提高,確保進一步優(yōu)化數(shù)據(jù)處理的效果。最后,宏觀數(shù)據(jù)庫的構(gòu)建為數(shù)據(jù)統(tǒng)計結(jié)果的優(yōu)化奠定了堅實的基礎,借助多元化經(jīng)濟統(tǒng)計體系的運用,能夠為經(jīng)濟管理活動需求提供必要的服務,盡量規(guī)避統(tǒng)計工作重復性的出現(xiàn)。對各種統(tǒng)計系統(tǒng)加以整合,確保數(shù)據(jù)信息更好地融合。由此可見,在宏觀數(shù)據(jù)庫形成的基礎上,可以為數(shù)據(jù)的優(yōu)化提供必要的發(fā)揮平臺,進一步優(yōu)化統(tǒng)計信息完整程度。
二、數(shù)據(jù)挖掘技術(shù)在經(jīng)濟統(tǒng)計中的應用
(一)預處理方面
應用數(shù)據(jù)挖掘技術(shù)的過程中,在對預處理方法運用的時候,可以智能分析所提取出來的基礎信息。而數(shù)據(jù)挖掘結(jié)構(gòu)本身卻會受經(jīng)濟信息影響,難以構(gòu)建數(shù)據(jù)收集機制,所以,在實際應用方面,數(shù)據(jù)信息的預處理是不容小覷的管理機制與控制措施。通過經(jīng)濟統(tǒng)計預處理,可以統(tǒng)籌劃定并分析數(shù)據(jù)差距、不真實性以及不正確性。而數(shù)據(jù)清理的過程則是處理基礎數(shù)據(jù)問題的過程,可以選擇使用均值法清理方法、平滑方法或者是預測方法。其中,在選用均值法數(shù)據(jù)處理的過程中,可以均值處理基礎數(shù)據(jù)當中的噪聲數(shù)據(jù)以及數(shù)據(jù)點空值,以保證數(shù)據(jù)庫可以借助屬性均值填充并補足數(shù)據(jù)方面的空白。只有在確保數(shù)據(jù)挖掘系統(tǒng)在基礎數(shù)據(jù)分析結(jié)構(gòu)方面足夠到位,才能夠使統(tǒng)計分析數(shù)據(jù)更加具有實效性與完整性。而在分析數(shù)據(jù)點取值方面,而在選用平滑法對數(shù)據(jù)進行處理的時候,即可統(tǒng)一化地計算基礎數(shù)據(jù)空值和噪聲數(shù)據(jù),并與加權(quán)平均數(shù)處理機制相互結(jié)合,進一步分析所提取數(shù)據(jù)的影響權(quán)重值,以確保實際計算的結(jié)果更為真實。Cj點實際權(quán)值。
(二)集成化結(jié)構(gòu)方面
應用數(shù)據(jù)挖掘技術(shù)以后,即便是同一地區(qū)數(shù)據(jù)信息,如果統(tǒng)計主體與標準不同,也一定要采用相應的數(shù)據(jù)集成體系,保證數(shù)據(jù)集成效果得以優(yōu)化,增強數(shù)據(jù)統(tǒng)計的準確程度,而這同樣也是數(shù)據(jù)挖掘技術(shù)始終追求的目標。一方面,應深度整合模式集成結(jié)構(gòu)。因經(jīng)濟活動當中的數(shù)據(jù)量較大且種類相對復雜,所以有必要系統(tǒng)且深入地處理經(jīng)濟數(shù)據(jù)信息集成結(jié)果及其數(shù)據(jù)的呈現(xiàn)模式。其中,使用數(shù)據(jù)挖掘技術(shù)的時候,為對比分析std-id與std-no,需游俠地對比含有元數(shù)據(jù)模塊,確保實體識別效率得到保障,滿足質(zhì)量標準要求。另一方面,應深入分析人冗余的問題,因數(shù)據(jù)挖掘技術(shù)從本質(zhì)上來講就是深加工數(shù)據(jù)的過程。在這種情況下,要想確保經(jīng)濟統(tǒng)計價值完整,就必須保證技術(shù)模型處于最簡的狀態(tài),并針對正相關關系數(shù)據(jù)實時集中化精簡性地操作,綜合考慮冗余屬性,細化處理問題數(shù)據(jù)。其中,以人均國民生產(chǎn)總值為例,數(shù)據(jù)信息主要是利用國內(nèi)生產(chǎn)總值與人口屬性進行計算并得出,所以數(shù)據(jù)必須要經(jīng)過精簡操作。
(三)決策樹方面
對數(shù)據(jù)挖掘技術(shù)進行應用的過程中,需要針對其展開系統(tǒng)化地分析以及總結(jié),以確保數(shù)據(jù)的輸出效果更加完整,并且輸出的形式和經(jīng)濟管理人員所制定的決策需求相適應。值得注意的是,決策樹屬于快速且能夠?qū)?shù)據(jù)信息進行直觀分類的措施,并且形成數(shù)據(jù)模型,深化處理數(shù)據(jù)信息。其中,應借助訓練集對決策樹進行構(gòu)建,并結(jié)合具體問題以及參數(shù)要求科學合理地構(gòu)建具有可行性的分析策略,并且在短時間內(nèi)輸出數(shù)據(jù)分析的模型。與此同時,要通過既有決策樹來分類數(shù)據(jù)信息,保證遞歸過程優(yōu)勢的有效發(fā)揮,并且在決策樹樹根的位置發(fā)展至樹干與樹丫等,最終會輸出與分類條件相適應的數(shù)據(jù)。但應當注意的是,分類條件要求相對嚴格,在節(jié)點全部數(shù)據(jù)都隸屬相同類別的情況下,就處于最常見的停止條件,而另外一種則是在具備分類屬性的情況下,在二次分割輸入數(shù)據(jù)的時候,即可停止進行分類。在整個過程中,借助決策樹實施經(jīng)濟數(shù)據(jù)統(tǒng)計過程中,應定期采取剪枝操作程序,盡可能規(guī)避起伏影響,有效增強數(shù)據(jù)的實效性與穩(wěn)定性。
(四)遺傳算法方面
所謂的遺傳算法就是將生物自然與遺傳機理相互結(jié)合,隨意抽取算法。在實踐應用方面,綜合考慮社會問題,有效采集被指定人群的信息,在隱含信息整合與分析的基礎上獲取最終的結(jié)果。因遺傳算法具有一定的隱含性,所以能夠與其他模型有效結(jié)合,對隱含數(shù)據(jù)加以采集。隨后,深入分析既有挖掘數(shù)據(jù)信息,并應用在實踐中。需要注意的是,經(jīng)濟問題是發(fā)展變化問題,所以內(nèi)部的聯(lián)系十分復雜,將遺傳算法作為重要參考依據(jù),即可在源頭處向下延伸,并有效地獲取數(shù)據(jù),整體分析數(shù)據(jù)信息,即可保證經(jīng)濟問題更為直接與具體,確保相關工作人員在處理問題方面也更為直觀,切實地表現(xiàn)出隱性的問題。這樣一來,即可保證統(tǒng)計工作更為直接與簡單。
三、數(shù)據(jù)挖掘技術(shù)未來發(fā)展前景
數(shù)據(jù)挖掘技術(shù)在未來發(fā)展的過程中,將更具有效性、綜合性以及適用性的特征。為系統(tǒng)化地了解數(shù)據(jù)挖掘技術(shù)的價值,下文將通過以上三方面的發(fā)展趨勢展開進一步地探討與研究,以期在后期發(fā)展方面,充分發(fā)揮數(shù)據(jù)挖掘技術(shù)的重要作用,推進經(jīng)濟統(tǒng)計工作的全面可持續(xù)發(fā)展。
(一)有效性
數(shù)據(jù)挖掘技術(shù)能夠針對數(shù)據(jù)信息實施深層加工,也是統(tǒng)計工作的重要基礎,其目的性明顯且在實際應用方面,在長期統(tǒng)計數(shù)據(jù)積累的同時,可以深處理并加工基礎數(shù)據(jù)。而在實踐方面,以數(shù)據(jù)使用人員實際要求為基礎,站在多個分析角度應用數(shù)據(jù)信息,能夠統(tǒng)計并分類數(shù)據(jù)中所蘊含的數(shù)據(jù)信息,使得原有混亂數(shù)據(jù)庫得到科學化與系統(tǒng)化地歸類整理,借助這一形式,也使得數(shù)據(jù)信息管理更加便利與高效。
(二)綜合性
針對數(shù)據(jù)挖掘技術(shù)而言,從本質(zhì)上來講是系統(tǒng)化數(shù)據(jù)統(tǒng)計工具,但并非是單一性數(shù)據(jù)分析,能夠?qū)κ褂萌藛T針對類型不同信息的需求得到滿足。近年來,在國內(nèi)社會經(jīng)濟發(fā)展的背景下,經(jīng)濟管理部分也要針對社會內(nèi)部經(jīng)濟發(fā)展數(shù)據(jù)展開統(tǒng)計與分析。需要注意的是,數(shù)據(jù)信息所具備的管理權(quán)限與處理權(quán)限存在明顯差異,所以經(jīng)濟管理部門應結(jié)合多樣化需求下的經(jīng)濟管理內(nèi)容展開統(tǒng)計與分析,以保證數(shù)據(jù)信息有效地轉(zhuǎn)換為多元化數(shù)據(jù)形式,遵循信息來源與統(tǒng)計信息計算方式,科學化地評估其可靠性,確保數(shù)據(jù)統(tǒng)計信息更加準確。
(三)適用性
對于國內(nèi)經(jīng)濟管理部門而言,在職權(quán)管理工作方面的表現(xiàn)十分分散,且各類型經(jīng)濟管理部門對于數(shù)據(jù)信息需求量與類型也存在明顯的差異。在大部分區(qū)域,諸多經(jīng)濟管理部門針對統(tǒng)計活動傳統(tǒng)實施的路徑都彰顯出局限性,無法借助經(jīng)濟管理活動為其提供高質(zhì)量服務。而在實踐工作中,也很容易出現(xiàn)重復性統(tǒng)計亦或是不完全性統(tǒng)計的問題,對經(jīng)濟數(shù)據(jù)分析有效性產(chǎn)生了直接的影響。而將數(shù)據(jù)挖掘技術(shù)應用于其中,則能夠規(guī)避以上問題,并確保所得到的數(shù)據(jù)更加準確,并整合處理數(shù)據(jù)挖掘技術(shù),確保數(shù)據(jù)資源的豐富性與多樣性。
四、結(jié)語
綜上所述,在現(xiàn)代經(jīng)濟管理過程中,經(jīng)濟統(tǒng)計活動價值明顯提高,所以需要深入分析基礎數(shù)據(jù)主體才能夠與市場實際需求相互結(jié)合,并構(gòu)建有效性較強的經(jīng)濟決策。在實踐方面,需對系統(tǒng)化數(shù)據(jù)挖掘技術(shù)加以利用,在確保數(shù)據(jù)質(zhì)量的基礎上,不斷優(yōu)化經(jīng)濟建設實際效率,最終達到數(shù)據(jù)深加工的目的。而在經(jīng)濟統(tǒng)計活動實施方面,需科學合理地運用應用措施,以保證數(shù)據(jù)挖掘技術(shù)得以進一步優(yōu)化。
參考文獻:
[1]邢莉.統(tǒng)計分析的新模式———數(shù)據(jù)挖掘技術(shù)[J].統(tǒng)計與咨詢,2006(04).
[2]王斌會.數(shù)據(jù)挖掘技術(shù)及其應用現(xiàn)狀[J].統(tǒng)計與決策,2006(10).
[3]徐輝,史旻.淺論數(shù)據(jù)挖掘技術(shù)及其應用[J].計算機光盤軟件與應用,2012(05).
[4]邢莉.統(tǒng)計分析的新模式———數(shù)據(jù)挖掘技術(shù)[J].統(tǒng)計與咨詢,2006(04).
[5]鄒鐵英,陳煉,謝泰生.數(shù)據(jù)挖掘技術(shù)在經(jīng)濟消費預測中的研究[J].現(xiàn)代計算機(專業(yè)版),2008(12).
作者:洪鵬飛 單位:浙江財經(jīng)大學