大數(shù)據(jù)時代的概念與特征范文
時間:2024-01-04 17:40:55
導語:如何才能寫好一篇大數(shù)據(jù)時代的概念與特征,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
關(guān)鍵詞:大數(shù)據(jù)時代 大數(shù)據(jù)理解
1大數(shù)據(jù)時代概念的提出
當前,大數(shù)據(jù)這一詞匯在各行各業(yè)中出現(xiàn)的頻率越來越高,各種媒體中也經(jīng)常對這大數(shù)據(jù)這一概念進行推廣,大數(shù)據(jù)時代逐漸成為了一個社會熱詞,昭示著大數(shù)據(jù)時代的來臨。
在學界中,大數(shù)據(jù)的理論思考與實踐探索一直在如火如荼的濟寧這,并與經(jīng)濟市場,政府機關(guān)形成了良好的合作與互相支持的模式。大數(shù)據(jù)時代的來臨與當前互聯(lián)網(wǎng)時代的建設基礎和發(fā)展迅速的信息技術(shù)具有重要聯(lián)系,早在上個世紀末就有了關(guān)于大數(shù)據(jù)時代的理論雛形,對整合所有數(shù)據(jù)并對數(shù)據(jù)進行加工,分析,處理提出設想。這一設想的提出與同一時期的“商業(yè)智能”的具有密切的聯(lián)系,所謂商業(yè)智能也是指建立數(shù)據(jù)倉庫的基礎上挖掘數(shù)據(jù)的深度含義,分析數(shù)據(jù)從而挖掘出數(shù)據(jù)之間的內(nèi)部聯(lián)系性,從而獲取文化公司所需要的信息,為文化公司的發(fā)展提供決策思路和數(shù)據(jù)支持。
直到世紀,信息技術(shù)的發(fā)展導致各種數(shù)據(jù)統(tǒng)計工作的便捷與高效性,人們逐漸發(fā)現(xiàn)了進行大規(guī)模數(shù)據(jù)分析和研究對文化公司在發(fā)展過程中所能起到的作用,互聯(lián)網(wǎng)的覆蓋范圍越來越廣,在各行業(yè)各的應用程度愈來愈高,智能手機的普及都為大數(shù)據(jù)時代的來臨打下了堅實的基礎,隨后大數(shù)據(jù)的概念在信息技術(shù)行業(yè)中越來越得到認可與重視,大數(shù)據(jù)的相關(guān)理論基礎研究與前景展望也越來越多,為大數(shù)據(jù)時代構(gòu)建了理論結(jié)構(gòu)與應用前景。
2012年的達沃斯世界經(jīng)濟論壇中將大數(shù)據(jù)作為主題之一進行討論,可以說變相確定了大數(shù)據(jù)在未來社會發(fā)展進程中的地位,探究了以信息技術(shù)為依托的大數(shù)據(jù)處理分析如何對人類社會的發(fā)展作為貢獻。國內(nèi)對大數(shù)據(jù)在未來發(fā)展中將占據(jù)的地位和起到的作用也做出了充分的認可,各大企業(yè)與高校對大數(shù)據(jù)的概念與應用已經(jīng)開始進行研究與實踐。
2大數(shù)據(jù)一詞的概念與理解
對大數(shù)據(jù)時代的理解離不開對大數(shù)據(jù)的概念的理解。什么是大數(shù)據(jù)?就當下而言,雖然大數(shù)據(jù)一詞的出現(xiàn)的頻率極高,許多媒體,部門,論壇都在使用這一詞語,但是對大數(shù)據(jù)一詞的核心含義的理解卻并不一定充分。當前學界內(nèi)對數(shù)據(jù)一詞的定義尚且沒有一個統(tǒng)一的較為得到廣泛認可的定義。對大數(shù)據(jù)一詞的定義可以分為幾種,例如維基百科上說大數(shù)據(jù)就是指數(shù)量、規(guī)模龐大的數(shù)據(jù)資料,無法利用常見的軟件工具對其進行高效率收集,處理與分析。還有的的說法認為大數(shù)據(jù)就是單純指數(shù)據(jù)量足夠大,遠超常規(guī)水平的數(shù)據(jù)集合。還有的說法主要是認為大數(shù)據(jù)進行處理的方式才是大數(shù)據(jù)一詞的實質(zhì),即大數(shù)據(jù)是通過特殊處理模式能提高企業(yè)對市場形勢的掌控程度,為決策提供指導的數(shù)據(jù)分析處理方法。
因此來看,大數(shù)據(jù)的特征應該包含著兩方面,一是大數(shù)據(jù)處理在技術(shù)層面具有先進性,二是大數(shù)據(jù)在社會性方面具有廣泛性。如上文所述,大數(shù)據(jù)一詞的出現(xiàn)是信息技術(shù)進步的結(jié)果。大數(shù)據(jù)最先出現(xiàn)其是存在與IT界的術(shù)語,大數(shù)據(jù)是一個多項技術(shù)合并在一起的概念,是一個具有系統(tǒng)性的體系,包括對數(shù)據(jù)依托信息技術(shù)實現(xiàn)大規(guī)模儲存與聯(lián)網(wǎng)分享的云技術(shù),對數(shù)據(jù)進行分析處理的分布式處理技術(shù),指紋識別,虹膜識別等對數(shù)據(jù)進行保密管理的感知技術(shù)等等,都應該包括與大數(shù)據(jù)體系之中。與此同時,大數(shù)據(jù)還具有社會性。大數(shù)據(jù)這一概念的出現(xiàn)離不開信息爆炸化的時代特征,大量的信息充斥于社會的每一個角落并呈現(xiàn)著井噴式的增長,每一個人都是數(shù)據(jù)的創(chuàng)造者與傳遞著,國際化進程的加快使人類社會前所未有的緊密聯(lián)系在一起,在這種時代背景下醞釀出來的大數(shù)據(jù)概念無法避免的具有人類社會發(fā)展的特征。
在大數(shù)據(jù)時代,人們的思維模式必須向大數(shù)據(jù)化的方向靠攏,傳統(tǒng)的思維模式已經(jīng)不適合時代的發(fā)展。信息技術(shù)的進步使我們的思維模式也可以在依托大數(shù)據(jù)提供的信息作出更準確的決策和判斷。在大數(shù)據(jù)模式下,高效率的數(shù)據(jù)收集與處理是我們可以脫離傳統(tǒng)的抽樣調(diào)查得出結(jié)論的辦法,不用再考慮數(shù)據(jù)模型是否具有科學性和代表性,也不用考慮抽樣結(jié)果是否具有偶然性,因為我們已經(jīng)可以立足于全面性的數(shù)據(jù)來對問題進行思考與判斷,同時,對數(shù)據(jù)的判斷要提高效率,應為判斷的本身也是一個大數(shù)據(jù)的過程,提高判斷的效率再借以數(shù)據(jù)統(tǒng)計來提高其準確性。在大數(shù)據(jù)時代,人們面對數(shù)據(jù)不需要刨根問底的研究數(shù)據(jù)出現(xiàn)的原因,而是應該要考慮數(shù)據(jù)之間的關(guān)聯(lián)性,研究數(shù)據(jù)之間的聯(lián)系,思考關(guān)聯(lián)出現(xiàn)的原因而不是單純研究因果關(guān)系。
大數(shù)據(jù)時代對于社會的改變在于,它變革的是人們處理數(shù)據(jù)的方式與模式,改變的是人認知世界,認知事物的方法,在數(shù)據(jù)化的信息處理中提供發(fā)現(xiàn)問題,解決問題,創(chuàng)造價值的方法。大數(shù)據(jù)作為一個新生事物能開創(chuàng)出一個新的時代,不得不說大數(shù)據(jù)在我們當下的社會發(fā)展進程中是極有價值的。雖然大數(shù)據(jù)的定義及體系,實踐應用方面還存在許多不足,缺少經(jīng)驗方面的積累,但是筆者相信隨著時間的推移大數(shù)據(jù)體系的形成必將越來越完備。我們當下所需要做的就是把握住大數(shù)據(jù)時代的時代脈搏,必須明確大數(shù)據(jù)時代的要求:首先,大數(shù)據(jù)時代必須充分利用信息技術(shù)來提高數(shù)據(jù)的收集與儲存,利用新的數(shù)據(jù)處理模式發(fā)現(xiàn)數(shù)據(jù)之間的關(guān)聯(lián)新,為決策提高科學性的指導與數(shù)據(jù)支持。然后,大數(shù)據(jù)是技術(shù)屬性與社會屬性的有機統(tǒng)一,所以在大數(shù)據(jù)時代中兩方面工作都要雙管齊下,提高技術(shù)水平的同時還要注重社會實踐應用,達到改變市場運作模式,各組織的結(jié)構(gòu)的目的。最后,大數(shù)據(jù)不是一個高高在上的概念性名詞,而是應該作為一種新的思維方式適用于社會的各個方面,包括政府行政,企業(yè)運營和人民生活等等,是新的時代智慧與時代氣息,而不是單純的一種技術(shù)或處理數(shù)據(jù)的手段。
必須要明確大數(shù)據(jù)時代真正的思想內(nèi)涵,才能是我國在新時代的發(fā)展過程中不落人后,占據(jù)著有力地位,提高國家的信息化程度與綜合實力,對本論文的命題“大數(shù)據(jù)時代”對企業(yè)人力資源管理工作的影響能做出正確的分析探究。
參考文獻:
篇2
闡述了大數(shù)據(jù)的概念、特征、相關(guān)技術(shù)和面臨的挑戰(zhàn),大數(shù)據(jù)時代實驗室管理提升帶來的新方向,包括實驗室大數(shù)據(jù)的采集、存儲與處理、分析決策系統(tǒng)等的建立,更加注重保密和法律問題,對實驗室管理新特點也做了分析。
關(guān)鍵詞:
大數(shù)據(jù);實驗室;管理
海量數(shù)據(jù)已經(jīng)使我們進入了大數(shù)據(jù)時代,數(shù)據(jù)信息的來源、傳播速度和傳播數(shù)量正在影響、改變著人們的思維方式和生活、工作習慣。近年來,基于“大數(shù)據(jù)”的實驗室管理系統(tǒng)的開發(fā)以及互聯(lián)網(wǎng)的實驗室管理技術(shù)正在興起[1,2],那么“大數(shù)據(jù)”究竟是什么,“大數(shù)據(jù)”的發(fā)展將會給實驗室的日常管理帶來何種影響或進步,實驗室工作者又將如何面對直至駕馭這種進步,是本文主要討論的問題。
一、“大數(shù)據(jù)”的概念,特征,相關(guān)技術(shù)和面臨的挑戰(zhàn)
(一)“大數(shù)據(jù)”的概念
一般比較公認的“大數(shù)據(jù)”概念是:數(shù)據(jù)量大;數(shù)據(jù)處理迅速;數(shù)據(jù)類型多樣;數(shù)據(jù)價值高,密度低。美國互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)將大數(shù)據(jù)定義為:為更經(jīng)濟地從高頻率的、大容量的、不同結(jié)構(gòu)和類型的數(shù)據(jù)中獲取價值而設計的新一代架構(gòu)和技術(shù)[3]。另一個對大數(shù)據(jù)較為抽象的概念是,一種在數(shù)據(jù)量增長迅速、信息來源繁多龐雜中,實現(xiàn)管理智能的思維形態(tài)[4,5]。
(二)“大數(shù)據(jù)”特征
簡稱4V特征。為Volume(數(shù)據(jù)量大)、Variety(種類多)、Value(價值低)、Velocity(高速處理和響應)[6-9]。(1)Volume。指的是由網(wǎng)絡應用、科學研究產(chǎn)生的數(shù)據(jù)量,及從這些數(shù)據(jù)衍生出來的數(shù)據(jù)非常龐大。(2)Va-riety。數(shù)據(jù)有多種數(shù)據(jù)源,數(shù)據(jù)類型多樣,結(jié)構(gòu)復雜。(3)Value。在大量數(shù)據(jù)中,有價值的不多,即價值密度較低。(4)Velocity。大量的數(shù)據(jù)要求對數(shù)據(jù)快速處理,實時分析,從分析結(jié)果中解釋并預測事物的發(fā)展。
(三)“大數(shù)據(jù)”面臨的挑戰(zhàn)
(1)如何將復雜的數(shù)據(jù)整合成有機合理的結(jié)構(gòu)成為面臨的問題。(2)時效性即對數(shù)據(jù)處理系統(tǒng)的高速、低耗要求是一個挑戰(zhàn)。(3)涉及隱私保護等安全問題,是數(shù)據(jù)處理和分析的重要方面。(4)高能耗是大數(shù)據(jù)發(fā)展的制約瓶頸。(5)大數(shù)據(jù)分析結(jié)果差異化。復雜的分析過程導致差異的分析結(jié)果,差異結(jié)果在現(xiàn)實生活中不同程度地影響著人們,反而可能制約了獲取知識的能力[10,11]。
二、大數(shù)據(jù)時代實驗室管理的框架[12-15]
高校實驗室是高校教學、科研和實訓的綜合體??茖W,規(guī)范,高效,安全的現(xiàn)代化管理方式,是實驗室管理的發(fā)展方向與目標。大數(shù)據(jù)技術(shù)可將先進的網(wǎng)絡技術(shù)與數(shù)據(jù)庫結(jié)合,引入到實驗室管理的理念中,提高實驗室的信息化管理技術(shù)。通過對大量數(shù)據(jù)的有效分析,為管理者提供決策功能。通過各個信息平善建立,有力保障高校教學和科研有序進行。大數(shù)據(jù)時代,利用大數(shù)據(jù)技術(shù)實現(xiàn)實驗室高效管理要建立和完善以下系統(tǒng)。
(一)建立實驗室大數(shù)據(jù)的采集系統(tǒng)
主要分為實驗室管理信息系統(tǒng),按角色劃分分為學生,實驗室管理員和系統(tǒng)管理員,數(shù)據(jù)包含各種預約信息,成績查詢和登記等系統(tǒng),實驗室儀器設備的基本信息,購買、使用、維護、保養(yǎng)、維修、報廢等數(shù)據(jù),實驗試劑和耗材的信息,實驗室人員的管理信息,實驗室管理文件信息。采集的數(shù)據(jù)要盡量使數(shù)據(jù)全面,完整,從各個方面反映事物的真實性。因此在數(shù)據(jù)采集階段要合理設計數(shù)據(jù)的結(jié)構(gòu)和內(nèi)容。
(二)建立實驗室大數(shù)據(jù)的存儲和處理系統(tǒng)
在采集數(shù)據(jù)中要做到采集數(shù)據(jù)完整性和實效性。完整性指信息的統(tǒng)計不僅有簡單的數(shù)據(jù),還可以采用圖片、視頻等數(shù)據(jù)。實效性是指對采集的數(shù)據(jù)及時更新,如實驗室易耗品的使用情況、儀器設備的使用狀態(tài)、儀器的預約狀態(tài)等。
(三)實驗室管理中通過對大數(shù)據(jù)進行分析進而形成決策
以往對實驗室的管理和決策很大程度上依賴于經(jīng)驗。大數(shù)據(jù)下管理的決策、預警主要依靠數(shù)據(jù)的分析。對出現(xiàn)的問題提出后,帶著問題對相關(guān)的數(shù)據(jù)分析,提供給管理者解決的方案。
(四)大數(shù)據(jù)使用過程中的保密和法律問題
大數(shù)據(jù)一個巨大的優(yōu)點是數(shù)據(jù)資源共享,但實驗室內(nèi)很多數(shù)據(jù)是只能在有限范圍內(nèi)分享的,比如最新的科研數(shù)據(jù)、客戶的送檢結(jié)果等。因此實驗室管理中,在充分發(fā)揮大數(shù)據(jù)優(yōu)勢的同時也要注意信息保密和法律方面的管理。
三、大數(shù)據(jù)時代實驗室管理的特點
(一)實驗室安全管理職能化
實驗室安全是實現(xiàn)實驗室功能的基礎保證。門禁系統(tǒng)取代門鎖,刷卡出入,視頻監(jiān)控系統(tǒng)可對實驗室進出人員控制和監(jiān)督,并促進實驗人員責任心的建立。遠程實驗室儀器控制和報警系統(tǒng),可幫助技術(shù)人員遠程控制實驗儀器的操作和電源開關(guān),及時監(jiān)控實驗室儀器和周圍環(huán)境的安全動態(tài)。
(二)實驗室試劑耗材的管理更加動態(tài)、實時
通過數(shù)據(jù)庫對試劑耗材的使用情況數(shù)據(jù)分析,在最短的時間內(nèi)對試劑耗材進行預定和補充,對未來的實驗所需加以預測分析。同時對試劑耗材的供貨方式,供貨速度,供貨廠家等分析,可對供貨商進行有效控制和監(jiān)督,保證試劑耗材的質(zhì)量和安全使用。
(三)實驗儀器標準化網(wǎng)絡管理
實驗儀器的唯一條形碼識別管理系統(tǒng),可保證實驗儀器從入庫,使用,維護的全網(wǎng)絡公開、開放。實驗室儀器的預約系統(tǒng)可保證大型儀器管理共享,保證儀器的高效使用。使用全程電子記錄和監(jiān)控,可有效統(tǒng)計和分析儀器的使用率,對今后儀器購買提供有效數(shù)據(jù)。實驗室準入制度的網(wǎng)絡化學習、考試、準入,不僅保證實驗室儀器者的基本素質(zhì),而且對儀器的正常高效運轉(zhuǎn)提供必要保障。另外,反饋的數(shù)據(jù)提供進一步的網(wǎng)絡支持。
(四)實驗規(guī)章制度和課程多樣化學習
寫實、生動的動畫模擬,可以將刻板文字化的規(guī)章制度轉(zhuǎn)化更易接受和領會的方式,加深制度的學習和認識,避免實際中因制度不嚴格執(zhí)行導致的失誤。很多在現(xiàn)實中危險的事故和實驗,可結(jié)合大數(shù)據(jù)的分析和模擬,建立新型的實驗教學課程,讓學生了解不同實驗操作過程可能發(fā)生的危害,讓學生感受和探索,以避免真正危險事故的發(fā)生。
(五)實驗室人員管理升級與升級管理
人員管理可在數(shù)據(jù)系統(tǒng)中劃分不同角色,分配不同權(quán)限,承擔相應義務。實驗室人員的管理是為更好保證實驗室安全高效運轉(zhuǎn),實驗技術(shù)人員可根據(jù)現(xiàn)象分析、統(tǒng)計分析,積極協(xié)助科研人員的技術(shù)開發(fā)、儀器升級等工作,并通過數(shù)據(jù)系統(tǒng)及時了解實驗中亟待解決的問題。
四、結(jié)語
我國要建設創(chuàng)新型國家,必須全面實施科教興國與人才強國戰(zhàn)略。人才培養(yǎng)是人才強國的重要基礎。實驗室是人才培養(yǎng)與人才施展才華的基礎條件,提升實驗室管理水平,更好的服務于人才培養(yǎng)與人才發(fā)揮聰明才智,是實驗室管理工作持之以恒的追求。大數(shù)據(jù)時代無疑為這種追求提供了方向和目標。
作者:張艷艷 韓濤 高秀芝 黃漫青 丁軻 單位:北京農(nóng)學院食品科學與工程學院
參考文獻:
[1]崔德鳳,張永紅,沈紅.淺談高校重點實驗室信息化平臺建設[J].北京教育,2013,(2):48-49
[2]李密生,忻圣婷,肖欣.基于校園網(wǎng)的實驗教學管理系統(tǒng)的設計[J].實驗室科學,2014,(4):61-66
[3]張意軒,于洋.大數(shù)據(jù)時代的大媒體[N].人民日報,2013-01-17.
[4]劉智慧,張泉靈.大數(shù)據(jù)技術(shù)研究綜述[J].浙江大學學報,2014,48(6):957-972.
[5]馬建光,姜巍.大數(shù)據(jù)的概念、特征及其應用[J].國防科技,2013,(4):10-16.
[6]霍夢蘭.大數(shù)據(jù)時代的問題挑戰(zhàn)與應對策略[J].科技視界,2014,(34):206,311.
[7]王萍麗,吳政,吳英昊.大數(shù)據(jù)時代軍隊現(xiàn)代遠程教育發(fā)展問題研究[J].繼續(xù)教育,2014,(12):47-49.
[8]吳梅.大數(shù)據(jù)及其對地礦分析測試工作的啟示———以貴州地質(zhì)礦產(chǎn)中心實驗室為例[J].價值工程,2014,(17):234-235.
[9]方巍,鄭玉,徐江.大數(shù)據(jù):概念、技術(shù)及應用研究綜述[J].南京信息工程大學學報,自然科學版,2014,6(5):405-419.
[10]李勇輝.大數(shù)據(jù)概念辨析及應對措施[J].互聯(lián)網(wǎng)天地,2014,(1):11-13.
[11]王書偉.大數(shù)據(jù)時代政府部門間信息資源共享策略研究[D].長春:吉林大學,2013.
[12]陳昌興.高校實驗室信息化的云計算策略與方法[J].實驗技術(shù)與管理,2014,(1):221-224.
[13]程琳琳,王旭,程延俊等.實驗室信息管理系統(tǒng)(LIMS)在實驗室科學管理中的應用[J].熱帶農(nóng)業(yè)工程,2014,(1):16-20.
篇3
實際上,大數(shù)據(jù)的應用遠遠不止于此,各行各業(yè)都能見到它的影子。在其起步階段,互聯(lián)網(wǎng)和電商等與IT技術(shù)關(guān)聯(lián)度較大的領域最先了解和使用了大數(shù)據(jù),隨著大數(shù)據(jù)逐漸被社會各界認知,越來越多的行業(yè)包括大量傳統(tǒng)行業(yè)在內(nèi),都開始了解和應用大數(shù)據(jù)。大數(shù)據(jù)對人們的生活究竟產(chǎn)生了怎樣的影響?為此,《經(jīng)濟》記者專訪了中國商業(yè)聯(lián)合會數(shù)據(jù)分析專業(yè)委員會會長鄒東生,與他就大數(shù)據(jù)的相關(guān)問題進行了深入探討。
從1.0向2.0時代過渡
鄒東生認為,當前中國正處于大數(shù)據(jù)1.1時代,是以認知為特征的大數(shù)據(jù)1.0時代向以應用為特征的大數(shù)據(jù)2.0時代的過渡階段。“盡管大數(shù)據(jù)的概念在21世紀初就傳入中國,但是在2010年前后才開始被中國的社會各界廣泛認知?!编u東生向記者解釋,“過去的四五年是大數(shù)據(jù)在中國的普及階段,政府、企業(yè),特別是一些原本做數(shù)據(jù)建設和信息技術(shù)的公司,開始主動認為大數(shù)據(jù)是一個趨勢。國家前后出臺了很多大數(shù)據(jù)領域的相關(guān)規(guī)劃和推動大數(shù)據(jù)發(fā)展的政策,一些大數(shù)據(jù)交易平臺和交易所陸續(xù)成立,越來越多的大數(shù)據(jù)相關(guān)會議也在中國舉辦”。總結(jié)和展望大數(shù)據(jù)概念在我國的普及和發(fā)展過程,鄒東生認為主要可以分為3個階段,“第一階段是2010年前后大數(shù)據(jù)的1.0認知階段,這是社會各界對大數(shù)據(jù)概念產(chǎn)生初步認知的時期,政府部門和企業(yè)界對大數(shù)據(jù)的理解千差萬別,各不相同;第二階段就是當前,是大數(shù)據(jù)1.1階段,是認知大數(shù)據(jù)向應用大數(shù)據(jù)的過渡時期;第三階段是不遠的將來大數(shù)據(jù)2.0應用階段,未來幾年,大數(shù)據(jù)的相關(guān)項目將陸續(xù)落地,產(chǎn)生實用性價值,大數(shù)據(jù)將進入應用和產(chǎn)生價值的階段?!?/p>
在劃分大數(shù)據(jù)時代的不同階段和闡釋相應特征的基礎上,鄒東生向《經(jīng)濟》記者概括了當前我國大數(shù)據(jù)發(fā)展的主要特征,他認為主要可以從大數(shù)據(jù)的認知、應用和人才培養(yǎng)角度出發(fā),分為3個方面。第一,從認知大數(shù)據(jù)的角度出發(fā),企業(yè)開始探索大數(shù)據(jù)能為自己帶來什么?!白畛?,人們對大數(shù)據(jù)的求知欲僅僅停留在‘我希望了解什么是大數(shù)據(jù)’,而現(xiàn)在,越來越多的企業(yè)希望了解大數(shù)據(jù)能給自己帶來什么和大數(shù)據(jù)項目如何落地?!钡诙?,從應用大數(shù)據(jù)的角度出發(fā),企業(yè)對大數(shù)據(jù)的關(guān)注不僅僅停留在技術(shù)層面,更多向分析數(shù)據(jù)和研究數(shù)據(jù)發(fā)展。“前幾年大數(shù)據(jù)相關(guān)會議和活動的主角是技術(shù)公司,只要一說大數(shù)據(jù),他們就必提一些技術(shù)的新名詞,從而導致很多人誤認為大數(shù)據(jù)就是一種技術(shù)。這其實是大數(shù)據(jù)1.0時代的一種特殊認知。因為在那一階段,很多企業(yè)還沒有構(gòu)建自己的數(shù)據(jù)平臺,缺乏數(shù)據(jù)基礎,企業(yè)開始接觸和應用大數(shù)據(jù)分析的第一步就是數(shù)據(jù)化,離不開對于技術(shù)的接觸。但是技術(shù)僅僅是大數(shù)據(jù)的底層,不是大數(shù)據(jù)的核心。未來,隨著技術(shù)的逐漸開源,越來越多先進技術(shù)門檻的降低,越來越多的人會明白大數(shù)據(jù)最具價值的部分不是通過數(shù)據(jù)搭建的技術(shù)平臺,不是數(shù)據(jù)本身的儲存,而是它的分析過程,是通過對數(shù)據(jù)進行的深層次應用,幫助企業(yè)提高決策決心,降低運營風險?!钡谌?,從人才培養(yǎng)的角度,企業(yè)越來越重視大數(shù)據(jù)人才的價值。大數(shù)據(jù)人才即將迎來井噴階段,“以各企業(yè)對數(shù)據(jù)分析人才的需求為例,前兩年相關(guān)的人才需求比較零散,而現(xiàn)在的需求十分旺盛,甚至一天之內(nèi)就可能出現(xiàn)幾萬個崗位空缺,有些職位也對應著高額的薪水,目前大數(shù)據(jù)人才仍處于井噴的前期,并未迎來真正的繁榮。未來,越來越多的企業(yè)會認識到自己的核心競爭力應該是人才儲備,而不是技術(shù)儲備,越來越多的企業(yè)會將數(shù)據(jù)分析人才當成自己的標配人才,因為不論是營銷還是企業(yè)管理崗位,都需要數(shù)據(jù)分析能力。那時才是大數(shù)據(jù)人才需求和供給的大繁榮階段,大數(shù)據(jù)人才才能變?yōu)樽钣袃r值的人才?!?/p>
核心價值
進入21世紀以來,互聯(lián)網(wǎng)對人們的生產(chǎn)生活產(chǎn)生了巨大影響,在極大程度上推動了各行各業(yè)的創(chuàng)新和進步,互聯(lián)網(wǎng)自身也在不斷的發(fā)展中改變和獲得突破。時至今日,傳統(tǒng)互聯(lián)網(wǎng)技術(shù)在融合了云計算和云存儲等新概念的基礎上,已進入了大數(shù)據(jù)時代。對于傳統(tǒng)互聯(lián)網(wǎng)和大數(shù)據(jù)間的差異,鄒東生認為:“傳統(tǒng)的互聯(lián)網(wǎng)是一種服務于各行各業(yè)的工具,致力于為人們帶來直接的便捷,企業(yè)在前期需要進行充分的互聯(lián)網(wǎng)相關(guān)技術(shù)搭建,但這一過程并不一定能帶來快速和直接的盈利。所以對于互聯(lián)網(wǎng)企業(yè)而言,‘走得早,不一定走得好’。而大數(shù)據(jù)則不同,在大數(shù)據(jù)領域,越早使用大數(shù)據(jù)和相關(guān)技術(shù)、理念分析處理問題,就能越早獲益?!?/p>
為什么大數(shù)據(jù)企業(yè)“走得早”,就能“走得好”?鄒東生告訴記者,這是由大數(shù)據(jù)的核心價值決定的?!按髷?shù)據(jù)能夠幫助企業(yè)進行精準分析,從而提高企業(yè)的決策效率,幫助企業(yè)獲取更多的收益,降低成本。換言之,大數(shù)據(jù)能夠給企業(yè)帶來看得見、摸得著的收益?!背藥椭髽I(yè)精準決策,在解決“數(shù)據(jù)孤島”問題上,大數(shù)據(jù)也將發(fā)揮巨大作用。他認為大數(shù)據(jù)的出現(xiàn)是解決“數(shù)據(jù)破碎化問題”的鑰匙,“大數(shù)據(jù)能夠通過構(gòu)建數(shù)據(jù)溝通平臺將‘數(shù)據(jù)孤島’打通,最大程度地使得原本不關(guān)聯(lián)的東西相互關(guān)聯(lián)”。鄒東生同時強調(diào)如果使用不當,大數(shù)據(jù)技術(shù)非但不能解決,甚至可能加劇數(shù)據(jù)的破碎化,他說:“如果缺乏對大數(shù)據(jù)分析過程的深度理解和正確認知,搭建平臺前沒有充分的研究,大數(shù)據(jù)的使用將無法打通數(shù)據(jù)間的‘孤島’,甚至可能會產(chǎn)生越來越多的數(shù)據(jù)碎片和信息流失”。
那么,如何挖掘大數(shù)據(jù)的核心價值?鄒東生為有意向應用大數(shù)據(jù)的企業(yè)提出了“三步走”的建議。第一步,從企業(yè)自身角度出發(fā),“企業(yè)越早信息化,未來數(shù)據(jù)分析的‘彈藥’就越充足。企業(yè)首先需要將自己的數(shù)據(jù)保存起來,在此基礎上,有目的、有計劃地收集外部數(shù)據(jù),通過外部數(shù)據(jù)和內(nèi)部數(shù)據(jù)的整合,形成足夠大的數(shù)據(jù)體量”。第二步,從企業(yè)和大數(shù)據(jù)平臺間的合作角度出發(fā),“利用數(shù)據(jù)平臺幫忙整合數(shù)據(jù)”。第三步,從對大數(shù)據(jù)分析的角度出發(fā),“在結(jié)合行業(yè)和數(shù)據(jù)特征的基礎上,設計算法,提供科學的量化、引導和分析,使大數(shù)據(jù)成為幫助企業(yè)更好提高決策效率和降低風險的分析工具”。
篇4
關(guān)鍵詞:大數(shù)據(jù)時代;教師德育勝任力;轉(zhuǎn)向;培養(yǎng)路徑
隨著教育信息化、“互聯(lián)網(wǎng)+”行動的不斷推進和數(shù)字校園建設、“三通兩平臺”工程的精準實施,教育也正式邁入了以網(wǎng)絡為平臺、數(shù)據(jù)爆炸式增長為標志、云計算為支撐的大數(shù)據(jù)時代[1]。大數(shù)據(jù)時代的來臨,對整個教育系統(tǒng)產(chǎn)生了顛覆性的影響,也必將對教師的教育教學與個人發(fā)展帶來新的挑戰(zhàn)[2],對教師的德育勝任力提出新的要求。在大數(shù)據(jù)時代,海量信息和優(yōu)質(zhì)教育資源的開放共享削弱了教師傳統(tǒng)意義上的道德權(quán)威;網(wǎng)絡化生存中的人機互動更加凸顯出了師生間面對面交流和溝通的重要性;多維多變的價值觀念和學生復雜的價值訴求使得教師的價值引領作用在當下顯得更為沉重[3];慕課和翻轉(zhuǎn)課堂雖然減輕了教師的教學壓力,但卻對教師在學生的思想引領、價值型塑、人格感化和情感陶冶等方面提出了更高要求……總之,在新形勢下,教師完成立德樹人根本使命的重要性、緊迫性和艱巨性更加突出。教育作為鑲嵌在社會系統(tǒng)中的子系統(tǒng),其發(fā)展必須與時代潮流相適應。這種適應雖然表現(xiàn)在調(diào)整課程內(nèi)容和結(jié)構(gòu)、革新教學模式和方法、應用新興設備和技術(shù)等多個方面,但最關(guān)鍵的還是在于教師要與時俱進地更新教育觀念,優(yōu)化知識結(jié)構(gòu),提升專業(yè)水平。教師若想在大數(shù)據(jù)這股浪潮中游刃有余,就必須以自信的姿態(tài)、主動的精神和切實的行動提升自身的德育能力。那么,在大數(shù)據(jù)時代,教師德育勝任力的內(nèi)涵應如何界定?它有哪些特征?教師德育勝任力又需實現(xiàn)哪些轉(zhuǎn)向?我們該采取哪些措施來培養(yǎng)教師的德育勝任力?這些問題都是當前德育研究亟需解決的重要課題。
一、大數(shù)據(jù)時代的教師德育勝任力
勝任力研究雖有將近百年歷史,但真正進入教育領域卻始于20世紀70年代末。研究主題聚焦在教育管理者的勝任力培養(yǎng)上,如美國中學校長協(xié)會構(gòu)建了校長勝任力指標體系,以此來指導校長選聘和職業(yè)發(fā)展工作[4]。在我國,關(guān)于教師勝任力研究的最早文獻是2003年的《未來教師勝任力測評:原理和技術(shù)》一文,該文認為,“教師勝任力指教師個體所具備的、與實施成功教學有關(guān)的一種專業(yè)知識、專業(yè)技能和專業(yè)價值觀”[5]。迄今為止,我國教師勝任力研究已走過15個年頭,并取得了不少有價值的研究成果,學者們從概念界定、模型構(gòu)建、研究方法、勝任力測評及具體應用等方面進行了較為深入的探討。在整個教師勝任力研究中,雖然有部分學者對教師德育能力、教師德育素養(yǎng)(素質(zhì))、教師德育專業(yè)化展開了相關(guān)研究,如檀傳寶教授認為,教師的德育素養(yǎng)結(jié)構(gòu)由道德與文化素養(yǎng)、學科專業(yè)素養(yǎng)和教育專業(yè)素養(yǎng)三部分構(gòu)成[6]。但目前尚未有人提出“教師德育勝任力”這一概念并對其進行研究,更沒有人結(jié)合具體的時代背景來闡述教師的德育勝任力。進入大數(shù)據(jù)時代,傳統(tǒng)的德育環(huán)境不復存在,教育對象在不斷發(fā)生變化,教師德育勝任力的概念也需重新定義。在批判借鑒國內(nèi)外學界關(guān)于勝任力、教師勝任力及教師德育能力(素養(yǎng)、素質(zhì))等概念的基礎上,并結(jié)合當前時展和社會環(huán)境對教師德育能力提出的特殊要求,我們認為:大數(shù)據(jù)時代的教師德育勝任力是指大數(shù)據(jù)時代下每個教師能夠成功實施德育工作需要具備的一系列顯著的個體特征;這些特征主要包括高尚的道德修養(yǎng)、先進的德育理念、豐富的專業(yè)知識、高超的德育能力和良好的數(shù)據(jù)素養(yǎng)。上述概念具有五個主要特征:一是全員性。由于“沒有離開教育的教學,也沒有離開教學的教育”[7],所以“教師即人師”,每位教師都應承擔起教書育人的使命。二是相對獨立性。雖然教師勝任力、教學勝任力、德育勝任力三者有重疊和交叉,但德育勝任力應該有其自身的獨特性。三是綜合性。教師德育勝任力是由知識、態(tài)度、能力和價值觀等多種因素構(gòu)成的整體。四是時代性。教師德育勝任力是一個隨時展的動態(tài)概念,不僅傳統(tǒng)的德育素養(yǎng)不可或缺,而且教師還要“加強對時展的了解,與時俱進地進行道德學習,從媒介素養(yǎng)到國際理解,不斷增強自身的價值敏感性和價值選擇力”[3]。五是個性化。教師除了要具備通用的德育勝任力之外,還應彰顯出卡里斯瑪特質(zhì),表現(xiàn)出與眾不同的人格魅力。
二、大數(shù)據(jù)時代教師德育勝任力的轉(zhuǎn)向
整體而言,大數(shù)據(jù)進入教育領域,既是一場革命,也是一種挑戰(zhàn);既是一次十分難得的機遇,也是一種無法回避的負擔。大數(shù)據(jù)在給學校德育的改革創(chuàng)新與轉(zhuǎn)型發(fā)展帶來福音的同時,也對教師德育勝任力提出了全新挑戰(zhàn),需要所有教師的主動適應與積極作為,但在付諸行動之前,我們有必要弄清楚大數(shù)據(jù)時代下的教師德育勝任力究竟面臨著何種挑戰(zhàn),需要從哪些方面進行轉(zhuǎn)向。1.德育思維由經(jīng)驗式思維轉(zhuǎn)向數(shù)據(jù)式思維大數(shù)據(jù)不僅是一種信息資源和技術(shù)工具,更重要的是“一種思維方式,即讓數(shù)據(jù)開口說話,讓數(shù)據(jù)成為人類思考問題、做出行為決策的基本出發(fā)點”[8]。思維方式上的變革是置身于大數(shù)據(jù)時代的教師遭遇到的最大挑戰(zhàn)。這是因為,在教育領域,教師長期以來已經(jīng)習慣于依靠自身的常識、直覺、經(jīng)驗或有限理性進行思考和決策,而很少去傾聽身邊數(shù)字所發(fā)出的聲音[9]。然而,大數(shù)據(jù)時代的來臨使得這種經(jīng)驗式的德育思維難以為繼,教師的德育決策需要基于數(shù)據(jù)分析而制定。大數(shù)據(jù)具有的相關(guān)性、開放性、個性化和前瞻性思維可以幫助教師采集到有關(guān)學生品德發(fā)展的海量數(shù)據(jù),通過數(shù)據(jù)挖掘和關(guān)聯(lián)分析,就能夠比較全面而準確地掌握學生的興趣愛好、個性特征、思想動態(tài)、價值取向和行為趨勢等重要信息,教師就可以在此基礎上為學生提供符合其需求的個性化教育服務。顯然,這種數(shù)據(jù)式的德育思維具有無可比擬的優(yōu)勢,不僅可以為教師的德育工作打開新的思路,而且還能增強學校德育的實效性,因而也對傳統(tǒng)的德育思維造成了巨大沖擊。如今,當教師在德育實踐中遇到棘手的德育難題時,優(yōu)先考慮的應該是嘗試著從數(shù)據(jù)視角去尋求解決方案,而不是沿襲傳統(tǒng)思維。2.德育重心由集體式教育轉(zhuǎn)向個性化服務由于師資力量、技術(shù)手段和思維習慣等因素的共同影響,當前的學校德育基本上是根據(jù)學生的平均水平和總體特征而實施的同質(zhì)化教育,這使得我國古已有之的因材施教的教育理想始終難以落到實處。然而,有了大數(shù)據(jù)的支持,教師就能夠觀察和收集到每個學生的品德發(fā)展數(shù)據(jù)。這些數(shù)據(jù)為教師讀懂千差萬別的學生打開了一扇窗戶,也將促使德育重心從宏觀的群體教育轉(zhuǎn)向以學生為中心的個性化服務。在大數(shù)據(jù)時代,學生道德需求的多元化和個性化趨勢日漸凸顯,教師就應該根據(jù)學生不同的品德發(fā)展水平和獨特的學習風格,選擇合適的德育資源組織德育教學及相關(guān)活動,其工作重心“從知識傳授逐漸演變?yōu)殚_展教學評估,根據(jù)學生學習節(jié)奏、進度和效果,為學生設計個性化的學習計劃和方案,與學生就學習效果、學習方法和學習計劃等進行有效溝通”[10]。此外,學生每一種品德的形成,其知、情、意、行四個要素的發(fā)展方向和水平也不盡一致,這就要求教師能夠根據(jù)相關(guān)數(shù)據(jù)識別出學生品德發(fā)展結(jié)構(gòu)中的短板或不足,從而有的放矢地進行教育補救。當然,大數(shù)據(jù)只是為個性化德育服務提供了條件支持和技術(shù)可能,若要真正實現(xiàn),還需要教師付出果敢的努力和行動,不斷提升自身的德育素養(yǎng)。3.專業(yè)能力由傳統(tǒng)素養(yǎng)轉(zhuǎn)向數(shù)據(jù)素養(yǎng)大數(shù)據(jù)雖然為教師能夠勝任德育工作創(chuàng)造了有利條件,但同時也對教師的專業(yè)能力提出了新的要求,即從傳統(tǒng)素養(yǎng)向數(shù)據(jù)素養(yǎng)轉(zhuǎn)變。首先,教師要具有強烈的數(shù)據(jù)意識,能夠敏銳地察覺到海量數(shù)據(jù)中真正有價值的信息,并能快速而準確地捕捉到這些信息。其次,教師要具備篩選和清洗數(shù)據(jù)的能力。大數(shù)據(jù)的海量性和復雜性特征導致了數(shù)據(jù)的價值密度離散、容錯率增大,如何通過強大的機器算法實現(xiàn)數(shù)據(jù)的去冗降噪和價值提純,是教師面臨的一大難題。再次,教師要擁有較強的數(shù)據(jù)解讀和分析能力,能夠挖掘出數(shù)據(jù)背后的隱藏價值,賦予數(shù)據(jù)特定背景,使其成為信息,再對信息進行歸納總結(jié),使其升華為教育智慧。譬如,在一次百以內(nèi)加減運算的數(shù)學考試中,甲、乙二人的成績分別為100分和98分,如何看待這一微弱差距,不同的教師會表現(xiàn)出不一樣的行為。數(shù)據(jù)解讀能力強的教師會結(jié)合二人的知識基礎、學習習慣、性格特征等相關(guān)數(shù)據(jù),客觀而準確地分析其中原因,進而在接下來的教育教學中為乙同學提供精準的個性化服務,如鞏固已學知識或克服粗心毛病。反之,數(shù)據(jù)解讀能力弱的教師可能會將這一差距僅僅看成是數(shù)字間的不同,出現(xiàn)解讀不夠或解讀過度的現(xiàn)象。前者認為二者間沒有本質(zhì)差別而不問不顧,后者夸大二者間的差距而引發(fā)暈輪效應,這兩種做法都會為乙同學的發(fā)展埋下禍根。最后,教師還要具備對大數(shù)據(jù)德育應用進行倫理審視的能力,謹防大數(shù)據(jù)在德育應用中出現(xiàn)侵犯學生隱私、踐踏教育倫理、限制學生自由和阻礙學生發(fā)展等倫理風險。
三、大數(shù)據(jù)時代教師德育勝任力的培養(yǎng)路徑
篇5
關(guān)鍵詞:大數(shù)據(jù);BI;發(fā)展
中圖分類號:TP311.13 文獻標識碼:A 文章編號:1674-7712 (2014) 12-0000-01
近些年大數(shù)據(jù)(big data)一詞被提及的頻率越來越高。原本只是用來形容海量信息的含義,在信息時代又賦予了它新的含義-新信息時代的風向標。
如今是信息爆炸的時代,數(shù)據(jù)正在迅速膨脹變大,原本傳統(tǒng)電信金融行業(yè)是信息產(chǎn)生的大戶,隨著互聯(lián)網(wǎng)行業(yè)的異軍突起,立刻成為了大數(shù)據(jù)軍團中的絕對主力。互聯(lián)網(wǎng)公司在日常運營中生成、累積的用戶網(wǎng)絡行為數(shù)據(jù)。這些數(shù)據(jù)的規(guī)模是如此龐大,以至于不能用G或T來衡量。
隨著越來越多的行業(yè)對數(shù)據(jù)越來越重視,帶來了BI的巨大市場商機和快速發(fā)展。隨著大數(shù)據(jù)的興起,IBM、Oracle、SAP、微軟等廠商像是尋到了新的金礦,開始極力推崇大數(shù)據(jù)理念。于是眾廠商蜂擁而至,搶奪大數(shù)據(jù)市場,以SAP的HANA和ORACLE的Exalytitcs為代表。也有部分推BI的廠商還達不到大數(shù)據(jù)的層次,固守在報表分析的陣地上。
大數(shù)據(jù)具有4個特征(4V):
(一)數(shù)據(jù)量大(Volume)
第一個特征是數(shù)據(jù)量大。大數(shù)據(jù)的起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。
(二)類型繁多(Variety)
第二個特征是數(shù)據(jù)類型繁多。包括網(wǎng)絡日志、音頻、視頻、圖片、地理位置信息等等,多類型的數(shù)據(jù)對數(shù)據(jù)的處理能力提出了更高的要求。
(三)價值密度低(Value)
第三個特征是數(shù)據(jù)價值密度相對較低。如隨著物聯(lián)網(wǎng)的廣泛應用,信息感知無處不在,信息海量,但價值密度較低,如何通過強大的機器算法更迅速地完成數(shù)據(jù)的價值“提純”,是大數(shù)據(jù)時代亟待解決的難題。
(四)速度快時效高(Velocity)
第四個特征是處理速度快,時效性要求高。這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘最顯著的特征。
基于大數(shù)據(jù)以上特性,對于傳統(tǒng)BI來說是一個重大的挑戰(zhàn)和沖擊。
以RTB(實時競價廣告)模式為例,這種面向網(wǎng)民的廣告實時推送方式需呀以毫秒級的速度分析海量數(shù)據(jù),進而實現(xiàn)互聯(lián)網(wǎng)廣告的精準推送。RTB模式主要需解決“人的認知”和“價值幾何”,前者需要對每個用戶實施消費行為進行分析,意味著需要解讀萬億量級的數(shù)據(jù);后者則需依托復雜算法計算ROI(投資回報率),告訴決策并顯現(xiàn)交易結(jié)果,而每筆競價只有50毫秒乃至更少的決策時間。收納并瞬間解構(gòu)如此龐大的數(shù)據(jù),也只有大數(shù)據(jù)工具才能做到。
傳統(tǒng)BI采集的數(shù)據(jù)主要來自于ERP、CRM等,具有格式化的數(shù)據(jù),而大數(shù)據(jù)采集的數(shù)據(jù)種類則多種多樣,既有結(jié)構(gòu)化的數(shù)據(jù),更多的是非結(jié)構(gòu)化的數(shù)據(jù)。這就要求數(shù)據(jù)處理技術(shù)在分析、算法上相對傳統(tǒng)BI來說有極大的改變,已經(jīng)無法依賴傳統(tǒng)的BI工具。類似RTB這類新興商業(yè)模式不斷涌現(xiàn),對于營銷反應速度提出極高的要求,傳統(tǒng)BI能支持小時級的決策已經(jīng)很了不起了,無法應對如此幾乎是實時決策分析的要求,處理如此海量的數(shù)據(jù)分析及計算。數(shù)量和速度就是大數(shù)據(jù)帶給傳統(tǒng)BI的挑戰(zhàn)。
大數(shù)據(jù)和BI都需要構(gòu)建數(shù)據(jù)倉庫、分析系統(tǒng),再進行數(shù)據(jù)挖掘、實現(xiàn)數(shù)據(jù)呈現(xiàn),運用機理和技術(shù)結(jié)構(gòu)其實是一致的。與BI不同,大數(shù)據(jù)處理的數(shù)據(jù)是雜亂的、非結(jié)構(gòu)化的數(shù)據(jù),因此大數(shù)據(jù)有它獨特的數(shù)據(jù)分析工具,其建模也要比BI復雜得多,數(shù)據(jù)呈現(xiàn)方式也不僅僅是報表方式。從這方面來看大數(shù)據(jù)能力要比傳統(tǒng)BI強大得多。幾年前還只有大型網(wǎng)絡公司應用大數(shù)據(jù)技術(shù),而如今,零售業(yè)、銀行業(yè)、公共事業(yè)、智能社區(qū)等領域,幾乎所有擁有海量數(shù)據(jù)的企業(yè)都在使用或開始嘗試使用大數(shù)據(jù)技術(shù),這些技術(shù)在部分項目中也起到了關(guān)鍵的作用,這些將擠壓傳統(tǒng)BI工具的生存空間。
大數(shù)據(jù)的出現(xiàn)對BI行業(yè)來說是一個挑戰(zhàn)也是巨大的商機。也正是大數(shù)據(jù)的出現(xiàn)促進了BI加速發(fā)展,不斷升級。
大數(shù)據(jù)分析缺乏成熟的實踐經(jīng)驗,其方式方法與傳統(tǒng)的數(shù)據(jù)倉庫與BI系統(tǒng)有著一定的區(qū)別。在實施大數(shù)據(jù)分析項目之前,企業(yè)不僅應該知道使用何種技術(shù),還應該知道在什么時候、什么地方使用。各數(shù)據(jù)之間有哪些關(guān)聯(lián)性?哪個數(shù)據(jù)是可信的?如何從海量的數(shù)據(jù)中挖掘出有價值的、易用的客戶信息?
要回答這些問題,企業(yè)需要一個單一、完整、可信的客戶數(shù)據(jù)視圖,而創(chuàng)建一個單一、完整、可信的客戶數(shù)據(jù)視圖,數(shù)據(jù)集成是關(guān)鍵。沒有集成的數(shù)據(jù),其商業(yè)價值為零。數(shù)據(jù)集成讓組織機構(gòu)能夠?qū)鹘y(tǒng)的交易數(shù)據(jù)與全新的交互數(shù)據(jù)組合起來,從而獲得在其他情況下無法達成的洞察力和價值。
在大數(shù)據(jù)概念面世之前,商業(yè)智能(BI)幾乎是我們進入‘智慧世界’的不二選擇,然而,價格不菲的數(shù)據(jù)庫、數(shù)據(jù)倉庫、ETL等工具共同構(gòu)筑的高門檻擋住了很多企業(yè)一探究竟的腳步,而數(shù)據(jù)規(guī)模爆炸式的增長更是加高了這個門檻,讓很多企業(yè)對于獲取‘智慧’的投入成本望而怯步。
盡管隨著技術(shù)不斷進步,商業(yè)智能日益平民化,如今基于EXCL表也能在一定程度上實現(xiàn)傳統(tǒng)商業(yè)智能的部分功能。但是商業(yè)智能最經(jīng)典的架構(gòu)還是基于數(shù)據(jù)倉庫為基礎,利用ETL工具進行數(shù)據(jù)抽取、轉(zhuǎn)化、建模,然后通過報表等形式展現(xiàn)結(jié)果。整個過程每個環(huán)節(jié)都投資不菲且耗時,因此很長時間以來,商業(yè)智能被認為大企業(yè)的專有。相對而言,大數(shù)據(jù)主要用于互聯(lián)網(wǎng)企業(yè),采用通用硬件設備加上開源軟件實現(xiàn),成本相對低廉得多。入門門檻低,也是大數(shù)據(jù)能夠迅速興起的重要原因。
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,未來的大數(shù)據(jù)時代,一定是各種信息呈現(xiàn)規(guī)??焖僭鲩L的狀態(tài),如何更快獲取有用的信息是關(guān)鍵,智能分析工具會變得越來越重要,可以凌駕于多個管理系統(tǒng)、數(shù)據(jù)庫之上,如何通過更靈活、可控的BI工具,真正挖掘出大數(shù)據(jù)時代的價值,是大數(shù)據(jù)和BI面臨的共同挑戰(zhàn)。
參考文獻:
篇6
關(guān)鍵詞:大數(shù)據(jù)時代;大數(shù)據(jù);統(tǒng)計學;數(shù)據(jù)分析
引言:
目前階段,在計算機處理技術(shù)不斷發(fā)展的背景下,在對規(guī)模較大并且較為復雜的數(shù)據(jù)進行處理過程中,人們已經(jīng)逐漸掌握了方法與技能,并且能夠在大規(guī)模的數(shù)據(jù)中找出具有一定價值的信息,所以,大數(shù)據(jù)時代已經(jīng)來臨。在數(shù)據(jù)時代中,在人文社科與人類自然科學技術(shù)等方面都會有較大的發(fā)展,同時也會一定程度上改變?nèi)藗兊纳钆c工作方式。除此之外,大數(shù)據(jù)時代也同樣為統(tǒng)計學提供了良好的發(fā)展機會,但也存在一定的挑戰(zhàn)。
一、大數(shù)據(jù)時代的概念
大數(shù)據(jù)時代的提出者是麥肯錫,他認為數(shù)據(jù)已經(jīng)逐漸進入到各個行業(yè)與各業(yè)務職能的領域中,并且逐漸成為了主要的生產(chǎn)因素[1]。因此,人們在對大規(guī)模數(shù)據(jù)進行挖掘與應用的過程,也就意味著新的生產(chǎn)率增長的來臨。雖然“大數(shù)據(jù)”在眾多行業(yè)被廣泛應用,但是,特別是在信息與互聯(lián)網(wǎng)的領域中應用突出。
二、怎樣理解大數(shù)據(jù)
(一)大數(shù)據(jù)概念界定與構(gòu)成
大數(shù)據(jù),即由于日常產(chǎn)生的數(shù)據(jù)量快速增長,使得數(shù)據(jù)庫無法利用相應的管理工具對其進行管理與收集,最終導致在進行搜索、分析、存取、共享數(shù)據(jù)時具有較大的困難。
大數(shù)據(jù)的構(gòu)成包括四部分,并將其總結(jié)為4V,即Volume,Variety,Value,Velocity[2]。第一部分是價值密度低,將視頻作為具體實例來說,實現(xiàn)連續(xù)并且不間斷的監(jiān)控,其中有價值的數(shù)據(jù)信息只有一兩秒。第二部分是數(shù)據(jù)體量極大,已經(jīng)從TB實現(xiàn)了PB的躍升。第三部分是數(shù)據(jù)類型眾多,主要包括視頻、圖片、網(wǎng)絡日志以及地理信息等。第四部分是處理的速度超快,可以用一秒定律來解釋。
(二)海量數(shù)據(jù)帶來哪些挑戰(zhàn)
第一,數(shù)據(jù)存儲。由于大數(shù)據(jù)的數(shù)據(jù)規(guī)模是PB級別,所以,存儲的系統(tǒng)也需要進行等級的拓展,并且可以通過磁盤柜或者是增加模塊實現(xiàn)容量的增加。然而,目前階段,數(shù)據(jù)的增長速度驚人,所以系統(tǒng)資源的消耗也不斷增加,導致系統(tǒng)的運行效率有所下降[3]。因為對海量數(shù)據(jù)始終停留在分布式的存儲階段,所以,對于爆炸式的數(shù)據(jù)增長,原有的存儲方案已經(jīng)無法滿足現(xiàn)有的數(shù)據(jù)變化需求。
第二,處理技術(shù)。由于海量數(shù)據(jù)的分布性與數(shù)據(jù)量與以往存在較大的差異,所以,原有的數(shù)據(jù)管理技術(shù)已經(jīng)處于落后狀態(tài)。
第三,數(shù)據(jù)安全。在互聯(lián)網(wǎng)規(guī)模逐漸擴大的情況下,數(shù)據(jù)的應用已經(jīng)出現(xiàn)指數(shù)級別的增長,所以,對于數(shù)據(jù)安全的保護與監(jiān)控來說具有一定的難度。
(三)大數(shù)據(jù)相關(guān)應用與實踐
第一,體育賽事應用。以2014年的世界杯為例,在充分發(fā)揮記者與編輯敏銳度的基礎上,騰訊也利用對大數(shù)據(jù)的分析以及云計算等方式來為為其提供移動與社交的數(shù)據(jù)。與此同時,騰訊與IBM進行合作,并通過文化、賽事與球迷三方面來對世界杯球迷的關(guān)注重點進行信息的挖掘,進而實現(xiàn)新欄目的創(chuàng)作,并且在短時間內(nèi)贏得了廣大球迷的認可與關(guān)注。
第二,產(chǎn)品推薦應用。產(chǎn)品推薦的應用比較廣泛,可以對客戶信息、交易歷史、購買過程等數(shù)據(jù)進行全面的分析,并進行有價值信息的挖掘。同時,針對同一產(chǎn)品的不同客戶訪問信息也可以進行挖掘。最終,通過對客戶行為的分析,來確定消費者的共,這樣就可以更好的為客戶推薦產(chǎn)品。
除此之外,在產(chǎn)品推薦中,可以在對客戶社交行為進行信息挖掘與分析的基礎上來進行社區(qū)的營銷。對客戶微信微博以及社區(qū)活動中的偏好數(shù)據(jù)進行分析,并為其提供符合客戶興趣愛好的產(chǎn)品。
圖一
三、如何分析大數(shù)據(jù)
(一)如何挖掘數(shù)據(jù)中價值
以匹配廣告為具體事例進行分析,主要有兩種數(shù)據(jù)。第一種是廣告庫,其中包括廣告庫以及廣告的客戶信息[4]。但是這種數(shù)據(jù)信息比較適合在傳統(tǒng)數(shù)據(jù)庫中應用。第二種是用戶在觀看廣告后的行為??梢园岩陨蟽煞N數(shù)據(jù)進行有效的結(jié)合,并通過相應的算法來體現(xiàn)價值。在實踐應用過程中,可以充分體會到第二種信息的重要作用??梢詾橛脩籼峁┢渌璧男畔?,并通過群體智能以及群體行為對之前用戶使用的效果進行分析,最終通過具體的反饋機制,將最優(yōu)質(zhì)的信息提供給用戶,還可以進行搜索或者是查詢信息。
(二)如何做處理與分析
第一,更新抽樣調(diào)查的工作理念。由于大數(shù)據(jù)時代的數(shù)據(jù)樣本是以往資料綜合,所以,可以對相關(guān)事務的數(shù)據(jù)信息進行分析,進一步對總體進行了解,還可以更好的了解局部。同時需要解決以下問題:抽樣框架不穩(wěn)定,調(diào)查目的設定不合理、樣本量受限[5]。第二,積極改變對于數(shù)據(jù)精確度的標準。在大數(shù)據(jù)時代的背景下,數(shù)據(jù)的來源比較廣泛,并且對數(shù)據(jù)進行處理的技術(shù)也有所提高,所以,可以允許數(shù)據(jù)存在不準確的情況。大數(shù)據(jù)時代需要吸收多種數(shù)據(jù),但并需要一味的要求數(shù)據(jù)精準。第三,合理轉(zhuǎn)變數(shù)據(jù)關(guān)系的分析重點。由于大數(shù)據(jù)時代的數(shù)據(jù)規(guī)模比較大,而且結(jié)構(gòu)也十分復雜,變量的關(guān)系也比較繁雜。所以,在對數(shù)據(jù)進行分析的過程中,不應該對因果關(guān)系進行仔細的分析,而重要的是對事物相關(guān)的關(guān)系進行分析。需要轉(zhuǎn)換思路,對事物關(guān)系的形式與目的進行詳細的分析。
四、 大數(shù)據(jù)對統(tǒng)計學科和統(tǒng)計研究工作的影響
(一) 拓展統(tǒng)計學研究領域
因為大數(shù)據(jù)時代的到來,所以會對各個領域產(chǎn)生一定的影響,同樣給統(tǒng)計學帶來影響。在統(tǒng)計學中,其主要的研究對象就是其所要認識的客體,是客觀存在事物自身的數(shù)量特征與關(guān)系。其中,統(tǒng)計學研究對象最主要的特點就是數(shù)量性。然而,在傳統(tǒng)的統(tǒng)計學當中,數(shù)據(jù)主要是試驗與調(diào)查的數(shù)值。在大數(shù)據(jù)時代中,統(tǒng)計研究的對象不僅包括以結(jié)構(gòu)數(shù)據(jù)度量的數(shù)量,此外,還可以包括一些無法用數(shù)量關(guān)系進行衡量的半結(jié)構(gòu)與非結(jié)構(gòu)數(shù)據(jù),其中可以包括動畫、圖片、聲音、文本等等[6]。所以,可以說,在大數(shù)據(jù)時代背景下,統(tǒng)計學的研究對象領域有所擴大。
(二) 對統(tǒng)計計算規(guī)范產(chǎn)生影響
在傳統(tǒng)的統(tǒng)計學當中,一般是使用方差、平均數(shù)以及相對數(shù)等數(shù)據(jù)計算規(guī)范來真實反映事物量特征的,同時還可以反映事物量的關(guān)系與界限,能夠通過數(shù)據(jù)計算規(guī)范來計算出具體的數(shù)值。但是,半結(jié)構(gòu)與非結(jié)構(gòu)的數(shù)據(jù)是無法通過傳統(tǒng)數(shù)據(jù)計算規(guī)范進行計算的[7]。所以,在大數(shù)據(jù)時代的背景下,傳統(tǒng)的數(shù)據(jù)計算規(guī)范也同樣遇到了難題。
(三) 對統(tǒng)計研究工作的過程產(chǎn)生影響
1. 數(shù)據(jù)整理和分析
第一,數(shù)據(jù)審核。原有的數(shù)據(jù)審核主要的目的就是對數(shù)據(jù)準確性和完整性進行嚴格的檢查。但是,在大數(shù)據(jù)的時代中,對數(shù)據(jù)的審核就必須要確保數(shù)據(jù)處理的速度以及預測的準確程度,同時還需要對數(shù)處理的規(guī)模進行準確的確定,也就是數(shù)據(jù)量級別的確定。除此之外,因為大數(shù)據(jù)自身具有不穩(wěn)定性,并且十分混亂。但是,即使是這樣,大數(shù)據(jù)也能夠挖掘出信息內(nèi)部存在的隱蔽關(guān)系以及有價值的知識。所以,大數(shù)據(jù)所反映的研究對象存在準確與不準確兩種,但是,任何一種的數(shù)據(jù)都具有一定的價值,通常情況下是不需要進行替換或者是刪除的[8]。
第二,數(shù)據(jù)存儲。在以往的數(shù)據(jù)存儲中,審核、匯總以及編制的圖表等資料是重點資料,并且需要進行保存起來的。然而,大數(shù)據(jù)保存最主要的目的就是對存儲的成本進行有效的控制,同時需要根據(jù)相應的法規(guī)計劃來確定數(shù)據(jù)存儲的規(guī)模。
2. 數(shù)據(jù)積累、開發(fā)與應用
第一,數(shù)據(jù)積累。傳統(tǒng)統(tǒng)計工作主要是根據(jù)所制定的研究目的來對數(shù)據(jù)進行匯總與分類,并進行保存,這樣可以更好的為后期數(shù)據(jù)的分析與查詢提供有利的條件。但是,在大數(shù)據(jù)的積累中,具有價值的信息需要對大數(shù)據(jù)進行處理后才可以發(fā)現(xiàn)。不容置疑,大數(shù)據(jù)具有一定的復雜性,所以,在積累的過程中,不可以進行簡單的處理。因為大數(shù)據(jù)的規(guī)模大,結(jié)構(gòu)也比較復雜,無法實現(xiàn)簡單的分類,而且,在對大數(shù)據(jù)進行簡單整理時非常容易使其混亂,對其真實性產(chǎn)生影響,可能會丟失具有價值的信息。
第二,數(shù)據(jù)開發(fā)。大數(shù)據(jù)時代下的數(shù)據(jù)流動性極強,所以,其自身的價值有再生性。因此,大數(shù)據(jù)時代的數(shù)據(jù)不會貶值,反而會增值。為了能夠?qū)λ芯康膶ο筮M行更深入的了解,就需要對其整合。
第三,數(shù)據(jù)應用。對數(shù)據(jù)的傳統(tǒng)應用主要是為了對現(xiàn)象進行解釋與預測。但是,在大數(shù)據(jù)時代,數(shù)據(jù)應用的核心就是在相關(guān)關(guān)系前提下的預測。
結(jié)語
綜上所述,現(xiàn)階段我國社會正處于大數(shù)據(jù)時代,并且對于社會未來的發(fā)展具有重要的意義。文章對大數(shù)據(jù)時代的概念與定義以及構(gòu)成進行了闡述與分析,同時,對大數(shù)據(jù)的實際應用與實踐進行了探討。針對大數(shù)據(jù)價值的挖掘與分析處理進行了研究,最后列舉了大數(shù)據(jù)對統(tǒng)計學科以及統(tǒng)計研究工作的影響,進而對今后大數(shù)據(jù)的數(shù)據(jù)分析工作提供了有價值的理論依據(jù),并積極的推動了大數(shù)據(jù)時代的發(fā)展,進一步促進了社會的進步。(作者單位:中國人民大學)
參考文獻:
[1]朱建平,章貴軍,劉曉葳等.大數(shù)據(jù)時代下數(shù)據(jù)分析理念的辨析[J].統(tǒng)計研究,2014,31(2):10-19.
[2]張學敏.大數(shù)據(jù)時代的數(shù)據(jù)分析[J].電子世界,2014(16):5-5,6.
[3]李祥歌,王奇奇,郭軼博等.基于大數(shù)據(jù)時代的數(shù)據(jù)挖掘及分析[J].電子制作,2015(3):81-81.
[4]劉江娜.大數(shù)據(jù)時代:為什么數(shù)據(jù)分析能讓你的企業(yè)脫穎而出[J].環(huán)球市場信息導報,2014(36):92-93.
[5]郭華庚,向禮花.大數(shù)據(jù)時代網(wǎng)絡信息歸檔的元數(shù)據(jù)分析[J].貴州師范學院學報,2015,31(3):24-28.
[6]高書國.大數(shù)據(jù)時代的數(shù)據(jù)困惑――教育研究的數(shù)據(jù)困境[J].教育科學研究,2015(1):24-30.
篇7
在高?;A工作中,高校檔案管理工作是高校工作的其中一項基本工作,做好高校檔案管理工作是對高校的未來發(fā)展非常重要。隨著社會的發(fā)展,高校也在不斷地深化改革中,高校管理工作也必須與時俱進,優(yōu)化改革,充分應用大數(shù)據(jù)的優(yōu)勢,來優(yōu)化檔案管理工作,提高高校檔案管理工作效率,怎么去適應社會和高校的深化改革,是現(xiàn)在目前高校所面臨的一大課題。綜上所述,大數(shù)據(jù)對于高校檔案管理工作的創(chuàng)新和改革是十分有必要的。
1.相關(guān)基礎理論概述
1.1 大數(shù)據(jù)的定義
到目前為止,大數(shù)據(jù)的概念眾說紛紜,至今沒有統(tǒng)一的概念定義,因為大數(shù)據(jù)對于我們來說是一個非常抽象的概念,在定義問題上,很難有一個統(tǒng)一的答案。在百度上可以查詢到大數(shù)據(jù)的一個定義即巨量資料,它是指依據(jù)目前主流的軟件,規(guī)模巨大的資料在有效時間里,無法做到擷取、管理、處理,并且整理出為大規(guī)模企業(yè)獲取利益的資訊。然而在維基百科中對于大數(shù)據(jù)的定義就相對簡單一些,大數(shù)據(jù)是指借助常用軟件工具來獲取、管理、處理數(shù)據(jù),所消耗的時間超出了規(guī)定時間的數(shù)據(jù)集。著名研究機構(gòu)Gartner公司對大數(shù)據(jù)有個全新的定義,是指利用全新的處理模式來處理、洞察、優(yōu)化數(shù)據(jù),從而達到高增長率、多樣化的信息資訊。這樣就避免了隨機抽樣的捷徑,而是處理所有數(shù)據(jù),準確率更大,從而替代了以往傳統(tǒng)的隨機抽樣的思維模式。該書中有三個思維方式的改變,整體分析替代隨機抽樣,精確而又混雜,相關(guān)關(guān)系替代因果關(guān)系,使數(shù)據(jù)分析更加可信。
1.2 大數(shù)據(jù)的特征
大數(shù)據(jù)有四大特征:一是數(shù)據(jù)量巨大;二是數(shù)據(jù)類型多;三是價值密度低;四是數(shù)據(jù)處理快速。以上四種特征是傳統(tǒng)數(shù)據(jù)處理所不具備的。對大數(shù)據(jù)快速處理分析是大數(shù)據(jù)所特有的價值。目前現(xiàn)代社會是一個信息社會,數(shù)據(jù)是當今社會是否進步的標志,促進互聯(lián)網(wǎng)高速發(fā)展。
2.大數(shù)據(jù)時代高校檔案管理創(chuàng)新的必要性
檔案管理是現(xiàn)在高校管理中一項非常重要的基礎工作,它可以加強高校內(nèi)部管理和促進高校健康發(fā)展。在現(xiàn)當今信息化時代,檔案管理工作方式方法就必須借助大數(shù)據(jù),提升工作效率。相比傳統(tǒng)檔案管理,高校檔案管理具有工作量大、數(shù)據(jù)量大的特征?,F(xiàn)如今,高校在檔案管理工作上有很多挑戰(zhàn):數(shù)據(jù)的多樣化類型和存儲方式的多樣化被統(tǒng)一起來就相對比較困難,所以,以往我國提倡運用“直接鑒定法”面對大的電子格式的文件,在現(xiàn)如今將受到很大的挑戰(zhàn),文件管理者對每一份電子文件都認真閱讀恐怕不太現(xiàn)實。后來檔案管理直接運用宏觀鑒定的方法來鑒定電子文件,首先從總體上把握該文件是否有價值,從而提升工作效率。運用這種方法,先確定該機構(gòu)是電子文件管理的對象,然后從這個機構(gòu)中搜尋所需的電子文件,?熱∮屑壑檔牡繾游募?只是?子文件管理的第一步,在信息化大環(huán)境下,收集電子文件應該是很簡單的事情,但是在大量的電子文件中如何快速篩選出對自己有價值的電子文件,卻是一個大的困難。怎么分類這些電子文件?怎么歸檔保存這些電子文件?從哪些電子文件中能夠篩選出油價會的數(shù)據(jù)?科學地運用大數(shù)據(jù)技術(shù)就可以解決點以上所面臨的問題。大數(shù)據(jù)轉(zhuǎn)化器的安裝,可以加快系統(tǒng)數(shù)據(jù)收集的速度,節(jié)省了大量的時間,大數(shù)據(jù)軟件可以為搜尋過的數(shù)據(jù)建立獨自的索引,然后生成可以搜索的鏈接,這樣就可以為檔案工作者提升工作效率。大數(shù)據(jù)技術(shù)還可以進行數(shù)據(jù)類型的分類、新數(shù)據(jù)的搜索,進而提高檔案工作人員應對更加復雜的數(shù)據(jù)處理能力。由上面可知,傳統(tǒng)的高校檔案管理已經(jīng)跟不上大數(shù)據(jù)發(fā)展的速度,做好高校檔案管理,為高校檔案管理提供更好的服務,是當下大數(shù)據(jù)時代高校檔案管理工作的重要課題。
3.大數(shù)據(jù)時代下檔案管理的創(chuàng)新對策
創(chuàng)新檔案管理可以體現(xiàn)許多知識和技能,可以完善管理機制和開發(fā)檔案新資源,更好地滿足當今社會對知識的需求,很好體現(xiàn)了大數(shù)據(jù)時代對檔案信息管理的新要求。只有適應高校不同發(fā)展時期的要求、大數(shù)據(jù)觀、大檔案觀,這樣才能更好地創(chuàng)新和優(yōu)化傳統(tǒng)檔案管理方式。檔案管理的不斷創(chuàng)新,才能加強高校檔案資源的管理,更好地保護好巨大的檔案數(shù)據(jù),而且還能夠挖掘出更具有價值的檔案信息,更好地服務好高校檔案管理工作。
3.1 大數(shù)據(jù)觀
大數(shù)據(jù)時代預言家維克托對大數(shù)據(jù)的定義是對所有數(shù)據(jù)進行分析而不是隨機抽樣數(shù)據(jù)分析,更具代表性,更具說服力。大數(shù)據(jù)應用了所有數(shù)據(jù),每個數(shù)據(jù)都是有價值的。大數(shù)據(jù)作為一個新的概念,大多數(shù)人對它還是完全了解,在理解和認識上還是有些偏差,大數(shù)據(jù)并不是從字面上所說的大,分析的數(shù)據(jù)也不一定非常多,有時候數(shù)百個GB的數(shù)據(jù)也可以稱為大數(shù)據(jù),還是要看它的第三維度即速度或時間維度,這個第三維度具有科學性,優(yōu)化和整合了數(shù)據(jù)。在當今大數(shù)據(jù)時代下,數(shù)據(jù)就是檔案,單個數(shù)據(jù)沒有什么意義,但是單個數(shù)據(jù)在集體數(shù)據(jù)中都有各自特定的價值和作用。檔案部門應該慢慢培養(yǎng)檔案大數(shù)據(jù)的觀念。
3.2 大檔案觀
對于大檔案觀理念的理解,可以從以下兩個方面來理解。第一,所有數(shù)據(jù)都有可以入檔,檔案的大門更加寬廣。檔案歸檔的內(nèi)容更加豐富,涵蓋一切具有保存和利用的價值的信息,特別是互聯(lián)網(wǎng)信息更加快速,及時抓取一切可以抓取的信息。不要忽略一些零碎的信息。第三,檔案普遍。人們傳統(tǒng)的觀念是只有存放在檔案管里的物件才是檔案,但是目前網(wǎng)絡每時每刻都在更新數(shù)據(jù),它們涵蓋各個方面,好多都沒有收藏到館里,我們應該改變觀念。充分認識到只要是可以檢索到的信息,都有它存在的價值,遍布在我們?nèi)粘I畹拿恳粋€角落里。
3.3 大服務觀
在大數(shù)據(jù)時代下,檔案服務越來越受到重視?!盀槊穹铡敝饾u成為檔案管理的核心。檔案部門要轉(zhuǎn)變以為“守財奴”的角色,時刻堅守國家賦予的責任和黨的利益。在大數(shù)據(jù)時代大背景下,檔案管理部門的職責不僅僅是從海量數(shù)據(jù)中挖取核心數(shù)據(jù),還可以量化分析出用戶的習慣和興趣愛好,把檔案服務放在核心位置,進而可以向廣大用戶提供更加精準的檔案定制和更優(yōu)質(zhì)的服務,所以,用戶希望得到的檔案服務是精細化地優(yōu)質(zhì)數(shù)據(jù),隨時就可以享受到“問題――數(shù)據(jù)――解決方案”全方位服務。全面提升檔案使用者的滿意度。
3.4 大平臺
篇8
關(guān)鍵詞:大數(shù)據(jù);圖書館;信息服務;數(shù)據(jù)分析;數(shù)據(jù)挖掘
中圖分類號:G25 文獻標志碼:A 文章編號:1674-9324(2015)32-0210-02
一、引言
目前,大數(shù)據(jù)已經(jīng)獲得各行各業(yè)的青睞,各界人士已開始研究并應用大數(shù)據(jù)技術(shù),而與大數(shù)據(jù)密切相關(guān)的圖書館的發(fā)展也受到越來越多人的關(guān)注。同時,大數(shù)據(jù)的崛起也驅(qū)動著圖書館采取措施進行積極應對。圖書館作為儲存知識、傳播信息和提供服務的資源庫,如何采集各種載體的數(shù)據(jù)資源,并從中分析、挖掘出讀者行為中隱含的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)信息,找出讀者的隱性需求,繼而改善圖書館的服務質(zhì)量,已成為大數(shù)據(jù)時代下圖書館提高信息服務質(zhì)量和改進制度建設的機遇。本文在對大數(shù)據(jù)的概念和特點認識的基礎上,重點分析了大數(shù)據(jù)對圖書館的影響、機遇和挑戰(zhàn)。
二、大數(shù)據(jù)
1.大數(shù)據(jù)的概念。大數(shù)據(jù)的概念并沒有一個統(tǒng)一定義,只要是具備數(shù)據(jù)量龐大和數(shù)據(jù)形式多樣,并且是非結(jié)構(gòu)化的數(shù)據(jù),即為大數(shù)據(jù)。大數(shù)據(jù)通常具有以下幾個特點:數(shù)據(jù)量大(Volume)、種類多(Variety)、速度快(Velocity)的特點。
2.大數(shù)據(jù)的特點及技術(shù)。對于大數(shù)據(jù)的特點,業(yè)界通常用4個“V”來概括,即Volume、Variety、Value、Velocity。Volume:數(shù)據(jù)量巨大。經(jīng)濟的發(fā)展使各種活動及設備產(chǎn)生了越來越大的數(shù)據(jù)量,已從TB級別躍升到PB級別。Variety:種類繁多。數(shù)據(jù)的種類不止是結(jié)構(gòu)化的,現(xiàn)已出現(xiàn)了非結(jié)構(gòu)化的數(shù)據(jù),如圖書館中讀者的行為信息數(shù)據(jù)等。Value:價值密度低。價值密度與數(shù)據(jù)量密切相關(guān),密度的大小與數(shù)據(jù)量的多少成反比。如何從海量的數(shù)據(jù)中提取出有價值的數(shù)據(jù)是數(shù)據(jù)挖掘的研究重點。Velocity:處理速度快。這是大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)挖掘不同的最顯著的特征。大數(shù)據(jù)技術(shù)主要包括數(shù)據(jù)分析、數(shù)據(jù)處理、數(shù)據(jù)挖掘、數(shù)據(jù)服務等。
3.圖書館的大數(shù)據(jù)。圖書館的業(yè)務通常包括圖書的搜集、整理、管理和書刊的利用,具體包括采購、歸類編目、數(shù)據(jù)安全保障、網(wǎng)絡建設、信息咨詢、圖書和數(shù)字化資料借閱、多媒體服務等方面。因此圖書館每天都會產(chǎn)生大量的數(shù)據(jù)?,F(xiàn)今,隨著圖書資源中類的多樣化及圖書館新服務的開展,圖書館的大數(shù)據(jù)不只局限于結(jié)構(gòu)化的數(shù)據(jù),還包含大量的非結(jié)構(gòu)化數(shù)據(jù),例如圖書館與讀者的交互信息、圖書館工作人員的工作動態(tài)以及讀者對圖書館的各種信息行為都會被記錄,因此就形成了圖書館大數(shù)據(jù)。
三、大數(shù)據(jù)對圖書館的影響
1.大數(shù)據(jù)將對圖書館的建設產(chǎn)生影響。為了滿足用戶需求,順應時代的發(fā)展,數(shù)字圖書館應運而生,增加了圖書資源的來源,使圖書信息數(shù)據(jù)量越來越大,原始的圖書館數(shù)據(jù)管理機制已不能適應海量數(shù)據(jù)的管理需求,為此,圖書館需要重建良好的數(shù)據(jù)庫體系和高質(zhì)量的索引,從而可以提高讀者檢索數(shù)據(jù)資料的效率,并根據(jù)讀者需求,利用大數(shù)據(jù)技術(shù)中的數(shù)據(jù)分析技術(shù)從海量數(shù)據(jù)中提取出有用數(shù)據(jù)。因此,圖書館應增加數(shù)據(jù)分析、數(shù)據(jù)挖掘等數(shù)據(jù)分析技術(shù)功能,從海量數(shù)據(jù)中挖掘出有用數(shù)據(jù),提高讀者的檢索效率。
2.大數(shù)據(jù)對圖書館的數(shù)據(jù)存取能力提出挑戰(zhàn)?!按蟆笔谴髷?shù)據(jù)的一個重要特征,此外,大數(shù)據(jù)具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)和動態(tài)的數(shù)據(jù)體系、多樣的數(shù)據(jù)類型、巨大的數(shù)據(jù)價值等特征。因此,如何在多樣的或者大量的數(shù)據(jù)中,迅速獲取信息,并對這些數(shù)據(jù)進行存儲和管理成為圖書館急需解決的問題。
3.數(shù)據(jù)挖掘?qū)⒊蔀閳D書館的重要服務目標。圖書館應該面向各種學科和研究方向中不同層次的用戶,應該為來自各種層面的社會群體提供服務。這也就要求圖書館可以提供更加全面而且個性化的服務,因此,圖書館應該包含各個領域的數(shù)據(jù),并從各類數(shù)據(jù)中分析并挖掘出對讀者有用的、感興趣的數(shù)據(jù)信息,并且不斷地更新服務類型,以滿足用戶多樣化的需求。數(shù)據(jù)的搜集、存儲和分析處理將成為圖書館資源建設的重要內(nèi)容。
四、大數(shù)據(jù)時代圖書館面臨的機遇和挑戰(zhàn)
1.大數(shù)據(jù)對圖書館的機遇。大數(shù)據(jù)具有在多樣的或者大量的數(shù)據(jù)中,迅速獲取信息的能力。圖書館大數(shù)據(jù)除了館藏資源,還包括用戶的行為信息,如讀者借取的書目類型、范疇、方向等。圖書館可以利用大數(shù)據(jù)的相關(guān)技術(shù),如數(shù)據(jù)分析、數(shù)據(jù)挖掘等技術(shù)手段,分析并整合出讀者近期關(guān)注的熱點研究方向,為圖書部門決策者提供更加有用的信息,使他們能夠更快、更準確地掌握相關(guān)研究領域其他科研人員的研究進展。同時,利用數(shù)據(jù)分析和數(shù)據(jù)挖掘技術(shù),對讀者平時的檢索訪問歷史進行搜集、分析和處理,并挖掘出有用信息,從而預測出讀者的各種需求,使圖書館能夠更好地為讀者提供服務。
2.大數(shù)據(jù)對圖書館的挑戰(zhàn)。大數(shù)據(jù)給圖書館帶來的挑戰(zhàn)表現(xiàn)在以下幾個方面:(1)圖書館面臨著如何應對大數(shù)據(jù)的挑戰(zhàn)。大數(shù)據(jù)具有多樣性,包括非結(jié)構(gòu)化和結(jié)構(gòu)化的數(shù)據(jù),其中絕大多數(shù)數(shù)據(jù)是大小、內(nèi)容、格式、用途完全不同的難以處理的非結(jié)構(gòu)化的數(shù)據(jù)。圖書館面對大數(shù)據(jù)的到來,首先應該具有大數(shù)據(jù)的思維和意識,其次才能判斷圖書館的發(fā)展趨勢和選擇應對策略,最后才談得上技術(shù)實現(xiàn)的問題。大數(shù)據(jù)既不等于數(shù)據(jù)挖掘也不等于統(tǒng)計分析,但是這些技術(shù)和算法都需要大數(shù)據(jù)的支持。圖書館應正確認識大數(shù)據(jù),才能對大數(shù)據(jù)的到來做好準備。(2)大數(shù)據(jù)對圖書館的數(shù)據(jù)整合、處理能力及圖書館的各種技術(shù)開發(fā)、服務提出了挑戰(zhàn)。隨著海量數(shù)據(jù)的出現(xiàn),為了順應時展,圖書館的改進不能僅僅停留在硬件改進的層面上,還要提出一套具體數(shù)據(jù)的分析、處理和挖掘的方法和體系,以提高全面把握和綜合深入的能力。(3)數(shù)據(jù)安全、知識產(chǎn)權(quán)、商業(yè)利益、公共安全受損的威脅增大。大數(shù)據(jù)的發(fā)展,信息開放度加大,新的信息采集、數(shù)據(jù)分析、數(shù)據(jù)挖掘技術(shù)以及海量數(shù)據(jù)存儲技術(shù)和設備將不斷涌現(xiàn),云計算將更加普及,這將對數(shù)據(jù)的安全構(gòu)成很大的風險。
五、大數(shù)據(jù)時代圖書館的應對策略
大數(shù)據(jù)不僅僅是一項技術(shù),更是思維方式、發(fā)展戰(zhàn)略和商業(yè)模式。以海量的非結(jié)構(gòu)化數(shù)據(jù)為代表的大量數(shù)據(jù)的產(chǎn)生是大數(shù)據(jù)時代的一個重要特點。對海量的、非結(jié)構(gòu)化的數(shù)據(jù)進行處理,一方面需要大量的計算資源,另一方面需要專門的數(shù)據(jù)處理技能,它的到來使圖書館面臨著前所未有的機遇和挑戰(zhàn),為此,圖書館不僅要具有大數(shù)據(jù)的思維和意識,認真分析自身現(xiàn)狀及發(fā)展需求,還要正確認識大數(shù)據(jù)的來源和發(fā)展方向,以提高圖書館未來的發(fā)展方向,并在大數(shù)據(jù)的支撐下為讀者提供更好的、人性化的服務。本文將圖書館的應對策略總結(jié)如下:大數(shù)據(jù)的獲取。數(shù)據(jù)資源的獲取來源包括數(shù)字數(shù)據(jù)、傳統(tǒng)圖書館的館藏資源和讀者行為數(shù)據(jù)?,F(xiàn)今,數(shù)字圖書館已經(jīng)實現(xiàn)了資源的數(shù)字化和對數(shù)字資源的獲取,圖書館加強了對讀者行為數(shù)據(jù)的獲取策略,從而分析出讀者的喜好和需求,提高信息服務質(zhì)量。(1)大數(shù)據(jù)的存儲和分析。數(shù)據(jù)量的急劇增加,對圖書館資源的存儲空間和計算能力提出了巨大的挑戰(zhàn),圖書館需要一些低廉而又高效的存儲和計算設備,而云計算為海量數(shù)據(jù)存儲和計算帶來了希望,圖書館可利用云計算技術(shù)解決這一問題。(2)加強大數(shù)據(jù)的建設。為了積極應對大數(shù)據(jù)的到來,圖書館應該提高大數(shù)據(jù)建設水平,規(guī)劃好一個完整的大數(shù)據(jù)處理流程。同時,圖書館應該以讀者需求為導向,不斷推出新服務模式,提高圖書館的個性化服務。(3)技術(shù)和管理人員培養(yǎng)。高技術(shù)人員和管理團隊能夠提高大數(shù)據(jù)的處理水平,以便更好得為讀者提供服務。因此,圖書館應該為管理人員提供定期的培訓,提高管理人員的專業(yè)水平。
六、結(jié)語
大數(shù)據(jù)時代的到來深刻影響著圖書館的發(fā)展,使傳統(tǒng)圖書館面臨變革,同時也是對圖書館的機遇和挑戰(zhàn)。大數(shù)據(jù)為圖書館提供了新的視角,不僅能更細致、準確地洞察用戶,而且能更深入地剖析業(yè)務工作,引導圖書館向更人性化、專業(yè)化的層面發(fā)展。即使目前還無法預測大數(shù)據(jù)在實際工作中將會產(chǎn)生何種具體的效用,但其獨特的魅力和理念將吸引研究者進行更多的探索。
參考文獻:
[1]郝志剛.大數(shù)據(jù)、云計算與圖書館[J].新世紀圖書館,2014,(6):36-39.
[2]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報,2012,(5):37-40.
[3]李恬.大數(shù)據(jù)理念與圖書館大數(shù)據(jù)[J].新世紀圖書館,2014,(6):24-27.
[4]周加藝.大數(shù)據(jù)與圖書館服務創(chuàng)新[J].情報探索,2014,(6):114-116.
篇9
關(guān)鍵詞:大數(shù)據(jù)時代;高職計算機;專業(yè)教育
一、大數(shù)據(jù)的概念與特點
所謂“大數(shù)據(jù)”顧名思義也就是指龐大的數(shù)據(jù)信息量。由于網(wǎng)絡、計算機的信息量較為龐大,同時結(jié)構(gòu)復雜,類型眾多,因此只能用“大”字來對其容量進行形容。對于大數(shù)據(jù)的特點而言,其數(shù)據(jù)的增長具備動態(tài)性、持續(xù)性的特征。在互聯(lián)網(wǎng)下數(shù)據(jù)隨時可能會產(chǎn)生,隨時可能被存儲,這也導致數(shù)據(jù)的增長具有動態(tài)性。尤其是在網(wǎng)絡環(huán)境下,海量數(shù)據(jù)瞬時產(chǎn)生,同時還會隨著時間的延長而不斷增長。另外,大數(shù)據(jù)存在著數(shù)據(jù)類型多樣的特點,這也決定著大數(shù)據(jù)的數(shù)據(jù)類型不存在固定的形式。隨著經(jīng)濟的發(fā)展,社會的進步,社會中產(chǎn)生了很多數(shù)據(jù)信息,這些信息的類型并不固定,既具備結(jié)構(gòu)化的特征也具備多樣性、豐富性的特征,在這里也能看出大數(shù)據(jù)的重要作用。
二、大數(shù)據(jù)時代下高職計算機專業(yè)教學創(chuàng)新的必要性
由于在大數(shù)據(jù)時代下計算機的技術(shù)得到了不斷的更新,因此高職計算機專業(yè)教學的具體理念也就必須要隨之而更新,只有如此才能在不斷發(fā)展的過程中提升學生的計算機專業(yè)能力。高職院校教師應該充分發(fā)揮教育的引導理念,此外,大數(shù)據(jù)時代對我國的整體環(huán)境進行了改變,這也要求學生必須要在實際情況中具備創(chuàng)新精神,所以,計算機教師必須要提高服務創(chuàng)新意識,在業(yè)余時間內(nèi)加強對大數(shù)據(jù)的了解,提升自身的業(yè)務能力,不斷對傳統(tǒng)計算機的教學模式與具體的內(nèi)容進行更新,如此才能夠真正培養(yǎng)出能力過硬的計算機專業(yè)人才。由此可見,在大數(shù)據(jù)時代高職計算機專業(yè)教學創(chuàng)新勢在必行。
三、基于大數(shù)據(jù)時代下的高職計算機專業(yè)教育改革策略
(一)提升教師專業(yè)能力
想要對高職計算機專業(yè)教育進行改革,就必須要對教師的專業(yè)能力進行提升,如果教師自身的專業(yè)能力都無法滿足教學的需求,那么學生也就很難在學習過程中獲得進步。從高職學校的角度來看,其應該多多開展培訓,同時聘請經(jīng)驗較為豐富的教師對其他教師進行帶動,進而提升教師的團隊素養(yǎng)。另外,在大數(shù)據(jù)時代,高職院校計算機專業(yè)課程教學還需要對大數(shù)據(jù)進行充分的融入,對大數(shù)據(jù)的教學內(nèi)容進行增加,對大數(shù)據(jù)的潛在價值進行挖掘,提升學生學習計算機知識的主動性。具體的說,高職計算機教師應該立足于實際,對大數(shù)據(jù)的特色進行掌握,并運用大數(shù)據(jù)創(chuàng)新教學過程,提升對大數(shù)據(jù)的實踐能力。
(二)運用多元化的教學模式
高職計算機專業(yè)教師應該對多元化的教學模式進行運用,改革計算機專業(yè)教育,因為單一的教學模式可能很難滿足學生的學習需求,在開展教學的過程中,教師首先應該運用案例教學。計算機的教學內(nèi)容不僅僅包括計算機基礎知識,同時還包含著很多與現(xiàn)實生活聯(lián)系密切的網(wǎng)絡技術(shù),如果能夠多運用案例教學,就可以以學生為教學主體,促進學生計算思維能力的提升。其次,教師應該運用討論法,讓學生在學習計算機知識的過程中互相討論,如此就可以提升學生的思維能力。最后,教師可以適當運用驅(qū)動教學法,對大數(shù)據(jù)的理念在課程中進行引入,使學生可以真正的理解抽象思維的具體價值。
(三)構(gòu)建大數(shù)據(jù)網(wǎng)絡教學平臺
對于大數(shù)據(jù)來說,其在實際情況下具有極為鮮明的時代特征,可以對人類的工作方式進行創(chuàng)新與改革,通過對龐大的數(shù)據(jù)信息進行處理,無論是在各個領域中的人都能夠因此而受益。此外,大數(shù)據(jù)的價值具備較大挖掘潛力。從教育角度來看,在教育數(shù)據(jù)進行挖掘可以完善教學內(nèi)容,更新教學理念,提升教學效率,因此,高職院校完全可以利用大數(shù)據(jù)的這一特性,對大數(shù)據(jù)網(wǎng)絡教學平臺進行構(gòu)建,以云計算技術(shù)為基礎,構(gòu)建能夠讓學生與教師進行互動、教學的平臺。在所構(gòu)建的網(wǎng)絡平臺中,無論是教師還是學生都能夠更加自如的運用數(shù)據(jù)技術(shù),以此來輔助教學,可提升學生的學習效率。由于大數(shù)據(jù)網(wǎng)絡教學以大數(shù)據(jù)為核心,因此學生學習的興趣也可以得到激發(fā),另外,平臺的存在還能夠評估學生具體的學習效果,對于教師來說,其可以通過平臺搜集相關(guān)的資源,進而分析自身的教學行為,不斷更新教學理念。
篇10
關(guān)鍵詞:統(tǒng)計學;教育改革;大數(shù)據(jù)
一、引言
最早提出大數(shù)據(jù)時代到來的機構(gòu)是全球知名的麥肯錫咨詢公司,該公司在一份研究報告中指出:“數(shù)據(jù)已經(jīng)滲透到當今每一個行業(yè)和業(yè)務職能領域,成為重要的生產(chǎn)因素,人們對于海量數(shù)據(jù)的挖掘和運用,預示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來”。
大數(shù)據(jù)是隨著互聯(lián)網(wǎng)技術(shù)的廣泛應用帶來的數(shù)據(jù)量和數(shù)據(jù)類型激增而衍生出來的一種現(xiàn)象,但大數(shù)據(jù)一詞不僅指規(guī)模大、種類多的數(shù)據(jù)集,還包括對這種數(shù)據(jù)集進行采集、處理與分析以提取有價值信息和直接創(chuàng)造價值的技術(shù)構(gòu)架和技術(shù)過程。大數(shù)據(jù)的第一個特征是數(shù)據(jù)量巨大。截止到2012年,數(shù)據(jù)量已經(jīng)從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。第二個特征是數(shù)據(jù)類型繁多、異構(gòu)性突出,包括網(wǎng)絡日志、音頻、視頻、圖片、地理位置信息等等。第三個特征是數(shù)據(jù)價值密度較低,數(shù)據(jù)中存在大量重復性和無價值性信息或噪聲。如何通過強大的計算技術(shù)和統(tǒng)計分析等方法迅速完成數(shù)據(jù)的價值提純,是大數(shù)據(jù)時代亟待解決的難題。第四個特征是處理速度快、時效性要求高。這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘最顯著的特征。
目前,不同的學科領域?qū)Υ髷?shù)據(jù)概念有著不盡相同的解釋,但各種解釋中大致可以從兩個方面去理解。首先,大數(shù)據(jù)概念體現(xiàn)在數(shù)據(jù)量的巨大、種類的眾多及產(chǎn)生速度的飛快,同時產(chǎn)生的數(shù)據(jù)集極有可能包含著各種半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);其次,大數(shù)據(jù)概念還體現(xiàn)在對數(shù)據(jù)進行處理的手段和流程方面,由于數(shù)據(jù)量的龐大和類型復雜,利用常規(guī)的統(tǒng)計軟件已經(jīng)無法對當今的數(shù)據(jù)進行及時有效的存儲、分析及處理。因此,所謂的大數(shù)據(jù)并不是單純指數(shù)據(jù)流量的巨大,還指其結(jié)構(gòu)的復雜和種類的多樣,在數(shù)據(jù)處理和分析上需要采用高端計算平臺或高級統(tǒng)計軟件,以及海量數(shù)據(jù)中存在著可挖掘的潛在的大量價值信息與知識。
近年來,隨著高速計算機的應用、信息技術(shù)的快速發(fā)展,特別是云計算技術(shù)的發(fā)展,使大數(shù)據(jù)的存儲和分析技術(shù)得到迅速發(fā)展,目前的核心技術(shù)有MapReduce、GFS、BigTable、Hadoop,以及數(shù)據(jù)可視化等。在數(shù)據(jù)搜集上,可方便地通過在線互聯(lián)網(wǎng)數(shù)據(jù)庫獲取二手數(shù)據(jù)或一手實時數(shù)據(jù)。在數(shù)據(jù)分析上,傳統(tǒng)統(tǒng)計學方法采取的是基于統(tǒng)計模型的樣本數(shù)據(jù)分析,而大數(shù)據(jù)分析技術(shù)則是通過高端計算平臺,對大數(shù)據(jù)中的信息進行挖掘。
統(tǒng)計學作為對數(shù)據(jù)進行處理和分析的科學,必然受到大數(shù)據(jù)的影響。在大數(shù)據(jù)時代,統(tǒng)計學教育必須與時俱進,跟上時展步伐。近年來,有不少文獻討論了大數(shù)據(jù)環(huán)境下我國統(tǒng)計學教育的改革問題(例如[1]-[5]),本文在分析大數(shù)據(jù)時代特征的前提下,進一步討論我國統(tǒng)計學教育的現(xiàn)狀與挑戰(zhàn)、統(tǒng)計學教育改革的內(nèi)容、方法、借鑒和適應時代要求的變革問題。
二、統(tǒng)計學教育的現(xiàn)狀與挑戰(zhàn)
2013年,教育部對我國統(tǒng)計學專業(yè)設置進行一次新的調(diào)整,將原來的既可授予理學學位,也可授予經(jīng)濟學學位的統(tǒng)計學專業(yè)劃分為統(tǒng)計學、應用統(tǒng)計學和經(jīng)濟統(tǒng)計學三個本科專業(yè)[6]。根據(jù)教育部高等學校統(tǒng)計類專業(yè)教學指導委員會2013年11月公布的數(shù)據(jù),當時全國有194所高校開設了統(tǒng)計學專業(yè),156所高校開設了應用統(tǒng)計學專業(yè),164所高校開設了經(jīng)濟統(tǒng)計學專業(yè)[6]。目前,全國開設這三個統(tǒng)計學專業(yè)的高校個數(shù)和在校學生人數(shù)與2013年相比都有不少的增加。
面對大數(shù)據(jù)時代,我們目前的統(tǒng)計學教育無論在培養(yǎng)目標和教學內(nèi)容上,還是在教育方式和人才培養(yǎng)模式上,都存在著亟待解決的挑戰(zhàn)性問題。例如,在專業(yè)培養(yǎng)目標和人才培養(yǎng)過程中,我們比較重視課程層面上的評價,比較輕視專業(yè)層面上的整體評價,缺乏對學生綜合能力的反饋機制。
關(guān)于教學內(nèi)容,目前三個統(tǒng)計學專業(yè)在統(tǒng)計理論和應用統(tǒng)計兩個方面有不同的側(cè)重。統(tǒng)計理論主要包括:抽樣理論、實驗設計、估汁理論、假設險驗、決策理論、貝葉斯統(tǒng)計、半?yún)?shù)和非參數(shù)統(tǒng)計、序貫分析、多元統(tǒng)計分析、時間序列分析、小樣本理論和大樣本理論等。在數(shù)據(jù)分析中,現(xiàn)今的統(tǒng)計方法基本以結(jié)構(gòu)化數(shù)據(jù)為主要處理對象,而對非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的分析和工具涉及較少。因此,現(xiàn)今統(tǒng)計學課程及內(nèi)容已不能滿足從事非結(jié)構(gòu)型和半結(jié)構(gòu)型的大數(shù)據(jù)研究和商業(yè)應用對人才培養(yǎng)的需要,必須進行必要的改革。
對于教育方式,鑒于大數(shù)據(jù)時代要求,統(tǒng)計分析人員需要具備較高的數(shù)學和現(xiàn)代統(tǒng)計學基礎,具有較高的軟件操作能力,掌握一定的大數(shù)據(jù)收集、整理、分析、處理和挖掘數(shù)據(jù)的技能。日本學者城田真琴認為:“數(shù)據(jù)科學家要有計算機科學專業(yè)背景,數(shù)學、統(tǒng)計方面的素養(yǎng)和使用數(shù)據(jù)挖掘軟件的技能,善于利用數(shù)據(jù)可視化的手法展現(xiàn)晦澀難懂的信息,而且具備相應的專業(yè)知識、眼界和視野,具有適應社會發(fā)展和創(chuàng)造價值的能力”。現(xiàn)今的統(tǒng)計學教育方式還不能很好適應大數(shù)據(jù)時代數(shù)據(jù)科學人才培養(yǎng)需要,必須進行必要及時的調(diào)整和變革。
對人才培養(yǎng)模式,大數(shù)據(jù)時代不僅要求培養(yǎng)具有數(shù)據(jù)處理和分析所需的基本素質(zhì)與技能,更重視培養(yǎng)從海量數(shù)據(jù)中發(fā)現(xiàn)和挖掘價值信息、把握市場機遇、創(chuàng)造利潤的潛在能力。面對大數(shù)據(jù)時代的諸多挑戰(zhàn),現(xiàn)代統(tǒng)計技術(shù)、數(shù)據(jù)挖掘方法、計算機信息技術(shù)、軟件工具和理念的日新月異,培養(yǎng)統(tǒng)計人才的教育模式也需要相應變化,統(tǒng)計學教育只有與時俱進,主動做出全面的調(diào)整和變革才能適應新時代知識進步和激烈人才市場競爭的需要,積極迎接大數(shù)據(jù)時代的挑戰(zhàn)。
大數(shù)據(jù)時代對統(tǒng)計學教師有更高的要求,統(tǒng)計學教師需要與時俱進,跟上時代步伐。隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計算等信息技術(shù)的發(fā)展,對數(shù)據(jù)的分析和處理的技術(shù)也隨之要求更高,統(tǒng)計學教師固有的知識體系已不能滿足培養(yǎng)現(xiàn)代統(tǒng)計人才的需要,必須進一步深化和更新原有的統(tǒng)計學理論知識,而且還需要學習掌握計算機技術(shù)、互聯(lián)網(wǎng)、數(shù)據(jù)庫和信息科學等有關(guān)知識和技術(shù),同時還要熟悉處理非結(jié)構(gòu)型和半結(jié)構(gòu)型數(shù)據(jù)的知識和技能,以適應現(xiàn)代統(tǒng)計學教育對教師的知識結(jié)構(gòu)和基本素質(zhì)的要求。
大數(shù)據(jù)時代對統(tǒng)計專業(yè)的學生也提出了更高的要求,他們不僅需要掌握現(xiàn)代統(tǒng)計理論、統(tǒng)計方法和專業(yè)統(tǒng)計軟件,還要學會如何分析、處理來自互聯(lián)網(wǎng)或各種實際問題中的海量數(shù)據(jù),如何利用統(tǒng)計軟件和互聯(lián)網(wǎng)技術(shù)進行數(shù)據(jù)操作,如何借助軟件技術(shù)和統(tǒng)計準則判斷數(shù)據(jù)質(zhì)量,如何進行模型選擇和評價模型方法的有效性,如何準確清晰地呈現(xiàn)統(tǒng)計分析結(jié)果和結(jié)論,等等。
2014年11月,美國統(tǒng)計學會了統(tǒng)計學本科專業(yè)指導性教學綱要 [7],該教學綱要對統(tǒng)計學專業(yè)提出四個方面的要求:(1)具有扎實的數(shù)學和統(tǒng)計學基礎、強大的統(tǒng)計計算和編程能力,熟練使用統(tǒng)計軟件和數(shù)據(jù)庫;(2)分析來自現(xiàn)實問題的真實數(shù)據(jù),真實數(shù)據(jù)是統(tǒng)計專業(yè)教育的重要組成部分;(3)掌握多樣化的統(tǒng)計模型方法;(4)具有通過語言、圖表和動畫等方式解釋數(shù)據(jù)分析結(jié)果的能力。美國是統(tǒng)計學教育和人才培養(yǎng)最先進的國家之一,該指導性教學綱要代表著美國統(tǒng)計學專業(yè)培養(yǎng)人才的基本要求和發(fā)展方向,對我國統(tǒng)計教育的改革具有重要的參考價值。以該指導性教學綱要為參考依據(jù),對照我國目前的統(tǒng)計學本科專業(yè)教育,無論是在培養(yǎng)目標和課程設置方面,還是在教學內(nèi)容和教學方法方面,都存在著亟待解決的挑戰(zhàn)性問題。
三、統(tǒng)計學教育的改革
大數(shù)據(jù)時代的統(tǒng)計學教育不僅是各種統(tǒng)計方法、數(shù)據(jù)挖掘方法和信息技術(shù)手段的延續(xù)或發(fā)展,更主要的是這些方法的集成應用和在實際數(shù)據(jù)分析中的真實體驗。過去,企業(yè)數(shù)據(jù)庫價格昂貴,在統(tǒng)計學教育的教學案例或?qū)嶒炚n教學中,很少采用真實和海量的數(shù)據(jù)庫資源,基本都是采用過時或虛擬的數(shù)據(jù)。今天,像百度大數(shù)據(jù)引擎這樣的數(shù)據(jù)庫的逐步對外開放,將有助于開展“線上大數(shù)據(jù)統(tǒng)計實驗”教學。為了適應大數(shù)據(jù)時代要求,有必要利用網(wǎng)絡資源以及各種數(shù)據(jù)處理軟件,搭建線上大數(shù)據(jù)分析實驗教學平臺,全面開展大數(shù)據(jù)統(tǒng)計實驗教學的改革。實際上,借助大數(shù)據(jù)分析平臺,本科階段的統(tǒng)計學教育就可以融人聯(lián)機分析和數(shù)據(jù)的可視化教學。其次,要時刻關(guān)注大數(shù)據(jù)分析理論的進展,及時將新理論新方法融入課堂教學內(nèi)容。
需要指出的是,在大數(shù)據(jù)時代,經(jīng)典統(tǒng)計理論和方法并沒有過時,但需要進行改進和進一步發(fā)展。這是因為,網(wǎng)上采集的巨型數(shù)據(jù)集往往存在大量的重復性和無價值數(shù)據(jù)信息,使得大數(shù)據(jù)價值密度降低。在對這些數(shù)據(jù)進行分析處理之前往往需要通過去噪、分層、截斷、聚類等方法的預處理,將其變成便于進行分析處理的小數(shù)據(jù),繼而借助于經(jīng)典統(tǒng)計方法進行分析和處理。因而在大數(shù)據(jù)時代仍然需要采用傳統(tǒng)統(tǒng)計學的小樣本理論和方法。所以,即便是在大數(shù)據(jù)時代,經(jīng)典統(tǒng)計方法仍然是進行統(tǒng)計分析的基石,其核心地位不可動搖。所以,在大數(shù)據(jù)時代仍然要強化統(tǒng)計學的基本理論和方法,尤其是在長期發(fā)展和實踐應用中經(jīng)過驗證的、成熟有效的經(jīng)典和現(xiàn)代統(tǒng)計方法,在大數(shù)據(jù)時代仍然沒有過時,但需要結(jié)合大數(shù)據(jù)分析的需要對經(jīng)典統(tǒng)計方法進行必要的發(fā)展和改進。
大數(shù)據(jù)科學需要統(tǒng)計學與數(shù)學、計算機等學科的結(jié)合。亞馬遜大數(shù)據(jù)科學家John Rauser 認為:“數(shù)據(jù)科學家是統(tǒng)計學家和計算機工程師的結(jié)合體”。為了滿足大數(shù)據(jù)時代的要求,統(tǒng)計學專業(yè)的課程設置需要進行必要的調(diào)整。應根據(jù)新時代人才培養(yǎng)的要求,增設與大數(shù)據(jù)前沿領域發(fā)展相關(guān)的課程,如計算機網(wǎng)絡和大數(shù)據(jù)相關(guān)的軟件應用,同時要加大實驗課和社會實踐課的比重,引導學生理解和掌握大數(shù)據(jù)概念、理論、技術(shù)和方法,培養(yǎng)其運用大數(shù)據(jù)的相關(guān)分析工具解決實際問題的能力。對于理論課程,除基本統(tǒng)計理論外,還應開設一些較為現(xiàn)代和深入的課程,如現(xiàn)代貝葉斯方法、神經(jīng)網(wǎng)絡、數(shù)據(jù)挖掘、應用隨機過程論等。另外,還應開設與大數(shù)據(jù)分析相關(guān)的關(guān)聯(lián)規(guī)則、決策樹、機器學習、支持向量機等課程。
為了培養(yǎng)與時代適應的統(tǒng)計學人才,統(tǒng)計學專業(yè)教師應不斷更新自身的知識結(jié)構(gòu)和價值觀念,改變認識數(shù)據(jù)、收集數(shù)據(jù)和分析數(shù)據(jù)的思維,主動學習和補充互聯(lián)網(wǎng)、現(xiàn)代數(shù)據(jù)分析技術(shù)、數(shù)據(jù)庫和數(shù)據(jù)挖掘技術(shù),使自己的知識體系不斷更新和提升,跟上時展的步伐。
在大數(shù)據(jù)時代,要注意培養(yǎng)學生適應社會的能力。統(tǒng)計專業(yè)人才培養(yǎng)模式應以提高本專業(yè)學生數(shù)據(jù)分析方面的能力,開闊他們的視野,培養(yǎng)其適應社會的能力。應積極引導學生進入實訓場所動手操作和鍛煉,嘗試以企事業(yè)單位的財政、金融、保險、統(tǒng)計、咨詢和信息公司等部門為主構(gòu)建專業(yè)性教育實踐基地。鼓勵學生到大數(shù)據(jù)相關(guān)的機構(gòu)部門、產(chǎn)業(yè)園區(qū)和企業(yè)中去調(diào)查研究和實踐。此外,統(tǒng)計專業(yè)應積極同其他專業(yè)進行合作,聯(lián)合培養(yǎng)適應新時代要求的數(shù)據(jù)分析人才。鑒于大數(shù)據(jù)對數(shù)據(jù)分析人員在計算機技術(shù)、行業(yè)認知、業(yè)務知識、數(shù)據(jù)分析工具和方法的要求提高,統(tǒng)計學科應主動與計算機、經(jīng)濟學、管理學等相關(guān)學科合作,培養(yǎng)學生的計算機能力、專業(yè)素質(zhì)和業(yè)務修養(yǎng)。
“它山之石可以攻玉”,關(guān)于統(tǒng)計學專業(yè)的課程設置,可以參考和借鑒美國統(tǒng)計學會公布的統(tǒng)計學本科專業(yè)指導性教學綱要。根據(jù)該教學綱要,統(tǒng)計專業(yè)的課程設置應該涵蓋五個模塊[7]:(1)統(tǒng)計方法與統(tǒng)計理論。建立統(tǒng)計模型并對模型的輸出結(jié)果進行評價,熟悉統(tǒng)計推斷,能夠從數(shù)據(jù)分析中得出恰當?shù)慕Y(jié)論。(2)數(shù)據(jù)操作和統(tǒng)計計算。熟練使用一款專業(yè)統(tǒng)計軟件進行探索性數(shù)據(jù)分析,發(fā)現(xiàn)和清洗數(shù)據(jù)中的錯誤記錄,具有編程能力和算法思維,可以進行各種數(shù)據(jù)操作,還應掌握統(tǒng)計計算技術(shù),能夠進行模擬研究。(3)數(shù)學基礎。熟練掌握微積分、線性代數(shù)、矩陣論、概率論和數(shù)理統(tǒng)計的基礎知識。(4)實踐訓練和表達能力。具有良好的表達和交流能力,善于通過圖示和動畫等聽眾易于理解的方式展示分析結(jié)論,并且具有團隊合作精神和項目領導能力。(5)特定領域的知識。掌握特定應用領域的知識,并用統(tǒng)計學特有的思維方法來分析和解決特定領域的實際問題。
大數(shù)據(jù)時代是以數(shù)據(jù)為中心的時代,統(tǒng)計學專業(yè)的教育改革必須適應這個時代的要求。統(tǒng)計數(shù)據(jù)分析中軟件應用能力至關(guān)重要。在眾多統(tǒng)計軟件中推薦使用R和SAS軟件,因為R是免費開源軟件,其統(tǒng)計建模、統(tǒng)計計算和可視化功能強大,更新迅速,是最新統(tǒng)計方法的主要平臺,非常有利于培養(yǎng)學生的編程能力和知識更新能力,而SAS軟件被很多公司用于數(shù)據(jù)管理和數(shù)據(jù)分析,在實際應用領域具有長期而深遠的影響,是數(shù)據(jù)分析不可或缺的專業(yè)統(tǒng)計軟件。當然,教學中也可以嘗試使用其他專業(yè)統(tǒng)計軟件,例如經(jīng)濟統(tǒng)計專業(yè)學生也可使用SPSS軟件,但最好會使用SAS或R軟件。在加強軟件使用和編程能力的基礎上,應加強學生統(tǒng)計計算和統(tǒng)計模擬能力的培養(yǎng)。在大數(shù)據(jù)時代,強調(diào)統(tǒng)計計算的重要性是大勢所趨。統(tǒng)計模擬技術(shù)是伴隨著高速計算機和信息技術(shù)的快速發(fā)展而廣泛應用的現(xiàn)代技術(shù),可用來解決傳統(tǒng)學科領域中無法解決的問題。例如,在計算技術(shù)飛速發(fā)展的今天,貝葉斯統(tǒng)計方法過去曾經(jīng)面臨的計算瓶頸正在逐漸消失,基于馬爾科夫鏈蒙特卡洛(MCMC)技術(shù)的統(tǒng)計模擬方法在數(shù)據(jù)分析中的強大威力正在日益顯現(xiàn)[8]。
參考文獻:
[1] 劉春杰,大數(shù)據(jù)時代對當代統(tǒng)計學教育的挑戰(zhàn),統(tǒng)計與決策,2015年,第8期。
[2] 孟生旺,袁衛(wèi),大數(shù)據(jù)時代的統(tǒng)計教育,統(tǒng)計研究,2015年,第32卷4期。
[3] 葛虹,韓偉,大數(shù)據(jù)時代統(tǒng)計教育變革的SWOT分析與發(fā)展策略,統(tǒng)計與決策,2015年,第4期。
[4] 張海波,黃世祥,統(tǒng)計學專業(yè)學生大數(shù)據(jù)分析能力的培養(yǎng)方式選擇,統(tǒng)計與決策,2014年,第24期。
[5] 李衛(wèi)東,大數(shù)據(jù)對統(tǒng)計學科發(fā)展的影響,統(tǒng)計與決策,2014年,第13.期。
[6] 教育部高等學校統(tǒng)計類專業(yè)教學指導委員會.統(tǒng)計學專業(yè)教學單位.http:///category/信息公開/教學單位,2013-11-15.
熱門標簽
相關(guān)文章
2大數(shù)據(jù)技術(shù)在工業(yè)經(jīng)濟中的應用
3大數(shù)據(jù)在農(nóng)村金融機構(gòu)的運用
4大數(shù)據(jù)背景下企業(yè)財務風險管理及思考