數(shù)據(jù)信息論文范文

時(shí)間:2023-03-31 21:55:40

導(dǎo)語(yǔ):如何才能寫(xiě)好一篇數(shù)據(jù)信息論文,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。

數(shù)據(jù)信息論文

篇1

在電子商務(wù)網(wǎng)站設(shè)計(jì)的應(yīng)用在設(shè)計(jì)電子商務(wù)網(wǎng)站的時(shí)候,首選就需要幫助銷售商對(duì)客戶行為的了解,這樣才能使得站點(diǎn)的使用效率得到有效提高,此時(shí)就需要應(yīng)用數(shù)據(jù)挖掘技術(shù),這樣網(wǎng)絡(luò)管理員就可以根據(jù)客戶在上網(wǎng)過(guò)程中所瀏覽的網(wǎng)站頁(yè)面及其數(shù)據(jù)信息歸納分析經(jīng)常訪問(wèn)該站點(diǎn)的用戶類型,及其訪問(wèn)途徑和通過(guò)怎樣的方式完成交易等內(nèi)容,這樣才能讓建立的網(wǎng)站更吸引客戶,同時(shí)也為網(wǎng)站結(jié)構(gòu)的進(jìn)一步優(yōu)化、站點(diǎn)訪問(wèn)量和效果的提升提供有利的依據(jù)。整個(gè)電子商務(wù)網(wǎng)站的設(shè)計(jì)包括三個(gè)步驟,分別為數(shù)據(jù)信息的采集、分析以及提供個(gè)性化服務(wù)。

1.數(shù)據(jù)信息的采集

因?yàn)橹挥袑⒖蛻粝嚓P(guān)的數(shù)據(jù)信息收集起來(lái),才能在分析之后,將個(gè)性化的服務(wù)提供給客戶,也就是說(shuō)電子商務(wù)網(wǎng)站向客戶提供個(gè)性化服務(wù)是基于說(shuō)數(shù)據(jù)信息采集的。銷售商能夠得到客戶在注冊(cè)過(guò)程中保存的信息,即客戶的基本信息,包括姓名、籍貫、家庭住址、出生日期以及愛(ài)好等,同時(shí)還能根據(jù)客戶所瀏覽的網(wǎng)頁(yè)和商品等信息,對(duì)客戶關(guān)注和傾向的商品進(jìn)行判斷,進(jìn)而為客戶建立相應(yīng)的服務(wù)檔案。而且客戶人員還能在計(jì)算機(jī)的數(shù)據(jù)庫(kù)中存儲(chǔ)客戶與自身交流時(shí)的數(shù)據(jù)信息。當(dāng)客戶完成訂單和付款之后,可以對(duì)其收貨地址信息加以確定,進(jìn)而掌握客戶的所在地等信息,進(jìn)而進(jìn)一步完善客戶對(duì)應(yīng)的信息數(shù)據(jù)庫(kù)。同時(shí)還能夠?qū)蛻舻耐对V和評(píng)價(jià)進(jìn)行分類整理,使客戶的服務(wù)檔案得到不斷的完善,以此為網(wǎng)站的優(yōu)化提供更加有利的數(shù)據(jù)資料。與此同時(shí)還會(huì)將數(shù)據(jù)挖掘技術(shù)引入到網(wǎng)絡(luò)服務(wù)器中,進(jìn)行一個(gè)可以對(duì)客戶瀏覽途徑和頁(yè)面以及點(diǎn)擊產(chǎn)品信息加以記載的數(shù)據(jù)庫(kù)系統(tǒng),實(shí)現(xiàn)各企業(yè)資源共享的目標(biāo),并且還不會(huì)對(duì)網(wǎng)絡(luò)服務(wù)器的訪問(wèn)速度產(chǎn)生影響。

2.數(shù)據(jù)信息的分析

想要設(shè)計(jì)出一個(gè)成功的電子商務(wù)網(wǎng)站,就應(yīng)該在保持對(duì)客戶完全透明的基礎(chǔ)上,及時(shí)、快速、準(zhǔn)確的分析客戶資料及其訪問(wèn)行為,進(jìn)而保證客戶訪問(wèn)頁(yè)面的處理時(shí)間不被占用的條件下,為客戶提供一個(gè)可以更方便、快捷的進(jìn)行網(wǎng)購(gòu)、網(wǎng)上交易等商務(wù)活動(dòng)環(huán)境。首先,就要分析客戶行為和登錄方式,對(duì)網(wǎng)站客戶群進(jìn)行劃分歸類;其次在進(jìn)行內(nèi)容設(shè)計(jì)的時(shí)候重點(diǎn)考慮客戶群的年齡、愛(ài)好和特點(diǎn)等方面,將網(wǎng)站內(nèi)容加以歸類,并針對(duì)不同類別的客戶群,展示客戶感興趣的商品信息,最后再根據(jù)客戶的訪問(wèn)、瀏覽信息以及訂單信息,為客戶的行為資料進(jìn)行及時(shí)修改和完善。

3.個(gè)性化服務(wù)

這就是通過(guò)挖掘網(wǎng)絡(luò)數(shù)據(jù)信息,了解和掌握客戶的需求和興趣,準(zhǔn)確的向客戶提供個(gè)性化的產(chǎn)品推薦,這不但要根據(jù)客戶的諸多方面對(duì)其提供滿足其需求的信息,而且還是主動(dòng)為客戶提供所需信息,使網(wǎng)站的個(gè)性化服務(wù)的特點(diǎn)更為突出,進(jìn)而吸引更多的客戶。并且為了使得客戶類型更加穩(wěn)定和準(zhǔn)確,就需要優(yōu)先臭氧統(tǒng)計(jì)具有較長(zhǎng)注冊(cè)時(shí)間、較多瀏覽記錄以及產(chǎn)品購(gòu)買數(shù)量大的客戶。

二、結(jié)束語(yǔ)

篇2

1.對(duì)資料管理重視不夠,圖書(shū)資料管理工作基礎(chǔ)較差??v觀大部分的企業(yè),普遍存在對(duì)資料管理工作忽視的問(wèn)題。企業(yè)的管理層往往認(rèn)為這項(xiàng)工作無(wú)足輕重,不會(huì)對(duì)企業(yè)的發(fā)展產(chǎn)生影響。較低的重視度使得企業(yè)對(duì)圖書(shū)資料管理要求寬泛,在工作人員、工作內(nèi)容以及工作制度等方面沒(méi)有加以重視和關(guān)注,使得工作人員工作積極性不高、專業(yè)性不強(qiáng),工作內(nèi)容模糊,工作制度缺失等問(wèn)題出現(xiàn)。另外,企業(yè)對(duì)圖書(shū)資料管理工作資金投入較少,使其軟硬件基礎(chǔ)設(shè)施落后。以上因素都使得圖書(shū)資料管理工作基礎(chǔ)變得薄弱,不能完全發(fā)揮自身職能去服務(wù)企業(yè)。

2.圖書(shū)資料利用率不足,利用效果不明顯。圖書(shū)資料在企業(yè)的發(fā)展中起著信息交流、互相溝通的作用,特別是在企業(yè)制定發(fā)展戰(zhàn)略時(shí)候能夠提供參考、借鑒和考證等方面的幫助。但是,對(duì)于大多數(shù)的企業(yè)而言卻沒(méi)有充分利用圖書(shū)資料這些特點(diǎn)。主要原因在于文書(shū)資源的管理缺乏網(wǎng)絡(luò)化和現(xiàn)代化,再加上對(duì)圖書(shū)資料的整理編排不科學(xué)等,當(dāng)企業(yè)需要借助相關(guān)資料進(jìn)行分析決策時(shí),面對(duì)龐雜的圖書(shū)資料工作者不能及時(shí)地將對(duì)方所需的資料提取出來(lái),給對(duì)方工作造成不便,打擊了企業(yè)其他部門取用圖書(shū)資料的積極性,造成了企業(yè)雖然占有大量的文書(shū)資源但是其他部門不充分利用的現(xiàn)狀。

3.圖書(shū)資料工作與檔案管理工作協(xié)調(diào)性差,工作漏洞時(shí)常存在。在企業(yè)里會(huì)出現(xiàn)圖書(shū)資料工作和檔案管理工作的對(duì)接偏差,使兩者間的協(xié)調(diào)性受到了嚴(yán)重地削弱,進(jìn)而不能及時(shí)提供有效、全面的信息資源。造成兩者間工作協(xié)調(diào)性差的原因主要在于雙方不能明確各自的工作范圍和內(nèi)容,不能夠做好相互的銜接工作。圖書(shū)資料工作與檔案管理工作不能夠很好地配合會(huì)導(dǎo)致一些漏洞的發(fā)生,如在圖書(shū)資料工作中,文種使用不當(dāng)、初始稿件丟失、檔案收集工作不及時(shí)等;在檔案管理工作方面,存在著操作不規(guī)范,主要體現(xiàn)在對(duì)檔案的裝訂、添加附件、編號(hào)等工作上。

4.圖書(shū)資料管理軟硬件建設(shè)投入不足,制約了信息化管理進(jìn)程。圖書(shū)資料管理軟硬件投入不足主要是指企業(yè)在其硬件設(shè)備以及人員配備方面沒(méi)有給與足夠的資金投入,使之不能夠滿足工作的需要,制約了信息化的管理進(jìn)程。主要體現(xiàn)為現(xiàn)有的辦公設(shè)備較為成舊,在開(kāi)展信息化建設(shè)時(shí)不能夠提供硬件支持。另外,人員配備方面也存在缺陷,表現(xiàn)為現(xiàn)有的工作人員素質(zhì)較低,也沒(méi)有高素質(zhì)的專業(yè)人員的引入。

二、大數(shù)據(jù)時(shí)代圖書(shū)資料信息化管理工作發(fā)展的建議

針對(duì)上述問(wèn)題,應(yīng)當(dāng)從以下幾個(gè)方面出發(fā)對(duì)其進(jìn)行改進(jìn):

1.做好圖書(shū)資料管理的基礎(chǔ)工作,加強(qiáng)企業(yè)部門之間資料管理的協(xié)調(diào)。為了更好地做好圖書(shū)資料管理的基礎(chǔ)工作,加強(qiáng)部門之間與圖書(shū)資料管理的溝通合作。企業(yè)需要對(duì)圖書(shū)資料工作人員加以規(guī)范和約束,督促其做好本職工作,諸如搜集,分類,鑒別,整理等,還要增強(qiáng)其服務(wù)意識(shí)。在提高重視度的同時(shí)還要針對(duì)圖書(shū)資料管理工作的性質(zhì)制定完善的管理制度和工作方法、流程等。最后在加強(qiáng)基礎(chǔ)性工作方面還要對(duì)其進(jìn)行有效的、全方位的監(jiān)管,確保工作的準(zhǔn)確性、全面性、及時(shí)性。另外,在部門協(xié)調(diào)方面,負(fù)責(zé)圖書(shū)資料管理的部門也應(yīng)加強(qiáng)和企業(yè)內(nèi)部其他部門的聯(lián)系與互動(dòng),及時(shí)將搜集處理好的信息及時(shí)地提供給企業(yè)內(nèi)部需要的部門,以幫助企業(yè)在制定目標(biāo)或戰(zhàn)略時(shí)及時(shí)做出判斷,切實(shí)發(fā)揮自身的基礎(chǔ)性作用,在一定程度上也能夠增強(qiáng)企業(yè)對(duì)圖書(shū)資料管理的重視度。

2.實(shí)現(xiàn)圖書(shū)資料管理的數(shù)字化,簡(jiǎn)化手動(dòng)、整理和歸檔的過(guò)程。為了提高圖書(shū)資料的利用率,使之更加方便地為其他部分提供服務(wù),企業(yè)應(yīng)對(duì)現(xiàn)有的圖書(shū)資料管理模式進(jìn)行改革創(chuàng)新。圖書(shū)資料管理部門要逐步實(shí)現(xiàn)圖書(shū)資料管理的數(shù)字化,即在原有紙質(zhì)資料基礎(chǔ)上引入數(shù)字化處理技術(shù)。在對(duì)紙質(zhì)資料進(jìn)行整理、編號(hào)、儲(chǔ)存的同時(shí),將大數(shù)據(jù)時(shí)代的技術(shù)優(yōu)勢(shì)應(yīng)用于圖書(shū)資料的管理工作中,將圖書(shū)資料進(jìn)行數(shù)字化處理,建立數(shù)據(jù)庫(kù),從而簡(jiǎn)化手動(dòng)、整理和歸檔資料的過(guò)程,也能夠在很大程度上方便需要者查閱。數(shù)字化、網(wǎng)絡(luò)化的介入將徹底改變圖書(shū)資料傳統(tǒng)的處理方式,將不必要的、過(guò)于繁瑣的步驟和工作進(jìn)行刪減和革新,不僅能夠提高了圖書(shū)資料管理者的工作效率,減輕了其工作負(fù)荷,還提高了圖書(shū)資料的利用效率。

3.強(qiáng)化員工管理意識(shí),科學(xué)梳理圖書(shū)資料工作與圖書(shū)資料管理工作的配合度。為了增強(qiáng)圖書(shū)資料工作和圖書(shū)資料管理工作的配合度,企業(yè)應(yīng)當(dāng)對(duì)這兩項(xiàng)工作進(jìn)行科學(xué)地梳理。首先,要對(duì)圖書(shū)資料工作和圖書(shū)資料工作各自的工作范圍和內(nèi)容加以明確,要以條文的形式對(duì)其各自的職責(zé)進(jìn)行規(guī)范,特別在涉及兩者工作銜接時(shí)的各項(xiàng)工作項(xiàng)目的歸屬加以明確。其次,要確保兩者在各自的工作中恪盡職守,嚴(yán)格按照各自的制度和規(guī)范要求來(lái)開(kāi)展工作,避免因自己的工作疏忽或者漏洞給對(duì)方的工作帶來(lái)不便,進(jìn)而影響兩者點(diǎn)的協(xié)調(diào)。再者,還要在意識(shí)方面對(duì)雙方加以增強(qiáng),使之不僅能夠明確自身工作的重要性,還能夠充分認(rèn)識(shí)到對(duì)方工作的重要性以及自身的工作對(duì)對(duì)方工作的影響力??傊?,要使圖書(shū)資料工作和檔案管理工作雙發(fā)充分了解圖書(shū)資料和檔案資料之間的重要關(guān)系,明確兩者是相輔相成,相互依托的,只有這樣才能夠促進(jìn)兩者間的有效配合。

4.加強(qiáng)資料管理的軟硬件建設(shè),提供資料信息化管理支撐。在加強(qiáng)資料管理的軟硬件建設(shè)方面,企業(yè)需要做到以下幾點(diǎn):1)加大對(duì)基礎(chǔ)設(shè)施的精力和財(cái)力投入。為了適應(yīng)信息化的發(fā)展,企業(yè)要對(duì)現(xiàn)有的基礎(chǔ)設(shè)施加以升級(jí)或者更換,使之在辦公中滿足網(wǎng)絡(luò)搜索引擎、網(wǎng)絡(luò)信息平臺(tái)等各項(xiàng)信息化建設(shè)的需要。2)加大對(duì)現(xiàn)有的工作人員的培訓(xùn)力度。企業(yè)要通過(guò)公共課、視頻教學(xué)、網(wǎng)絡(luò)會(huì)議、外派學(xué)習(xí)等手段對(duì)員工進(jìn)行專業(yè)、服務(wù)意識(shí)等方面的培訓(xùn),提高其綜合素質(zhì)。3)引進(jìn)專業(yè)化的高素質(zhì)人才。企業(yè)應(yīng)適當(dāng)提高圖書(shū)資料工作人員的任用門檻,聘用更多經(jīng)過(guò)專業(yè)知識(shí)學(xué)習(xí)或經(jīng)過(guò)專業(yè)培訓(xùn)的人員,借助這些專業(yè)人員的力量來(lái)對(duì)現(xiàn)有的圖書(shū)資料工作進(jìn)行信息化管理方向的創(chuàng)新和轉(zhuǎn)變。

三、結(jié)語(yǔ)

篇3

1.1惡意的對(duì)計(jì)算機(jī)進(jìn)行攻擊伴隨著計(jì)算機(jī)的軟件發(fā)展,各種方面的軟件、硬件都在出現(xiàn)和更新中。作為計(jì)算機(jī)最基礎(chǔ)的數(shù)據(jù)統(tǒng)計(jì)等功能也進(jìn)入了開(kāi)放性越來(lái)越強(qiáng)的變新中。在醫(yī)院的SQL數(shù)據(jù)庫(kù)中使用的是局域網(wǎng),在這個(gè)局域網(wǎng)里面的用戶基本都可以訪問(wèn)到數(shù)據(jù)庫(kù)及應(yīng)用系統(tǒng)。這樣的互享模式如果是在醫(yī)院內(nèi)部倒也沒(méi)什么,只是各種惡意的軟件橫行,會(huì)導(dǎo)致不少來(lái)自外界未知的惡意軟件對(duì)醫(yī)院的計(jì)算機(jī)進(jìn)行攻擊。這些都給醫(yī)院的信息管理系統(tǒng)的安全造成了極大的威脅。一旦醫(yī)院的數(shù)據(jù)庫(kù)信息被泄露,從收費(fèi)的數(shù)據(jù)到醫(yī)療的信息、從病人隱私的保密到管理信息保密都會(huì)處于一個(gè)透明的狀態(tài),這對(duì)于醫(yī)院的信息管理是一個(gè)巨大的沖擊,也會(huì)帶給病人一些重大麻煩。為了避免這類事情發(fā)生。需要醫(yī)院信息管理系統(tǒng)和數(shù)據(jù)庫(kù)處在非常安全的環(huán)境里。這也是本文研究基于SQL數(shù)據(jù)庫(kù)的醫(yī)院信息管理綜合應(yīng)用平臺(tái)設(shè)計(jì)的重心。

1.2被動(dòng)的進(jìn)行攻擊在不影響正常網(wǎng)絡(luò)使用的情況下,還會(huì)有更高明的竊取破譯數(shù)據(jù)庫(kù)的方法,這也是所謂的被動(dòng)的進(jìn)行攻擊。在這種竊取、破譯的行為下,當(dāng)事人醫(yī)院數(shù)據(jù)庫(kù)很難查悉這行為,因此會(huì)造成非常重要的機(jī)密性文件數(shù)據(jù)的泄露。醫(yī)院的數(shù)據(jù)庫(kù)是整個(gè)醫(yī)院信息系統(tǒng)的靈魂,很多黑客病毒都會(huì)以此為突破點(diǎn)以獲得很重要的機(jī)密數(shù)據(jù)。無(wú)論是主動(dòng)的還是被動(dòng)的攻擊方式,都是現(xiàn)今使用的SQL數(shù)據(jù)庫(kù)系統(tǒng)的抖動(dòng),為了保證醫(yī)院的計(jì)算機(jī)信息安全,保證醫(yī)院和病人的隱私,有必要針對(duì)這些缺陷進(jìn)行改進(jìn)?;赟QL數(shù)據(jù)庫(kù)系統(tǒng)的綜合信息應(yīng)用平臺(tái)設(shè)計(jì)可以更貼近實(shí)際,防止人為惡意的網(wǎng)絡(luò)安全的攻擊。這也是醫(yī)院今后采用SQL數(shù)據(jù)庫(kù)進(jìn)行工作時(shí)的防范重點(diǎn)。

2SQL數(shù)據(jù)庫(kù)在醫(yī)院信息管理綜合應(yīng)用中的完善

2.1根據(jù)具體的需要相應(yīng)的增加或者減少相應(yīng)的模塊數(shù)量醫(yī)院和個(gè)人可以根據(jù)自己的具體需要,進(jìn)行一些簡(jiǎn)單的維護(hù),將系統(tǒng)的模塊進(jìn)行增加或減少。并且在增減模塊的同時(shí)注意維護(hù)編程的界面,這樣才能設(shè)計(jì)出很友好的系統(tǒng)模塊。有了針對(duì)性的結(jié)構(gòu)特點(diǎn),這樣的數(shù)據(jù)庫(kù)應(yīng)用平臺(tái)不僅更符合醫(yī)院信息管理系統(tǒng)的設(shè)計(jì),而且還增大了獨(dú)立性和獨(dú)特性,因此也可以整體提高系統(tǒng)的可維護(hù)性和可靠性。選用這樣模塊化的SQL數(shù)據(jù)庫(kù)應(yīng)用平臺(tái)也是設(shè)計(jì)結(jié)構(gòu)的特點(diǎn)。

2.2采取開(kāi)發(fā)式結(jié)構(gòu)特點(diǎn)研究基于SQL數(shù)據(jù)庫(kù)的醫(yī)院信息管理綜合應(yīng)用設(shè)計(jì)就必須要仔細(xì)斟酌這數(shù)據(jù)庫(kù)的系統(tǒng)硬件的結(jié)構(gòu)設(shè)計(jì)。這個(gè)也是整個(gè)信息系統(tǒng)的核心內(nèi)容。當(dāng)前采取的數(shù)據(jù)統(tǒng)計(jì)模式執(zhí)行的是TCP/IP的協(xié)議。如果要進(jìn)一步加強(qiáng)系統(tǒng)給的可靠性,保證醫(yī)院和病人信息的安全就應(yīng)當(dāng)采取開(kāi)發(fā)式結(jié)構(gòu)特點(diǎn)的系統(tǒng)硬件結(jié)構(gòu)設(shè)計(jì)。采取這樣的硬件結(jié)構(gòu)設(shè)計(jì)可以減少冗余的配置,保證系統(tǒng)可靠性。在整體的醫(yī)院數(shù)據(jù)信息系統(tǒng)中,最重要的就是這個(gè)系統(tǒng)。在完善機(jī)遇SQL數(shù)據(jù)庫(kù)的應(yīng)用設(shè)計(jì)時(shí)自然需要通過(guò)增強(qiáng)系統(tǒng)給的整體可靠性,以聯(lián)合增強(qiáng)SQL數(shù)據(jù)庫(kù)的互聯(lián)網(wǎng)安全機(jī)密新能。SQL依然可支持遠(yuǎn)程的訪問(wèn),這也是醫(yī)院信息數(shù)據(jù)庫(kù)需要有的特點(diǎn)。因此,雖然可支持遠(yuǎn)程訪問(wèn)的功能會(huì)導(dǎo)致醫(yī)院的信息保密功能不太安全,卻也不能刪除。但是可具體根據(jù)醫(yī)療方面的任務(wù)對(duì)應(yīng)的增加遠(yuǎn)程訪問(wèn)的時(shí)間限制、地點(diǎn)限制和次數(shù)限制。這也是開(kāi)發(fā)式硬件結(jié)構(gòu)的特點(diǎn)。

2.3系統(tǒng)性能優(yōu)化SQL數(shù)據(jù)庫(kù)歷經(jīng)幾年的研究和使用已經(jīng)近乎完美,因此對(duì)數(shù)據(jù)庫(kù)的性能進(jìn)行優(yōu)化是個(gè)非常困難的任務(wù)。然而,只要是實(shí)際工作有需要的,都應(yīng)當(dāng)做出針對(duì)性的系統(tǒng)性能優(yōu)化。為了保證醫(yī)院信息的安全,也為了保證醫(yī)院工作的效率,系統(tǒng)性能優(yōu)化的完善勢(shì)在必行。在醫(yī)院日常的工作中,最繁重的就是數(shù)據(jù)統(tǒng)計(jì)和索引了,若性能得到優(yōu)化,就可以大大加快數(shù)據(jù)庫(kù)的反應(yīng)速度,這樣也能使醫(yī)院的工作和服務(wù)得到提升。

3結(jié)論

篇4

近年來(lái),數(shù)據(jù)挖掘與商務(wù)智能技術(shù)發(fā)展迅速,充分借鑒國(guó)外相關(guān)研究,尤其是ACMSIGKDD課程委員會(huì)對(duì)數(shù)據(jù)挖據(jù)課程建設(shè)建議,對(duì)進(jìn)行數(shù)據(jù)挖掘類課程的教學(xué)建設(shè)研究有重要意義。ACM(美國(guó)計(jì)算機(jī)協(xié)會(huì))于1998年成立了SIGKDD(知識(shí)發(fā)現(xiàn)興趣小組),致力于知識(shí)發(fā)現(xiàn)與數(shù)據(jù)挖掘的相關(guān)研究,ACMSIGKDD課程委員會(huì)連續(xù)多年多次更新其主要課程———數(shù)據(jù)挖據(jù)課程的建議,其中委員會(huì)將數(shù)據(jù)挖掘課程分為基礎(chǔ)部分與高級(jí)主題,基礎(chǔ)部分覆蓋了數(shù)據(jù)挖掘的基本方法,高級(jí)主題既有數(shù)據(jù)挖掘基本方法的深入研究,又有更高級(jí)算法的介紹。國(guó)外很多大學(xué)的計(jì)算機(jī)科學(xué)學(xué)院、商學(xué)院都開(kāi)設(shè)了數(shù)據(jù)挖掘類課程并同時(shí)進(jìn)行相關(guān)研究。波士頓大學(xué)開(kāi)設(shè)了“數(shù)據(jù)管理與商務(wù)智能”課程,課程主要包括基礎(chǔ)、核心技術(shù)、應(yīng)用三部分。許多國(guó)外著名大學(xué)建立了教學(xué)管理系統(tǒng),提供大量的案例、在線討論和在線輔導(dǎo)功能。國(guó)內(nèi)很多學(xué)校都開(kāi)設(shè)了數(shù)據(jù)挖掘的相關(guān)課程,我國(guó)大多數(shù)高校的課程大綱內(nèi)容與國(guó)外大致相同,只是在實(shí)踐部分選用了不同的商務(wù)案例。數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域廣泛,因此可以根據(jù)開(kāi)課學(xué)院和專業(yè)選擇合適的實(shí)例。

二、根據(jù)信息管理專業(yè)本科生培養(yǎng)要求確定課程目標(biāo)

數(shù)據(jù)挖掘課程是一門綜合性很強(qiáng)的前沿學(xué)科,對(duì)計(jì)算機(jī)軟硬件、數(shù)據(jù)庫(kù)、人工智能技術(shù)、統(tǒng)計(jì)學(xué)算法、優(yōu)化算法等基礎(chǔ)知識(shí)都有較高的要求。因此該門課程開(kāi)設(shè)在學(xué)生大三下學(xué)期,既有相關(guān)知識(shí)的基礎(chǔ),又為大四做畢業(yè)設(shè)計(jì)提供了一種思路。信息管理專業(yè)是計(jì)算機(jī)與管理相結(jié)合的專業(yè),旨在培養(yǎng)具備信息系統(tǒng)開(kāi)發(fā)能力與信息資源分析與處理能力的綜合應(yīng)用型人才。對(duì)信息管理專業(yè)的學(xué)生而言,本課程主要的目標(biāo)是數(shù)據(jù)挖掘算法原理理解、數(shù)據(jù)挖掘算法在商務(wù)管理問(wèn)題中的應(yīng)用以及常用數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘軟件的熟練應(yīng)用和二次開(kāi)發(fā)。

三、基于模塊化方法的課程內(nèi)容分析

模塊化教學(xué)模式是按照程序模塊化的構(gòu)想和原則來(lái)設(shè)計(jì)教學(xué)內(nèi)容的一整套教學(xué)體系,它是在既定的培養(yǎng)目標(biāo)指導(dǎo)下,將全部教學(xué)內(nèi)容按照一定標(biāo)準(zhǔn)或規(guī)則進(jìn)行分解,使其成為多個(gè)相對(duì)獨(dú)立的教學(xué)模塊,且各教學(xué)模塊之間可以按照一定的規(guī)則有選擇性的重新組合。學(xué)生可以根據(jù)個(gè)人興趣和職業(yè)取向在不同模塊之間進(jìn)行選擇和搭配,從而實(shí)現(xiàn)不同的教學(xué)目標(biāo)和人才培養(yǎng)要求。模塊化教學(xué)本質(zhì)上是以知識(shí)點(diǎn)與實(shí)踐的細(xì)化為出發(fā)點(diǎn)研究的。商務(wù)智能方法本身非常豐富,實(shí)踐應(yīng)用也是課程的主要特點(diǎn)之一,因此十分適合使用模塊化的知識(shí)分解方式。本課程的知識(shí)點(diǎn)模塊管理分為兩個(gè)層次,一是從宏觀角度設(shè)計(jì)課程的基礎(chǔ)內(nèi)容模塊和高級(jí)主題模塊;二是從微觀角度針對(duì)較為復(fù)雜的教學(xué)內(nèi)容進(jìn)行的知識(shí)點(diǎn)劃分。

1.課程主要內(nèi)容模塊化分析。目前該課程包括十章理論內(nèi)容,分別為數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的基本知識(shí)、數(shù)據(jù)倉(cāng)庫(kù)的OLAP技術(shù)、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘系統(tǒng)的結(jié)構(gòu)、概念描述:特征化與比較、挖掘大型數(shù)據(jù)庫(kù)中的關(guān)聯(lián)規(guī)則、分類與預(yù)測(cè)、聚類分析、復(fù)雜類型數(shù)據(jù)挖掘和序列模式挖掘。根據(jù)模塊化管理的宏觀角度分類,課程內(nèi)容的第一至五章屬于基礎(chǔ)理論部分和簡(jiǎn)單數(shù)據(jù)挖掘技術(shù)的介紹,可以作為基礎(chǔ)內(nèi)容模塊;第六至八章為數(shù)據(jù)挖掘的核心算法,其中既有基礎(chǔ)理論與技術(shù)方法,又可深入到較難的方法和復(fù)雜的應(yīng)用,因此介于基礎(chǔ)內(nèi)容與高級(jí)主題之間;第九、十章可以算做課程的高級(jí)主題模塊;另外,課程的實(shí)踐模塊既包含數(shù)據(jù)倉(cāng)庫(kù)的建設(shè)又包含數(shù)據(jù)挖掘算法的應(yīng)用,難度也介于基礎(chǔ)內(nèi)容與高級(jí)主題之間。

2.復(fù)雜知識(shí)點(diǎn)的模塊化管理。從微觀角度對(duì)知識(shí)點(diǎn)進(jìn)行設(shè)計(jì)主要針對(duì)的是上述的高級(jí)主題、以及難度介于基礎(chǔ)內(nèi)容與高級(jí)主題之間的章節(jié),由于這些章節(jié)知識(shí)點(diǎn)在難度上有一定層次,講授內(nèi)容彈性比較大,因此需要在課程設(shè)計(jì)中明確一定課時(shí)量所要達(dá)到的難度。以商務(wù)智能技術(shù)中的分類算法為例:首先一般的入門課程都會(huì)介紹分類算法的概念和基本原理;接著開(kāi)始介紹分類算法的基礎(chǔ)算法———決策樹(shù),而決策樹(shù)算法中又包含ID3等多種算法,并且除了決策樹(shù)外,還有其他更高級(jí)的分類算法;在真正使用分類法進(jìn)行預(yù)測(cè)時(shí),還要分析預(yù)測(cè)準(zhǔn)確度;最終要將所學(xué)知識(shí)加以應(yīng)用。這樣就形成了一個(gè)結(jié)構(gòu)清晰、難度循序漸進(jìn)的知識(shí)點(diǎn)模塊的層次關(guān)系。在宏觀角度、微觀角度對(duì)教學(xué)內(nèi)容進(jìn)行分類的前提下進(jìn)行相應(yīng)的授課方法與考查方法的研究,才能真正有助于學(xué)生的學(xué)習(xí)。

四、授課與考核方法設(shè)計(jì)

對(duì)不同層次學(xué)生要求不同,這種不同既體現(xiàn)在知識(shí)點(diǎn)的要求上,又直接體現(xiàn)在任務(wù)的難易性程度上,這都需要教師在課程設(shè)計(jì)時(shí)充分考慮不同要求情況下的不同的授課方式,并使學(xué)生清楚自己需要掌握的程度。對(duì)于高級(jí)算法和實(shí)現(xiàn)部分,通??梢赃x擇一到兩章內(nèi)容采用專題探討式的教學(xué)方法。這種方法是指在教師啟發(fā)和引導(dǎo)下,以學(xué)生為主體,選擇某個(gè)基本教學(xué)單元為專題,學(xué)生自主研究作為知識(shí)傳遞的基本形式,將多種靈活的教學(xué)方式綜合運(yùn)用到教學(xué)環(huán)節(jié)的教學(xué)方法。根據(jù)信管專業(yè)培養(yǎng)方案的培養(yǎng)目標(biāo)、以及對(duì)學(xué)生調(diào)研的情況,實(shí)踐環(huán)節(jié)比較適合選擇成熟的商務(wù)智能工具進(jìn)行數(shù)據(jù)的整合和多維數(shù)據(jù)建模,也就是直接使用現(xiàn)成的;或者使用數(shù)據(jù)挖掘軟件進(jìn)行數(shù)據(jù)建模,完善數(shù)據(jù)挖掘算法??梢葬槍?duì)學(xué)生管理基礎(chǔ)課與IT基礎(chǔ)課知識(shí)的掌握情況,選擇合適的工具為學(xué)生設(shè)計(jì)綜合性實(shí)驗(yàn)。實(shí)驗(yàn)中給出部分操作步驟,并在實(shí)驗(yàn)后期僅給出數(shù)據(jù)與工具,讓學(xué)生自己設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)、進(jìn)行數(shù)據(jù)挖掘、并對(duì)挖掘結(jié)果進(jìn)行多種形式的展示。

五、結(jié)論

篇5

大數(shù)據(jù)時(shí)代的到來(lái),計(jì)算機(jī)信息處理技術(shù)也存在著很大風(fēng)險(xiǎn),其中最突出的問(wèn)題是計(jì)算機(jī)病毒以及惡意盜版軟件等,給用戶使用計(jì)算機(jī)產(chǎn)生了極大的消極影響。這些還是一些比較基礎(chǔ)的問(wèn)題,隨著計(jì)算機(jī)技術(shù)的發(fā)展,還出現(xiàn)篡改數(shù)據(jù)、冒名頂替等問(wèn)題,影響計(jì)算機(jī)技術(shù)服務(wù)質(zhì)量,計(jì)算機(jī)信息處理技術(shù)受到了前所未有的考驗(yàn)。另外,大數(shù)據(jù)時(shí)代的到來(lái),還出現(xiàn)了許多新型網(wǎng)絡(luò)技術(shù),針對(duì)一些繁瑣的問(wèn)題能夠有效解決,提高了人們的工作效率,然而,這也在一定程度上降低了網(wǎng)絡(luò)的真實(shí)性,特別是在網(wǎng)絡(luò)交流和溝通日益緊密的前提下,導(dǎo)致網(wǎng)絡(luò)信息真假難分,不僅增加了信息搜索難度,而且致使人們無(wú)法快速獲得真實(shí)信息。因此,提高計(jì)算機(jī)信息處理技術(shù)至關(guān)重要。

2大數(shù)據(jù)時(shí)代計(jì)算機(jī)信息處理技術(shù)

2.1信息采集、加工方面

計(jì)算機(jī)信息處理技術(shù)要進(jìn)行工作,首先,要采集數(shù)據(jù)信息,計(jì)算機(jī)技術(shù)都是建立在數(shù)據(jù)采集基礎(chǔ)之上的,數(shù)據(jù)采集主要是針對(duì)目標(biāo)信息源進(jìn)行實(shí)時(shí)的信息監(jiān)督和控制,并將才覺(jué)得數(shù)據(jù)儲(chǔ)存在計(jì)算機(jī)數(shù)據(jù)庫(kù)中,為各個(gè)軟件提供信息支持,確保下一項(xiàng)工作順利進(jìn)行;其次,對(duì)數(shù)據(jù)信息進(jìn)行加工,按照用戶的要求,對(duì)數(shù)據(jù)信息進(jìn)行加工;最后,將加工好的數(shù)據(jù)信系進(jìn)行分類,最終傳送到用戶手中,實(shí)現(xiàn)數(shù)據(jù)采集、加工以及傳送目標(biāo)。

2.2存儲(chǔ)方面

計(jì)算機(jī)存儲(chǔ)技術(shù)是將采集的信息儲(chǔ)存到計(jì)算機(jī)數(shù)據(jù)庫(kù)之中,在用戶需要某一項(xiàng)信息過(guò)程中,可以通過(guò)數(shù)據(jù)庫(kù)直接將數(shù)據(jù)調(diào)取出來(lái),計(jì)算機(jī)以其儲(chǔ)存量大、速度快等優(yōu)勢(shì),受到人們?cè)絹?lái)越多的關(guān)注,另外,計(jì)算機(jī)技術(shù)還能夠?qū)崿F(xiàn)長(zhǎng)時(shí)間儲(chǔ)存。

2.3信息安全方面

大數(shù)據(jù)時(shí)代的到來(lái),讓人們感受技術(shù)帶來(lái)的便捷的同時(shí),也讓人們意識(shí)到數(shù)據(jù)信息安全對(duì)人們的重要性。因此,為了能夠提高數(shù)據(jù)信息的安全、可靠性,可以通過(guò)以下幾個(gè)方面進(jìn)行:首先,建立計(jì)算機(jī)信息安全體系,加大專業(yè)技術(shù)人才的培養(yǎng)力度,投入資金,為構(gòu)建計(jì)算機(jī)安全體系奠定堅(jiān)實(shí)的基礎(chǔ);其次,加大研究力度,開(kāi)發(fā)信息安全技術(shù)產(chǎn)品。傳統(tǒng)信息安全技已經(jīng)無(wú)法滿足大數(shù)據(jù)時(shí)代數(shù)據(jù)安全需求,為了能夠盡快改善數(shù)據(jù)安全問(wèn)題,應(yīng)加大研究力度,尋求更好的解決方案,有效避免數(shù)據(jù)信息受到威脅;最后,重視對(duì)重要數(shù)據(jù)的檢測(cè),大數(shù)據(jù)時(shí)代的突出特點(diǎn)是數(shù)據(jù)量大,無(wú)法實(shí)現(xiàn)對(duì)每一個(gè)數(shù)據(jù)的檢測(cè)。因此,為了提高數(shù)據(jù)安全系數(shù),應(yīng)加強(qiáng)對(duì)重點(diǎn)數(shù)據(jù)信息的檢測(cè),從而確保數(shù)據(jù)信息安全。

2.4信息處理技術(shù)的發(fā)展

計(jì)算機(jī)硬件具有一定局限性,在一定程度上阻礙了計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展,而云計(jì)算網(wǎng)絡(luò)能夠突破這一弊端。因此,推廣和應(yīng)用云計(jì)算機(jī)網(wǎng)絡(luò)成為未來(lái)大數(shù)據(jù)時(shí)代計(jì)算機(jī)信息處理的主要發(fā)展趨勢(shì)。傳統(tǒng)計(jì)算機(jī)網(wǎng)絡(luò)是將硬件與網(wǎng)絡(luò)有機(jī)結(jié)合,抑制了計(jì)算機(jī)信息處理技術(shù)的發(fā)展,將二者分離開(kāi),促使云計(jì)算主筋形成云計(jì)算網(wǎng)絡(luò),從而構(gòu)建大數(shù)據(jù)信息網(wǎng)絡(luò)系統(tǒng),推動(dòng)我國(guó)社會(huì)不斷發(fā)展。

3結(jié)論

篇6

1.大數(shù)據(jù)的概念和特征

對(duì)于大數(shù)據(jù)時(shí)代,目前通常認(rèn)為有下述四大特征,稱為“四V”特征:第一,數(shù)據(jù)體量巨大(VolumeBig):數(shù)據(jù)量級(jí)已從TB(1TB=210GB)發(fā)展至PB(1PB=210TB)乃至ZB(1ZB=220PB),可稱海量、巨量乃至超量;第二,數(shù)據(jù)類型繁多:越來(lái)越多的為視頻、位置信息、圖像與圖片等半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)信息;第三,價(jià)值密度低,商業(yè)價(jià)值高:以視頻為例,連續(xù)不間斷監(jiān)控過(guò)程中有價(jià)值的數(shù)據(jù)可能僅為一兩秒的數(shù)據(jù)流;第四,處理速度快,處理工具演進(jìn)快:數(shù)據(jù)流往往為高速實(shí)時(shí)數(shù)據(jù)流,而且往往需要快速、持續(xù)的實(shí)時(shí)處理。[2,3]

2.大數(shù)據(jù)時(shí)代對(duì)人才的需求

2013年3月,IDC數(shù)字宇宙報(bào)告《大數(shù)據(jù),更大的數(shù)字身影,最大增長(zhǎng)在遠(yuǎn)東》預(yù)計(jì)到2020年數(shù)字宇宙規(guī)模將達(dá)到40ZB。這意味著需要大量的人力和技術(shù)對(duì)如此龐大的數(shù)據(jù)進(jìn)行處理、分析和管理。在此情況下,對(duì)于大數(shù)據(jù)環(huán)境下新型人才的培養(yǎng)問(wèn)題在近年逐漸受到重視。未來(lái)對(duì)具有大數(shù)據(jù)管理和分析能力的人才需求將快速增長(zhǎng),這些人員除了具備相應(yīng)的技術(shù)能力、管理能力、社交能力、系統(tǒng)分析和開(kāi)發(fā)的能力外,還需要具備深度分析數(shù)據(jù)的能力。同時(shí),一些和大數(shù)據(jù)相關(guān)的職位也會(huì)應(yīng)運(yùn)而生,例如數(shù)據(jù)分析師、數(shù)據(jù)架構(gòu)師等。2011年麥肯錫全球研究所給出的一份報(bào)告預(yù)測(cè),美國(guó)到2018年對(duì)具有良好信息素養(yǎng)的經(jīng)理人才的需求量大約在150萬(wàn)人,此外,還需要14萬(wàn)~19萬(wàn)數(shù)據(jù)分析方面的資深專家。[4]在我國(guó),互聯(lián)網(wǎng)企業(yè)、電子商務(wù)、金融機(jī)構(gòu)、醫(yī)療衛(wèi)生、零售、保險(xiǎn)等行業(yè)及政府?dāng)?shù)據(jù)中心對(duì)大數(shù)據(jù)專業(yè)人才的需求量都很大。

二、大數(shù)據(jù)時(shí)代下山東理工大學(xué)信管專業(yè)培養(yǎng)模式

大數(shù)據(jù)時(shí)代產(chǎn)生對(duì)相關(guān)人才的巨大需求,因此,山東理工大學(xué)(以后簡(jiǎn)稱“我?!保┬殴軐I(yè)提出了新的培養(yǎng)標(biāo)準(zhǔn)和課程設(shè)置體系,培養(yǎng)具有我校特色的信息管理專業(yè)人才。

1.培養(yǎng)目標(biāo)和培養(yǎng)標(biāo)準(zhǔn)

在大數(shù)據(jù)環(huán)境下,重新定位信管專業(yè)的培養(yǎng)目標(biāo)和標(biāo)準(zhǔn),以適應(yīng)“大數(shù)據(jù)”對(duì)專業(yè)人才提出的新要求,是信管專業(yè)建設(shè)的首要議題。我校信管專業(yè)突破國(guó)內(nèi)高校信息管理專業(yè)人才培養(yǎng)的三種主要模式(一是強(qiáng)調(diào)IT技術(shù),弱化了現(xiàn)代管理理論與方法;二是強(qiáng)調(diào)管理又過(guò)于弱化了IT技術(shù);三是IT技術(shù)與管理相融合,但實(shí)際效果不理想),[5]強(qiáng)調(diào)學(xué)生不但要掌握現(xiàn)代信息系統(tǒng)的規(guī)劃、分析、設(shè)計(jì)、實(shí)施和運(yùn)維等方面的方法與技術(shù),更要具有現(xiàn)代管理科學(xué)思想和較強(qiáng)的信息系統(tǒng)開(kāi)發(fā)利用以及數(shù)據(jù)分析處理能力。我校信管專業(yè)還制定了全新的培養(yǎng)標(biāo)準(zhǔn)矩陣(如表1所示),從五大方面28個(gè)小方面更為詳實(shí)地闡述了信管專業(yè)學(xué)生需具備的技能和能力,并為課程的設(shè)置提供了依據(jù)。

2.課程設(shè)置體系

為了滿足大數(shù)據(jù)時(shí)代對(duì)人才提出的新要求,我校信管專業(yè)課程設(shè)置圍繞主干學(xué)科(管理學(xué)、經(jīng)濟(jì)學(xué)、計(jì)算機(jī)科學(xué)與技術(shù)、管理科學(xué)與工程)不僅設(shè)置了國(guó)內(nèi)高校信管專業(yè)常設(shè)的管理學(xué)、統(tǒng)計(jì)學(xué)、管理信息系統(tǒng)、數(shù)據(jù)庫(kù)原理與應(yīng)用、數(shù)據(jù)結(jié)構(gòu)與算法分析、計(jì)算機(jī)網(wǎng)絡(luò)基礎(chǔ)與應(yīng)用、Java程序設(shè)計(jì)、電子商務(wù)等課程外,還設(shè)置了數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘、商務(wù)智能與人工智能等相關(guān)課程,使學(xué)生在理解新興數(shù)據(jù)處理模式的同時(shí),智能化數(shù)據(jù)分析處理及決策支持能力得到訓(xùn)練。與此同時(shí),還設(shè)置了基于移動(dòng)終端的APP開(kāi)發(fā)、企業(yè)信息系統(tǒng)構(gòu)建與仿真、電子商務(wù)平臺(tái)架構(gòu)設(shè)計(jì)等課程,使信管專業(yè)的學(xué)生成為擁有合理知識(shí)結(jié)構(gòu)的復(fù)合型人才。大數(shù)據(jù)時(shí)代下新型的信息管理與信息系統(tǒng)專業(yè)人才的培養(yǎng)既要高度重視理論知識(shí)的學(xué)習(xí),又要加強(qiáng)實(shí)踐能力的培養(yǎng)。為此,我校信管專業(yè)還設(shè)置了工程實(shí)訓(xùn)、軟件實(shí)習(xí)等實(shí)踐項(xiàng)目,以及為期10周的IM&IS應(yīng)用實(shí)踐環(huán)節(jié),為學(xué)生搭建實(shí)踐平臺(tái),拓寬實(shí)踐渠道。通過(guò)3年在校學(xué)習(xí)及總計(jì)約1年的實(shí)踐鍛煉(如圖1所示),我校信管畢業(yè)生不僅具有良好的管理知識(shí)基礎(chǔ)、信息技術(shù)應(yīng)用能力,現(xiàn)代信息系統(tǒng)的開(kāi)發(fā)利用的能力,還具備智能數(shù)據(jù)分析處理工具的操作能力以及綜合數(shù)據(jù)分析處理能力。

3.特色

大數(shù)據(jù)時(shí)代下,我校信管專業(yè)制定了具有自身特色的培養(yǎng)模式,即:培養(yǎng)目標(biāo)和標(biāo)準(zhǔn)與行業(yè)發(fā)展結(jié)合,適應(yīng)大數(shù)據(jù)對(duì)人才能力需求的變化;培養(yǎng)具有綜合分析和管理能力,強(qiáng)調(diào)動(dòng)手能力的新型信管人才。

三、總結(jié)

篇7

心電圖蜂窩大數(shù)據(jù)網(wǎng)絡(luò)系統(tǒng)包括心電圖中心服務(wù)器、報(bào)告診斷中心(可接收由全球各地醫(yī)療機(jī)構(gòu)傳來(lái)的心電信息)、多種檢查設(shè)備(心電圖機(jī)、運(yùn)動(dòng)平板、動(dòng)態(tài)心電圖等)和終端瀏覽器4個(gè)部分。心電圖中心服務(wù)器由數(shù)據(jù)庫(kù)、數(shù)據(jù)儲(chǔ)存和數(shù)據(jù)轉(zhuǎn)換系統(tǒng)組成。它運(yùn)行的系統(tǒng)主要包括:預(yù)約檢查申請(qǐng)模塊系統(tǒng)、排隊(duì)叫號(hào)系統(tǒng)、檢查系統(tǒng)、心電圖輔助分析系統(tǒng)、終端瀏覽系統(tǒng)、專業(yè)查詢及統(tǒng)計(jì)系統(tǒng)。其中,預(yù)約檢查申請(qǐng)模塊與HIS緊密結(jié)合,可準(zhǔn)確查詢到患者的預(yù)約就診信息;排隊(duì)叫號(hào)系統(tǒng)幫助患者及時(shí)了解大約需要的就診等待時(shí)間,以便安排檢查行程。在心電圖檢查結(jié)束后,心電圖機(jī)通過(guò)檢查系統(tǒng)將心電圖數(shù)據(jù)與HIS中的患者信息進(jìn)行匹配,再發(fā)送到心電圖服務(wù)器;服務(wù)器運(yùn)行數(shù)字接收程序(MedExXDTJReceived),將心電圖數(shù)據(jù)入庫(kù)。而報(bào)告診斷中心通過(guò)FTP文件傳送服務(wù)自動(dòng)從服務(wù)器下載病歷數(shù)據(jù),在心電圖輔助分析系統(tǒng)的協(xié)助下,完成心電圖分析、報(bào)告編輯等,保存后自動(dòng)將數(shù)據(jù)上傳到服務(wù)器。醫(yī)生工作站打開(kāi)ECGWeb瀏覽、IE瀏覽等終端瀏覽系統(tǒng),通過(guò)服務(wù)器上的臨床心電圖MedExECGWebSetup服務(wù)程序?yàn)g覽心電圖及報(bào)告[5-6]。

2網(wǎng)絡(luò)系統(tǒng)技術(shù)方案

心電圖蜂窩大數(shù)據(jù)網(wǎng)絡(luò)系統(tǒng)能夠?qū)⒎稚⒌男碾姅?shù)據(jù)進(jìn)行集中儲(chǔ)存、轉(zhuǎn)化、管理、分析和統(tǒng)計(jì),將完成史無(wú)前例的心電大數(shù)據(jù)管理,為全人類的心電學(xué)研究提供全面而豐富的病例資料。除此之外,它還可實(shí)現(xiàn)與各級(jí)醫(yī)療機(jī)構(gòu)的HIS等信息系統(tǒng)的對(duì)接,實(shí)現(xiàn)心電數(shù)據(jù)的共享。該網(wǎng)絡(luò)系統(tǒng)所涉及的相關(guān)技術(shù)包括以下幾方面。

2.1心電設(shè)備網(wǎng)絡(luò)化連接

系統(tǒng)支持將動(dòng)態(tài)心電圖、運(yùn)動(dòng)心電圖、數(shù)字心電圖機(jī)等心電檢查設(shè)備連入網(wǎng)絡(luò),從而實(shí)現(xiàn)全部心電檢查的網(wǎng)絡(luò)化。利用數(shù)字化技術(shù),將心電檢查設(shè)備等所采集的心電信號(hào)數(shù)據(jù)轉(zhuǎn)換成心電圖,發(fā)送到心電圖中心服務(wù)器,實(shí)現(xiàn)全院醫(yī)生的臨床Web瀏覽。

2.2門診與病房技術(shù)支持配備門診預(yù)約、登記、心電檢查網(wǎng)絡(luò)系統(tǒng),與醫(yī)院HIS進(jìn)行無(wú)縫連接。病房將可使用的不同型號(hào)心電設(shè)備之間進(jìn)行數(shù)字連接,以打通與全球心電信息網(wǎng)絡(luò)的聯(lián)系。

2.2.1便攜式心電檢查儀該設(shè)備應(yīng)用于床旁心電圖檢查,支持心電圖的采集、存儲(chǔ)、回放與傳輸。臨床采集心電信號(hào)后,通過(guò)無(wú)線傳輸技術(shù),將心電圖快速傳到心電圖診斷中心,再由診斷中心出具報(bào)告。這樣一來(lái),就實(shí)現(xiàn)了邊檢查、邊報(bào)告,簡(jiǎn)化了以往“檢查后再集中報(bào)告”的傳統(tǒng)流程,為患者節(jié)約了診治時(shí)間[7]。

2.2.2心電診斷中心中心設(shè)有多功能心電分析系統(tǒng),心電圖醫(yī)生根據(jù)專有用戶名和密碼登錄系統(tǒng),不僅可分析已有記錄的波形和參數(shù),還可隨時(shí)調(diào)閱相關(guān)類型的心電圖進(jìn)行對(duì)比分析與統(tǒng)計(jì)等操作;所發(fā)出的心電圖報(bào)告可保存、打印、審核及傳送。目前,山西醫(yī)科大學(xué)第二醫(yī)院在網(wǎng)絡(luò)心電監(jiān)測(cè)診斷方面開(kāi)展了卓有成效的工作:建立有完備的遠(yuǎn)程心電監(jiān)測(cè)中心,構(gòu)建了城市、社區(qū)和農(nóng)村三級(jí)會(huì)診系統(tǒng)服務(wù)模式,并正逐步健全山西省心電監(jiān)測(cè)數(shù)據(jù)庫(kù),為解決省內(nèi)醫(yī)療基礎(chǔ)資料分布不均的問(wèn)題找到了良策。我院自2012年3月起全面開(kāi)展院內(nèi)、院外、院前心電網(wǎng)絡(luò)信息化管理,覆蓋全院所有病房、門/急診和體檢中心,并發(fā)展院外站點(diǎn)51個(gè),年心電圖檢查量達(dá)13萬(wàn)人次,且呈逐年增長(zhǎng)之勢(shì)。

2.2.3心電圖中心服務(wù)器設(shè)立在全球各國(guó)家和地區(qū)或各級(jí)醫(yī)院的服務(wù)器中心,接收特定范圍內(nèi)的心電數(shù)據(jù)并進(jìn)行數(shù)據(jù)儲(chǔ)存及轉(zhuǎn)換,再傳回服務(wù)器所在醫(yī)院的心電圖數(shù)據(jù)管理庫(kù),并提供終端計(jì)算機(jī)的FTP文件傳送服務(wù),與臨床ECGWeb瀏覽、WebService等相應(yīng)匹配。

2.3統(tǒng)計(jì)檢索

該系統(tǒng)具備多種查詢條件,可進(jìn)行醫(yī)生工作量、檢查工作量、設(shè)備工作量等的管理統(tǒng)計(jì)。不僅如此,它還能方便地對(duì)心電圖數(shù)據(jù)進(jìn)行查詢、歸納與統(tǒng)計(jì)分析,為科研創(chuàng)新和教學(xué)工作提供了有力保障。

3全球心電信息網(wǎng)絡(luò)系統(tǒng)設(shè)計(jì)目標(biāo)

當(dāng)今在大數(shù)據(jù)時(shí)代背景下,傳統(tǒng)的心電信息業(yè)務(wù)管理模式正悄然發(fā)生著改變。在傳統(tǒng)模式下,人工干預(yù)過(guò)多,如檢查收費(fèi)、報(bào)告生成等流程皆需人力介入,易造成監(jiān)管混亂;心電圖與患者病史及臨床診斷脫節(jié),難以實(shí)現(xiàn)心電圖數(shù)據(jù)共享;記錄在熱敏紙上的心電圖容易丟失且保存不便,給心電圖分析及科研資料的積累造成很大的困難[6]。隨著全球心電信息網(wǎng)絡(luò)系統(tǒng)的建立,上述問(wèn)題均能引刃而解。它能為心電圖原始資料的積累和共享搭建理想的平臺(tái),還能實(shí)現(xiàn)傳統(tǒng)心電信息業(yè)務(wù)管理模式下無(wú)法完成的目標(biāo):(1)實(shí)現(xiàn)全球各國(guó)、各醫(yī)院區(qū)域范圍內(nèi)的患者基礎(chǔ)資料和心電檢查資料的全面共享。(2)實(shí)現(xiàn)基層醫(yī)院與中心醫(yī)院以及各國(guó)專家之間的心電檢查會(huì)診功能,從而實(shí)現(xiàn)區(qū)域內(nèi)心電圖檢查設(shè)備和高端人才資源的全面共享,乃至從整體上提高全球心電診斷質(zhì)量和衛(wèi)生服務(wù)水平。(3)搭建院前120急救心電圖檢查遠(yuǎn)程診斷平臺(tái),中心醫(yī)院根據(jù)傳回的心電圖報(bào)告及早做好心臟病患者搶救的手術(shù)準(zhǔn)備。(4)提供對(duì)疑難病例的會(huì)診支持。(5)患者能夠在區(qū)域范圍內(nèi)任何一家醫(yī)療機(jī)構(gòu)獲得同等質(zhì)量的心電診斷服務(wù),從而方便患者就近就診且避免重復(fù)檢查。此外,還能夠方便患者上網(wǎng)查詢自己的心電檢查報(bào)告。(6)實(shí)現(xiàn)科研素材與業(yè)務(wù)學(xué)習(xí)資料的方便獲取,解決了基層醫(yī)院心電診斷醫(yī)生工作、培訓(xùn)難以兼顧的難題;能夠促進(jìn)心電工作者在工作中學(xué)習(xí),從而快速提高業(yè)務(wù)素質(zhì)。(7)建立各國(guó)區(qū)域性的心電圖像資料庫(kù)和典型病例數(shù)據(jù)庫(kù),供教學(xué)和科研使用;建立各國(guó)區(qū)域范圍內(nèi)各家醫(yī)院的心電診斷質(zhì)量追蹤數(shù)據(jù)庫(kù),以形成從源頭上把關(guān)的心電診斷質(zhì)控體系,從而全面提升各國(guó)心電診斷水平。(8)促進(jìn)各國(guó)區(qū)域內(nèi)醫(yī)療信息化建設(shè),為今后構(gòu)建基于人體健康檔案的衛(wèi)生信息服務(wù)平臺(tái)奠定基礎(chǔ)。

4結(jié)語(yǔ)

篇8

【關(guān)鍵詞】大數(shù)據(jù)環(huán)境;文書(shū)檔案管理;信息化;企業(yè)發(fā)展

企業(yè)在發(fā)展中各項(xiàng)管理活動(dòng)增多,必然會(huì)生成非常多的企業(yè)文書(shū)檔案,是對(duì)企業(yè)經(jīng)營(yíng)、管理各項(xiàng)信息記錄的保存與管理。在信息化時(shí)代下,企業(yè)發(fā)展離不開(kāi)信息技術(shù),不管是企業(yè)還是機(jī)關(guān)單位,均構(gòu)建了信息化管理平臺(tái),文書(shū)檔案管理信息化趨勢(shì)也加強(qiáng)。信息技術(shù)為載體的管理方法比起傳統(tǒng)文書(shū)檔案管理存儲(chǔ)數(shù)量增大,檔案信息瀏覽與查詢更加便捷,檔案儲(chǔ)存時(shí)間更長(zhǎng),但是依然受到以下因素限制,出現(xiàn)一些管理上的問(wèn)題,仍面臨挑戰(zhàn)。

一、大數(shù)據(jù)環(huán)境與企業(yè)文書(shū)檔案信息化管理

(一)大數(shù)據(jù)概述。人類社會(huì)不斷發(fā)展中以及網(wǎng)絡(luò)行為日漸增多的背景下,作為一種信息記錄與數(shù)據(jù)保存下來(lái)的內(nèi)容就是大數(shù)據(jù),其中不僅包含了生產(chǎn)信息、數(shù)據(jù),還包括其他涉及企業(yè)發(fā)展的隱私。在網(wǎng)絡(luò)逐漸普及下,大數(shù)據(jù)應(yīng)用日漸普遍,儲(chǔ)存容量不斷增大,期間會(huì)產(chǎn)生非常多的難以加工與應(yīng)用的數(shù)據(jù),為應(yīng)用與管理帶來(lái)難度。在數(shù)據(jù)容量不斷增大的背景下,很多用戶可以通過(guò)查詢、文件檢索、下載、加工、復(fù)制等方法應(yīng)用這些數(shù)據(jù),使數(shù)據(jù)復(fù)雜與繁瑣程度進(jìn)一步增大,為管理帶來(lái)了阻礙。

在信息技術(shù)不斷發(fā)展的背景下,各種信息數(shù)據(jù)獲取也更加有難度,激烈的市場(chǎng)競(jìng)爭(zhēng)中誰(shuí)最先獲得了這些信息,誰(shuí)就獲得了發(fā)展機(jī)會(huì),增加了搶占市場(chǎng)的籌碼,對(duì)于數(shù)據(jù)資產(chǎn)的保護(hù)任何企業(yè)都沒(méi)有懈怠過(guò)。大數(shù)據(jù)獲取不僅體現(xiàn)在數(shù)據(jù)源獲得上,更體現(xiàn)在借助這些數(shù)據(jù)源,對(duì)真正有價(jià)值的數(shù)據(jù)進(jìn)一步發(fā)掘,增加數(shù)據(jù)潛在價(jià)值。當(dāng)前,網(wǎng)絡(luò)應(yīng)用體量大幅度增加,大數(shù)據(jù)成為人們生活不可缺少的信息。

(二)企業(yè)文書(shū)檔案與信息化管理概述。企業(yè)文書(shū)系統(tǒng)地記錄了企業(yè)成立到發(fā)展期間各項(xiàng)經(jīng)營(yíng)與管理活動(dòng),比如,財(cái)務(wù)管理、人事管理、外事管理等,都是企業(yè)有顯著價(jià)值的資源,通常,文書(shū)信息由企業(yè)專門部門負(fù)責(zé),包括對(duì)文書(shū)的收集、整理、排列以及轉(zhuǎn)送、開(kāi)發(fā)、處理等。在大數(shù)據(jù)環(huán)境下,企業(yè)文書(shū)檔案信息化管理在信息技術(shù)下會(huì)大大提高管理效率,發(fā)揮其內(nèi)在的服務(wù)價(jià)值。

二、大數(shù)據(jù)環(huán)境下企業(yè)文書(shū)檔案信息化管理的主要內(nèi)容

(一)企業(yè)文書(shū)檔案的數(shù)字化管理。企業(yè)文書(shū)檔案以紙質(zhì)為主,其中記錄著各項(xiàng)文字信息,錄入信息的過(guò)程較為漫長(zhǎng),考驗(yàn)著工作人員的耐心,需要付出一定勞動(dòng),如果信息量龐大,容易出現(xiàn)錄入錯(cuò)誤等,查詢信息時(shí)也較為困難。但是大數(shù)據(jù)下企業(yè)文書(shū)檔案可以實(shí)現(xiàn)信息化管理,應(yīng)用計(jì)算機(jī)的自動(dòng)篩選技術(shù)可以有效節(jié)省人力、物力,提高工作效率。大數(shù)據(jù)環(huán)境下企業(yè)文書(shū)檔案管理一個(gè)顯著特點(diǎn)就是可以對(duì)紙質(zhì)檔案進(jìn)行數(shù)字處理,且不改變檔案中的信息內(nèi)容,更加利于保存、查詢等,這就是電子檔案價(jià)值的體現(xiàn),也是大數(shù)據(jù)環(huán)境下企業(yè)文書(shū)檔案信息化管理的重要內(nèi)容之一。

(二)企業(yè)文書(shū)檔案網(wǎng)絡(luò)化管理。經(jīng)過(guò)從紙質(zhì)到數(shù)字化的轉(zhuǎn)換后,還需要對(duì)數(shù)字化檔案進(jìn)行管理,依據(jù)互聯(lián)網(wǎng)可以進(jìn)行不分時(shí)間、不分地點(diǎn)的修改與添加,使電子檔案更加細(xì)化、具體,用戶查詢更加方便,體現(xiàn)了檔案網(wǎng)絡(luò)化管理的便捷性。企業(yè)文書(shū)檔案利用功能很多,包括網(wǎng)絡(luò)檢索、借閱、歸檔、復(fù)制、分類等。

三、大數(shù)據(jù)環(huán)境中企業(yè)文書(shū)檔案信息化利用

企業(yè)文書(shū)不僅為企業(yè)發(fā)展提供了支持,體現(xiàn)了生產(chǎn)與經(jīng)營(yíng)的價(jià)值,比如,人事管理、財(cái)務(wù)管理、科研成果等,為企業(yè)發(fā)展積累了寶貴經(jīng)驗(yàn),也是企業(yè)發(fā)展成果的體現(xiàn)。由此,企業(yè)文書(shū)檔案參考價(jià)值也很顯著,實(shí)施檔案化管理,可為用戶提供更多、更全面的檔案資源服務(wù)。企業(yè)發(fā)展中還能對(duì)文書(shū)檔案進(jìn)行重建,依據(jù)不同需求提供不同功能的服務(wù),也是大數(shù)據(jù)環(huán)境下企業(yè)文書(shū)檔案信息化服務(wù)的一種體現(xiàn)。與此同時(shí),借助不同地域下的網(wǎng)絡(luò)可供用戶隨時(shí)下載、查詢,使用戶對(duì)企業(yè)文化、產(chǎn)品等的了解更加全面、細(xì)致,還能對(duì)某個(gè)文書(shū)檔案進(jìn)行跟蹤服務(wù),體現(xiàn)開(kāi)放式服務(wù)的優(yōu)勢(shì)。

四、結(jié)語(yǔ)

總之,大數(shù)據(jù)環(huán)境下,企業(yè)文書(shū)檔案在信息技術(shù)基礎(chǔ)上可以為用戶提供更為全面、周到的服務(wù)。在企業(yè)生產(chǎn)日益增多的前提下,人力、物力成本會(huì)逐漸提高,由此,信息化檔案的應(yīng)用可節(jié)省成本與資源,為用戶在查詢、應(yīng)用、下載檔案信息中提供了便利。

【參考文獻(xiàn)】

[1]庫(kù)俊平.大數(shù)據(jù)環(huán)境中企業(yè)文書(shū)檔案的信息化管理及利用[J].創(chuàng)新科技,2013(9):50-51.

[2]江鴻.探析大數(shù)據(jù)環(huán)境中企業(yè)文書(shū)檔案的信息化管理[J].中國(guó)科技投資,2016(4):144.

篇9

論文關(guān)鍵詞:滇池流域,昆明主城,排水系統(tǒng)診斷

 

排水系統(tǒng)是城市基礎(chǔ)設(shè)施重要組成部分,可分為合流制和分流制兩種類型,其中合流制排水系統(tǒng)按雨、污、廢水產(chǎn)生的次序及處理程度的不同可分為直排式合流制、截流處理式合流制和全處理式合流制[1]。排水體制的選擇應(yīng)根據(jù)城鎮(zhèn)和工業(yè)企業(yè)規(guī)劃、當(dāng)?shù)亟涤昵闆r和排放標(biāo)準(zhǔn)、原有排水設(shè)施、污水處理和利用情況、地形和水體等條件,綜合考慮確定,同一城鎮(zhèn)的不同地區(qū)可采用不同的排水制度,新建地區(qū)的排水系統(tǒng)宜采用分流制[2]。

昆明主城地處滇池流域北岸濱湖上游區(qū)域,污染負(fù)荷比重大,占流域污染負(fù)荷總量約80%[3],目前昆明北岸主城二環(huán)路內(nèi)區(qū)域?yàn)楹狭髦婆潘到y(tǒng),二環(huán)路外為分流制排水系統(tǒng),雨季雨、污合流污水溢流污染問(wèn)題嚴(yán)重。為保護(hù)下游滇池水環(huán)境,昆明市政府將雨污分流管網(wǎng)改造和完善工程列為近期治滇重大工程,本研究針對(duì)昆明主城區(qū)排水系統(tǒng)存在的問(wèn)題,在昆明市地下管線探測(cè)工作的基礎(chǔ)上,利用ARCGIS高效的空間分析手段,構(gòu)建排水片區(qū)-子排水片區(qū)-排水單元結(jié)構(gòu)網(wǎng)絡(luò),建立污染源與排水系統(tǒng)拓?fù)潢P(guān)系,對(duì)研究范圍內(nèi)排水系統(tǒng)進(jìn)行全過(guò)程診斷,分析旱季污水收集率和雨季合流污水溢流率水利工程論文,為排水系統(tǒng)完善工程的全面開(kāi)展提供數(shù)據(jù)支持。

1 研究方法

1.1 空間數(shù)據(jù)信息處理

系統(tǒng)空間數(shù)據(jù)信息建立的基礎(chǔ)是原有的以AutoCAD繪制的排水管網(wǎng)圖。由基礎(chǔ)空間要素和管網(wǎng)要素組成,基礎(chǔ)空間要素包括地表構(gòu)筑物、下墊面、道路、河流等;管網(wǎng)要素包括管線和管網(wǎng)中的附屬設(shè)施(雨水篦子、排水口、檢查井、排水泵站等)。需要處理的工作包括以下兩方面:

1.1.1排水系統(tǒng)結(jié)構(gòu)分層

排水單元:可以為一棟樓、一個(gè)庭院、一個(gè)小區(qū)或一個(gè)街區(qū),劃分的依據(jù)為庭院排水管網(wǎng)和市政排水支管系統(tǒng)的相對(duì)獨(dú)立性,其意義在于界定出了排水系統(tǒng)管理和污染控制的最小且有效的可操作對(duì)象。

子排水片區(qū):在排水單元?jiǎng)澐值幕A(chǔ)上,以市政排水干管和輸水泵站為主線索,根據(jù)排水系統(tǒng)主次脈絡(luò),串聯(lián)排水單元,形成基于排水干管和泵站的子排水片區(qū)。

排水片區(qū):即污水處理廠納污范圍,由基于排水干管和輸送泵站的子排水片區(qū)組成。

1.1.2拓?fù)潢P(guān)系構(gòu)建

城市排水空間數(shù)據(jù)龐大、復(fù)雜、多層次,各要素間具有特定關(guān)聯(lián)性,且由此關(guān)聯(lián)性構(gòu)成了排水系統(tǒng)結(jié)構(gòu)。拓?fù)涫欠从晨臻g要素和要素類之間關(guān)系的數(shù)據(jù)模型或格式。利用拓?fù)湟?guī)則可以指定要素類中的要素之間有何種空間關(guān)系,或者多個(gè)不同要素類中的要素之間的空間關(guān)系。系統(tǒng)中涉及到的排水單元、排水管線、檢查井以及其他排水構(gòu)筑物之間的特定關(guān)系利用GIS提供的拓?fù)湟?guī)則建立,并利用拓?fù)涮幚砉δ苓M(jìn)行有效的管理。

1.2屬性數(shù)據(jù)信息處理

針對(duì)主要管網(wǎng)要素,錄入屬性信息論文的格式。

表1管網(wǎng)要素屬性信息

Tab.1 Attribute information of sewageelement

 

要素

數(shù)據(jù)信息

節(jié)點(diǎn)

X、Y坐標(biāo)、井底標(biāo)高、地面標(biāo)高、點(diǎn)源污水排放量(m3/s)、點(diǎn)源污染負(fù)荷排放量(t/s);

管線

管徑、管材、長(zhǎng)度、坡度、埋深、起點(diǎn)標(biāo)高、終點(diǎn)標(biāo)高、起始節(jié)點(diǎn)、終點(diǎn)節(jié)點(diǎn);

篇10

關(guān)鍵詞:區(qū)域發(fā)展;面板數(shù)據(jù)質(zhì)量;信息熵;FCM;可行性論證

中圖分類號(hào):F224.9

文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):

16721101(2015)02003605

Abstract: Based on information entropy from the perspective of data quantity under index system of regional development, this paper establishes the way of evaluation by the standard of information entropy, explores how to improve the information of data using fuzzy c-means algorithm, and validates the the proposed method from theoretical proof and empirical analysis.The paper makes improving experiments via panel data under comprehensive index system of regions of northern Anhui and along the Huaihe river.Its result suggests diversity in data by information entropy standard and marked improvement of information, which lays good basis of better data quality for consequent data mining.

Key words:regional development; quality of panel data; information entropy; fuzzy c-means algorithm; feasibility demonstration

在現(xiàn)代信息技術(shù)迅猛發(fā)展的背景下,越來(lái)越多的領(lǐng)域都采用數(shù)據(jù)驅(qū)動(dòng)的方式進(jìn)行研究。應(yīng)運(yùn)而生的數(shù)據(jù)技術(shù)從傳統(tǒng)的統(tǒng)計(jì)分析到數(shù)據(jù)挖掘,再到現(xiàn)今的云計(jì)算和大數(shù)據(jù)都很好的給生產(chǎn)生活帶來(lái)更多的價(jià)值。但是隨之而來(lái)的數(shù)據(jù)量度和尺度都變得紛繁復(fù)雜,再加上各行業(yè)所取觀測(cè)指標(biāo)的不同使得數(shù)據(jù)在單位、量綱和指標(biāo)含義等客觀情況下呈現(xiàn)很大差異性和不確定性,特別是經(jīng)濟(jì)數(shù)據(jù)指標(biāo)的數(shù)值差距過(guò)大,因此給數(shù)據(jù)技術(shù)方法本身的可行性以及所得結(jié)果的可靠性帶來(lái)很大挑戰(zhàn)。傳統(tǒng)的數(shù)據(jù)預(yù)處理中多采用清理、變換和規(guī)約等方法來(lái)提高數(shù)據(jù)質(zhì)量[1,2],在大多數(shù)文獻(xiàn)中多采用Min-Max標(biāo)準(zhǔn)化[3,4]、Z-score標(biāo)準(zhǔn)化[4]、Decimal scaling小數(shù)定標(biāo)標(biāo)準(zhǔn)化[5]以及Log和Atan函數(shù)轉(zhuǎn)化[6]來(lái)處理數(shù)據(jù),并不著重討論數(shù)據(jù)達(dá)到的質(zhì)量程度。但是由于標(biāo)準(zhǔn)化方法的一些理論局限性,容易在處理中降低數(shù)據(jù)的信息量。所以在研究中如何能夠判斷標(biāo)準(zhǔn)化后數(shù)據(jù)信息量的改變程度,這對(duì)采用的技術(shù)方法本身和后續(xù)結(jié)果分析將起到重要的作用。本文將嘗試探討數(shù)據(jù)信息量衡量熵標(biāo)準(zhǔn),并從理論層面和結(jié)合皖北沿淮區(qū)域經(jīng)濟(jì)發(fā)展數(shù)據(jù)做相應(yīng)的實(shí)證分析。

一、構(gòu)建熵標(biāo)準(zhǔn)下FCM分類改進(jìn)模型

(一)信息熵與FCM準(zhǔn)備

1.數(shù)據(jù)質(zhì)量的信息熵標(biāo)準(zhǔn)

熱力學(xué)第二定律表明孤立系統(tǒng)中任何變化都不可能減少熵值,1948年Shannon定義通信信號(hào)中平均信息量為熵[7],從此熵作為衡量信息量的一種方式被廣泛應(yīng)用。信息熵是數(shù)據(jù)含載信息程度的一種度量方式,當(dāng)信息熵越大時(shí)表明數(shù)據(jù)越無(wú)序,需要理清數(shù)據(jù)所需信息就越多,也說(shuō)明數(shù)據(jù)的信息量越大。離散隨機(jī)變量的信息熵定義為自信息的平均值

H(X)=Ep(x)[I(x)]=-∑xp(x)logp(x)

其中I(x)為事件的自信息,Ep(x)表示對(duì)隨機(jī)變量的概率取平均運(yùn)算。其具有熵的非負(fù)性、對(duì)稱性、擴(kuò)展性和可加性等相關(guān)性質(zhì)。

2.模糊C均值聚類FCM

模糊C均值聚類[8,9](FCM)是由Bezdek在1981年提出的一種模糊分類方法,F(xiàn)CM需要根據(jù)類中距和類間距構(gòu)造分類準(zhǔn)則,利用預(yù)先給定的分類數(shù)C對(duì)所給樣本點(diǎn)進(jìn)行分類。即求解規(guī)劃問(wèn)題:

minJm(U,Z,c)=∑ci=1∑Nk=1μhikd2ik,

s.t.∑ci=1μik=1,l≤k≤N;0≤μik≤1;

通過(guò)求解上面規(guī)劃問(wèn)題,利用得到的隸屬矩陣Uik=∑cj=1(dikdjk)-2m-1和聚類中心

Ci=∑nk=1umikXk∑nk=1umik,進(jìn)行迭代運(yùn)算得到分類結(jié)果。

(二) 熵標(biāo)準(zhǔn)下FCM分類改進(jìn)模型

由于熵值代表了數(shù)據(jù)的信息量,而通過(guò)衡量信息量可以產(chǎn)生評(píng)價(jià)策略,陳衍泰等在綜合評(píng)價(jià)方法分類的研究中總結(jié)了信息熵方法應(yīng)用在評(píng)價(jià)領(lǐng)域的情況[10],張樹(shù)森等將熵與聚類算法結(jié)合提出改進(jìn)的模糊聚類算法EFC[11],韓宇平等將最大熵原理用于評(píng)價(jià)區(qū)域水資源短缺問(wèn)題[12],劉紅琴等將信息熵應(yīng)用到能源消費(fèi)的分配衡量中[13],本文考慮將信息熵引入到數(shù)據(jù)質(zhì)量的評(píng)價(jià)中。

再由于區(qū)域發(fā)展數(shù)據(jù)在數(shù)值上差距過(guò)大,如果僅僅統(tǒng)一進(jìn)行z-score標(biāo)準(zhǔn)化處理則可能帶來(lái)信息損失,本文考慮利用FCM方法將數(shù)據(jù)進(jìn)行分類標(biāo)準(zhǔn)化,這樣也同時(shí)帶來(lái)數(shù)據(jù)扁平化特征,而由離散最大熵定理[7]可知,數(shù)據(jù)出現(xiàn)概率越相同,那么數(shù)據(jù)的信息熵越大。

設(shè)n維數(shù)據(jù)集{xi}ni=1進(jìn)行z-score標(biāo)準(zhǔn)化后{xi-μσ}ni=1在D段中出現(xiàn)的概率為{Pj(x)}Dj=1,利用FCM對(duì)數(shù)據(jù)分C類后原始數(shù)據(jù)重新組合變?yōu)閧xij}i=1,…C,j=1…ni,在每個(gè)數(shù)據(jù)集中表轉(zhuǎn)化得到數(shù)據(jù)集{xij-μiσ}i=1,…C,j=1…ni在D段中出現(xiàn)的概率為{Qj(x)}Dj=1,當(dāng)分段數(shù)D足夠體現(xiàn)數(shù)據(jù)概率分布時(shí)Q(x)比P(x)更加趨近相同概率。利用P(x)對(duì)Q(x)的散度D(P//Q)非負(fù)特征,有如下推導(dǎo):

D(P//Q)=∑xP(x)logP(x)Q(x)=

∑xP(x)logP(x)-

∑xP(x)logQ(x)≥0

Hp(x)=-

∑xP(x)logP(x)≤

-∑xP(x)logQ(x)≤-

∑xQ(x)logQ(x)=HQ(x)

因此在分類標(biāo)準(zhǔn)化后的數(shù)據(jù)信息量比直接標(biāo)準(zhǔn)化的信息量要大。從分類的角度來(lái)看,分類后數(shù)據(jù)標(biāo)準(zhǔn)化數(shù)值會(huì)產(chǎn)生比整體標(biāo)準(zhǔn)化更多的多樣性,從而帶來(lái)的信息量的增加,而數(shù)據(jù)信息量的增加也給后續(xù)的研究方法提供更好的數(shù)據(jù)質(zhì)量。

二、基于區(qū)域發(fā)展面板數(shù)據(jù)的實(shí)證分析

(一)指標(biāo)體系構(gòu)建與數(shù)據(jù)來(lái)源說(shuō)明

1.區(qū)域發(fā)展指標(biāo)體系構(gòu)建

結(jié)合前期工作制定指標(biāo)體系[14]21,指標(biāo)的選取原則兼顧經(jīng)濟(jì)、生活、環(huán)境、社會(huì)、特征產(chǎn)業(yè)和可持續(xù)發(fā)展的指標(biāo)體系,構(gòu)建一級(jí)指標(biāo),細(xì)化二級(jí)指標(biāo)共選取5個(gè)一級(jí)指標(biāo)和69個(gè)二級(jí)指標(biāo)如圖1所示,并由此構(gòu)建整體指標(biāo)模型和各級(jí)別體系。

具體指標(biāo)表現(xiàn)為:(1)在經(jīng)濟(jì)發(fā)展與產(chǎn)業(yè)結(jié)構(gòu)方面:GDP;城鎮(zhèn)固定資產(chǎn)投資額;出口總額;進(jìn)口總額;農(nóng)業(yè)總產(chǎn)值;工業(yè)總產(chǎn)值;建筑業(yè)鄉(xiāng)村從業(yè)人員數(shù);交通運(yùn)輸、倉(cāng)儲(chǔ)及郵政業(yè)鄉(xiāng)村從業(yè)人員數(shù);鄉(xiāng)村私營(yíng)企業(yè)從業(yè)人員數(shù);農(nóng)、林、牧、漁業(yè)鄉(xiāng)村從業(yè)人員數(shù);鄉(xiāng)村個(gè)體從業(yè)人員數(shù);工業(yè)從業(yè)人員年平均人數(shù);城鎮(zhèn)房地產(chǎn)開(kāi)發(fā)投資額;(2)民生能力與生活質(zhì)量:職工工資總額;總戶數(shù);農(nóng)民人均純收入;城鄉(xiāng)居民儲(chǔ)蓄存款余額;社會(huì)消費(fèi)品零售總額;城鎮(zhèn)居民最低生活保障人數(shù);新型農(nóng)村合作醫(yī)療參合率;建成區(qū)綠化覆蓋率;城市出租汽車數(shù);公共汽(電)車客運(yùn)總量(市轄區(qū));人口自然增長(zhǎng)率;城市公共汽(電)車客運(yùn)總量;城市每萬(wàn)人擁有公共交通車輛數(shù);城市人口密度;人口密度;基本養(yǎng)老保險(xiǎn)基金支出;基本醫(yī)療保險(xiǎn)參保人數(shù);人均公園綠地面積;(3)政府管理與社會(huì)服務(wù):財(cái)政收入;財(cái)政支出;財(cái)政用于教育的支出;財(cái)政支出中衛(wèi)生經(jīng)費(fèi);等級(jí)公路里程;公路貨物周轉(zhuǎn)量;公路旅客周轉(zhuǎn)量;公路客運(yùn)量;鐵路客運(yùn)量;城市道路長(zhǎng)度;城市供水總量;城市清掃保潔面積;城市天然氣供氣量;地質(zhì)災(zāi)害防治投資;城市公園數(shù);街道辦事處數(shù)量;(4)資源實(shí)力與可持續(xù)發(fā)展:降水量;人均水資源量;土地面積;林業(yè)用地面積;水田耕地面積;城市污水排放量;生活垃圾無(wú)害化處理率;城市排水管道長(zhǎng)度;城市污水處理率;工業(yè)廢氣排放量;工業(yè)廢水排放量;“三廢”綜合利用產(chǎn)品產(chǎn)值;(5)教育產(chǎn)業(yè)與創(chuàng)新科技:財(cái)政用于教育的支出;普通高等學(xué)校數(shù);普通高等學(xué)校在校學(xué)生數(shù);普通高中在校學(xué)生數(shù);普通小學(xué)在校生數(shù);發(fā)明專利申請(qǐng)受理量;發(fā)明專利授權(quán)量;科技活動(dòng)人員數(shù);

圖1綜合區(qū)域發(fā)展指標(biāo)結(jié)構(gòu)圖

基于以上初步指標(biāo)體系充分涵蓋從經(jīng)濟(jì)發(fā)展到人民生活,從政府能力到社會(huì)服務(wù),從可持續(xù)發(fā)展到特色產(chǎn)業(yè)的方方面面,兼顧發(fā)展的效率、速度、質(zhì)量、潛力和能力。但是在數(shù)據(jù)收集中往往遇到很多實(shí)際情況需要做修正,對(duì)于少部分的數(shù)據(jù)遺漏采用數(shù)據(jù)擬合回歸和缺省值補(bǔ)充等傳統(tǒng)數(shù)據(jù)預(yù)處理方法進(jìn)行修整[1],對(duì)于大部分的數(shù)據(jù)遺漏則采用指標(biāo)替換的方式進(jìn)行變通。

2.面板數(shù)據(jù)來(lái)源說(shuō)明

本文依托皖北沿淮地區(qū)6市39縣區(qū)的區(qū)域發(fā)展研究,因?yàn)樵谕畋毖鼗吹貐^(qū)中蚌埠市和淮南市具有相同的地緣特征和相似生活特征,所以對(duì)兩個(gè)地區(qū)指標(biāo)的衡量具有很好的實(shí)際意義,故而采用2005年到2012年蚌埠市和淮南市數(shù)據(jù),數(shù)據(jù)來(lái)源于中國(guó)知網(wǎng)提供的《中國(guó)統(tǒng)計(jì)年鑒》、《中國(guó)城市統(tǒng)計(jì)年鑒》和各地區(qū)發(fā)展統(tǒng)計(jì)年鑒等。同時(shí)本文數(shù)據(jù)屬于面板數(shù)據(jù),可以克服時(shí)間序列分析受多重共線性的困擾,能夠提供更多信息、變化、自由度和估計(jì)效率。

(二)具體實(shí)證分析

本文的具體實(shí)證分析分為以下三個(gè)方面:(1)對(duì)于原始數(shù)據(jù)的處理過(guò)程:按照論文前面介紹的科學(xué)指標(biāo)模型和數(shù)據(jù)采集來(lái)源,將兩個(gè)城市69個(gè)屬性從2005年到2012年共8年的數(shù)據(jù)進(jìn)行矩陣化,得到一個(gè)138行8列的原始數(shù)據(jù)矩陣,對(duì)于原始數(shù)據(jù)矩陣中的缺省值采用外插和內(nèi)插法進(jìn)行相應(yīng)的差值擬合得到完整的使用數(shù)據(jù)。(2)對(duì)于使用數(shù)據(jù)的分析過(guò)程:第一步根據(jù)本文前期工作[14]22通過(guò)對(duì)數(shù)據(jù)進(jìn)行譜系聚類、HCM和FCM三種聚類方法,采用Matlab2012b進(jìn)行編程,比較從分2類到分10類的由R方統(tǒng)計(jì)量和偽F統(tǒng)計(jì)量得到的半偏相關(guān)統(tǒng)計(jì)量SPRSQ數(shù)值,發(fā)現(xiàn)當(dāng)分三類時(shí)譜系聚類方法和HCM的SPRSQ數(shù)值達(dá)到最高值分別為0.400 1和0.023 9,而FCM的SPRSQ數(shù)值在分四類時(shí)達(dá)到最高值0.027 0,因此在進(jìn)行分類構(gòu)建信息熵時(shí),將分三類和分四類的情況均予以考慮。第二步根據(jù)論文前面討論的信息熵構(gòu)建過(guò)程進(jìn)行分類信息熵構(gòu)建,首先將利用FCM對(duì)數(shù)據(jù)分三類和分四類得到的數(shù)據(jù)集

{xij}i=1,…C,j=1…ni(其中C=3或者4),在每個(gè)數(shù)據(jù)集進(jìn)行z-score標(biāo)準(zhǔn)化:{xij-μiσi}i=1,…C,j=1…ni;然后討論這些數(shù)據(jù)在分D段中出現(xiàn)的概率{Qj(x)}Dj=1,其中分段數(shù)D的大小要足夠體現(xiàn)數(shù)據(jù)概率分布特征 [7,11]取D分別為10和20兩種情況,計(jì)算相關(guān)信息熵?cái)?shù)值H(X)=

EQ(x)[I(x)]=-∑xQ(x)logQ(x)

;最后通過(guò)和沒(méi)有進(jìn)行分段改進(jìn)的原始數(shù)據(jù)集的未標(biāo)準(zhǔn)化和統(tǒng)一標(biāo)準(zhǔn)化兩種情況進(jìn)行比較得到相關(guān)結(jié)論。(3)對(duì)于數(shù)值比較的分析結(jié)果:通過(guò)比較未標(biāo)準(zhǔn)化、普通的列統(tǒng)一標(biāo)準(zhǔn)化和采用FCM分三類和四類的類標(biāo)準(zhǔn)化的三種方法在取分段數(shù)為10和20下的信息熵大小,得到了相關(guān)的數(shù)值結(jié)果表1。

對(duì)表1中的相關(guān)數(shù)值做圖進(jìn)行直觀的表達(dá),可以得到在分10段情況下的圖2和分20段情況下的圖3,其中橫坐標(biāo)為從2005年到2012年每一年的數(shù)據(jù)情況,從圖中可以發(fā)現(xiàn)不論哪一年的數(shù)據(jù)數(shù)值在分類標(biāo)準(zhǔn)化后的熵值都高于圖中最下面的線,即統(tǒng)一標(biāo)準(zhǔn)化的數(shù)據(jù)熵值。

從以上圖表的結(jié)果來(lái)看,采用FCM算法對(duì)于數(shù)據(jù)分類標(biāo)準(zhǔn)化后得到的信息熵提升效果是明顯的,具體可以概括為以下的一些結(jié)論:

1.未標(biāo)準(zhǔn)化和統(tǒng)一標(biāo)準(zhǔn)化的結(jié)果數(shù)值完全一樣,這是因?yàn)閦-score標(biāo)準(zhǔn)化過(guò)程并不改變數(shù)據(jù)分布特征,因此他們擁有相同的概率分布,則信息熵也完全一致,故而數(shù)據(jù)所含信息不變,因此在作圖階段就不體現(xiàn)未標(biāo)準(zhǔn)化的結(jié)果圖形。

2.分段標(biāo)準(zhǔn)化后所有的數(shù)據(jù)結(jié)果均大于統(tǒng)一標(biāo)準(zhǔn)化的數(shù)據(jù)值,即信息熵在分段標(biāo)準(zhǔn)化后都有顯著提高,這和理論推導(dǎo)的結(jié)果一致。故而分段標(biāo)準(zhǔn)化的方法可以有效消除量綱差異,同時(shí)還能有效的提高數(shù)據(jù)信息熵,從而使得數(shù)據(jù)含有更好的信息量。

3.就分段標(biāo)準(zhǔn)化而言從所有列信息熵的總和數(shù)值可以發(fā)現(xiàn),在兩種最佳聚類數(shù)時(shí)信息熵的總和情況分別可以表示為:分10段3類時(shí)的9.07高于4類時(shí)的7.8,分20段3類時(shí)的12.19高于4類時(shí)的11;同時(shí)數(shù)據(jù)信息熵隨著分段的增大數(shù)值也在增大,這是信息熵本身性質(zhì)所決定的,因?yàn)榉侄卧蕉喔怕史植荚浇咏鶆蚍植迹呻x散最大熵定理以及本文理論推導(dǎo)可知數(shù)據(jù)信息熵在增加。但是如果分段過(guò)多,甚至達(dá)到數(shù)據(jù)總量的一定比例,此時(shí)再高的信息熵?cái)?shù)值也并不能夠說(shuō)明很好的信息量,所以在分段數(shù)的選取需要與數(shù)據(jù)總量相互匹配。

三、結(jié)論

根據(jù)以上論證發(fā)現(xiàn),從理論角度和實(shí)證分析都驗(yàn)證了分類標(biāo)準(zhǔn)化可以有效的提高數(shù)據(jù)信息量。所以在相應(yīng)數(shù)據(jù)分析方法使用之前,對(duì)于數(shù)據(jù)標(biāo)準(zhǔn)化處理階段可以嘗試采用分類標(biāo)準(zhǔn)化的方式,這樣既可以消除數(shù)據(jù)量綱差異,也可以有效的提高數(shù)據(jù)含載信息,為進(jìn)一步使用數(shù)據(jù)挖掘方法得到更好的數(shù)據(jù)結(jié)論提供較好的前期準(zhǔn)備。

同時(shí)由于在數(shù)據(jù)集統(tǒng)一標(biāo)準(zhǔn)化中均值唯一,相當(dāng)于只有一個(gè)中心節(jié)點(diǎn)。但是在分類標(biāo)準(zhǔn)化后,在不同類中都有相應(yīng)的均值作為中心節(jié)點(diǎn),所以分類標(biāo)準(zhǔn)化比傳統(tǒng)的統(tǒng)一標(biāo)準(zhǔn)化更符合現(xiàn)代互聯(lián)網(wǎng)思維,那就是去中心化和多節(jié)點(diǎn)多分類,以及扁平化結(jié)構(gòu)體系的相關(guān)思想。參考文獻(xiàn):

[1]Jiawei Han.Data Mining Concepts and Techniques, Second Edition[M].BeiJing: China Machine Press,2008:30-65.

[2]韓京宇.數(shù)據(jù)質(zhì)量研究綜述[J].計(jì)算機(jī)科學(xué),2008(2):1-5.

[3]程惠芳,唐輝亮.開(kāi)放條件下區(qū)域經(jīng)濟(jì)轉(zhuǎn)型升級(jí)綜合能力評(píng)價(jià)研究――中國(guó)31個(gè)省市轉(zhuǎn)型升級(jí)評(píng)價(jià)指標(biāo)體系分析[J].管理世界,2011(8):173-174.

[4]張鋼.長(zhǎng)江三角洲16個(gè)城市政府能力的比較研究[J].管理世界,2004(8):18-27.

[5]安悅.基于微博客的手機(jī)供應(yīng)商排名推薦[J].數(shù)學(xué)的認(rèn)識(shí)與實(shí)踐,2013(10):23-29.

[6]汪冬華.我國(guó)滬深300股指期貨和現(xiàn)貨市場(chǎng)的交叉相關(guān)性及其風(fēng)險(xiǎn)[J].系統(tǒng)工程理論與實(shí)踐,2014(3):631-639.

[7]田寶玉.信息論基礎(chǔ)[M].北京:人民郵電出版社,2008:18-26.

[8]史小松,黃勇杰,劉永革.數(shù)據(jù)挖掘技術(shù)中聚類的幾種常用方法比較[J].中國(guó)科技信息,2009(20):99-105.

[9]諸克軍,蘇順華,黎金玲.模糊C均值中的最優(yōu)聚類與最佳聚類數(shù)[J].系統(tǒng)工程理論與實(shí)踐,2005(3):52-61.

[10]陳衍泰.綜合評(píng)價(jià)方法分類及研究進(jìn)展[J].管理科學(xué)學(xué)報(bào),2004(2):69-77.

[11]張樹(shù)森.改進(jìn)的基于熵的中心聚類算法[J].計(jì)算機(jī)與現(xiàn)代化,2014(3):53-56.

[12]韓宇平.基于最大熵原理的區(qū)域水資源短缺風(fēng)險(xiǎn)綜合評(píng)估[J].安徽農(nóng)業(yè)科學(xué),2011(1):397-399.

[13]劉紅琴.基于信息熵的省域內(nèi)能源消費(fèi)總量分配研究[J].長(zhǎng)江流域資源與環(huán)境,2014(4):482-489.