大數(shù)據(jù)技術(shù)論文范文
時(shí)間:2023-04-05 20:56:39
導(dǎo)語(yǔ):如何才能寫(xiě)好一篇大數(shù)據(jù)技術(shù)論文,這就需要搜集整理更多的資料和文獻(xiàn),歡迎閱讀由公務(wù)員之家整理的十篇范文,供你借鑒。
篇1
大數(shù)據(jù)背景下的機(jī)器算法
專(zhuān)業(yè)
計(jì)算機(jī)科學(xué)與技術(shù)
學(xué)生姓名
楊宇瀟
學(xué)號(hào)
181719251864
一、 選題的背景、研究現(xiàn)狀與意義
為什么大數(shù)據(jù)分析很重要?大數(shù)據(jù)分析可幫助組織利用其數(shù)據(jù)并使用它來(lái)識(shí)別新的機(jī)會(huì)。反過(guò)來(lái),這將導(dǎo)致更明智的業(yè)務(wù)移動(dòng),更有效的運(yùn)營(yíng),更高的利潤(rùn)和更快樂(lè)的客戶。
在許多早期的互聯(lián)網(wǎng)和技術(shù)公司的支持下,大數(shù)據(jù)在2000年代初的數(shù)據(jù)熱潮期間出現(xiàn)。有史以來(lái)第一次,軟件和硬件功能是消費(fèi)者產(chǎn)生的大量非結(jié)構(gòu)化信息。搜索引擎,移動(dòng)設(shè)備和工業(yè)機(jī)械等新技術(shù)可提供公司可以處理并持續(xù)增長(zhǎng)的數(shù)據(jù)。隨著可以收集的天文數(shù)據(jù)數(shù)量的增長(zhǎng),很明顯,傳統(tǒng)數(shù)據(jù)技術(shù)(例如數(shù)據(jù)倉(cāng)庫(kù)和關(guān)系數(shù)據(jù)庫(kù))不適合與大量非結(jié)構(gòu)化數(shù)據(jù)一起使用。 Apache軟件基金會(huì)啟動(dòng)了第一個(gè)大數(shù)據(jù)創(chuàng)新項(xiàng)目。最重要的貢獻(xiàn)來(lái)自Google,Yahoo,F(xiàn)acebook,IBM,Academia等。最常用的引擎是:ApacheHive / Hadoop是復(fù)雜數(shù)據(jù)準(zhǔn)備和ETL的旗艦,可以為許多數(shù)據(jù)存儲(chǔ)或分析環(huán)境提供信息以進(jìn)行深入分析。 Apache Spark(由加州大學(xué)伯克利分校開(kāi)發(fā))通常用于大容量計(jì)算任務(wù)。這些任務(wù)通常是批處理ETL和ML工作負(fù)載,但與Apache Kafka等技術(shù)結(jié)合使用。
隨著數(shù)據(jù)呈指數(shù)級(jí)增長(zhǎng),企業(yè)必須不斷擴(kuò)展其基礎(chǔ)架構(gòu)以最大化其數(shù)據(jù)的經(jīng)濟(jì)價(jià)值。在大數(shù)據(jù)的早期(大約2008年),Hadoop被大公司首次認(rèn)可時(shí),維護(hù)有用的生產(chǎn)系統(tǒng)非常昂貴且效率低下。要使用大數(shù)據(jù),您還需要適當(dāng)?shù)娜藛T和軟件技能,以及用于處理數(shù)據(jù)和查詢速度的硬件。協(xié)調(diào)所有內(nèi)容同時(shí)運(yùn)行是一項(xiàng)艱巨的任務(wù),許多大數(shù)據(jù)項(xiàng)目都將失敗。如今,云計(jì)算已成為市場(chǎng)瞬息萬(wàn)變的趨勢(shì)。因?yàn)楦鞣N規(guī)模的公司都可以通過(guò)單擊幾下立即訪問(wèn)復(fù)雜的基礎(chǔ)架構(gòu)和技術(shù)。在這里,云提供了強(qiáng)大的基礎(chǔ)架構(gòu),使企業(yè)能夠勝過(guò)現(xiàn)有系統(tǒng)。
二、 擬研究的主要內(nèi)容(提綱)和預(yù)期目標(biāo)
隨著行業(yè)中數(shù)據(jù)量的爆炸性增長(zhǎng),大數(shù)據(jù)的概念越來(lái)越受到關(guān)注。 由于大數(shù)據(jù)的大,復(fù)雜和快速變化的性質(zhì),許多用于小數(shù)據(jù)的傳統(tǒng)機(jī)器學(xué)習(xí)算法不再適用于大數(shù)據(jù)環(huán)境中的應(yīng)用程序問(wèn)題。 因此,在大數(shù)據(jù)環(huán)境下研究機(jī)器學(xué)習(xí)算法已成為學(xué)術(shù)界和業(yè)界的普遍關(guān)注。 本文主要討論和總結(jié)用于處理大數(shù)據(jù)的機(jī)器學(xué)習(xí)算法的研究現(xiàn)狀。 另外,由于并行處理是處理大數(shù)據(jù)的主要方法,因此我們介紹了一些并行算法,介紹了大數(shù)據(jù)環(huán)境中機(jī)器學(xué)習(xí)研究所面臨的問(wèn)題,最后介紹了機(jī)器學(xué)習(xí)的研究趨勢(shì),我們的目標(biāo)就是研究數(shù)據(jù)量大的情況下算法和模型的關(guān)系,同時(shí)也會(huì)探討大部分細(xì)分行業(yè)數(shù)據(jù)量不大不小的情況下算法的關(guān)系。
三、 擬采用的研究方法(思路、技術(shù)路線、可行性分析論證等)
1.視覺(jué)分析。大數(shù)據(jù)分析用戶包括大數(shù)據(jù)分析專(zhuān)業(yè)人士和一般用戶,但是大數(shù)據(jù)分析的最基本要求是視覺(jué)分析。視覺(jué)分析直觀地介紹了大數(shù)據(jù)的特征,并像閱讀照片的讀者一樣容易接受。 2.數(shù)據(jù)挖掘算法。大數(shù)據(jù)分析的理論中心是數(shù)據(jù)挖掘算法。不同的數(shù)據(jù)挖掘算法依賴于不同的數(shù)據(jù)類(lèi)型和格式來(lái)更科學(xué)地表征數(shù)據(jù)本身。由于它們被全世界的統(tǒng)計(jì)學(xué)家所公認(rèn),因此各種統(tǒng)計(jì)方法(稱為真值)可以深入到數(shù)據(jù)中并挖掘公認(rèn)的值。另一方面是這些數(shù)據(jù)挖掘算法可以更快地處理大數(shù)據(jù)。如果該算法需要花費(fèi)幾年時(shí)間才能得出結(jié)論,那么大數(shù)據(jù)的價(jià)值是未知的。 3.預(yù)測(cè)分析。大數(shù)據(jù)分析的最后一個(gè)應(yīng)用領(lǐng)域是預(yù)測(cè)分析,發(fā)現(xiàn)大數(shù)據(jù)功能,科學(xué)地建立模型以及通過(guò)模型吸收新數(shù)據(jù)以預(yù)測(cè)未來(lái)數(shù)據(jù)。 4.語(yǔ)義引擎。非結(jié)構(gòu)化數(shù)據(jù)的多樣化為數(shù)據(jù)分析提出了新的挑戰(zhàn)。您需要一套工具來(lái)分析和調(diào)整數(shù)據(jù)。語(yǔ)義引擎必須設(shè)計(jì)有足夠的人工智能,以主動(dòng)從數(shù)據(jù)中提取信息。 5.數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理。大數(shù)據(jù)分析是數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理的組成部分。高質(zhì)量的數(shù)據(jù)和有效的數(shù)據(jù)管理確保了分析結(jié)果在學(xué)術(shù)研究和商業(yè)應(yīng)用中的可靠性和價(jià)值。大數(shù)據(jù)分析的基礎(chǔ)是前五個(gè)方面。當(dāng)然,如果您更深入地研究大數(shù)據(jù)分析,則還有更多特征,更深入,更專(zhuān)業(yè)的大數(shù)據(jù)分析方法。
四、 論文(設(shè)計(jì))的工作進(jìn)度安排
2020.03.18-2020.03.20 明確論文內(nèi)容,進(jìn)行相關(guān)論文資料的查找與翻譯。2020.04.04-2020.04.27:撰寫(xiě)開(kāi)題報(bào)告 。
2020.04.28-2020.04.30 :設(shè)計(jì)實(shí)驗(yàn)。
2020.05.01-2020.05.07 :開(kāi)展實(shí)驗(yàn)。
2020.05.08-2020.05.15 :準(zhǔn)備中期檢查。
2020.05.16-2020.05.23:根據(jù)中期檢查的問(wèn)題,進(jìn)一步完善實(shí)驗(yàn)2020.05.24-2020.05.28 :完成論文初稿。
2020.05.29-2020.06.26 :論文修改完善。
五、 參考文獻(xiàn)(不少于5篇)
1 . 王偉,王珊,杜小勇,覃雄派,王會(huì)舉.大數(shù)據(jù)分析——rdbms與mapreduce的競(jìng)爭(zhēng)與共生 .計(jì)算機(jī)光盤(pán)軟件與應(yīng)用,2012.被引量:273.
2 . 喻國(guó)明. 大數(shù)據(jù)分析下的中國(guó)社會(huì)輿情:總體態(tài)勢(shì)與結(jié)構(gòu)性特征——基于百度熱搜詞(2009—2 012)的輿情模型構(gòu)建.中國(guó)人民大學(xué)學(xué)報(bào),2013.被引量:9. 3 . 李廣建,化柏林.大數(shù)據(jù)分析與情報(bào)分析關(guān)系辨析.中國(guó)圖書(shū)館學(xué)報(bào),2014.被引量:16.
4 . 王智,于戈,郭朝鵬,張一川,宋杰.大數(shù)據(jù)分析的分布式molap技術(shù) .軟件學(xué)報(bào),2014.被引量:6.
5 . 王德文,孫志偉.電力用戶側(cè)大數(shù)據(jù)分析與并行負(fù)荷預(yù)測(cè) .中國(guó)電機(jī)工程學(xué)報(bào),2015.被引量:19.
6 . 江秀臣,杜修明,嚴(yán)英杰,盛戈皞,陳玉峰 ,郭志紅.基于大數(shù)據(jù)分析的輸變電設(shè)備狀態(tài)數(shù)據(jù)異常檢測(cè)方法 .中國(guó)電機(jī)工程學(xué)報(bào),2015.被引量:8.
7 . 喻國(guó)明. 呼喚“社會(huì)最大公約數(shù)”:2012年社會(huì)輿情運(yùn)行態(tài)勢(shì)研究——基于百度熱搜詞的大 數(shù)據(jù)分析.編輯之友,2013.被引量:4.
六、指導(dǎo)教師意見(jiàn)
簽字: 年 月 日
七、學(xué)院院長(zhǎng)意見(jiàn)及簽字
篇2
大數(shù)據(jù)時(shí)代的到來(lái),計(jì)算機(jī)信息處理技術(shù)也存在著很大風(fēng)險(xiǎn),其中最突出的問(wèn)題是計(jì)算機(jī)病毒以及惡意盜版軟件等,給用戶使用計(jì)算機(jī)產(chǎn)生了極大的消極影響。這些還是一些比較基礎(chǔ)的問(wèn)題,隨著計(jì)算機(jī)技術(shù)的發(fā)展,還出現(xiàn)篡改數(shù)據(jù)、冒名頂替等問(wèn)題,影響計(jì)算機(jī)技術(shù)服務(wù)質(zhì)量,計(jì)算機(jī)信息處理技術(shù)受到了前所未有的考驗(yàn)。另外,大數(shù)據(jù)時(shí)代的到來(lái),還出現(xiàn)了許多新型網(wǎng)絡(luò)技術(shù),針對(duì)一些繁瑣的問(wèn)題能夠有效解決,提高了人們的工作效率,然而,這也在一定程度上降低了網(wǎng)絡(luò)的真實(shí)性,特別是在網(wǎng)絡(luò)交流和溝通日益緊密的前提下,導(dǎo)致網(wǎng)絡(luò)信息真假難分,不僅增加了信息搜索難度,而且致使人們無(wú)法快速獲得真實(shí)信息。因此,提高計(jì)算機(jī)信息處理技術(shù)至關(guān)重要。
2大數(shù)據(jù)時(shí)代計(jì)算機(jī)信息處理技術(shù)
2.1信息采集、加工方面
計(jì)算機(jī)信息處理技術(shù)要進(jìn)行工作,首先,要采集數(shù)據(jù)信息,計(jì)算機(jī)技術(shù)都是建立在數(shù)據(jù)采集基礎(chǔ)之上的,數(shù)據(jù)采集主要是針對(duì)目標(biāo)信息源進(jìn)行實(shí)時(shí)的信息監(jiān)督和控制,并將才覺(jué)得數(shù)據(jù)儲(chǔ)存在計(jì)算機(jī)數(shù)據(jù)庫(kù)中,為各個(gè)軟件提供信息支持,確保下一項(xiàng)工作順利進(jìn)行;其次,對(duì)數(shù)據(jù)信息進(jìn)行加工,按照用戶的要求,對(duì)數(shù)據(jù)信息進(jìn)行加工;最后,將加工好的數(shù)據(jù)信系進(jìn)行分類(lèi),最終傳送到用戶手中,實(shí)現(xiàn)數(shù)據(jù)采集、加工以及傳送目標(biāo)。
2.2存儲(chǔ)方面
計(jì)算機(jī)存儲(chǔ)技術(shù)是將采集的信息儲(chǔ)存到計(jì)算機(jī)數(shù)據(jù)庫(kù)之中,在用戶需要某一項(xiàng)信息過(guò)程中,可以通過(guò)數(shù)據(jù)庫(kù)直接將數(shù)據(jù)調(diào)取出來(lái),計(jì)算機(jī)以其儲(chǔ)存量大、速度快等優(yōu)勢(shì),受到人們?cè)絹?lái)越多的關(guān)注,另外,計(jì)算機(jī)技術(shù)還能夠?qū)崿F(xiàn)長(zhǎng)時(shí)間儲(chǔ)存。
2.3信息安全方面
大數(shù)據(jù)時(shí)代的到來(lái),讓人們感受技術(shù)帶來(lái)的便捷的同時(shí),也讓人們意識(shí)到數(shù)據(jù)信息安全對(duì)人們的重要性。因此,為了能夠提高數(shù)據(jù)信息的安全、可靠性,可以通過(guò)以下幾個(gè)方面進(jìn)行:首先,建立計(jì)算機(jī)信息安全體系,加大專(zhuān)業(yè)技術(shù)人才的培養(yǎng)力度,投入資金,為構(gòu)建計(jì)算機(jī)安全體系奠定堅(jiān)實(shí)的基礎(chǔ);其次,加大研究力度,開(kāi)發(fā)信息安全技術(shù)產(chǎn)品。傳統(tǒng)信息安全技已經(jīng)無(wú)法滿足大數(shù)據(jù)時(shí)代數(shù)據(jù)安全需求,為了能夠盡快改善數(shù)據(jù)安全問(wèn)題,應(yīng)加大研究力度,尋求更好的解決方案,有效避免數(shù)據(jù)信息受到威脅;最后,重視對(duì)重要數(shù)據(jù)的檢測(cè),大數(shù)據(jù)時(shí)代的突出特點(diǎn)是數(shù)據(jù)量大,無(wú)法實(shí)現(xiàn)對(duì)每一個(gè)數(shù)據(jù)的檢測(cè)。因此,為了提高數(shù)據(jù)安全系數(shù),應(yīng)加強(qiáng)對(duì)重點(diǎn)數(shù)據(jù)信息的檢測(cè),從而確保數(shù)據(jù)信息安全。
2.4信息處理技術(shù)的發(fā)展
計(jì)算機(jī)硬件具有一定局限性,在一定程度上阻礙了計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展,而云計(jì)算網(wǎng)絡(luò)能夠突破這一弊端。因此,推廣和應(yīng)用云計(jì)算機(jī)網(wǎng)絡(luò)成為未來(lái)大數(shù)據(jù)時(shí)代計(jì)算機(jī)信息處理的主要發(fā)展趨勢(shì)。傳統(tǒng)計(jì)算機(jī)網(wǎng)絡(luò)是將硬件與網(wǎng)絡(luò)有機(jī)結(jié)合,抑制了計(jì)算機(jī)信息處理技術(shù)的發(fā)展,將二者分離開(kāi),促使云計(jì)算主筋形成云計(jì)算網(wǎng)絡(luò),從而構(gòu)建大數(shù)據(jù)信息網(wǎng)絡(luò)系統(tǒng),推動(dòng)我國(guó)社會(huì)不斷發(fā)展。
3結(jié)論
篇3
基本的大數(shù)據(jù)的處理流程可以分成數(shù)據(jù)采集、數(shù)據(jù)處理與集成、數(shù)據(jù)分析和數(shù)據(jù)解釋4個(gè)階段。首先獲取數(shù)據(jù)源的數(shù)據(jù),因?yàn)樵跀?shù)據(jù)源端的數(shù)據(jù)包含各種各樣的結(jié)構(gòu),需要使用某種方法將其進(jìn)行預(yù)處理,使數(shù)據(jù)成為某種可以用一種算法分析的統(tǒng)一數(shù)據(jù)格式,接著需要找到這種數(shù)據(jù)分析的算法,將預(yù)處理過(guò)的數(shù)據(jù)進(jìn)行算法特定的分析,并將分析的結(jié)果用可視化等手段呈現(xiàn)至用戶端。
1.1數(shù)據(jù)采集
大數(shù)據(jù)的采集是整個(gè)流程的基礎(chǔ),隨著互聯(lián)網(wǎng)技術(shù)和應(yīng)用的發(fā)展以及各種終端設(shè)備的普及,使得數(shù)據(jù)的生產(chǎn)者范圍越來(lái)越大,數(shù)據(jù)的產(chǎn)量也越來(lái)越多,數(shù)據(jù)之間的關(guān)聯(lián)也越來(lái)越復(fù)雜,這也是大數(shù)據(jù)中“大”的體現(xiàn),所以需要提高數(shù)據(jù)采集速度和精度要求。
1.2數(shù)據(jù)處理與集成
數(shù)據(jù)的處理與集成主要是對(duì)前一步采集到的大量數(shù)據(jù)進(jìn)行適當(dāng)?shù)念A(yù)處理,包括格式化、去噪以及進(jìn)一步集成存儲(chǔ)。因?yàn)閿?shù)據(jù)采集步驟采集到的數(shù)據(jù)各種各樣,其數(shù)據(jù)結(jié)構(gòu)也并不統(tǒng)一,不利于之后的數(shù)據(jù)分析,而且,一些數(shù)據(jù)屬于無(wú)效數(shù)據(jù),需要去除,否則會(huì)影響數(shù)據(jù)分析的精度和可靠性,所以,需要將數(shù)據(jù)統(tǒng)一格式并且去除無(wú)效數(shù)據(jù)。通常會(huì)設(shè)計(jì)一些過(guò)濾器來(lái)完成這一任務(wù)。
1.3數(shù)據(jù)分析
在完成了數(shù)據(jù)的采集和處理后,需要對(duì)數(shù)據(jù)進(jìn)行分析,因?yàn)樵谶M(jìn)行數(shù)據(jù)分析后才能體現(xiàn)所有大數(shù)據(jù)的重要價(jià)值。數(shù)據(jù)分析的對(duì)象是上一步數(shù)據(jù)的處理與集成后的統(tǒng)一格式數(shù)據(jù),需要根據(jù)所需數(shù)據(jù)的應(yīng)用需求和價(jià)值體現(xiàn)方向?qū)@些原始樣本數(shù)據(jù)進(jìn)一步地處理和分析?,F(xiàn)有的數(shù)據(jù)分析通常指采用數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘工具對(duì)集中存儲(chǔ)的數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)分析服務(wù)與傳統(tǒng)數(shù)據(jù)分析的差別在于其面向的對(duì)象不是數(shù)據(jù),而是數(shù)據(jù)服務(wù)。
1.4數(shù)據(jù)解釋
數(shù)據(jù)解釋是對(duì)大數(shù)據(jù)分析結(jié)果的解釋與展現(xiàn),在數(shù)據(jù)處理流程中,數(shù)據(jù)結(jié)果的解釋步驟是大數(shù)據(jù)分析的用戶直接面對(duì)成果的步驟,傳統(tǒng)的數(shù)據(jù)顯示方式是用文本形式體現(xiàn)的,但是,隨著數(shù)據(jù)量的加大,其分析結(jié)果也更復(fù)雜,傳統(tǒng)的數(shù)據(jù)顯示方法已經(jīng)不足以滿足數(shù)據(jù)分析結(jié)果輸出的需求,因此,數(shù)據(jù)分析企業(yè)會(huì)引入“數(shù)據(jù)可視化技術(shù)”作為數(shù)據(jù)解釋方式。通過(guò)可視化結(jié)果分析,可以形象地向用戶展示數(shù)據(jù)分析結(jié)果。
2云計(jì)算與大數(shù)據(jù)分析的關(guān)系
云計(jì)算是基于互聯(lián)網(wǎng)的相關(guān)服務(wù)的增加、使用和交付模式,通常涉及通過(guò)互聯(lián)網(wǎng)來(lái)提供動(dòng)態(tài)易擴(kuò)展且經(jīng)常是虛擬化的資源,是一種按使用量付費(fèi)的模式。這種模式提供可用的、便捷的、按需的網(wǎng)絡(luò)訪問(wèn),進(jìn)入可配置的計(jì)算資源共享池(資源包括網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)、應(yīng)用軟件、服務(wù)),這些資源能夠被快速提供,只需投入很少的管理工作,或與服務(wù)供應(yīng)商進(jìn)行很少的交互。目前,國(guó)內(nèi)外已經(jīng)有不少成熟的云計(jì)算的應(yīng)用服務(wù)。數(shù)據(jù)分析是整個(gè)大數(shù)據(jù)處理流程里最核心的部分。數(shù)據(jù)分析是以數(shù)據(jù)的價(jià)值分析為目的的活動(dòng),而基于大數(shù)據(jù)的數(shù)據(jù)分析通常表現(xiàn)為對(duì)已獲取的海量數(shù)據(jù)的分析,其數(shù)據(jù)來(lái)源可能是企業(yè)數(shù)據(jù)也可能是企業(yè)數(shù)據(jù)與互聯(lián)網(wǎng)數(shù)據(jù)的融合。從目前的趨勢(shì)來(lái)看,云計(jì)算是大數(shù)據(jù)的IT基礎(chǔ),是大數(shù)據(jù)分析的支撐平臺(tái),不斷增長(zhǎng)的數(shù)據(jù)量需要性能更高的數(shù)據(jù)分析平臺(tái)承載。所以,云計(jì)算技術(shù)的不斷發(fā)展可以為大數(shù)據(jù)分析提供更為靈活、迅速的部署方案,使得大數(shù)據(jù)分析的結(jié)果更加精確。另一方面,云計(jì)算的出現(xiàn)為大數(shù)據(jù)分析提供了擴(kuò)展性更強(qiáng),使用成本更低的存儲(chǔ)資源和計(jì)算資源,使得中小企業(yè)也可以通過(guò)云計(jì)算來(lái)實(shí)現(xiàn)屬于自己的大數(shù)據(jù)分析產(chǎn)品。大數(shù)據(jù)技術(shù)本身也是云計(jì)算技術(shù)的一種延伸。大數(shù)據(jù)技術(shù)涵蓋了從數(shù)據(jù)的海量存儲(chǔ)、處理到應(yīng)用多方面的技術(shù),包括海量分布式文件系統(tǒng)、并行計(jì)算框架、數(shù)據(jù)庫(kù)、實(shí)時(shí)流數(shù)據(jù)處理以及智能分析技術(shù),如模式識(shí)別、自然語(yǔ)言理解、應(yīng)用知識(shí)庫(kù)等等。但是,大數(shù)據(jù)分析要走向云計(jì)算還要賴于數(shù)據(jù)通信帶寬的提高和云資源的建設(shè),需要確保原始數(shù)據(jù)能遷移到云環(huán)境以及資源池可以隨需彈性擴(kuò)展。
3基于云計(jì)算環(huán)境的Hadoop
為了給大數(shù)據(jù)處理分析提供一個(gè)性能更高、可靠性更好的平臺(tái),研究者基于MapReduce開(kāi)發(fā)了一個(gè)基于云計(jì)算環(huán)境的開(kāi)源平臺(tái)Hadoop。Hadoop是一個(gè)以MapReduce算法為分布式計(jì)算框架,包括分布式文件系統(tǒng)(HDFS)、分布式數(shù)據(jù)庫(kù)(Hbase、Cassandra)等功能模塊在內(nèi)的完整生態(tài)系統(tǒng),已經(jīng)成為當(dāng)前最流行的大數(shù)據(jù)處理平臺(tái),并被廣泛認(rèn)可和開(kāi)發(fā)應(yīng)用?;贖adoop,用戶可編寫(xiě)處理海量數(shù)據(jù)的分布式并行程序,并將其運(yùn)行于由成百上千個(gè)節(jié)點(diǎn)組成的大規(guī)模計(jì)算機(jī)集群上。
4實(shí)例分析
本節(jié)以電信運(yùn)營(yíng)商為例,說(shuō)明在云計(jì)算環(huán)境中基于Hadoop的大數(shù)據(jù)分析給大數(shù)據(jù)用戶帶來(lái)的價(jià)值。當(dāng)前傳統(tǒng)語(yǔ)音和短信業(yè)務(wù)量下滑,智能終端快速增長(zhǎng),移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)發(fā)展迅速,大數(shù)據(jù)分析可以為運(yùn)營(yíng)商帶來(lái)新的機(jī)會(huì),幫助運(yùn)營(yíng)商更好地轉(zhuǎn)型。本文數(shù)據(jù)分析樣本來(lái)自于某運(yùn)營(yíng)商的個(gè)人語(yǔ)音和數(shù)據(jù)業(yè)務(wù)清單,通過(guò)Hadoop2.6.0在Ubuntu12.04系統(tǒng)中模擬了一個(gè)大數(shù)據(jù)分析平臺(tái)來(lái)處理獲得的樣本。希望通過(guò)對(duì)樣本數(shù)據(jù)的分析與挖掘,掌握樣本本身的一些信息。以上分析只是一些很基本的簡(jiǎn)單分析,實(shí)際上樣本數(shù)據(jù)中所蘊(yùn)含的價(jià)值要遠(yuǎn)遠(yuǎn)大于本文體現(xiàn)的。以上舉例意在說(shuō)明基于云計(jì)算的大數(shù)據(jù)分析可以在數(shù)據(jù)分析上體現(xiàn)出良好的性能,為企業(yè)帶來(lái)更豐富更有效率的信息提取、分類(lèi),并從中獲益。
5結(jié)束語(yǔ)
篇4
司法會(huì)計(jì)鑒定書(shū)
(文號(hào))
(鑒定專(zhuān)用用章)
(日期)
緒 言
×年×月×日,本院法紀(jì)檢察科提出委托,要求對(duì)A某某案中直接經(jīng)濟(jì)損失數(shù)額作出司法會(huì)計(jì)鑒定結(jié)論。
A某某,男,×歲,大專(zhuān)文化程度,現(xiàn)任甲公司證券業(yè)務(wù)部副經(jīng)理。×年×月×日,其在未對(duì)新開(kāi)戶股民B某某賬戶完成驗(yàn)資的情況下,擅自允許該戶全額透支交易近×元,給本單位造成巨大經(jīng)濟(jì)損失。
檢驗(yàn)收集了與A×#B某某股東賬戶相聯(lián)系的甲公司證券業(yè)務(wù)部×年×月×日和×年×月×日的B某某資金賬戶及其相關(guān)的交割單和委托單、中央登記結(jié)算公司A×#B某某股東賬戶籌碼清單等會(huì)計(jì)資料。
檢驗(yàn)采用核對(duì)法和分析法,逐一核對(duì)交易數(shù)量、金額和委托手續(xù),對(duì)比委托價(jià)與成交價(jià)、申報(bào)時(shí)間與成交時(shí)間,計(jì)算虧損數(shù)額。
所列檢材均冠以S字母,統(tǒng)一以兩位數(shù)編號(hào)。
檢 驗(yàn)
1.甲公司證券業(yè)務(wù)部B某某資金賬戶記錄:×年×月×日開(kāi)戶,未存入資金,×年×月×日賣(mài)出股票收回資金×元,×年×月×日與×年×月×日之間無(wú)記錄(見(jiàn)S03)。
2.甲公司證券業(yè)務(wù)部B某某資金賬戶×年×月×日清算交割單及其配對(duì)交割單記錄:先買(mǎi)入后賣(mài)出,再買(mǎi)入再賣(mài)出;共×股票×股,成交總額×元,賣(mài)出×股,成交總額×元,軋差-×元,與當(dāng)日余額一致。顯然,該戶未曾存入資金,第一、第二筆買(mǎi)入交易系全額透支?!聊辍猎隆寥找陨腺Y料記錄:賣(mài)出×股票×股,成交總額×元。至此,×股×股票全部平倉(cāng),交易虧損×元,與×年×月×日余額一致(見(jiàn)S01、S02)。
3.甲公司證券業(yè)務(wù)部B某某資金賬戶買(mǎi)入×股×股票有委托單,其中,×股委托價(jià)與成交價(jià)一致,申報(bào)時(shí)間與成交時(shí)間幾乎一致;×股委托價(jià)與成交價(jià)一致,申報(bào)時(shí)間等于成交時(shí)間;×股與×股合填一份委托單,且混填×股和×股賣(mài)出;×股委托價(jià)與成交價(jià)相近,申報(bào)時(shí)間等于成交時(shí)間(見(jiàn)S04至S36、附表)。
4.甲公司證券業(yè)務(wù)部B某某資金賬戶賣(mài)出×股×股票,僅有×年×月×日表明×股賣(mài)出委托的×股和×股兩份賣(mài)出委托單,但另有×股和×股賣(mài)出混填在×股買(mǎi)人委托單上;×股委托價(jià)與成交價(jià)相近,申報(bào)時(shí)間與成交時(shí)間幾乎一致(見(jiàn)S05、S37至附表)。
5.中央登記結(jié)算公司A×#B某某股東賬戶籌碼清單顯示,該戶×年×月×日賣(mài)出×股,系乙公司證券業(yè)務(wù)部強(qiáng)行平倉(cāng),無(wú)委托單(見(jiàn)S57、附表)。
6.甲公司證券業(yè)務(wù)部B某某資金賬戶清算交割單顯示,每筆交易數(shù)量和成交總額均與配對(duì)交割單數(shù)量和成交總額合計(jì)數(shù)一致(見(jiàn)S01至S02、S06至S36、S39至S56)。
論 證
1.按股票交易管理規(guī)定,股民開(kāi)設(shè)資金賬戶需存入一定數(shù)量的資金,并只能在此額度內(nèi)買(mǎi)入股票;委托單限填一次同向交易委托內(nèi)容,更不能混填反向交易委托內(nèi)容。履行股票交易管理的行為人理應(yīng)制止這些不規(guī)范的交易行為。
2.按股票交易管理規(guī)定,委托人須在事先填妥委托單,管理行為人應(yīng)對(duì)買(mǎi)入委托人的資金狀況嚴(yán)格審核,決定是否向交易員申報(bào),避免出現(xiàn)既委托價(jià)等于成交價(jià),又申報(bào)時(shí)間等于成交時(shí)間的情況。
3.按最高人民檢察院有關(guān)罪認(rèn)定的規(guī)定,直接經(jīng)濟(jì)損失必須是與管理活動(dòng)有直接因果關(guān)系,且對(duì)財(cái)產(chǎn)所有權(quán)的喪失,行為人顯已不具備挽回能力。若嚴(yán)格規(guī)范交易行為,上述B某某賬戶的虧損當(dāng)可避免。且根據(jù)中央登記結(jié)算公司A×#B某某股東賬戶籌碼清單,現(xiàn)籌碼已全部平倉(cāng),管理行為人顯已無(wú)力挽回?fù)p失,所以,×元符合以上的兩個(gè)條件。
4.按股票交易管理規(guī)定,股票業(yè)務(wù)與自營(yíng)業(yè)務(wù)的賬戶必須分開(kāi),因此,不能將在B某某賬戶非法自營(yíng)交易所獲取的盈利視為彌補(bǔ)該賬戶虧損的能力。
結(jié) 論
因甲公司證券業(yè)務(wù)部股票交易管理行為人疏于職守,使B某某賬戶交易行為嚴(yán)重不規(guī)范,造成直接經(jīng)濟(jì)損失×元(大寫(xiě))。
鑒定人:
(簽 章)
(鑒定資格證書(shū)號(hào):×)
復(fù)核人:
日期:
第二部分文證審查意見(jiàn)
司法會(huì)計(jì)文證審查意見(jiàn)書(shū)
文號(hào)
一、基本情況
x年x月x日,公訴人某某某提出委托,要求對(duì)A某某案件中的司法會(huì)計(jì)鑒定結(jié)論文書(shū)進(jìn)行審查。
x鑒定機(jī)構(gòu)提供的鑒定結(jié)論稱,因甲公司證券業(yè)務(wù)部股票交易管理行為人疏于職守,使B某某賬戶交易行為嚴(yán)重不規(guī)范,造成直接經(jīng)濟(jì)損失×元。
二、審查情況
該鑒定思路清晰、方法得當(dāng)、檢驗(yàn)充分,但論證尚缺火候。需在“所收集檢材是否合法”和“所收集檢材是否真實(shí)有效”兩個(gè)問(wèn)題上,補(bǔ)充論證。
篇5
大數(shù)據(jù)時(shí)代科技期刊的傳播媒介將是多樣化的,傳播范圍更廣,傳播速度更快。科技期刊可以通過(guò)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、移動(dòng)智能終端以及社交網(wǎng)絡(luò)等搭建交流平臺(tái),實(shí)現(xiàn)紙媒科技期刊和網(wǎng)絡(luò)學(xué)術(shù)數(shù)據(jù)庫(kù)資源同步以及無(wú)時(shí)間限制、無(wú)地域限制的資源共享。在這個(gè)平臺(tái)上,學(xué)者可以更方便地獲取各領(lǐng)域的學(xué)術(shù)資源,隨時(shí)隨地發(fā)表個(gè)人學(xué)術(shù)成果,與其他學(xué)者進(jìn)行學(xué)術(shù)探討及交換意見(jiàn)等。大數(shù)據(jù)更易滿足用戶需求,更好地提升了用戶體驗(yàn):一些國(guó)外期刊與facebook和twitter等集成,深化了期刊的服務(wù)內(nèi)涵;也有一些期刊增加了數(shù)字技術(shù),例如讀者可通過(guò)掃描期刊上的二維碼觀看一場(chǎng)手術(shù)視頻等。這些全新資源使學(xué)術(shù)交流更加便捷、更加個(gè)性化,同時(shí)也推動(dòng)了學(xué)術(shù)研究成果的傳播。
就大數(shù)據(jù)時(shí)代而言,青年編輯具有一定的優(yōu)勢(shì),主要體現(xiàn)在:
①青年編輯對(duì)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、移動(dòng)智能終端以及社交網(wǎng)絡(luò)等平臺(tái)較為熟悉,運(yùn)用起來(lái)更得心應(yīng)手。
②青年編輯的思維敏捷、思想活躍,好奇心更強(qiáng),適應(yīng)新事物、學(xué)習(xí)新知識(shí)的速度更快。正因?yàn)榍嗄昃庉嬀哂行聲r(shí)代的種種優(yōu)勢(shì),所以更應(yīng)該不斷學(xué)習(xí),不斷完善自我,從而適應(yīng)新時(shí)代的要求。
大數(shù)據(jù)時(shí)代對(duì)于青年編輯而言既是機(jī)遇也是挑戰(zhàn)。青年編輯要積極探索新技術(shù)在收發(fā)稿件、編輯加工、稿件校對(duì)、圖文編排等編輯出版環(huán)節(jié)中的應(yīng)用,利用新的技術(shù)和手段提高編校效率、拓寬思路。為此,在基本編輯技能和專(zhuān)業(yè)知識(shí)的基礎(chǔ)上應(yīng)具備下列幾方面的素質(zhì)。青年編輯應(yīng)該熟練應(yīng)用一些基本軟件:主要的繪圖軟件Visio、Origin7.0、Chemoffice、AutoCAD;圖片效果處理的常用軟件Photoshop、Illustrator、Coreldraw;數(shù)學(xué)公式編輯軟件MathType以及排版軟件Latex等。青年編輯要了解編輯行業(yè)不斷更新的新技術(shù):DOI作為數(shù)字對(duì)象唯一標(biāo)識(shí)符,是云計(jì)算背景下最佳的“大數(shù)據(jù)”樣本存儲(chǔ)和應(yīng)用技術(shù);CrossRef推出的CrossMark可使讀者了解該篇論文的“前世今生”,包括這篇論文是否更正或修改過(guò),哪篇博客或哪些媒體介紹過(guò)該論文,以及該論文被下載的次數(shù)等;ORCID使作者能夠跨學(xué)科、跨機(jī)構(gòu)地將自己的身份連接到研究對(duì)象,如數(shù)據(jù)集、設(shè)備和引文等,且該身份是唯一的;Cited-by引文追蹤服務(wù)可以使出版商和作者了解該論文或期刊的引用情況;FundRef主要用于資助情況(機(jī)構(gòu)、項(xiàng)目名稱等)的規(guī)范化,也可讓資助者了解產(chǎn)出情況。青年編輯應(yīng)熟練地掌握和應(yīng)用英語(yǔ),只有具有一定的英語(yǔ)閱讀和英語(yǔ)寫(xiě)作能力,才能迅速地了解并跟蹤國(guó)際學(xué)術(shù)發(fā)展的走向和國(guó)際科技期刊的前沿信息,及時(shí)發(fā)現(xiàn)并糾正英文摘要和英文題目中出現(xiàn)的錯(cuò)誤并檢查英文文獻(xiàn)的引用是否恰當(dāng),才能使科技期刊與國(guó)際接軌,提高期刊的影響力。
二、積極面對(duì)改革
在我國(guó)科技期刊編輯還埋頭于日常繁瑣的編輯業(yè)務(wù)時(shí),國(guó)外期刊的經(jīng)營(yíng)模式和出版方式已經(jīng)發(fā)生了翻天覆地的變化。我國(guó)期刊這種規(guī)模小、實(shí)力弱的發(fā)展?fàn)顟B(tài)已經(jīng)無(wú)法適應(yīng)當(dāng)前的“國(guó)際化”趨勢(shì),更無(wú)法與國(guó)際出版集團(tuán)相抗衡。為此,、教育部、原新聞出版總署等一直在積極推動(dòng)科技期刊改革。面對(duì)不斷深化的體制改革,青年編輯的首要任務(wù)是轉(zhuǎn)變思想觀念,認(rèn)清科技期刊的改革形勢(shì)和政策環(huán)境,不再閉門(mén)造車(chē),從傳統(tǒng)的繁瑣重復(fù)的工作中走出來(lái),努力接受新事物、新思想,提高網(wǎng)絡(luò)運(yùn)用能力和計(jì)算機(jī)運(yùn)用能力,只有這樣才能為改革做好準(zhǔn)備。
三、結(jié)論
篇6
>> 大數(shù)據(jù)關(guān)鍵技術(shù) 大數(shù)據(jù)關(guān)鍵技術(shù)分析及系統(tǒng)實(shí)例分析 淺談大數(shù)據(jù)基礎(chǔ)理論與關(guān)鍵技術(shù)發(fā)展 電力信息大數(shù)據(jù)高速存儲(chǔ)及檢索關(guān)鍵技術(shù)研究 電力大數(shù)據(jù)可視化系統(tǒng)開(kāi)發(fā)關(guān)鍵技術(shù)研究及趨勢(shì) 投資統(tǒng)計(jì)大數(shù)據(jù)處理關(guān)鍵技術(shù) 基于大數(shù)據(jù)的信息系統(tǒng)關(guān)鍵技術(shù) 淺析云環(huán)境下的大數(shù)據(jù)關(guān)鍵技術(shù) 面向大數(shù)據(jù)的Deep Web數(shù)據(jù)系統(tǒng)關(guān)鍵技術(shù)研究 大數(shù)據(jù)安全和隱私保護(hù)技術(shù)體系的關(guān)鍵技術(shù)研究 移動(dòng)數(shù)據(jù)庫(kù)關(guān)鍵技術(shù)及應(yīng)用探討 社會(huì)網(wǎng)絡(luò)大數(shù)據(jù)分析框架及其關(guān)鍵技術(shù) 農(nóng)業(yè)云大數(shù)據(jù)自組織推送關(guān)鍵技術(shù)綜述 基于大數(shù)據(jù)的信息系統(tǒng)關(guān)鍵技術(shù)研究 云計(jì)算環(huán)境下的大數(shù)據(jù)可靠存儲(chǔ)關(guān)鍵技術(shù)概述 面向大數(shù)據(jù)的分布式系統(tǒng)設(shè)計(jì)關(guān)鍵技術(shù)研究 大數(shù)據(jù)時(shí)代下軟件工程關(guān)鍵技術(shù)分析 移動(dòng)互聯(lián)網(wǎng)的大數(shù)據(jù)處理關(guān)鍵技術(shù) 電信運(yùn)營(yíng)商大數(shù)據(jù)變現(xiàn)之關(guān)鍵技術(shù) 移動(dòng)通信網(wǎng)絡(luò)中大數(shù)據(jù)處理的關(guān)鍵技術(shù) 常見(jiàn)問(wèn)題解答 當(dāng)前所在位置:l.
[4]Big data[EB/OL]..
[18]丁智,林治.MapRdeuce編程模型、方法及應(yīng)用綜述[J].電腦知識(shí)與技術(shù),2014,10(30):70607064.
[19]江舢,金晶,劉鵬展,等.分布式海量數(shù)據(jù)批處理技術(shù)綜述[Z].中國(guó)科技論文在線,2012.
[20]吳哲夫,肖鷹,張彤.大數(shù)據(jù)和云計(jì)算技術(shù)探析[J].互聯(lián)網(wǎng)天地,2015(4):611.
[21]馬紅玉,張柳.大數(shù)據(jù)中的可視化分析技術(shù)[J].山東農(nóng)業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2014,45(s):5658.
篇7
關(guān)鍵詞:大數(shù)據(jù);數(shù)字圖書(shū)館;數(shù)據(jù)庫(kù)
中圖分類(lèi)號(hào):G252 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)22-0261-04
Abstract: With the development of the Internet, information technology is developing fast, big data, cloud computing, Internet of things, such as vigorous development, the age of the Internet to a new level. In this paper is based on digital library as the background, study of characteristic database in the two projects and related statistical data.
Key words: big data; digital library; the database
從這個(gè)“大數(shù)據(jù)”展上看到了什么?2016年5月25日,中國(guó)大數(shù)據(jù)產(chǎn)業(yè)峰會(huì)暨中國(guó)電子商務(wù)創(chuàng)新發(fā)展峰會(huì)在貴陽(yáng)開(kāi)幕。國(guó)務(wù)院總理出席開(kāi)幕式并發(fā)表致辭。在致辭中說(shuō),當(dāng)今世界,信息化浪潮席卷全球,大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)等蓬勃發(fā)展,使互聯(lián)網(wǎng)[1]時(shí)代邁上一個(gè)新臺(tái)階。今天的中國(guó)要把握住世界科技革命的歷史機(jī)遇[1],按照創(chuàng)新、協(xié)調(diào)、綠色、開(kāi)放、共享的發(fā)展理念,加快創(chuàng)新型國(guó)家建設(shè),著力推進(jìn)結(jié)構(gòu)性改革尤其是供給側(cè)結(jié)構(gòu)性改革,推動(dòng)信息化與實(shí)體經(jīng)濟(jì)深度融合發(fā)展,不斷提升全要素生產(chǎn)率,努力保持經(jīng)濟(jì)中高速增長(zhǎng)、邁向中高端水平。
表示,要通過(guò)簡(jiǎn)政放權(quán)放管結(jié)合積極培育發(fā)展大數(shù)據(jù)等信息網(wǎng)絡(luò)產(chǎn)業(yè)。依靠改革推動(dòng)發(fā)展,這方面需要市場(chǎng)主導(dǎo),政府也大有可為。要打破“信息孤島”和“數(shù)據(jù)煙囪”,推動(dòng)政府信息共享,提升政府效能,讓企業(yè)和群眾辦事創(chuàng)業(yè)更方便。除涉及國(guó)家安全、商業(yè)秘密、個(gè)人隱私以外的數(shù)據(jù),都應(yīng)向社會(huì)開(kāi)放。充分利用信息化手段完善市場(chǎng)監(jiān)管,形成線上線下一體化監(jiān)管格局,實(shí)現(xiàn)“人在干、數(shù)在轉(zhuǎn)、云在算”。利用大數(shù)據(jù)等技術(shù)為民謀利、解民所憂,促進(jìn)形成公平普惠、便捷高效的民生服務(wù)體系。
我國(guó)數(shù)字圖書(shū)館的建設(shè)與發(fā)展,需要一大批高水平、高素質(zhì)的圖書(shū)館專(zhuān)業(yè)隊(duì)伍。
中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所所長(zhǎng)孫坦以“數(shù)字圖書(shū)館的發(fā)展與變革-面向語(yǔ)義信息環(huán)境的嵌入式圖書(shū)館服務(wù)”為題,從基于系統(tǒng)的服務(wù)變化、基于館員的服務(wù)變化以及再造數(shù)字信息基礎(chǔ)設(shè)施等方面對(duì)數(shù)字圖書(shū)館的發(fā)展與變革進(jìn)行了詳細(xì)論述。
浙江圖書(shū)館副館長(zhǎng)劉曉清以“數(shù)字圖書(shū)館建設(shè)與技術(shù)創(chuàng)新探索”為題,從數(shù)字圖書(shū)館的理想與現(xiàn)實(shí)、浙江數(shù)字圖書(shū)館建設(shè)、資源建設(shè)與整合、服務(wù)推廣、數(shù)字圖書(shū)館案例的討論、技術(shù)與服務(wù)創(chuàng)新探索等方面對(duì)數(shù)字圖書(shū)館的建設(shè)與服務(wù)作了講解。提出數(shù)字圖書(shū)館是一個(gè)生態(tài)系統(tǒng),數(shù)字圖書(shū)服務(wù)要形成產(chǎn)品,追求用戶體驗(yàn)的不斷提升
1 大數(shù)據(jù)中數(shù)字圖書(shū)館和自建數(shù)據(jù)庫(kù)分析
我們以中國(guó)知網(wǎng)電子資源為檢索平臺(tái),以主題=“大數(shù)據(jù)數(shù)字圖書(shū)館”搜索,從發(fā)表年度,學(xué)科,來(lái)源數(shù)據(jù)庫(kù)這三個(gè)方面進(jìn)行統(tǒng)計(jì),結(jié)果如下圖、表。
圖3和表3是分別對(duì)應(yīng)的,從圖表中我們看出,2002年一直到2015年,大數(shù)據(jù)的數(shù)字圖書(shū)館方面的文章基礎(chǔ)都是在500-600篇左右徘徊,沒(méi)有太大的發(fā)展和突破,圖書(shū)情報(bào)與數(shù)字圖書(shū)館, 計(jì)算機(jī)軟件及計(jì)算機(jī)應(yīng)用這兩個(gè)學(xué)科所占比例達(dá)到90%以上,來(lái)源數(shù)據(jù)庫(kù)主中中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)占了7473篇,中國(guó)優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫(kù)占880篇,還有特色期刊占了316篇,還有一些中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù)和中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù)有300多篇。
圖6和表6是分別對(duì)應(yīng)的,從圖表中我們看出,2002年一直到2015年,自建數(shù)據(jù)庫(kù)方面的文章基礎(chǔ)都是在50-300篇左右,圖書(shū)情報(bào)與數(shù)字圖書(shū)館, 計(jì)算機(jī)軟件及計(jì)算機(jī)應(yīng)用這兩個(gè)學(xué)科所占比例達(dá)到95%以上,其他領(lǐng)域相對(duì)較少,來(lái)源數(shù)據(jù)庫(kù)中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)占了3698篇,中國(guó)優(yōu)秀碩士學(xué)位論文,特色期刊,中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù)分別只有100多篇.
從圖6,表6中,我們可以看出,在大數(shù)據(jù)時(shí)代背景下,數(shù)字圖書(shū)館在近10年左右,創(chuàng)新和發(fā)展得很少, 數(shù)字圖書(shū)館在圖書(shū)情報(bào)領(lǐng)域,計(jì)算機(jī)領(lǐng)域應(yīng)用的比較廣泛.
2 特色數(shù)據(jù)庫(kù)研究
本文之前研究的課題《基于物聯(lián)網(wǎng)技術(shù)的苗木種質(zhì)資源管理應(yīng)用研究》[2],再加上現(xiàn)在正在研究的課題《花卉資源的關(guān)聯(lián)規(guī)則算法》為依據(jù),
《基于物聯(lián)網(wǎng)技術(shù)的苗木種質(zhì)資源管理應(yīng)用研究》項(xiàng)目中,數(shù)據(jù)庫(kù)主要是搜集苗木信息,并設(shè)計(jì)相關(guān)數(shù)據(jù)庫(kù),研究的是苗木種質(zhì)資源這塊內(nèi)容。
《花卉資源的關(guān)聯(lián)規(guī)則算法》項(xiàng)目主要研究的是花卉信息數(shù)據(jù)中的相關(guān)內(nèi)容。
這兩個(gè)項(xiàng)目中研究的都是正對(duì)某一領(lǐng)域而專(zhuān)門(mén)制作的數(shù)據(jù)庫(kù)的研究,《基于物聯(lián)網(wǎng)技術(shù)的苗木種質(zhì)資源管理應(yīng)用研究》是針對(duì)苗木數(shù)據(jù)庫(kù)而創(chuàng)建的數(shù)據(jù)庫(kù),《花卉資源的關(guān)聯(lián)規(guī)則算法》是針對(duì)花卉數(shù)據(jù)庫(kù)而創(chuàng)建的數(shù)據(jù)庫(kù),在苗木數(shù)據(jù)庫(kù)中可以查詢到苗木的形態(tài)特征,生長(zhǎng)習(xí)性,繁殖要點(diǎn),栽培管理,觀賞應(yīng)用以及其他的相關(guān)知識(shí)。通過(guò)對(duì)實(shí)物的認(rèn)識(shí),了解,可以加深課本知識(shí),通過(guò)實(shí)踐來(lái)認(rèn)識(shí)書(shū)本上的知識(shí),融會(huì)貫通?!痘ɑ苜Y源的關(guān)聯(lián)規(guī)則算法》通過(guò)對(duì)花卉信息的收集,通過(guò)關(guān)聯(lián)規(guī)則算法,找出相關(guān)性,通過(guò)后臺(tái)特色數(shù)據(jù)庫(kù)的研究,可以加深相關(guān)專(zhuān)業(yè)對(duì)花卉的理解,加大圖書(shū)館中花卉方面書(shū)籍的流通,從而方便管理,對(duì)花卉信息提供一定的決策支持。
3 結(jié)束語(yǔ)
“如果能夠妥善應(yīng)用大數(shù)據(jù),我們可以擁抱更為美好的未來(lái)?!庇《葒?guó)家信息技術(shù)學(xué)院(NIIT)全球首席執(zhí)行官帕特瓦爾丹說(shuō),大數(shù)據(jù)就像新的原油一樣寶貴,對(duì)大數(shù)據(jù)的利用開(kāi)辟了一個(gè)新興領(lǐng)域。他說(shuō),過(guò)去三、四十年,中國(guó)發(fā)展迅速,這使得數(shù)億人擺脫貧困,中國(guó)一直在發(fā)展服務(wù)業(yè)和電商產(chǎn)業(yè),制造業(yè)正在迅速現(xiàn)代化,這些產(chǎn)業(yè)已經(jīng)比較成熟,中國(guó)現(xiàn)在需要新的增長(zhǎng)點(diǎn)?!拔液芨吲d看到中國(guó)政府現(xiàn)在開(kāi)始關(guān)注大數(shù)據(jù)、互聯(lián)網(wǎng)產(chǎn)業(yè),并把它們打造成經(jīng)濟(jì)發(fā)展新引擎?!?/p>
參考文獻(xiàn):
[1] 王浩, 劉冰, 張琳琳. 大數(shù)據(jù)時(shí)代高校圖書(shū)館信息服務(wù)模式發(fā)展研究[J]. 新世界圖書(shū)館, 2016(2).
篇8
一、存在的主要問(wèn)題
我國(guó)在統(tǒng)計(jì)學(xué)研究生人才培養(yǎng)模式的創(chuàng)新和實(shí)踐上存在的主要問(wèn)題表現(xiàn)為:
1.培養(yǎng)目標(biāo)不清楚。經(jīng)濟(jì)統(tǒng)計(jì)學(xué)和數(shù)理統(tǒng)計(jì)學(xué)在培養(yǎng)目標(biāo)上,表述不清楚,主要以培養(yǎng)教學(xué)和科研的理論人才為主,特別是數(shù)理統(tǒng)計(jì)學(xué),因?yàn)閿?shù)理統(tǒng)計(jì)在統(tǒng)計(jì)學(xué)提升為一級(jí)學(xué)科之前為數(shù)學(xué)下設(shè)的一個(gè)二級(jí)學(xué)科,其培養(yǎng)仍然是數(shù)學(xué)人才,與當(dāng)今對(duì)統(tǒng)計(jì)學(xué)的要求相差較遠(yuǎn)。而從學(xué)生的就業(yè)角度來(lái)看,應(yīng)為應(yīng)用型的復(fù)合型人才為主。就從培養(yǎng)目標(biāo)來(lái)看,學(xué)校和學(xué)生以及社會(huì)對(duì)人才的需求上存在著很大的差異。所以如何將這幾者統(tǒng)一在一起,發(fā)揮培養(yǎng)目標(biāo)的導(dǎo)向性作用,變得非常重要。大部分沒(méi)有明確要掌握的統(tǒng)計(jì)工具、數(shù)據(jù)來(lái)源問(wèn)題。
數(shù)據(jù)來(lái)源主要分為四大類(lèi):?jiǎn)柧碚{(diào)查、網(wǎng)絡(luò)數(shù)據(jù)、數(shù)據(jù)庫(kù)、試驗(yàn)設(shè)計(jì)。針對(duì)這四大類(lèi)數(shù)據(jù)來(lái)源,必須有相應(yīng)的培養(yǎng)目標(biāo)。如調(diào)查數(shù)據(jù),就涉及到問(wèn)卷設(shè)計(jì)、數(shù)據(jù)獲取、數(shù)據(jù)自動(dòng)提取、數(shù)據(jù)處理;網(wǎng)絡(luò)數(shù)據(jù)如何利用爬蟲(chóng)技術(shù)?如何從大數(shù)據(jù)數(shù)據(jù)庫(kù)提取數(shù)據(jù)?
2.課程體系陳舊、無(wú)法適應(yīng)大數(shù)據(jù)時(shí)代。統(tǒng)計(jì)學(xué)提升為一級(jí)學(xué)科后,經(jīng)濟(jì)統(tǒng)計(jì)學(xué)和數(shù)理統(tǒng)計(jì)學(xué)的課程設(shè)置都不再適合統(tǒng)計(jì)學(xué)研究生的培養(yǎng)。而且以前的統(tǒng)計(jì)學(xué)的課程設(shè)置本身也存在著很多問(wèn)題。比如:(1)課程涉及的領(lǐng)域不能更好地體現(xiàn)統(tǒng)計(jì)的應(yīng)用性。統(tǒng)計(jì)學(xué)是一門(mén)綜合性、適應(yīng)面非常廣的應(yīng)用型的學(xué)科。而目前很多統(tǒng)計(jì)學(xué)研究生培養(yǎng)的課程體系過(guò)分注重理論的研究,比如數(shù)理統(tǒng)計(jì)學(xué)就過(guò)分注重?cái)?shù)學(xué)基礎(chǔ)類(lèi)課程的學(xué)習(xí),經(jīng)濟(jì)統(tǒng)計(jì)學(xué)只注重經(jīng)濟(jì)問(wèn)題的一些簡(jiǎn)單理論分析。導(dǎo)致課程設(shè)置的范圍狹窄,開(kāi)設(shè)的交叉學(xué)科和跨學(xué)科課程較少,大多數(shù)研究生都被束縛在本專(zhuān)業(yè)的研究方向上,致使研究生視野不夠?qū)捳{(diào),科研能力和適應(yīng)能力受到很大的限制。(2)前沿性知識(shí)在研究生專(zhuān)業(yè)課程中所占的比重不足。統(tǒng)計(jì)學(xué)課程內(nèi)容較為陳舊,研究性、前沿性不夠,有些課程內(nèi)容沒(méi)有反映出統(tǒng)計(jì)學(xué)學(xué)科領(lǐng)域內(nèi)的一些最新知識(shí)和科研成果,尤其是一些反映統(tǒng)計(jì)學(xué)學(xué)科領(lǐng)域的熱點(diǎn)、重點(diǎn)的研究以及未來(lái)發(fā)展趨勢(shì)等前沿性的知識(shí),很少能夠及時(shí)地反映到研究生教育的課程內(nèi)容中。(3)研究生課程創(chuàng)新性不足。統(tǒng)計(jì)學(xué)研究生層次差距很大,比如數(shù)理統(tǒng)計(jì)學(xué)的研究生很多本科為數(shù)學(xué)專(zhuān)業(yè),很多統(tǒng)計(jì)學(xué)的基礎(chǔ)課程沒(méi)有開(kāi)設(shè),而有些同學(xué)本科為統(tǒng)計(jì)學(xué)專(zhuān)業(yè),致使碩士生課程與本科生課程拉不開(kāi)檔次,教學(xué)內(nèi)容重復(fù),教學(xué)方法與教學(xué)形式比較單一,大都采取以講授為主,討論為輔的授課方法,部分課程因?yàn)闆](méi)有較嚴(yán)格的課外文獻(xiàn)的閱讀要求,致使課堂上的討論較難深入,考試以論文形式,學(xué)生通過(guò)率很高,課程結(jié)束后學(xué)生收獲不大。
3.實(shí)踐環(huán)節(jié)未得到應(yīng)該的重視和體現(xiàn)。傳統(tǒng)的統(tǒng)計(jì)學(xué)研究生在實(shí)踐教學(xué)環(huán)節(jié)方面比較欠缺,不重視諸如統(tǒng)計(jì)軟件、實(shí)習(xí)實(shí)訓(xùn)、實(shí)驗(yàn)課程、產(chǎn)學(xué)研合作等,缺乏數(shù)據(jù)環(huán)境。
4.考核制度沒(méi)有真正得到落實(shí)。在研究生培養(yǎng)模式中,考核制度起著篩選、分流、淘汰、激勵(lì)的作用,對(duì)研究生的培養(yǎng)質(zhì)量起到了保障作用,但實(shí)際中很難真正落實(shí)。一方面,是因?yàn)檠芯糠諊粷庠斐傻?,另一方面,部分學(xué)生為就業(yè)奔波,投放在論文上的精力不夠,再加上經(jīng)費(fèi)不足,這在一定程度上影響了畢業(yè)論文的質(zhì)量。統(tǒng)計(jì)學(xué)碩士研究生的培養(yǎng)還需要從整體優(yōu)化的角度去研究與實(shí)踐。
二、統(tǒng)計(jì)學(xué)碩士生人才培養(yǎng)構(gòu)建
如何構(gòu)建統(tǒng)計(jì)學(xué)研究生人才培養(yǎng)的新模式必須回答三個(gè)基本問(wèn)題:為什么要構(gòu)建新的培養(yǎng)模式?新的培養(yǎng)模式主要有哪些內(nèi)容?怎樣進(jìn)行構(gòu)建?必須明確新的人才培養(yǎng)模式目的,在于提高研究生教學(xué)質(zhì)量和專(zhuān)業(yè)人才培養(yǎng)質(zhì)量,從而適應(yīng)當(dāng)今社會(huì)對(duì)統(tǒng)計(jì)學(xué)高層次人才的需求;必須明確新的人才培養(yǎng)模式的具體培養(yǎng)目標(biāo),從而進(jìn)行具體構(gòu)建。
首先需明確制定新的人才培養(yǎng)模式的途徑和措施,以下主要從新的人才培養(yǎng)模式構(gòu)建的具體內(nèi)容、思路和方法方面進(jìn)行研究與實(shí)踐探索。
1.培養(yǎng)目標(biāo)的明確及其導(dǎo)向作用的發(fā)揮。隨著研究生的不斷擴(kuò)招,培養(yǎng)以教學(xué)和科研的理論人才為主的培養(yǎng)目標(biāo)已經(jīng)不再適應(yīng)社會(huì)的需求和發(fā)展,特別是統(tǒng)計(jì)學(xué)本身就是應(yīng)用型的學(xué)科。研究生人才成為了推動(dòng)生產(chǎn)力發(fā)展的直接力量,所以應(yīng)用復(fù)合型的人才更多地被社會(huì)所需要,所以明確培養(yǎng)目標(biāo)是研究生教育成功的第一步,而真正發(fā)揮科學(xué)的培養(yǎng)目標(biāo)的導(dǎo)向作用是研究生教育成功的關(guān)鍵。
2.統(tǒng)計(jì)學(xué)研究生課程體系的完善。課程體系是人才培養(yǎng)模式的重要組成部分。完善統(tǒng)計(jì)學(xué)學(xué)科研究生課程體系是統(tǒng)計(jì)學(xué)研究生人才培養(yǎng)模式的關(guān)鍵。統(tǒng)計(jì)學(xué)學(xué)科研究生培養(yǎng)模式的課程體系建設(shè)創(chuàng)新,應(yīng)在思想方法上真正重視統(tǒng)計(jì)學(xué)研究生課程體系建設(shè),真正體現(xiàn)課程建設(shè)的創(chuàng)新性,不斷加快和完善統(tǒng)計(jì)學(xué)碩士生課程體系的設(shè)計(jì)、創(chuàng)新、內(nèi)容修訂和評(píng)估體系,以適應(yīng)新興學(xué)科、邊緣學(xué)科和交叉學(xué)科發(fā)展對(duì)研究生知識(shí)結(jié)構(gòu)的要求,并精選課程內(nèi)容,編寫(xiě)高質(zhì)量教材和改進(jìn)課程教學(xué)方法,建立合理、完善的課程檢査評(píng)估體系,為提高研究生課程教學(xué)質(zhì)量提供堅(jiān)實(shí)的保障。
3.強(qiáng)化實(shí)踐教學(xué)環(huán)節(jié)和統(tǒng)計(jì)軟件應(yīng)用能力。開(kāi)始針對(duì)統(tǒng)計(jì)學(xué)研究生的實(shí)驗(yàn)課程體系,強(qiáng)化統(tǒng)計(jì)學(xué)軟件如SAS、R、SPSS等編程與實(shí)際問(wèn)題的實(shí)現(xiàn)等,強(qiáng)化與企事業(yè)單位的合作,從畢業(yè)論文、專(zhuān)業(yè)實(shí)習(xí)等方面加強(qiáng)合作,提升研究生的實(shí)際動(dòng)手能力,讓其初步具有在企事業(yè)單位從事相關(guān)工作的能力。同時(shí)需要強(qiáng)化研究生的統(tǒng)計(jì)軟件的學(xué)習(xí)和應(yīng)用,現(xiàn)今數(shù)據(jù)量越來(lái)越大、數(shù)據(jù)結(jié)構(gòu)越來(lái)越復(fù)雜,使得要解決實(shí)際問(wèn)題必須熟練掌握統(tǒng)計(jì)軟件的使用和編程,否則無(wú)法很好地完成處理、分析數(shù)據(jù)的實(shí)際需要。
4.構(gòu)建科學(xué)合理的考核制度。現(xiàn)在大多數(shù)考核仍為考試驅(qū)動(dòng)型,學(xué)生只會(huì)考試,沒(méi)有形成有效知識(shí)結(jié)構(gòu),應(yīng)用實(shí)踐能力弱。對(duì)于應(yīng)用性較強(qiáng)的一類(lèi)課程應(yīng)該從大作業(yè)、專(zhuān)題報(bào)告、程序編寫(xiě)、軟件應(yīng)用、討論、上機(jī)操作、考試等多維度進(jìn)行知識(shí)水平測(cè)度。構(gòu)建科學(xué)合理的多樣化、多元化的考評(píng)范式,對(duì)學(xué)生產(chǎn)生潛移默化的影響。強(qiáng)調(diào)課前、課中、課后的相互聯(lián)系,增強(qiáng)學(xué)生自學(xué)能力,強(qiáng)化師生互動(dòng),把學(xué)生從應(yīng)考能手培養(yǎng)成具有創(chuàng)新意思和實(shí)際動(dòng)手能力的科研好手。同時(shí)還要不斷完善學(xué)術(shù)規(guī)范,將其納人考核范圍之內(nèi),建立健全一套科學(xué)、合理、共同遵守的學(xué)術(shù)規(guī)范,對(duì)學(xué)術(shù)不端行為加以監(jiān)督和懲處,以凈化研究生的學(xué)術(shù)環(huán)境。要不斷提高學(xué)位論文質(zhì)量并將其作為考核研究生創(chuàng)新能力的一項(xiàng)指標(biāo)。
三、培養(yǎng)模式構(gòu)建的具體內(nèi)容
1.重構(gòu)統(tǒng)計(jì)學(xué)碩士課程體系:學(xué)位課,基礎(chǔ)課,實(shí)驗(yàn)課,實(shí)踐課。學(xué)位課注重統(tǒng)計(jì)學(xué)基礎(chǔ)的搭建,基礎(chǔ)課拓展學(xué)生統(tǒng)計(jì)基本方法,實(shí)驗(yàn)課培養(yǎng)學(xué)生動(dòng)手能力,實(shí)踐課的培養(yǎng)讓學(xué)生適應(yīng)數(shù)據(jù)環(huán)境。大數(shù)據(jù)分析需要的基本知識(shí)領(lǐng)域:(1)數(shù)據(jù)的存儲(chǔ)、管理:數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市、分布式數(shù)據(jù)庫(kù),云存儲(chǔ)、云計(jì)算、分布式、動(dòng)態(tài)式存儲(chǔ);(2)數(shù)據(jù)ETL、處理:多源異構(gòu)、非結(jié)構(gòu)化數(shù)據(jù)的清洗、轉(zhuǎn)換、綜合、優(yōu)化,文本處理、日志處理、圖像、視頻處理等,注重?cái)?shù)據(jù)質(zhì)量、數(shù)據(jù)管理等;(3)數(shù)據(jù)統(tǒng)計(jì)分析與挖掘:時(shí)序、多源、多元、面板、大數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)計(jì)、預(yù)測(cè)、挖掘、開(kāi)發(fā)等;(4)數(shù)據(jù)可視化i可視化是基本要求,可視化易于接受,直觀形象;(5)大數(shù)據(jù)分析案例:必須引入金融、電信、電商、移動(dòng)互聯(lián)、醫(yī)藥、零售、能源等領(lǐng)域的大數(shù)據(jù)真實(shí)案例,豐富認(rèn)識(shí)。
2.合理分配各課程模塊的學(xué)分和學(xué)時(shí),注重實(shí)踐課程的設(shè)置,大部分院校碩士生課程主要以理論為主,強(qiáng)化實(shí)踐教學(xué)及其重要。
3.主動(dòng)適應(yīng)大數(shù)據(jù),開(kāi)設(shè)大數(shù)據(jù)相關(guān)課程,如大數(shù)據(jù)平臺(tái)、計(jì)算平臺(tái)、編程平臺(tái)、數(shù)據(jù)平臺(tái)、可視化平臺(tái)等。
4.強(qiáng)化實(shí)踐教學(xué)環(huán)節(jié),提高前沿性知識(shí)課程所占比重。
5.合理開(kāi)設(shè)交叉學(xué)科和跨學(xué)科課程。
篇9
Abstract The arrival of the era of big data endows the library with new service content and requirements. In the aspect of open data services, libraries need to switch roles, and to provide users with collections catalog, data governance,open access, knowledge discovery, semantic analysis and other services.
Keywords big data;open data;library service;knowledge discovery;information organization
大數(shù)據(jù)帶來(lái)的信息風(fēng)暴正在變革人類(lèi)的生活、工作和思維[1]。在大數(shù)據(jù)時(shí)代,滲透到各個(gè)行業(yè)、領(lǐng)域的數(shù)據(jù)成為了推動(dòng)社會(huì)發(fā)展的要素之一,因此有人稱大數(shù)據(jù)時(shí)代的數(shù)據(jù)就是“金礦”。但這種“金礦”的價(jià)值挖掘與實(shí)現(xiàn)需要借助相應(yīng)的技術(shù)與平臺(tái),也需要人類(lèi)智慧的參與,于是,對(duì)大數(shù)據(jù)資源的高效利用成為了相關(guān)業(yè)界如IT、企業(yè)、科研等普遍關(guān)注的問(wèn)題。以信息組織、信息利用為所長(zhǎng)的圖書(shū)館,也感受到了大數(shù)據(jù)時(shí)代所帶來(lái)的變化,在近年來(lái)也展開(kāi)了大量的圖書(shū)館視野下的相關(guān)理論研究。
大數(shù)據(jù)帶給圖書(shū)館的影響與變化主要是數(shù)據(jù)的變化,即圖書(shū)館從面對(duì)傳統(tǒng)的有序、單一、少量的結(jié)構(gòu)化數(shù)據(jù)如數(shù)據(jù)庫(kù)數(shù)據(jù)向無(wú)序、多元、海量的非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)方向轉(zhuǎn)移。其中,作為大數(shù)據(jù)組成部分、集合了理念與實(shí)踐的開(kāi)放數(shù)據(jù)(Open Data)也受到了關(guān)注與研究。本文在概述大數(shù)據(jù)與開(kāi)放數(shù)據(jù)的基礎(chǔ)上,對(duì)開(kāi)放數(shù)據(jù)視角下的圖書(shū)館角色進(jìn)行了審視與分析,最后對(duì)大數(shù)據(jù)時(shí)代開(kāi)放數(shù)據(jù)環(huán)境下的圖書(shū)館創(chuàng)新服務(wù)如數(shù)據(jù)監(jiān)管、知識(shí)發(fā)現(xiàn)等服務(wù)進(jìn)行了列舉和概述。
1 大數(shù)據(jù)與開(kāi)放數(shù)據(jù)概述
1.1 大數(shù)據(jù)
目前,業(yè)界對(duì)大數(shù)據(jù)還沒(méi)有一個(gè)明確的定義,但也一般都認(rèn)為大數(shù)據(jù)是不可能用常規(guī)軟件和分析工具進(jìn)行分析的巨大數(shù)據(jù)集[2]。此外,大數(shù)據(jù)既有結(jié)構(gòu)化數(shù)據(jù),也有非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),涵蓋了文本、數(shù)字、圖像、視頻等多種類(lèi)型,并可跨越多個(gè)數(shù)據(jù)平臺(tái),如社交媒體網(wǎng)絡(luò)、網(wǎng)絡(luò)日志文件、傳感器、智能手機(jī)的定位數(shù)據(jù)、數(shù)字化文檔及歸檔的照片和視頻等[3]。
1.2 開(kāi)放數(shù)據(jù)
互聯(lián)網(wǎng)與開(kāi)放獲?。∣pen Access,OA)運(yùn)動(dòng)的發(fā)展,既使得人們的信息交流更加便捷與方便,也讓對(duì)開(kāi)源和開(kāi)放知識(shí)、數(shù)據(jù)、資源的利用逐漸成為人們獲取信息的主要組成部分。由此而產(chǎn)生的自由開(kāi)放思維也成了人們信息獲取的主要思維,總是期待著出現(xiàn)解決不局限于軟件、開(kāi)放格式和數(shù)據(jù)自由公開(kāi)與再使用的開(kāi)放信息,于是一種實(shí)現(xiàn)了更廣范圍的公開(kāi)與再使用數(shù)據(jù)即開(kāi)放數(shù)據(jù)便應(yīng)運(yùn)而生。
對(duì)開(kāi)放數(shù)據(jù)的定義存在爭(zhēng)論,不同的組織、機(jī)構(gòu)也存在不同的理解視角,但對(duì)于開(kāi)放數(shù)據(jù)的內(nèi)涵即其是一種理念及實(shí)踐、數(shù)據(jù)不受版權(quán)與專(zhuān)利等機(jī)制限制、可以被任何人自由獲取還是都能接受與認(rèn)可。有學(xué)者也曾對(duì)開(kāi)放數(shù)據(jù)的內(nèi)涵闡釋為:按照用戶特定的需求和一定的互聯(lián)網(wǎng)協(xié)議、規(guī)則、框架,對(duì)Web數(shù)據(jù)進(jìn)行存儲(chǔ)和組織的活動(dòng),而利用的數(shù)據(jù)來(lái)自不同的數(shù)據(jù)源或是不同的數(shù)據(jù)類(lèi)型,最終目標(biāo)是實(shí)現(xiàn)信息在網(wǎng)絡(luò)空間的開(kāi)放、共享與重用,以尋求信息數(shù)據(jù)最大可能的無(wú)限獲取與重用[4]。
開(kāi)放數(shù)據(jù)與一般的數(shù)據(jù)相比,其最大的特征就是數(shù)據(jù)集增值方式,即對(duì)象數(shù)據(jù)包含了所有的事實(shí)、數(shù)據(jù)、信息乃至智慧和知識(shí),也不如其它傳統(tǒng)數(shù)據(jù)可以直接獲取、利用和分析,依賴于見(jiàn)證者而存在,不是我們接受或不接受的數(shù)據(jù)或其它,是我們給予、分享和接受的記憶[5]。同時(shí),開(kāi)放數(shù)據(jù)還具有開(kāi)放性增值方式,因而在用戶多、普及率高的政府網(wǎng)站及公共信息服務(wù)、商業(yè)應(yīng)用等領(lǐng)域應(yīng)用廣泛,目前,英、美、澳等政府和淘寶等商業(yè)組織都應(yīng)用開(kāi)放數(shù)據(jù)進(jìn)行信息公開(kāi)等服務(wù),以增強(qiáng)與公眾、用戶之間的交流與互信。
2 基于開(kāi)放數(shù)據(jù)視角的圖書(shū)館角色審視與定位
在開(kāi)放數(shù)據(jù)的具體實(shí)踐如開(kāi)放存取運(yùn)動(dòng)、開(kāi)放研究出版、科學(xué)家電子實(shí)驗(yàn)筆記開(kāi)放及科學(xué)知識(shí)的出版與交流等形式中,圖書(shū)館都是各個(gè)實(shí)踐形式的主要參與者與推行者,但由于開(kāi)放數(shù)據(jù)運(yùn)動(dòng)目前在各國(guó)的實(shí)踐主體主要是政府,并且世界主要發(fā)達(dá)國(guó)家如美國(guó)、英國(guó)、法國(guó)等也均承諾政府將把公眾的需求放在重要位置,通過(guò)征求公眾意見(jiàn)逐步開(kāi)放有價(jià)值的數(shù)據(jù)集,體現(xiàn)了政府在開(kāi)放數(shù)據(jù)運(yùn)動(dòng)中的絕對(duì)推動(dòng)者、踐行者地位。在這種環(huán)境下,圖書(shū)館必須準(zhǔn)確定位自己的角色,發(fā)揮自身優(yōu)勢(shì)為開(kāi)放數(shù)據(jù)的發(fā)展提供服務(wù),如基于開(kāi)放數(shù)據(jù)的館藏目錄、開(kāi)放獲取等。
Hope Leman認(rèn)為在開(kāi)放數(shù)據(jù)運(yùn)動(dòng)中,圖書(shū)館員是知識(shí)工具箱與支持專(zhuān)家,即實(shí)現(xiàn)對(duì)概念的知識(shí)注釋、實(shí)驗(yàn)及相關(guān)技術(shù)研發(fā)的知識(shí)支持[6]。我國(guó)學(xué)者劉春麗、徐躍權(quán)則認(rèn)為在開(kāi)放數(shù)據(jù)環(huán)境中,圖書(shū)館可能扮演與研究周期各個(gè)階段的科學(xué)產(chǎn)出匹配的知識(shí)服務(wù)中心和開(kāi)放數(shù)據(jù)的管理和保存中心兩大角色[7]。
(1)知識(shí)服務(wù)中心。隨著科學(xué)研究的周期不同,圖書(shū)館在科研過(guò)程中所發(fā)揮的作用和提供的服務(wù)也隨之不同,如在科學(xué)研究的概念階段,圖書(shū)館可為進(jìn)行科學(xué)理念、研究計(jì)劃討論的用戶提供開(kāi)放書(shū)目等服務(wù),并將討論結(jié)果等形成新的知識(shí)分享數(shù)據(jù);在數(shù)據(jù)分析與出版階段,圖書(shū)館可借助于在開(kāi)放存取期刊發(fā)表、提交到機(jī)構(gòu)知識(shí)庫(kù)中等途徑將科學(xué)研究的結(jié)論、實(shí)驗(yàn)數(shù)據(jù)、科研過(guò)程等進(jìn)行開(kāi)放獲取與共享交流;在同行評(píng)審階段,圖書(shū)館可以發(fā)揮科研情報(bào)中心的作用,基于學(xué)術(shù)社交網(wǎng)絡(luò)及開(kāi)放存取平臺(tái),分析科學(xué)研究論文與數(shù)據(jù)的使用與評(píng)價(jià)活動(dòng),提取基于使用與評(píng)價(jià)的選擇性計(jì)量指標(biāo)(Altmetrics),對(duì)科學(xué)論文和科學(xué)數(shù)據(jù)的科學(xué)價(jià)值進(jìn)行評(píng)價(jià),進(jìn)而評(píng)估論文與作者在某一個(gè)研究領(lǐng)域的學(xué)術(shù)影響力[7]。
(2)開(kāi)放數(shù)據(jù)的管理與保存中心。歐洲研究圖書(shū)館協(xié)會(huì)主席Paul Ayris博士認(rèn)為在科學(xué)研究的開(kāi)放工作流中,要增加專(zhuān)業(yè)圖書(shū)館的可見(jiàn)度,要重視科學(xué)數(shù)據(jù)的再利用及科學(xué)數(shù)據(jù)保存的可持續(xù)性[8]。筆者以為在以數(shù)據(jù)密集型為科學(xué)研究特征的第四代科研范式下,數(shù)據(jù)特別是產(chǎn)生于實(shí)驗(yàn)、記錄了科研過(guò)程等重要信息的科學(xué)數(shù)據(jù)是科學(xué)研究所重視和再利用的數(shù)據(jù)對(duì)象,圖書(shū)館有責(zé)任與義務(wù)扮演開(kāi)放數(shù)據(jù)管理與中心的角色,以為科學(xué)家等用戶群體提供開(kāi)放數(shù)據(jù)的檢索、分析、保存等服務(wù)?;陂_(kāi)放數(shù)據(jù)的連續(xù)利用視角,圖書(shū)館還需進(jìn)行諸如開(kāi)放數(shù)據(jù)的關(guān)聯(lián)與、標(biāo)示與引用等服務(wù)。
3 大數(shù)據(jù)時(shí)代的圖書(shū)館開(kāi)放數(shù)據(jù)服務(wù)
大數(shù)據(jù)帶給社會(huì)以數(shù)據(jù)驅(qū)動(dòng)的社會(huì)創(chuàng)新與發(fā)展動(dòng)力,因此如美國(guó)總統(tǒng)科學(xué)技術(shù)顧問(wèn)委員會(huì)給總統(tǒng)和國(guó)會(huì)的報(bào)告所說(shuō)“聯(lián)邦政府的每一個(gè)機(jī)構(gòu)和部門(mén),都要制定一個(gè)應(yīng)對(duì)大數(shù)據(jù)的戰(zhàn)略”[9]一樣,包括政府在內(nèi)的社會(huì)各個(gè)機(jī)構(gòu)如美國(guó)政府、歐盟等都制定了應(yīng)對(duì)大數(shù)據(jù)的戰(zhàn)略對(duì)策。2010年11月,歐盟通信委員會(huì)向歐洲議會(huì)提交了“開(kāi)放數(shù)據(jù): 創(chuàng)新、增長(zhǎng)和透明治理的引擎”報(bào)告[10],首次將開(kāi)放數(shù)據(jù)與大數(shù)據(jù)關(guān)聯(lián)到了一起,并以開(kāi)放數(shù)據(jù)為核心,對(duì)大數(shù)據(jù)時(shí)代的挑戰(zhàn)進(jìn)行了戰(zhàn)略部署。但將大數(shù)據(jù)概念應(yīng)用到開(kāi)放數(shù)據(jù)上,則首先意味著數(shù)據(jù)的規(guī)模和類(lèi)型有了變化,產(chǎn)生于社交媒體、智能終端、傳感器上的海量非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)都是開(kāi)放數(shù)據(jù)的范疇;其次,意味著數(shù)據(jù)的應(yīng)用發(fā)生了變化,即數(shù)據(jù)不再是單一領(lǐng)域的數(shù)據(jù),而是覆蓋了用戶的所有需求領(lǐng)域,并可直接獲取和應(yīng)用。
大數(shù)據(jù)賦予開(kāi)放數(shù)據(jù)的新要求也意味著大數(shù)據(jù)時(shí)代的圖書(shū)館開(kāi)放數(shù)據(jù)服務(wù)將被賦予新的要求,筆者認(rèn)為,大數(shù)據(jù)時(shí)代的圖書(shū)館開(kāi)放數(shù)據(jù)服務(wù),主要有:
(1)多領(lǐng)域數(shù)據(jù)源的整合與開(kāi)放服務(wù)。從目前的開(kāi)放數(shù)據(jù)運(yùn)動(dòng)發(fā)展來(lái)看,主要實(shí)踐有開(kāi)放政府?dāng)?shù)據(jù)、開(kāi)放存取學(xué)術(shù)期刊與機(jī)構(gòu)知識(shí)庫(kù),距大數(shù)據(jù)時(shí)代所要求的多類(lèi)型、多領(lǐng)域發(fā)展程度要求尚遠(yuǎn)。圖書(shū)館由于有著涵蓋了所有領(lǐng)域的豐富館藏資源,是大數(shù)據(jù)時(shí)代數(shù)據(jù)開(kāi)放與整合的最佳實(shí)踐者。因此,圖書(shū)館可整合多方資源,如科技、人文、氣象、政務(wù)等諸多領(lǐng)域的報(bào)告、實(shí)驗(yàn)數(shù)據(jù)等資源,進(jìn)行數(shù)據(jù)的整合與開(kāi)放,讓公眾通過(guò)圖書(shū)館的一站式檢索服務(wù)平臺(tái)來(lái)獲取所需的數(shù)據(jù)。
(2)基于知識(shí)聯(lián)盟的數(shù)據(jù)開(kāi)放與共享服務(wù)。由于大數(shù)據(jù)時(shí)代的開(kāi)放數(shù)據(jù)是整合了不同系統(tǒng)、政府和部門(mén)之間的數(shù)據(jù)集,這就需要建立一個(gè)數(shù)據(jù)共享和互操作的框架,如新澤西州運(yùn)輸部利用采集到的數(shù)據(jù)(在汽車(chē)制造商的管轄下)能夠發(fā)現(xiàn)諸如擁堵和交通流等問(wèn)題,而這些功能通常是由當(dāng)?shù)鼗蛉珖?guó)的政府交通運(yùn)輸部門(mén)負(fù)責(zé)[11]。圖書(shū)館可借鑒這些成功的案例進(jìn)行構(gòu)建或參與到由政府、企業(yè)、社會(huì)機(jī)構(gòu)組成的知識(shí)聯(lián)盟,利用協(xié)作分析技術(shù)對(duì)數(shù)據(jù)和系統(tǒng)進(jìn)行無(wú)縫隙整合。
(3)基于一站式服務(wù)平臺(tái)的知識(shí)發(fā)現(xiàn)服務(wù)。數(shù)據(jù)“開(kāi)放”的核心是為了用戶更高效的發(fā)現(xiàn)和利用,以縮小信息所有者和用戶的信息不對(duì)稱距離。EDS、PRIMO、SUMMON等一站式知識(shí)發(fā)現(xiàn)平臺(tái)的應(yīng)用為圖書(shū)館的開(kāi)放數(shù)據(jù)知識(shí)發(fā)現(xiàn)服務(wù)提供了方便,圖書(shū)館可應(yīng)用這些平臺(tái)對(duì)用戶提供知識(shí)咨詢等服務(wù)。
(4)數(shù)據(jù)的開(kāi)發(fā)、創(chuàng)建、共享與轉(zhuǎn)換服務(wù)。此類(lèi)服務(wù)在圖書(shū)館界已有著成功的實(shí)踐,如開(kāi)源站點(diǎn)biblios.net采用了類(lèi)似維基模式向圖書(shū)館界提供開(kāi)放MARC數(shù)據(jù)的開(kāi)發(fā)、創(chuàng)建、共享、轉(zhuǎn)換服務(wù),目前以3000萬(wàn)余條數(shù)據(jù)成為為全球最大的免費(fèi)圖書(shū)館編目數(shù)據(jù)平臺(tái)[12],德國(guó)國(guó)家圖書(shū)館[13]、大英圖書(shū)館[14]也宣布對(duì)外提供開(kāi)放數(shù)據(jù)服務(wù)。
(5)數(shù)據(jù)監(jiān)管服務(wù)。開(kāi)放數(shù)據(jù)的檢索、價(jià)值挖掘與應(yīng)用實(shí)現(xiàn),必須經(jīng)過(guò)一定的排列、存檔與管理過(guò)程,而這些數(shù)據(jù)有可能是來(lái)自于有數(shù)據(jù)組織經(jīng)驗(yàn)和能力的政府、企業(yè)、公益組織等,也可能是來(lái)自于只提供數(shù)據(jù)而沒(méi)有數(shù)據(jù)組織或沒(méi)有組織意愿的公眾、機(jī)構(gòu)。圖書(shū)館可發(fā)揮自身的信息組織、信息分類(lèi)特長(zhǎng),對(duì)這些數(shù)據(jù)進(jìn)行修改、合并、標(biāo)引、分析與索引,即提供數(shù)據(jù)監(jiān)管服務(wù),使數(shù)據(jù)集合之后獲取最大收益。
篇10
大會(huì)熱忱歡迎從事信息安全領(lǐng)域管理、科研、教學(xué)、生產(chǎn)、應(yīng)用和服務(wù)的組織機(jī)構(gòu)和個(gè)人踴躍投稿。所投稿件經(jīng)過(guò)專(zhuān)家組評(píng)審后,錄取論文將在《信息網(wǎng)絡(luò)安全》(2015年第9期)雜志正刊上刊登,并收錄中國(guó)知網(wǎng)論文庫(kù)?!缎畔⒕W(wǎng)絡(luò)安全》將贈(zèng)送國(guó)家圖書(shū)館等單位作為藏書(shū)收藏,并向錄取論文作者發(fā)放稿費(fèi),專(zhuān)委會(huì)還將向優(yōu)秀論文作者頒發(fā)獎(jiǎng)金和獲獎(jiǎng)證書(shū)。
一、會(huì)議主題
2015年是網(wǎng)絡(luò)強(qiáng)國(guó)戰(zhàn)略的起步年。網(wǎng)絡(luò)強(qiáng)國(guó)離不開(kāi)自主可控的安全技術(shù)支持,只有實(shí)現(xiàn)網(wǎng)絡(luò)和信息安全的前沿技術(shù)和科技水平的趕超,才能實(shí)現(xiàn)關(guān)鍵核心技術(shù)的真正自主可控,才能實(shí)現(xiàn)從戰(zhàn)略層面、實(shí)施層面全局而振的長(zhǎng)策。當(dāng)前,信息網(wǎng)絡(luò)應(yīng)用飛速發(fā)展,技術(shù)創(chuàng)新的步伐越來(lái)越快,云計(jì)算、大數(shù)據(jù)、移動(dòng)網(wǎng)絡(luò)、物聯(lián)網(wǎng)、智能化、三網(wǎng)融合等一系列信息化應(yīng)用新概念、新技術(shù)、新應(yīng)用給信息安全行業(yè)提出新的挑戰(zhàn)。同時(shí),國(guó)際上網(wǎng)絡(luò)安全技術(shù)事件和政治博弈越來(lái)越激烈和復(fù)雜,“工業(yè)4.0”時(shí)代對(duì)網(wǎng)絡(luò)安全的沖擊來(lái)勢(shì)洶涌。我們需要全民樹(shù)立建設(shè)網(wǎng)絡(luò)強(qiáng)國(guó)的新理念,并切實(shí)提升國(guó)家第五空間的戰(zhàn)略地位和執(zhí)行力。本次會(huì)議的主題為“科技是建設(shè)網(wǎng)絡(luò)強(qiáng)國(guó)的基礎(chǔ)”。
二、征文內(nèi)容
1. 關(guān)于提升國(guó)家第五空間的戰(zhàn)略地位和執(zhí)行力的研究
2. 云計(jì)算與云安全
3. 大數(shù)據(jù)及其應(yīng)用中的安全
4. 移動(dòng)網(wǎng)絡(luò)及其信息安全
5. 物聯(lián)網(wǎng)安全
6. 智能化應(yīng)用安全
7. 網(wǎng)絡(luò)監(jiān)測(cè)與監(jiān)管技術(shù)
8. 面對(duì)新形勢(shì)的等級(jí)保護(hù)管理與技術(shù)研究
9. 信息安全應(yīng)急響應(yīng)體系
10. 可信計(jì)算
11. 網(wǎng)絡(luò)可信體系建設(shè)研究
12. 工業(yè)控制系統(tǒng)及基礎(chǔ)設(shè)施的網(wǎng)絡(luò)與信息安全
13. 網(wǎng)絡(luò)與信息系統(tǒng)的內(nèi)容安全
14. 預(yù)防和打擊計(jì)算機(jī)犯罪
15. 網(wǎng)絡(luò)與信息安全法制建設(shè)的研究
16. 重大安全事件的分析報(bào)告與對(duì)策建議
17. 我國(guó)網(wǎng)絡(luò)安全產(chǎn)業(yè)發(fā)展的研究成果與訴求
18. 其他有關(guān)網(wǎng)絡(luò)安全和信息化的學(xué)術(shù)成果
凡屬于網(wǎng)絡(luò)安全和信息安全領(lǐng)域的各類(lèi)學(xué)術(shù)論文、研究報(bào)告和成果介紹均可投稿。
三、征文要求
1. 論文要求主題明確、論據(jù)充分、聯(lián)系實(shí)際、反映信息安全最新研究成果,未曾發(fā)表,篇幅控制在5000字左右。
2. 提倡學(xué)術(shù)民主。鼓勵(lì)新觀點(diǎn)、新概念、新成果、新發(fā)現(xiàn)的發(fā)表和爭(zhēng)鳴。
3. 提倡端正學(xué)風(fēng)、反對(duì)抄襲,將對(duì)投稿的文章進(jìn)行相似性比對(duì)檢查。
4. 文責(zé)自負(fù)。單位和人員投稿應(yīng)先由所在單位進(jìn)行保密審查,通過(guò)后方可投稿。
5. 作者須按計(jì)算機(jī)安全專(zhuān)業(yè)委員會(huì)秘書(shū)處統(tǒng)一發(fā)出的論文模版格式排版并如實(shí)填寫(xiě)投稿表,在截止日期前提交電子版的論文與投稿表。
6、論文模版和投稿表請(qǐng)到計(jì)算機(jī)安全專(zhuān)業(yè)委員會(huì)網(wǎng)站下載,網(wǎng)址是:.cn。
聯(lián)系人:田芳,郝文江
電話:010-88513291,88513292
征文上傳Email 地址:
熱門(mén)標(biāo)簽
相關(guān)文章
2大數(shù)據(jù)技術(shù)在工業(yè)經(jīng)濟(jì)中的應(yīng)用
3大數(shù)據(jù)在農(nóng)村金融機(jī)構(gòu)的運(yùn)用
4大數(shù)據(jù)背景下企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)管理及思考