卷積神經(jīng)網(wǎng)絡概述范文
時間:2024-03-29 18:16:54
導語:如何才能寫好一篇卷積神經(jīng)網(wǎng)絡概述,這就需要搜集整理更多的資料和文獻,歡迎閱讀由公務員之家整理的十篇范文,供你借鑒。
篇1
關鍵詞:深度學習;機器學習;卷積神經(jīng)網(wǎng)絡
1概述
深度學習(Deep Learning)是人工智能、圖像建模、模式識別、神經(jīng)網(wǎng)絡、最優(yōu)化理論和信號處理等領域的交叉學科,主要構建和模擬人腦進行分析學習,它屬于機器學習的新興領域。
2大數(shù)據(jù)與深度學習
目前,光學檢測、互聯(lián)網(wǎng)、用戶數(shù)據(jù)、互聯(lián)網(wǎng)、金融公司等許多領域都出現(xiàn)了海量數(shù)據(jù),采用BP算法對于訓練神經(jīng)網(wǎng)絡出現(xiàn)了梯度越來越稀疏、收斂到局部最小值只能用有標簽的數(shù)據(jù)來訓練等缺點。Hinton于2006年提出了深度學習的概念,Lecun等人提出了卷積神經(jīng)網(wǎng)絡,卷積神經(jīng)網(wǎng)絡利用空間關系減少參數(shù)數(shù)目以提高訓練性能。
CPU和GPU計算能力大幅提升,為深度學習提供了硬件平臺和技術手段,在海量大數(shù)據(jù)處理技術上解決了早期神經(jīng)網(wǎng)絡訓練不足出現(xiàn)的過擬合、泛化能力差等問題。
大數(shù)據(jù)和深度學習必將互相支撐,推動科技發(fā)展。
3深度學習模型
深度學習模型實際上是一個包含多個隱藏層的神經(jīng)網(wǎng)絡,目前主要有卷積神經(jīng)網(wǎng)絡,深深度置信神經(jīng)網(wǎng)絡,循環(huán)神經(jīng)網(wǎng)絡。
1)卷積神經(jīng)網(wǎng)絡
在機器學習領域,卷積神經(jīng)網(wǎng)絡屬于前饋神經(jīng)網(wǎng)絡的一種,神經(jīng)元不再是全連接的模式,而是應用了局部感受區(qū)域的策略。然而傳統(tǒng)的神經(jīng)網(wǎng)絡使用神經(jīng)元間全連接的網(wǎng)絡結構來處理圖像任務,因此,出現(xiàn)了很多缺陷,導致模型⑹急劇增加,及其容易過擬合。
在卷積神經(jīng)網(wǎng)絡中,網(wǎng)絡中的神經(jīng)元只與前一層的部分神經(jīng)元連接,利用圖像數(shù)據(jù)的空間結構,鄰近像素間具有更強的相關性,單個神經(jīng)元僅對局部信息進行響應,相鄰神經(jīng)元感受區(qū)域存在重疊,因此,綜合所有神經(jīng)元可以得到全局信息的感知。
另外,一個卷積層中的所有神經(jīng)元均由同一個卷積核對不同區(qū)域數(shù)據(jù)響應而得到,即共享同一個卷積核,使得卷積層訓練參數(shù)的數(shù)量急劇減少,提高了網(wǎng)絡的泛化能力。
一般在卷積層后面會進行降采樣操作,對卷積層提取的特征進行聚合統(tǒng)計。降采樣區(qū)域一般不存在重疊現(xiàn)象。降采樣簡化了卷積層的輸出信息,進一步減少了訓練參數(shù)的數(shù)量,增強了網(wǎng)絡的泛化能力。
卷積神經(jīng)網(wǎng)絡實現(xiàn)了局部特征的自動提取,使得特征提取與模式分類同步進行,適用于處理高分辨率的圖像數(shù)據(jù)。目前,卷積神經(jīng)網(wǎng)絡在圖像分類、自然語言處理等領域得到廣泛應用。
2)深度置信網(wǎng)絡
深度置信網(wǎng)絡是一種生成模型,網(wǎng)絡中有若干隱藏層,同一隱藏層內(nèi)的神經(jīng)元沒有連接,隱藏層間的神經(jīng)元全連接。神經(jīng)網(wǎng)絡經(jīng)過“反向運行”得到輸入數(shù)據(jù)。
深度置信網(wǎng)絡可以用做生成模型,通過前期的逐層無監(jiān)督學習,神經(jīng)網(wǎng)絡可以較好的對輸入數(shù)據(jù)進行描述,然后把訓練好的神經(jīng)網(wǎng)絡看作深度神經(jīng)網(wǎng)絡,最后得到分類任務的深度神經(jīng)網(wǎng)絡。
深度置信網(wǎng)絡可以用于圖像識別、圖像生成等領域,深度置信網(wǎng)絡可以進行無監(jiān)督或半監(jiān)督的學習,利用無標記數(shù)據(jù)進行預訓練,提高神經(jīng)網(wǎng)絡性能。但近幾年由于卷積神經(jīng)網(wǎng)絡的飛速發(fā)展,深度置信網(wǎng)絡已經(jīng)很少被提及。
3)循環(huán)神經(jīng)網(wǎng)絡
循環(huán)神經(jīng)網(wǎng)絡是一種專門用于處理時序數(shù)據(jù)的神經(jīng)網(wǎng)絡,它與典型的前饋型神經(jīng)網(wǎng)絡最大區(qū)別在于網(wǎng)絡中存在環(huán)形結構,隱藏層內(nèi)部的神經(jīng)元是互相連接的,可以存儲網(wǎng)絡的內(nèi)部狀態(tài),其中包含序列輸入的歷史信息,實現(xiàn)了對時序動態(tài)行為的描述。這里的時序并非僅僅指代時間概念上的順序,也可以理解為序列化數(shù)據(jù)間的相對位置。如語音中的發(fā)音順序,某個英語單詞的拼寫順序等。序列化輸入的任務都可以用循環(huán)神經(jīng)網(wǎng)絡來處理。如語音、視頻、文本等。對于序列化數(shù)據(jù),每次處理時輸入為序列中的一個元素,比如單個字符、單詞、音節(jié),期望輸出為該輸入在序列數(shù)據(jù)中的后續(xù)元素。循環(huán)神經(jīng)網(wǎng)絡可以處理任意長度的序列化數(shù)據(jù)。
循環(huán)神經(jīng)網(wǎng)絡可以用于機器翻譯、連寫字識別、語音識別等。循環(huán)神經(jīng)網(wǎng)絡和卷積網(wǎng)絡結合,將卷積神經(jīng)網(wǎng)絡用于檢測并識別圖像中的物體,循環(huán)神經(jīng)網(wǎng)絡用于識別出物體的名稱為輸入,生成合理的語句,從而實現(xiàn)對圖像內(nèi)容的描述。
4深度學習應用
1)語音識別
語音識別技術主要包括特征提取技術、模式匹配準則及模型訓練技術三個方面。其應用領域主要有語音輸入系統(tǒng)、語音控制系統(tǒng)和智能對話查詢系統(tǒng),語音識別極大地推動了人工智能的快速發(fā)展。1952年Davis等人研究了世界上第一個能識別10個英文數(shù)字發(fā)音的實驗系統(tǒng)。大規(guī)模的語音識別研究是在20世紀70年代以后,在小詞匯量、孤立詞的識別方面取得了實質(zhì)性的進展。2012年,微軟研究院使用深度神經(jīng)網(wǎng)絡應用在語音識別上將識別錯誤率降低了20%,取得了突破性的進展。2015年11月17日,浪潮集團聯(lián)合全球可編程芯片巨頭Altera,以及中國最大的智能語音技術提供商科大訊飛,共同了一套DNN語音識別方案。
2)圖像分析
圖像是深度學習最早嘗試的應用領域。1989年,LeCun和他的同事們就發(fā)表了卷積神經(jīng)網(wǎng)絡的工作。2012年10月,Hinton和他的兩個學生用更深的CNN在ImageNet挑戰(zhàn)上獲得了第一名,使圖像識別向前躍進了一大步。
自2012年以來,深度學習應用于圖像識別使得準確率大大上升,避免了消耗人工特征抽取的時間,極大地提升了效率,目前逐漸成為主流的圖像識別與檢測方法。
篇2
關鍵詞:PCA算法;人臉識別;五級并行PCA模型;權重計算;均值濾波
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2016)19-0147-02
Research on Face Recognition System Based on Parallel PCA Algorithm
ZHAO Ya-peng
(College of Information Science and Engineering, Shandong University of Science and Technology, Qingdao 266590, China )
Abstract:In order to solve the problem of fast and accurate face recognition, a face recognition method based on parallel PCA algorithm is proposed. Using principal component analysis (PCA) method can reduce the dimension of features, easy to implement, training time is short, the design and implementation of a parallel algorithm for PCA, first of all according to the whole image to extract the 4 part of face images, then the whole image and 4 partial images at the same time by the same structure of the PCA model of learning, face feature vector extraction, the Euclidean distance for matching calculation of the test images and training images, finally through the test image with the five level parallel PCA model identification results are weighted decision, in order to achieve face recognition. Using the image data of the ORL face database , the simulation results in Matlab show that the method has a great degree of improvement in accuracy, the recognition speed is relatively fast, with a high degree of robustness.
Key words:PCA algorithm;Face recognition;Five level parallel PCA model;Weight calculation;Mean filter
1 概述
隨著智能終端設備(手機、Pad、門禁等)的不斷發(fā)展,身份識別已經(jīng)成為我們?nèi)粘I畹闹匾M成部分,身份驗證技術被廣泛應用于各個領域,特別是人們對于個人隱私信息的保護,使得身份識別再次成為關注的焦點。人臉識別作為身份識別的重要手段之一,因其具有識別率高、采集性強、接受性高等特點,在身份識別的各類方法中具有獨特的優(yōu)勢,成為了目前比較熱門的研究領域。
目前,卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks)是圖像識別領域最重要的研究熱點,而且在語音識別領域也取得了不錯的效果,但是卷積神經(jīng)網(wǎng)絡的整個訓練過程比較費時,而且實現(xiàn)相對復雜,而基于PCA算法的人臉識別技術因其自身存在的許多缺陷,一直沒有被廣泛應用,但該方法實現(xiàn)簡單、學習速度較快,因此,本文主要研究改進的并行PCA算法,以彌補傳統(tǒng)PCA算法在人臉識別領域的不足。
本文提出的基于并行PCA算法的人臉識別技術,首先對原始圖像進行預處理,如灰度歸一化和中值濾波等操作,以消除圖像噪聲、光照等因素造成的影響,使得特征提取更加準確可靠。然后,通過5級并行PCA模型獲取數(shù)據(jù)的不同特征矩陣,然后將訓練圖像和測試圖像分別進行子空間的投影,利用歐氏徑向基函數(shù)(Euclidean Radial Basis Function)進行人臉的匹配,最后根據(jù)訓練得到的權值向量進行加權決策。本文通過ORL人臉數(shù)據(jù)庫的仿真實驗證明,該算法的效果明顯好于PCA算法。
2 并行PCA算法
PCA(Principal Component Analysis)即主成分分析技術,PCA是基于K-L變換的統(tǒng)計學分析方法,是多元分析中常用的方法,其基本思想是將高維數(shù)據(jù)投影到低維空間,主要過程在于特征值的計算和矩陣的降維。將PCA應用于人臉識別時,首先將圖像轉化成矩陣向量,然后進行矩陣的奇異值分解(Singular Value Decomposition),將高維向量通過計算得到的特征向量矩陣投影到低維的向量空間,從而減少數(shù)據(jù)的計算量。
2.1 基于并行PCA算法的人臉識別流程
本文中提出的并行PCA算法,正是基于上述的PCA算法,通過建立5級的PCA算法模型同時進行數(shù)據(jù)特征的學習,使得最終的人臉識別準確率得到進一步的提高,具體的人臉識別流程如圖1所示。
2.2 并行PCA算法的實現(xiàn)的步驟
2.2.1 人臉圖像的預處理
首先,需要把ORL人臉數(shù)據(jù)數(shù)據(jù)庫的所有訓練圖像大小進行歸一化,并轉化為像素矩陣,矩陣大小記為,為矩陣的行數(shù),為矩陣的列數(shù)。之后利用均值濾波和灰度歸一化進行圖像的去噪處理,以消除光線等問題對圖像造成的影響,以方便后期的特征提取等操作。
2.2.2 人臉圖像的PCA降維
根據(jù)PCA的原理,可以將每一張圖像看成是一個高維的向量,所有的圖像可以看成是這個高維空間中的一點,PCA要做的就是找出另外一個盡可能多的反應圖像特征的低維空間。
假如樣本由n張大小為p*q的人臉圖像組成,那么每一張圖像可以保存為一列向量,向量維數(shù)是p*q,真?zhèn)€樣本可以看成是一個行數(shù)為n,列數(shù)為p*q的矩陣記為矩陣A。
根據(jù)上述過程,首先求出矩陣A的協(xié)方差矩陣,然后求出協(xié)方差矩陣的特征值,選取前m個最大的特征值,然后求出對應的特征向量,組成一個特征矩陣。通常所說的“特征臉”就是這些特征向量,而特種功能矩陣就是“特征臉”空間或者說子空間。然后可以將每一張圖片投影到該子空間,得到了每一張圖像的投影矩陣(l*m)。
2.2.3 人臉圖像的識別
對于待識別的圖像,也可以看成是一列向量,投影到子空間得到一個投影矩陣,然后一一求出這個投影矩陣與樣本圖像投影矩陣最相似的。然而有可能該人臉不是人臉庫中的,所以最相似的人臉也不一定是同一個人臉,還需要設置一個閾值來判斷待識別人臉是否是人臉庫中的。
人臉識別部分正是基于上述的PCA算法,在本文所提出的并行PCA模型中,是由5級的PCA模型同時進行人臉識別這一操作,最后根據(jù)訓練得到的權值向量進行決策,通過使用多個PCA模型,從而使得整個識別過程的準確率得到進一步的提升。
3 系統(tǒng)設計及實現(xiàn)
3.1 系統(tǒng)總體設計
本文中所提出的基于并行PCA算法的人臉識別系統(tǒng),包括人臉圖像采集模塊、圖像預處理模塊、識別模塊。人臉圖像采集模塊主要是采集訓練圖像數(shù)據(jù)和測試圖像數(shù)據(jù),并由原始圖像提取出4幅與之對應的部分圖像;圖像預處理模塊主要就是進行圖像歸一化和圖像的去噪工作,圖像的歸一化包括大小歸一化和灰度歸一化,可以使用比較常見的直方圖均衡化等技術,而圖像的去噪可以使用中值濾波技術,以去除比較常見的高斯噪聲等;人臉識別模塊是基于5級相互獨立的PCA模型進行特征值的學習和比對,而且通過訓練得到的權值向量進行最終的是臉識別決策。整個系統(tǒng)的實現(xiàn)是基于Matlab進行仿真實驗的,實驗數(shù)據(jù)來自劍橋大學AT&T實驗室創(chuàng)建的ORL人臉數(shù)據(jù)庫。
3.2系統(tǒng)功能模塊實現(xiàn)
3.2.1人臉圖像采集實現(xiàn)
圖像采集模塊主要就是將存儲在本地的圖像文件通過Matlab的imread函數(shù)讀入矩陣中,以方便后期的PCA操作,其核心語句為Image{t}=imread([[filepath,F(xiàn)ilDir(ii).name],'\',ImDir{ii}(jj).name]);
使用上述語句即可讀入訓練數(shù)據(jù)和測試數(shù)據(jù)文件。
3.2.2 圖像預處理模塊
該模塊的主要任務就是利用中值濾波和直方圖均衡化進行圖像的去噪工作,以消除不同光照和圖像噪聲的影響,提高準確率。其核心代碼為:
S1=zeros(1,256);
for i=1:256
for j=1:i
S1(i)=GP(j)+S1(i);
end
end
S2=round((S1*256)+0.5);
for i=1:256
GPeq(i)=sum(GP(find(S2==i)));
end
3.2.3 識別模塊
圖像經(jīng)過之前的預處理之后,需要將圖像矩陣轉化為列向量,一幅圖像就是一列向量,整個訓練圖像構成了整個特征空間矩陣,測試圖像也會轉化為一列向量,之后會利用矩陣之間的運算進行圖像的分析計算。識別模塊的工作就是根據(jù)測試圖像和之前所有的訓練數(shù)據(jù)進行對比,查找到與之最相似的圖像,實驗的結果如圖2所示。
4 結論
PCA算法作為傳統(tǒng)的人臉識別算法,因其自身存在的許多缺陷而沒能發(fā)揮較好的作用,但是其自身具有其他算法所不具有的特點,本文設計的并行PCA算法雖然是基于PCA算法,但是借鑒了卷積神經(jīng)網(wǎng)絡的多層結構,而且使用加權操作進行最終人臉識別的決策?;贠RL人臉數(shù)據(jù)庫的測試結果表明,該并行PCA算法的準確率和魯棒性均得到了進一步的提升,與其他的單獨PCA算法具有十分明顯的優(yōu)勢。
參考文獻:
[1] 張利芳. 基于PCA算法的人臉識別系統(tǒng)研究[D].太原:中北大學,2015.
[2] 楊海燕,蔣新華. 基于并行卷積神經(jīng)網(wǎng)絡的人臉關鍵點定位方法研究[J]. 計算機應用研究, 2015, 32(8): 2517-2519.
[3] 楊穎嫻. 基于PCA算法和小波變換的人臉識別技術[J]. 微電子與計算機, 2011, 28(1): 92-94.
[4] 段寶彬,韓立新. 改進的卷積神經(jīng)網(wǎng)絡及在碎紙拼接中的應用[J]. 計算機工程與應用, 2014, 50(9): 176-181.
篇3
關鍵詞:人工智能;科技情報;自動感知
中圖分類號:TP18文獻標志碼:A文章編號:2095-2945(2020)32-0057-02
Abstract:Fromtheperspectiveofartificialintelligence,peoplerequireasignificantimprovementintheaccuracyofscientificandtechnologicalinformationservices,sothatitsvaluecontinuestorise,bringingchallengesandopportunitiesforintelligencework.Bysummarizingthecontentsofartificialintelligenceandscientificandtechnologicalinformation,combinedwithartificialintelligencetechnology,thispaperstudiestheautomaticperceptionofscientificandtechnologicalinformationneedsconcerningthekeypoints,contentperceptionandotheraspects,highlightingthewisdom,intelligenceandefficiencyofscientificandtechnologicalinformationwork,andoptimizingtheautomaticperceptionscheme.
Keywords:artificialintelligence;scientificandtechnologicalinformation;automaticperception
前言
當前科技情報服務對象不僅局限于特定的行業(yè)和領域,已經(jīng)逐漸滲透至某一技術和個人,情報機構只有提升情報分析和反應能力才可以滿足新需求。因此,機構有必要加強對用戶需求的感知度,依托人工智能技術構建科技情報的感知框架,提升感知工作的合理性和高效性,進而挖掘科技情報感知領域的價值。
1人工智能及科技情報感知概述
1.1人工智能分析
人工智能又稱AI,伴隨著計算速度、核心算法的優(yōu)化,該技術已經(jīng)在神經(jīng)網(wǎng)絡、自然語言、機器學習等方面趨于成熟。當前人工智能技術可以定制個性化任務,結合不同的環(huán)境響應個體需求,制定解決方案[1]。因此,人工智能技術能夠快速處理海量數(shù)據(jù),若人類智力水平已無法滿足嚴苛工作要求,可以借助人工智能技術處理復雜工作。同時,科技情報感知模塊屬于綜合預測過程,因此有必要結合人工智能技術制定科技情報感知方案,實現(xiàn)情報工作向智慧化、個性化、精準化方向發(fā)展。
1.2情報感知分析
科技情報感知主要是工作人員針對采集到的數(shù)據(jù)完成處理、分析,進而滿足受眾對于情報的需求,并對今后其發(fā)展過程進行預測。學者劉記曾指出,依托科技情報感知工作可以為實現(xiàn)國家治理體系和治理能力現(xiàn)代化提供支持,加快情報刻畫、情報感知以及情報響應能力的建設進程。其中,情境感知的研究具有一定復雜度,G.Chen通過調(diào)查情境信息、情境類型、情境傳播等模型和系統(tǒng),分析情境感知的應用程序,得出情境感知是領域普適學習的關鍵。例如,借助情境感知可以為用戶提供體溫、運動路徑、溫度等方面的服務。
因此,科技情報感知工作對于我國情報治理、預先感知等方面影響較大,結合人工智能技術創(chuàng)新科技情報感知模塊已是大勢所趨。當前大數(shù)據(jù)時代科技情報已經(jīng)不僅停留于文獻領域,正逐漸向多種數(shù)據(jù)源模式發(fā)展,要求科技情報軟硬件不斷升級優(yōu)化,數(shù)據(jù)存儲和處理水平逐漸升級,進而滿足社會對情報數(shù)據(jù)的需求。
2人工智能視域下科技情報需求自動感知研究
2.1融合關鍵點
(1)創(chuàng)新驅(qū)動。當前科技情報需求逐漸向科技創(chuàng)新領域發(fā)展,依托我國創(chuàng)新驅(qū)動的發(fā)展戰(zhàn)略,基于科學技術完成升級和發(fā)展。將科學技術和科技情報相結合后,情報工作的創(chuàng)新性較強,具有數(shù)字化和智慧化優(yōu)勢,并突出情報工作的個性化和精準性。因此,依托人工智能技術完成科技情報的自動感知十分關鍵,是當前科技發(fā)展的必經(jīng)之路。
(2)前瞻性定位。新時期資源的網(wǎng)絡化和數(shù)字化發(fā)展為科技情報研究工作提供大數(shù)據(jù)支持,可以在海量數(shù)據(jù)的收集、分析、處理方面發(fā)揮優(yōu)勢。傳統(tǒng)的數(shù)據(jù)研究方式很難在大量數(shù)據(jù)的基礎上提升情報研究質(zhì)量,同時會增加研究人員的任務量。且每位工作人員自身的專業(yè)知識、情報敏感度、知識狀態(tài)存在差異性,導致最終得出的情報結果不同甚至差異化較大。應用人工智能技術完成科技情報的自動感知十分重要,可以突出工作的準確性、高效性和穩(wěn)定性。因此,將新興人工智能技術和傳統(tǒng)情報服務工作相融合是現(xiàn)代情報領域的關鍵,如自動獲取和加工情報、高速處理文本信息、人工智能決策平臺、依托語義內(nèi)容的科研成果評價等[2]。
2.2內(nèi)容感知
(1)感知系統(tǒng)分析。大數(shù)據(jù)背景下,科技情報預測和傳播功能受到重視和應用,屬于科技領域的研究熱點,可以對競爭、合作、研究方面進行正確的價值判斷??萍记閳蟾兄饕劳锌煽?、豐富的數(shù)據(jù),借助“互聯(lián)網(wǎng)+大數(shù)據(jù)”模式獲取信息,在多種資料中得到關鍵的信息和數(shù)據(jù),進而完成科技情報的感知工作。同時,數(shù)據(jù)源具有冗余度高、形式多樣、存儲量大的優(yōu)勢,因此能夠落實科技情報感知工作,篩選數(shù)據(jù)源、除去冗余數(shù)據(jù)、分析剩余有效信息。借助數(shù)據(jù)集模式與知識儲備庫、感知數(shù)據(jù)庫一同為感知過程提供信息支持。內(nèi)容感知系統(tǒng)內(nèi)的數(shù)據(jù)源并非固定不變,且信息的更新速度較快、技術淘汰時間較短,因此內(nèi)容感知是實時更新、持續(xù)變化的數(shù)據(jù)系統(tǒng)?;谙嚓P輔助項目,幫助用戶了解工作內(nèi)容。例如,借助“科技情報產(chǎn)品報告”為感知系統(tǒng)研究和應用提供支持,該報告可以幫助用戶了解系統(tǒng),提前評估系統(tǒng)實際能力,便于用戶針對性提出情報需求。
(2)系統(tǒng)實現(xiàn)模式。a.數(shù)據(jù)源存儲。若想發(fā)揮科技情報的自動感知作用,系統(tǒng)內(nèi)需要具備大容量數(shù)據(jù)集合,進而為感知產(chǎn)品提供分析支持。同時,數(shù)據(jù)處理過程中對于信息查詢、存儲挑戰(zhàn)較大。因此,本課題結合Neo4j數(shù)據(jù)庫、互聯(lián)網(wǎng)技術提升數(shù)據(jù)處理和存儲效率,提高系統(tǒng)適應水平,保證其良好的查詢效率。Neo4j數(shù)據(jù)庫主要劃分為兩類應用模式:服務器模式、內(nèi)嵌模式。本課題利用內(nèi)嵌模式,借助Java-API,將Neo4j數(shù)據(jù)庫和圖模型相互整合。由于API的特點是數(shù)據(jù)結構靈活,因此可以通過直接編碼的模式和圖數(shù)據(jù)庫完成交互操作。b.數(shù)據(jù)源分類。若想對數(shù)據(jù)源完成自動分類,建議識別數(shù)據(jù)源的結構功能。例如,利用機器學習、詞匯特征等方式劃分數(shù)據(jù)源的功能及結構。依托數(shù)據(jù)源要素、類型詞匯特點、詞匯分布特征等方面,依托神經(jīng)網(wǎng)絡內(nèi)分類器訓練模式,圍繞領域技術、專題、情報報告、組織數(shù)據(jù)庫等方面對數(shù)據(jù)源進行分類[3]。c.構建任務抽取模型。結合用戶需求抽取目標任務可以充分發(fā)揮科技情報的自動感知優(yōu)勢,優(yōu)化RNN模塊。在研究階段利用Bi-LSTM-CRF、卷積網(wǎng)絡模型抽取數(shù)據(jù)源,并借助長短時雙向記憶模型化解RNN梯度爆炸、消失情況。抽取模型內(nèi)的輸入數(shù)據(jù)是卷積,包含知識元素、句子、詞等特征向量,而輸出數(shù)據(jù)則依托(Conditionalrandomfield)條件隨機得到結果完成預測。此模型借助多元組的方式展示數(shù)據(jù)源抽取結果,圍繞數(shù)據(jù)源性質(zhì)、事項、主體、依據(jù)、對象等要素進行連接。
2.3情境感知
(1)情境感知系統(tǒng)。情境感知系統(tǒng)內(nèi)部因素種類較多,且科技情報感知階段需要依據(jù)情境完成,并對感知結果造成影響。因此,在開展科技情報感知工作時,建議對特定用戶完成重新評估。同時,情境感知在情報感知工作中十分關鍵,若忽視結果會對外部情境產(chǎn)生較大影響,使預測工作喪失精準度。因此,應基于外部情境條件定位事物發(fā)展方向,得到精準感知結果,發(fā)揮情報前瞻性優(yōu)勢。其中在獲取情境數(shù)據(jù)時應關注“小數(shù)據(jù)”,即初始結構化數(shù)據(jù),此類資源雖數(shù)量較小,但是內(nèi)部包含價值信息,可以獲取歷史情境信息。此外,問題情境應圍繞橫向和縱向兩個層面分析,橫向維度是梳理本層實際情況,針對性選擇研究方法和處理方式;縱向維度則依托時間節(jié)點理清情境信息。
(2)系統(tǒng)執(zhí)行方案。情境感知系統(tǒng)建設主要內(nèi)容是借助科技手段獲取某一情境內(nèi)的數(shù)據(jù)并完成融合。因此,情境感知技術實際上是借助人工智能中傳感器等技術,依托計算機感知當前情境,完成感知應用、智能識別、決策支持,具有無干擾的優(yōu)勢。情境感知包含情境獲取、處理、應用三個階段。其中,情境獲取主要依靠傳感器終端獲取設備關聯(lián)、用戶關聯(lián)、資源關聯(lián)、環(huán)境關聯(lián)情境,并將上述情境信息轉變?yōu)閿?shù)字信號,利用嵌入系統(tǒng)完成判斷和處理;情境處理過程則借助建模的方式控制情境信息,構建信息數(shù)據(jù)庫。整合情境感知信息并協(xié)調(diào)對應的組合,控制資源分布并將其嵌入至感知數(shù)據(jù)庫內(nèi);服務應用階段相當于人工智能處理模塊,可以結合用戶需求提供合理服務。
2.4需求-反饋機制
(1)工作過程。需求-反饋機制實際上可以體現(xiàn)用戶和人工智能間的關聯(lián)性,屬于科技情報感知的關鍵環(huán)節(jié),包含自動感知信息、數(shù)據(jù)、產(chǎn)品模塊。依托人工智能技術,通過AI方式減輕工作人員任務量。其中,AI能夠智能化處理多領域工作,如醫(yī)療、教育、駕駛、金融、安防等。在科技情報感知領域引入人工智能技術可以準確、高效、及時地開展情報工作,提升工作效率、減少決策偶然性、加快數(shù)據(jù)分析處理速度。同時,科技情報感知工作的主體是用戶,首先需要將其對產(chǎn)品的需求發(fā)送至AI處,其次借助人工智能模塊分析、整合內(nèi)外感知數(shù)據(jù)庫信息,最后向用戶反饋情報產(chǎn)品和相關結果。
(2)情報感知產(chǎn)品。情報感知產(chǎn)品主要結合用戶產(chǎn)品需求,依據(jù)感知數(shù)據(jù)庫內(nèi)的條件因素預測今后用戶對于情報產(chǎn)品的需求,進而在后續(xù)工作中有針對性地向用戶推送產(chǎn)品信息,為科技情報工作的可持續(xù)發(fā)展提供支持。因此,人工智能和科技情報感知工作相結合可以充分發(fā)揮自動感知優(yōu)勢,降低對工作人員決策的依賴性。專業(yè)人員依據(jù)多種數(shù)據(jù)源進行分析與評估,最終得出精準的感知結果。同時,人工智能技術的應用可以自動形成情報感知產(chǎn)品,并向用戶推送反饋數(shù)據(jù),由主動感知向自動感知發(fā)展,契合新時期情報3.0的發(fā)展趨勢,加快國家科技決策和科技創(chuàng)新發(fā)展進程。