專(zhuān)利信息系統(tǒng)設(shè)計(jì)論文

時(shí)間:2022-04-02 11:25:44

導(dǎo)語(yǔ):專(zhuān)利信息系統(tǒng)設(shè)計(jì)論文一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢(xún)客服老師,歡迎參考。

專(zhuān)利信息系統(tǒng)設(shè)計(jì)論文

1專(zhuān)利信息可視化分析系統(tǒng)的需求分析

1.1專(zhuān)利信息可視化分析系統(tǒng)的建設(shè)目標(biāo)

專(zhuān)利信息可視化分析系統(tǒng)的設(shè)計(jì)是把商業(yè)智能(BI)技術(shù)應(yīng)用于專(zhuān)利信息分析,主要是為了實(shí)現(xiàn)以下建設(shè)目標(biāo):①引入專(zhuān)利分析指標(biāo),用戶(hù)可以不用知道專(zhuān)利指標(biāo)的計(jì)算方式,只需要了解這些指標(biāo)的用途,就可以利用系統(tǒng)得出分析結(jié)果。②建立多維分析系統(tǒng),為用戶(hù)從多角度分析問(wèn)題提供可靠的工具,從而為專(zhuān)利申請(qǐng)和專(zhuān)利戰(zhàn)略制定提供準(zhǔn)確、及時(shí)的依據(jù)。③為企業(yè)了解競(jìng)爭(zhēng)對(duì)手的核心技術(shù)和研究熱點(diǎn)領(lǐng)域及確定專(zhuān)利申請(qǐng)戰(zhàn)略、專(zhuān)利實(shí)施戰(zhàn)略與專(zhuān)利保護(hù)戰(zhàn)略服務(wù)。④為發(fā)現(xiàn)科技創(chuàng)新人才提供支持。⑤為國(guó)家從宏觀層面發(fā)現(xiàn)技術(shù)發(fā)展趨勢(shì)、提升科研水平、制定投入與產(chǎn)出規(guī)劃等提供決策支持。這些建設(shè)目標(biāo)決定了專(zhuān)利信息可視化分析系統(tǒng)設(shè)計(jì)的功能目標(biāo),主要包括功能體系結(jié)構(gòu)的說(shuō)明、各模塊之間關(guān)系的描述、系統(tǒng)界面形式的選擇以及各個(gè)功能模塊的設(shè)計(jì)。

1.2專(zhuān)利信息可視化分析系統(tǒng)的主要功能

專(zhuān)利信息可視化分析系統(tǒng)最主要的功能是對(duì)專(zhuān)利數(shù)據(jù)進(jìn)行可視化分析并繪制相關(guān)圖譜以及對(duì)相關(guān)數(shù)據(jù)進(jìn)行挖掘與預(yù)測(cè)。專(zhuān)利信息可視化分析系統(tǒng)的總體功能結(jié)構(gòu)。專(zhuān)利信息可視化分析系統(tǒng)主要由四大部分組成,即數(shù)據(jù)倉(cāng)庫(kù)、ETL系統(tǒng)、OLAP和數(shù)據(jù)挖掘。數(shù)據(jù)倉(cāng)庫(kù)是專(zhuān)利數(shù)據(jù)的存儲(chǔ)地;ETL系統(tǒng)可以批量地把異構(gòu)的專(zhuān)利數(shù)據(jù)進(jìn)行處理;OLAP系統(tǒng)是多維分析專(zhuān)利數(shù)據(jù)的技術(shù)核心;數(shù)據(jù)挖掘就是從大量的專(zhuān)利數(shù)據(jù)中發(fā)現(xiàn)隱藏的模式和規(guī)律。

1.3專(zhuān)利信息可視化分析系統(tǒng)的性能需求

與一般信息系統(tǒng)的性能需求相同,專(zhuān)利信息可視化分析系統(tǒng)的性能需求主要包括安全性需求、可靠性需求、用戶(hù)界面需求、響應(yīng)時(shí)間需求、靈活性需求、故障處理需求、可擴(kuò)展性需求等。

1.4專(zhuān)利信息可視化分析系統(tǒng)的功能需求

專(zhuān)利信息可視化分析系統(tǒng)的功能需求可以定義為兩大類(lèi),即多維數(shù)據(jù)數(shù)分析和專(zhuān)利數(shù)據(jù)挖掘。多維數(shù)據(jù)分析即多角度分析數(shù)據(jù),專(zhuān)利信息可視化分析系統(tǒng)的分析角度包括專(zhuān)利申請(qǐng)時(shí)間(從整體和技術(shù)領(lǐng)域分析專(zhuān)利申請(qǐng)的趨勢(shì))、專(zhuān)利公開(kāi)時(shí)間(分析專(zhuān)利的公開(kāi)趨勢(shì),專(zhuān)利申請(qǐng)與公開(kāi)的時(shí)間差,即專(zhuān)利申請(qǐng)延遲公開(kāi)的大致時(shí)間)、專(zhuān)利機(jī)構(gòu)和人(分析和評(píng)估專(zhuān)利機(jī)構(gòu)和人)、專(zhuān)利申請(qǐng)地域(分析專(zhuān)利地域分布趨勢(shì)及各地域技術(shù)優(yōu)勢(shì)和人才分布情況)、專(zhuān)利權(quán)人(分析專(zhuān)利權(quán)人的技術(shù)狀況、專(zhuān)利申請(qǐng)狀況、專(zhuān)利質(zhì)量和研究熱點(diǎn)等)、專(zhuān)利發(fā)明人(發(fā)現(xiàn)高產(chǎn)專(zhuān)利發(fā)明人和核心技術(shù)人員,與專(zhuān)利分類(lèi)號(hào)結(jié)合可以分析專(zhuān)利發(fā)明人的技術(shù)特點(diǎn))、專(zhuān)利分類(lèi)號(hào)(從IPC分類(lèi)和專(zhuān)利技術(shù)領(lǐng)域分析專(zhuān)利信息,結(jié)合區(qū)域、發(fā)明人和專(zhuān)利權(quán)人可以綜合分析專(zhuān)利數(shù)據(jù),確定各區(qū)域、發(fā)明人、專(zhuān)利權(quán)人的技術(shù)特點(diǎn)和優(yōu)勢(shì))、專(zhuān)利授權(quán)(觀察專(zhuān)利授權(quán)狀況及相關(guān)法律狀態(tài))、專(zhuān)利失效(觀察專(zhuān)利失效狀況)和專(zhuān)利類(lèi)型(分析專(zhuān)利類(lèi)型,并結(jié)合其他角度進(jìn)行綜合分析,如專(zhuān)利技術(shù)生命周期)等。用戶(hù)可以自由選擇數(shù)據(jù)分析的角度,系統(tǒng)還需提供數(shù)據(jù)篩選功能,如制定特定的專(zhuān)利權(quán)人和時(shí)間段作專(zhuān)利分析,即數(shù)據(jù)切片,系統(tǒng)必須提供數(shù)據(jù)切片功能。專(zhuān)利數(shù)據(jù)挖掘功能包括專(zhuān)利發(fā)明人關(guān)聯(lián)分析、專(zhuān)利權(quán)人關(guān)聯(lián)分析、IPC關(guān)聯(lián)分析、專(zhuān)利引證分析、專(zhuān)利聚類(lèi)分析和專(zhuān)利申請(qǐng)時(shí)序分析等。專(zhuān)利發(fā)明人關(guān)聯(lián)分析用來(lái)發(fā)現(xiàn)專(zhuān)利發(fā)明人之間的合作發(fā)明狀況,并可以通過(guò)這個(gè)模型為企業(yè)選擇合適的發(fā)明人和技術(shù)人才;專(zhuān)利權(quán)人關(guān)聯(lián)分析用來(lái)發(fā)現(xiàn)專(zhuān)利權(quán)人之間的關(guān)系網(wǎng)絡(luò);IPC關(guān)聯(lián)分析用來(lái)發(fā)現(xiàn)專(zhuān)利技術(shù)領(lǐng)域間的關(guān)系;專(zhuān)利引證分析利用專(zhuān)利之間的引用關(guān)系發(fā)現(xiàn)基礎(chǔ)專(zhuān)利、核心專(zhuān)利、技術(shù)演變過(guò)程;專(zhuān)利聚類(lèi)分析用來(lái)對(duì)專(zhuān)利數(shù)據(jù)進(jìn)行劃分;專(zhuān)利申請(qǐng)時(shí)序分析用來(lái)預(yù)測(cè)未來(lái)的專(zhuān)利發(fā)展趨勢(shì)。

2專(zhuān)利信息可視化分析系統(tǒng)的設(shè)計(jì)思路

2.1專(zhuān)利數(shù)據(jù)倉(cāng)庫(kù)建立

2.1.1維度建模

數(shù)據(jù)倉(cāng)庫(kù)的模型構(gòu)建與一般事務(wù)型數(shù)據(jù)庫(kù)模型構(gòu)建方式不同。美國(guó)的K.Ralph在長(zhǎng)期的數(shù)據(jù)庫(kù)分析與設(shè)計(jì)中總結(jié)出了一種“維度建?!狈ā>S度建模是一種將數(shù)據(jù)結(jié)構(gòu)化的設(shè)計(jì)方法,并且提供快速查詢(xún)功能。維度將對(duì)象分為度量和上下文。度量常常以數(shù)值形式出現(xiàn),稱(chēng)為“事實(shí)”,事實(shí)被大量文本形式的上下文包圍。上下文被直觀地分割成多個(gè)獨(dú)立的邏輯塊,稱(chēng)為“維”。維度描述了度量上下文的“5W”(即Who、What、When、Where和Why)信息以及作用方式。

2.1.2專(zhuān)利數(shù)據(jù)的特征

充分了解現(xiàn)有數(shù)據(jù)的真實(shí)情況是影響數(shù)據(jù)倉(cāng)庫(kù)模型的重要因素。本系統(tǒng)通過(guò)中國(guó)專(zhuān)利數(shù)據(jù)庫(kù)獲取了2000—2012年湖南省專(zhuān)利申請(qǐng)數(shù)據(jù)共計(jì)93754條,這些專(zhuān)利數(shù)據(jù)包括發(fā)明專(zhuān)利和實(shí)用新型專(zhuān)利,但不包括外觀專(zhuān)利。

2.2專(zhuān)利數(shù)據(jù)處理

2.2.1專(zhuān)利申請(qǐng)日和公開(kāi)日處理

專(zhuān)利申請(qǐng)日和公開(kāi)日處理的過(guò)程如下:首先從原始的專(zhuān)利數(shù)據(jù)源的公開(kāi)日字段和申請(qǐng)日字段提取出日期數(shù)據(jù),然后將這兩個(gè)字段的記錄合并成為一個(gè)數(shù)據(jù)集,由于這個(gè)數(shù)據(jù)集中有大量的冗余數(shù)據(jù),為提供性能需去除重復(fù)的數(shù)據(jù),這里采用聚合的方式去除冗余數(shù)據(jù)。

2.2.2專(zhuān)利分類(lèi)號(hào)處理

1)專(zhuān)利分類(lèi)號(hào)處理的方案。原始數(shù)據(jù)中的專(zhuān)利分類(lèi)號(hào)表述形式為C11B1/00(2006.01)I;C11B1/04(2006.01)I,以“;”為拆分符拆成多條記錄存入數(shù)據(jù)倉(cāng)庫(kù)。這個(gè)步驟的處理將IPC數(shù)據(jù)首先存入DimIPC維度表,其次還要將IPC和專(zhuān)利申請(qǐng)?zhí)栮P(guān)聯(lián)起來(lái)載入FactIPC事實(shí)表進(jìn)行技術(shù)分析。專(zhuān)利分類(lèi)號(hào)處理通常有3種方案,根據(jù)專(zhuān)利數(shù)據(jù)處理時(shí)間和結(jié)果,本文采用方案三。2)專(zhuān)利分類(lèi)號(hào)處理的數(shù)據(jù)流。專(zhuān)利分類(lèi)號(hào)的處理由3個(gè)數(shù)據(jù)流和1個(gè)包含在循環(huán)容器中的數(shù)據(jù)流所組成,這4個(gè)數(shù)據(jù)流的具體執(zhí)行方式如圖9所示。數(shù)據(jù)流1把原始數(shù)據(jù)中的專(zhuān)利申請(qǐng)?zhí)栕侄魏头诸?lèi)號(hào)全部讀取到臨時(shí)的記錄集中,但是在FactIPC中已存在的不再讀取。這時(shí)記錄集中記錄是以“[專(zhuān)利申請(qǐng)?zhí)東分類(lèi)號(hào)1;分類(lèi)2;……]”的形式存儲(chǔ)。

2.2.3專(zhuān)利事實(shí)表處理

專(zhuān)利事實(shí)數(shù)據(jù)處理可以包括3個(gè)方面:①專(zhuān)利申請(qǐng)區(qū)域處理;②專(zhuān)利機(jī)構(gòu)處理;③其他數(shù)據(jù)規(guī)范化處理。如圖10所示。

2.2.4專(zhuān)利授權(quán)和專(zhuān)利失效數(shù)據(jù)處理

專(zhuān)利授權(quán)數(shù)據(jù)處理比較簡(jiǎn)單。先把FactPatent事實(shí)表中的專(zhuān)利是否授權(quán)字段置為0,0代表專(zhuān)利沒(méi)有授權(quán)。在原始數(shù)據(jù)源中讀取的專(zhuān)利數(shù)據(jù)都是已經(jīng)授權(quán)的專(zhuān)利數(shù)據(jù),這里只要把獲得原始數(shù)據(jù)中的專(zhuān)利申請(qǐng)?zhí)柵cFactPatent事實(shí)表中的數(shù)據(jù)進(jìn)行比對(duì),如果存在則將FactPatent事實(shí)表中的專(zhuān)利是否授權(quán)字段置為1,表示該條專(zhuān)利已經(jīng)授權(quán)。專(zhuān)利失效的處理同專(zhuān)利授權(quán)。

2.2.5其他處理

專(zhuān)利發(fā)明人的拆分處理和專(zhuān)利權(quán)人的拆分處理與專(zhuān)利分類(lèi)號(hào)處理類(lèi)似。另外,還需要對(duì)一些在上述步驟中存在但尚未入庫(kù)的數(shù)據(jù)進(jìn)行手工處理。比如在進(jìn)行專(zhuān)利事實(shí)數(shù)據(jù)處理的過(guò)程中,存在區(qū)域無(wú)法匹配的數(shù)據(jù),要仔細(xì)檢查這些數(shù)據(jù)的錯(cuò)誤原因,然后修改再入庫(kù)。

3SSIS包處理和數(shù)據(jù)檢查

SSIS包建立好后接下來(lái)就是執(zhí)行。SSIS包執(zhí)行完以后,這時(shí)數(shù)據(jù)倉(cāng)庫(kù)中已有了專(zhuān)利數(shù)據(jù),為了確保數(shù)據(jù)的準(zhǔn)確性還需要對(duì)數(shù)據(jù)進(jìn)行檢查,看看是否存在異常。而最重要的一步檢查是查看專(zhuān)利的記錄數(shù)是否與搜集的數(shù)據(jù)吻合。

作者:文庭孝楊忠劉曉英單位:中南大學(xué)湘潭大學(xué)