論文學(xué)術(shù)創(chuàng)新力特征研究

時(shí)間:2022-05-06 05:04:01

導(dǎo)語(yǔ):論文學(xué)術(shù)創(chuàng)新力特征研究一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢(xún)客服老師,歡迎參考。

論文學(xué)術(shù)創(chuàng)新力特征研究

1引言

HeatonJeremyPW指出創(chuàng)新力在學(xué)術(shù)部門(mén)中發(fā)揮著非常重要的作用【1】,對(duì)論文學(xué)術(shù)創(chuàng)新力進(jìn)行評(píng)價(jià)有助于發(fā)現(xiàn)創(chuàng)新價(jià)值高、能較大程度推動(dòng)學(xué)科發(fā)展的論文,從而促進(jìn)科研人員的學(xué)術(shù)創(chuàng)新。目前關(guān)于學(xué)術(shù)創(chuàng)新力的研究成果雖然不多,但學(xué)術(shù)創(chuàng)新力評(píng)價(jià)正在逐漸引起國(guó)內(nèi)外學(xué)術(shù)界的關(guān)注。目前與創(chuàng)新力評(píng)價(jià)相關(guān)的研究較多,包括高校創(chuàng)新力、學(xué)科創(chuàng)新力、企業(yè)創(chuàng)新力等,但直接研究學(xué)術(shù)創(chuàng)新力評(píng)價(jià)的文獻(xiàn)非常少。因此本文在進(jìn)行文獻(xiàn)搜集和參考時(shí),不僅參考了學(xué)術(shù)創(chuàng)新力評(píng)價(jià)相關(guān)的文獻(xiàn),還參考了與學(xué)術(shù)創(chuàng)新力相似的學(xué)術(shù)影響力以及學(xué)科創(chuàng)新力等方面的文獻(xiàn)。

2相關(guān)研究

目前,論文的學(xué)術(shù)創(chuàng)新力評(píng)價(jià)方法主要分為兩大類(lèi),分別是以同行評(píng)價(jià)為主要手段的定性評(píng)價(jià)法和基于文獻(xiàn)計(jì)量學(xué)的定量評(píng)價(jià)法。2.1同行評(píng)議法。同行評(píng)議最早源于1416年威尼斯共和國(guó)邀請(qǐng)同行專(zhuān)家對(duì)專(zhuān)利進(jìn)行評(píng)審,該方法被大規(guī)模采用是在19世紀(jì)的美國(guó),由美國(guó)科學(xué)基金會(huì)組織和實(shí)施。之后,德意志的聯(lián)合研究會(huì)、歐洲科學(xué)基金會(huì)、加拿大的社會(huì)科學(xué)與人文基金會(huì)等組織都開(kāi)始采用同行評(píng)議的方法,同行評(píng)議逐漸成為被國(guó)際學(xué)術(shù)界廣泛采用的一種學(xué)術(shù)評(píng)價(jià)手段。同行評(píng)議這種評(píng)價(jià)方法雖然被廣泛使用,但一直存在著較多的弊端。不同專(zhuān)家本身的思維認(rèn)知和掌握的知識(shí)體系不同,對(duì)同一問(wèn)題按照同一標(biāo)準(zhǔn)產(chǎn)生的觀點(diǎn)也存在不同,并且還有其他因素可能會(huì)限制專(zhuān)家的判斷,因此該方法易受到專(zhuān)家主觀性的影響。另外,當(dāng)面臨海量評(píng)價(jià)數(shù)據(jù)時(shí),專(zhuān)家評(píng)議的速度慢,耗時(shí)長(zhǎng),效率低下,這些都是制約同行評(píng)議方法使用的因素。2.2文獻(xiàn)計(jì)量法。文獻(xiàn)計(jì)量法就是基于與創(chuàng)新力評(píng)價(jià)相關(guān)的量化指標(biāo)來(lái)衡量論文創(chuàng)新力的大小。在目前的評(píng)價(jià)方法中,學(xué)術(shù)創(chuàng)新力評(píng)價(jià)的文獻(xiàn)計(jì)量法包括單個(gè)特征指標(biāo)評(píng)價(jià)法、以影響力測(cè)度創(chuàng)新力法、指標(biāo)體系評(píng)價(jià)法、基于論文內(nèi)容的評(píng)價(jià)法、構(gòu)造創(chuàng)新力評(píng)價(jià)指標(biāo)法五類(lèi)方法。(1)單個(gè)特征指標(biāo)評(píng)價(jià)法【2-3】。這類(lèi)方法主要包括用h指數(shù),影響因子等單個(gè)特征指標(biāo)來(lái)衡量學(xué)術(shù)創(chuàng)新力。單個(gè)特征指標(biāo)能在某種程度上體現(xiàn)出論文的質(zhì)量,但h指數(shù)高的作者產(chǎn)出的論文并不一定都具有很高的創(chuàng)新力,影響因子高的論文質(zhì)量高,但質(zhì)量高的論文可能是對(duì)之前的文獻(xiàn)進(jìn)行了歸納總結(jié),也可能是對(duì)現(xiàn)有的理論進(jìn)行了實(shí)證研究,其創(chuàng)新力不一定高。因此,僅用h指數(shù)或影響因子這些單個(gè)特征指標(biāo)進(jìn)行論文的學(xué)術(shù)創(chuàng)新力評(píng)價(jià)存在不合理性。(2)以影響力測(cè)度創(chuàng)新力法【4-7】。目前,有很多學(xué)者將創(chuàng)新力和影響力等同,認(rèn)為影響力大的論文其創(chuàng)新力一般都比較高,而影響力評(píng)價(jià)的方法體系和指標(biāo)體系已經(jīng)比較成熟,所有很多學(xué)者直接用學(xué)術(shù)影響力的指標(biāo)和方法進(jìn)行學(xué)術(shù)創(chuàng)新力的評(píng)價(jià)。但實(shí)際上學(xué)術(shù)影響力和學(xué)術(shù)創(chuàng)新力之間不能等同,影響力高的論文創(chuàng)新力不一定高,因此直接使用影響力測(cè)度創(chuàng)新力存在不科學(xué)性。(3)指標(biāo)體系評(píng)價(jià)法【8】。這類(lèi)方法從多個(gè)不同的角度提取與學(xué)術(shù)創(chuàng)新力相關(guān)的指標(biāo),利用相關(guān)指標(biāo)構(gòu)建用于學(xué)術(shù)創(chuàng)新力評(píng)價(jià)的指標(biāo)體系,之后通過(guò)熵權(quán)法、層次分析法或?qū)<以u(píng)測(cè)法確定各指標(biāo)的權(quán)重,最后加權(quán)求和得到創(chuàng)新主體的學(xué)術(shù)創(chuàng)新力。該方法雖然分析角度比較完整,但各個(gè)變量對(duì)學(xué)術(shù)創(chuàng)新力的作用機(jī)制非常復(fù)雜,簡(jiǎn)單使用加權(quán)求和的方法測(cè)度創(chuàng)新力也存在不合理性。(4)基于論文內(nèi)容的評(píng)價(jià)法【9】。主要通過(guò)自然語(yǔ)言處理的手段,從題錄數(shù)據(jù)或者全文內(nèi)容中提取出能表征論文創(chuàng)新點(diǎn)的數(shù)值特征或者文字特征,得到同領(lǐng)域論文創(chuàng)新力的相對(duì)大小?;谡撐膬?nèi)容的評(píng)價(jià)法指標(biāo)提取過(guò)程復(fù)雜,且通常只能對(duì)同領(lǐng)域的論文進(jìn)行評(píng)價(jià)。(5)構(gòu)造創(chuàng)新力評(píng)價(jià)指標(biāo)法【10-15】。在關(guān)于學(xué)術(shù)創(chuàng)新力評(píng)價(jià)的研究中,還有一些學(xué)者基于引文或者知識(shí)網(wǎng)絡(luò)構(gòu)造了新的學(xué)術(shù)創(chuàng)新力評(píng)價(jià)指標(biāo),用構(gòu)造的指標(biāo)值指示學(xué)術(shù)創(chuàng)新力的大小。構(gòu)造的某些指標(biāo)存在定義方式過(guò)于直白、可解釋性不強(qiáng)等缺點(diǎn),該方法考慮到的數(shù)據(jù)維度有限。2.3研究現(xiàn)狀述評(píng)。通過(guò)分析國(guó)內(nèi)外學(xué)術(shù)創(chuàng)新力評(píng)價(jià)的研究現(xiàn)狀,發(fā)現(xiàn)目前的研究還存在許多不足。在學(xué)術(shù)創(chuàng)新力影響因素的相關(guān)研究中,文獻(xiàn)大多集中在對(duì)論文影響力的影響因素的研究上,鮮有文獻(xiàn)真正結(jié)合學(xué)術(shù)創(chuàng)新力的概念、特點(diǎn)和過(guò)程對(duì)學(xué)術(shù)創(chuàng)新力的影響因素進(jìn)行分析和實(shí)證研究。不管使用定性法還是定量法對(duì)學(xué)術(shù)創(chuàng)新力進(jìn)行評(píng)價(jià),都需要按照一定的指標(biāo)和準(zhǔn)則做出判斷,因此結(jié)合創(chuàng)新力的特點(diǎn)提取出真正影響學(xué)術(shù)創(chuàng)新力的因素非常有必要。通過(guò)上文對(duì)學(xué)術(shù)創(chuàng)新力評(píng)價(jià)方法研究現(xiàn)狀的分析可知,與其他四類(lèi)定量評(píng)價(jià)方法相比,構(gòu)造指標(biāo)體系法只使用一個(gè)構(gòu)造的指標(biāo)衡量論文的學(xué)術(shù)創(chuàng)新力,可操作性強(qiáng)。這類(lèi)方法從引文網(wǎng)絡(luò)或者知識(shí)網(wǎng)絡(luò)的角度出發(fā),探究學(xué)術(shù)創(chuàng)新力的相關(guān)規(guī)律,能相對(duì)有效地對(duì)論文的學(xué)術(shù)創(chuàng)新力進(jìn)行評(píng)價(jià)。因此本文嘗試使用構(gòu)造指標(biāo)法構(gòu)造學(xué)術(shù)創(chuàng)新力特征指標(biāo)體系。目前有代表性的構(gòu)造指標(biāo)法主要包括下面三種:“S指數(shù)”測(cè)度法【11】、基于期刊組合的測(cè)度法【14】、動(dòng)態(tài)網(wǎng)絡(luò)測(cè)度法【15】,在這三種方法中,基于期刊組合的測(cè)度方法認(rèn)為只要在參考文獻(xiàn)中對(duì)期刊進(jìn)行了新的組合,即實(shí)現(xiàn)了創(chuàng)新,目前這種定義方式過(guò)于直白,可解釋性不強(qiáng),并且這種方法的計(jì)算過(guò)于復(fù)雜?!癝指數(shù)”評(píng)價(jià)法和動(dòng)態(tài)網(wǎng)絡(luò)評(píng)價(jià)法都符合科學(xué)簡(jiǎn)單、測(cè)量維度單一、基于結(jié)構(gòu)屬性等原則【11】,能有效地對(duì)論文的學(xué)術(shù)創(chuàng)新力進(jìn)行評(píng)價(jià)。相比較而言,動(dòng)態(tài)網(wǎng)絡(luò)評(píng)價(jià)法不僅關(guān)注了論文的參考文獻(xiàn)和引證文獻(xiàn),還關(guān)注了引證文獻(xiàn)引用結(jié)構(gòu)的特征,更能體現(xiàn)出論文對(duì)學(xué)科知識(shí)的革新程度。另外,動(dòng)態(tài)網(wǎng)絡(luò)評(píng)價(jià)法的被引頻次遠(yuǎn)大于“S指數(shù)”評(píng)價(jià)法,該方法的被認(rèn)可程度高。圖書(shū)情報(bào)領(lǐng)域的理論和方法體系相對(duì)比較成熟,大部分工作都是對(duì)現(xiàn)有工作的革新,動(dòng)態(tài)網(wǎng)絡(luò)測(cè)度法更偏向于測(cè)度常規(guī)性革新,因此本文選擇動(dòng)態(tài)網(wǎng)絡(luò)測(cè)度法對(duì)論文進(jìn)行創(chuàng)新力值的標(biāo)注。動(dòng)態(tài)網(wǎng)絡(luò)測(cè)度法如圖1所示,圖1是論文的引用結(jié)構(gòu)圖,在圖中,中間的灰色方塊代表論文,左邊的圓形代表論文參考文獻(xiàn)的集合,右邊較大的圓形代表論文的引證文獻(xiàn)集合。根據(jù)引用結(jié)構(gòu),引證文獻(xiàn)有三類(lèi):圖中綠色的方框表示引證文獻(xiàn)既引用了論文i又引用了論文的參考文獻(xiàn)j,紅色方框表示引證文獻(xiàn)只引用了論文i,藍(lán)色方框表示引證文獻(xiàn)只引用了論文的參考文獻(xiàn)j。圖1學(xué)術(shù)創(chuàng)新力的動(dòng)態(tài)網(wǎng)絡(luò)測(cè)度法該文章認(rèn)為,在論文的引用結(jié)構(gòu)中,如果引證文獻(xiàn)只引用了該論文,沒(méi)有引用論文的參考文獻(xiàn),證明該論文對(duì)現(xiàn)有理論、技術(shù)的革新程度較大,即該論文具有很大的創(chuàng)新力。如果該論文的所有引證文獻(xiàn)既引用了該論文,又引用了該論文的參考文獻(xiàn),就認(rèn)為論文對(duì)于已有知識(shí)理論的改變很小,該論文幾乎不具有創(chuàng)新力。據(jù)此將創(chuàng)新力公式定義如下:D=ni-nkni+nk+nk(1)其中ni表示引證文獻(xiàn)只引用了你的論文,nj表示引證文獻(xiàn)既引用了你的論文,又引用了你的論文的參考文獻(xiàn),nk表示引用者只引用了你的參考文獻(xiàn)。該值基于引用結(jié)構(gòu)度量了創(chuàng)新性,該值的取值范圍是[-1,1],值越接近于1,說(shuō)明文章的學(xué)術(shù)創(chuàng)新力越強(qiáng)。認(rèn)為被引頻次為0的文章不具有創(chuàng)新力,創(chuàng)新力值記為-1。

3學(xué)術(shù)創(chuàng)新力特征指標(biāo)構(gòu)建

學(xué)術(shù)創(chuàng)新力歸納為創(chuàng)新主體通過(guò)創(chuàng)新過(guò)程產(chǎn)生新理論、新方法、新應(yīng)用等新知識(shí)的能力。根據(jù)概念可知,學(xué)術(shù)創(chuàng)新力表示的是創(chuàng)新主體產(chǎn)生新知識(shí)的能力,這種能力在創(chuàng)新過(guò)程中產(chǎn)生,最終體現(xiàn)在創(chuàng)新成果中。因此,要對(duì)學(xué)術(shù)創(chuàng)新力進(jìn)行測(cè)度,需要對(duì)創(chuàng)新過(guò)程和創(chuàng)新成果進(jìn)行研究,提取出能表征創(chuàng)新力值的特征。創(chuàng)新過(guò)程可以分為三個(gè)階段【8】:創(chuàng)新積累階段、創(chuàng)新產(chǎn)出階段和創(chuàng)新擴(kuò)散階段。相應(yīng)地,根據(jù)創(chuàng)新過(guò)程將學(xué)術(shù)創(chuàng)新力分為創(chuàng)新吸收力、創(chuàng)新產(chǎn)出力和創(chuàng)新擴(kuò)散力。對(duì)學(xué)術(shù)創(chuàng)新力進(jìn)行評(píng)價(jià),不僅要考慮跟創(chuàng)新過(guò)程有關(guān)的指標(biāo),還要考慮能影響學(xué)術(shù)創(chuàng)新力的內(nèi)在因素,這些因素?zé)o關(guān)創(chuàng)新過(guò)程或創(chuàng)新成果。綜合上面的分析,將學(xué)術(shù)創(chuàng)新力的一級(jí)指標(biāo)歸納為創(chuàng)新吸收力指標(biāo)、創(chuàng)新產(chǎn)出力指標(biāo)、創(chuàng)新擴(kuò)散力指標(biāo)和學(xué)術(shù)創(chuàng)新力評(píng)價(jià)的其他內(nèi)在影響指標(biāo)。如表1所示。3..1創(chuàng)新吸收力指標(biāo)。學(xué)術(shù)論文的創(chuàng)新并不是憑空想象,而是具有繼承性和發(fā)展性,科研工作者在進(jìn)行科學(xué)研究時(shí)需要對(duì)同一領(lǐng)域的現(xiàn)有知識(shí)進(jìn)行采集、整理和吸收。學(xué)術(shù)創(chuàng)新的吸收階段依托的主要介質(zhì)是跟研究?jī)?nèi)容相關(guān)的參考文獻(xiàn)【16】,高質(zhì)量的參考文獻(xiàn)能為創(chuàng)新主體提供有價(jià)值的知識(shí)理論和方法體系,激發(fā)學(xué)者新的想法,為論文創(chuàng)新的前期工作奠定基礎(chǔ)。因此,本文將參考文獻(xiàn)的相關(guān)特征作為創(chuàng)新吸收力的評(píng)價(jià)指標(biāo),評(píng)估論文在創(chuàng)新過(guò)程中對(duì)現(xiàn)有知識(shí)的吸收和采納程度。采用參考文獻(xiàn)數(shù)量表征吸收數(shù)量,參考文獻(xiàn)被引頻次和參考文獻(xiàn)期刊影響因子均值表征吸收質(zhì)量,參考文獻(xiàn)中近三年論文占比表征吸收速度,參考文獻(xiàn)的學(xué)科廣度分布表征吸收的廣度。學(xué)科分布廣度計(jì)算是將論文參考文獻(xiàn)的分類(lèi)號(hào)作為參考文獻(xiàn)所屬的學(xué)科領(lǐng)域,使用參考文獻(xiàn)來(lái)自不同學(xué)科的程度表示創(chuàng)新吸收的廣度。信息熵是香農(nóng)提出來(lái)的用于量化信息的指標(biāo)【17】,用于描述狀態(tài)的不確定程度。本文借鑒信息熵的概念,定義了如下公式來(lái)表示論文d創(chuàng)新吸收的廣度:H(d)=-∑i=1kpilogpi(2)其中k是論文d的參考文獻(xiàn)所屬的學(xué)科類(lèi)別數(shù),pi是參考文獻(xiàn)中屬于第i類(lèi)的論文篇數(shù)與總參考文獻(xiàn)數(shù)量的比值。當(dāng)所有的參考文獻(xiàn)都來(lái)自同一學(xué)科領(lǐng)域時(shí),該公式的值為0。該公式的值越大,表明參考文獻(xiàn)涉及的學(xué)科領(lǐng)域越廣,創(chuàng)新吸收的廣度越大。3.2創(chuàng)新產(chǎn)出力指標(biāo)。創(chuàng)新主體在對(duì)已有的學(xué)術(shù)成果進(jìn)行借鑒和吸收后,會(huì)激發(fā)腦內(nèi)對(duì)某一問(wèn)題的思考和靈感,從而在原有的研究基礎(chǔ)上創(chuàng)造出新方法或者新理論。創(chuàng)新主體的創(chuàng)新過(guò)程無(wú)法物化,但科研成果是創(chuàng)新的最終結(jié)果,也是創(chuàng)新力最直接的表現(xiàn)形式。在研究成果中,作者可能基于之前研究方法的不足,對(duì)方法做出了改進(jìn);或者將之前零碎的知識(shí)融合創(chuàng)新,構(gòu)建出某研究領(lǐng)域完整的知識(shí)體系;或者通過(guò)對(duì)學(xué)科基礎(chǔ)知識(shí)的研究,提出新的觀點(diǎn)理論??蒲谐晒w現(xiàn)了創(chuàng)新主體思考的過(guò)程與結(jié)果,因此,本文將創(chuàng)新成果即論文的各種特征作為創(chuàng)新力評(píng)價(jià)的特征指標(biāo)。除了采用論文的字?jǐn)?shù)、論文所在期刊的影響因子和期刊論文被引頻次的均值表征創(chuàng)新產(chǎn)出力外,還采用論文和參考文獻(xiàn)的相似度表征論文的新穎性,論文涉及的主題范圍表征論文主題分布的廣度。論文新穎性和論文主題分布廣度的選取依據(jù)和計(jì)算方法如下:(1)論文新穎性一般來(lái)說(shuō),論文內(nèi)容的新穎性可以通過(guò)論文和其他文獻(xiàn)的相似度來(lái)表示。若相似度較高,證明論文和其他文獻(xiàn)的差異度小,文章的新穎性低。相反地,低相似度意味著論文的高新穎性。來(lái)自不同領(lǐng)域的論文之間肯定存在著較低的相似度,依據(jù)其他所有論文計(jì)算出來(lái)的新穎度值不準(zhǔn)確。通常認(rèn)為論文和其參考文獻(xiàn)所在的研究領(lǐng)域相同或者相似,所以本文借鑒文獻(xiàn)【18】的公式,用論文和其參考文獻(xiàn)之間的相似度表示新穎性:Novelty(d)=1|DR|∑d∈DR∑w∈Vp(w|d)logp(w|d)p(w|d')(3)其中DR是論文的參考文獻(xiàn)集,V是根據(jù)論文及其參考文獻(xiàn)的內(nèi)容構(gòu)建的無(wú)重復(fù)詞匯集,p(w|d)是單詞w在論文d中出現(xiàn)的概率,定義如下:p(w|d)=num(w|d)∑w∈Vnum(w'|d)(4)該公式的原型是KL散度【19】(Kullback–Leiblerdiver⁃gence,KLD),它用于衡量?jī)蓚€(gè)概率分布之間的差異性。在這里該值用于衡量單詞在論文和參考文獻(xiàn)中分布的差異,該值越大,論文和參考文獻(xiàn)的相似性越低,論文的新穎性越高。(2)論文主題分布的廣度每篇論文雖然都有核心的研究目標(biāo),但不同論文涉及到的主題范圍不同。論文用到的主題概念越多,說(shuō)明論文涉及的學(xué)術(shù)領(lǐng)域越廣泛,論文具備創(chuàng)新力的可能性越高。因此,本文將主題分布的廣度作為創(chuàng)新產(chǎn)出力評(píng)價(jià)的一個(gè)指標(biāo)。借鑒文獻(xiàn)【20】中的公式,論文主題分布的廣度定義如下:diversity(d)=1|Z|∑zi∈Z-p(zi|d)logp(zi|d)(5)其中Z是論文涉及到的主題集合,P(zi|d)表示文檔d所分配的主題z∈Z的概率分布。此概率分布可以使用主題模型LDA【21】來(lái)計(jì)算得到。LDA是一種概率生成方法,輸入論文的內(nèi)容和主題個(gè)數(shù),可以得到文檔在各個(gè)主題下的概率分布。3.3創(chuàng)新擴(kuò)散力指標(biāo)。學(xué)術(shù)創(chuàng)新的過(guò)程表現(xiàn)為“吸收—?jiǎng)?chuàng)新—擴(kuò)散—再創(chuàng)新—再擴(kuò)散”,學(xué)術(shù)創(chuàng)新擴(kuò)散是指科研工作者的學(xué)術(shù)成果被他人引用和借鑒,催動(dòng)其他學(xué)者新想法的涌現(xiàn)。知識(shí)創(chuàng)新后的擴(kuò)散程度和范圍能反映出學(xué)術(shù)創(chuàng)新的價(jià)值和被認(rèn)可度,是學(xué)術(shù)成果創(chuàng)新力最直接的表現(xiàn)形式。本文采用的科研成果形式是學(xué)術(shù)論文,論文創(chuàng)新產(chǎn)生的影響可以通過(guò)被引用的特征量化。因此,本文使用引證文獻(xiàn)的相關(guān)特征來(lái)測(cè)度創(chuàng)新擴(kuò)散力。具體包括采用被引頻次表征擴(kuò)散數(shù)量,采用引證文獻(xiàn)的平均被引頻次和引證文獻(xiàn)期刊影響因子的均值表征擴(kuò)散的質(zhì)量,采用論文擴(kuò)散到不同學(xué)科的程度表征擴(kuò)散廣度,擴(kuò)散廣度的計(jì)算方法同創(chuàng)新吸收的廣度,在計(jì)算時(shí)需把參考文獻(xiàn)的相關(guān)特征替換為引證文獻(xiàn)對(duì)應(yīng)的特征。3.4學(xué)術(shù)創(chuàng)新。力其他內(nèi)在影響指標(biāo)以上的評(píng)價(jià)指標(biāo)是基于論文的創(chuàng)新過(guò)程提取出來(lái)的,實(shí)際上除了以上指標(biāo),還有一些其他因素會(huì)影響論文的創(chuàng)新力。本文選取合著者因素、作者聲望、論文受資助情況三個(gè)方面分析影響學(xué)術(shù)創(chuàng)新力的特征。合著因素主要是通過(guò)合作者數(shù)量和合作者所在機(jī)構(gòu)數(shù)來(lái)表征。作者聲望主要通過(guò)第一作者總被引頻次、h指數(shù)、參與發(fā)表的文章數(shù)量,論文最大被引次數(shù),平均被引頻次五個(gè)方面來(lái)表征?;鹳Y助主要分為不同的等級(jí):重大國(guó)家級(jí)基金、國(guó)際級(jí)基金、省部級(jí)基金、一般基金和無(wú)基金。

4實(shí)證分析-以圖情學(xué)為例

4.1數(shù)據(jù)來(lái)源。核心期刊刊載的論文質(zhì)量較高,具有一定程度的學(xué)術(shù)創(chuàng)新力,因此本文研究的期刊論文選自圖書(shū)情報(bào)領(lǐng)域的18種核心期刊,他們分別是:《情報(bào)科學(xué)》,《中國(guó)圖書(shū)館學(xué)報(bào)》,《圖書(shū)情報(bào)工作》,《大學(xué)圖書(shū)館學(xué)報(bào)》,《圖書(shū)館雜志》,《圖書(shū)館論壇》,《現(xiàn)代圖書(shū)情報(bào)技術(shù)》,《圖書(shū)館建設(shè)》,《圖書(shū)情報(bào)知識(shí)》,《情報(bào)資料工作》,《情報(bào)學(xué)報(bào)》,《圖書(shū)館》,《情報(bào)理論與實(shí)踐》,《情報(bào)雜志》,《圖書(shū)館工作與研究》,《圖書(shū)館理論與實(shí)踐》,《圖書(shū)館學(xué)研究》,《圖書(shū)與情報(bào)》。本文選取發(fā)表時(shí)間在2012-2016年期間的論文,選擇這個(gè)時(shí)間段發(fā)表的論文主要有三個(gè)原因,一是時(shí)間較新,這個(gè)時(shí)間段發(fā)表的論文能有效反映出圖書(shū)情報(bào)領(lǐng)域最近幾年的創(chuàng)新?tīng)顟B(tài)。二是時(shí)間間隔較長(zhǎng),獲取到的論文數(shù)量多,有利于實(shí)證分析。三是提取的論文特征包括引證文獻(xiàn)相關(guān)的特征,而論文的被引高峰在之后的三到五年,選用這個(gè)期間發(fā)表的論文得到的特征數(shù)值更準(zhǔn)確,有利于模型的構(gòu)建與檢驗(yàn)。CNKI作為國(guó)內(nèi)權(quán)威的知識(shí)服務(wù)平臺(tái),收錄了上述提到的18種期刊,本章用到的數(shù)據(jù)都是從CNKI中獲取到的。從每種期刊中隨機(jī)選擇50篇論文,共獲得900篇論文,剔除作者是機(jī)構(gòu)單位而非個(gè)人的論文和特征缺失較多的論文,共得到期刊論文855篇。4.2學(xué)術(shù)創(chuàng)新力評(píng)價(jià)值的計(jì)算。利用從CNKI中獲取到的數(shù)據(jù),根據(jù)動(dòng)態(tài)網(wǎng)絡(luò)測(cè)度法的公式(1)計(jì)算出每篇論文的創(chuàng)新力值。855篇論文的創(chuàng)新力值分布如圖2所示,橫軸是論文的標(biāo)號(hào),縱軸是論文對(duì)應(yīng)的創(chuàng)新力值。從圖中可以看出,選取論文的創(chuàng)新力值分布較為分散,這有利于本文模型的構(gòu)建和實(shí)證分析。有少量文章的創(chuàng)新力值是-1,這些文章幾乎沒(méi)有創(chuàng)新力,文章被參考的價(jià)值較小。有部分文章的創(chuàng)新力值達(dá)到1,這些文章具有很高的創(chuàng)新性,對(duì)圖書(shū)情報(bào)學(xué)科的發(fā)展起到了很大的推動(dòng)作用。從圖中可以看出創(chuàng)新力在0.5~1之間的論文數(shù)量最多,有471篇,占比55%。創(chuàng)新力在-1~-0.5之間的論文只有86篇,占比10%。本文選擇的動(dòng)態(tài)網(wǎng)絡(luò)測(cè)度法偏向于測(cè)度常規(guī)性創(chuàng)新,即新論文對(duì)已有知識(shí)的革新程度。本文選取的論文均來(lái)自圖書(shū)情報(bào)領(lǐng)域的核心期刊,這些期刊含專(zhuān)業(yè)情報(bào)信息量大,期刊刊載的論文質(zhì)量高,能代表專(zhuān)業(yè)領(lǐng)域的發(fā)展水平,是推動(dòng)圖書(shū)情報(bào)領(lǐng)域發(fā)展的核心力量,因此核心期刊的論文大部分都具有一定程度的常規(guī)創(chuàng)新性,圖3表明本文選取的數(shù)據(jù)是有效的。4.3學(xué)術(shù)創(chuàng)新力。評(píng)價(jià)的特征值計(jì)算對(duì)于單篇論文,從CNKI中可以獲取到論文的作者、作者所在的單位、摘要、基金名稱(chēng)、分類(lèi)號(hào)、參考文獻(xiàn)的數(shù)量、被引頻次等信息,同時(shí)可以獲取到所有參考文獻(xiàn)、引證文獻(xiàn)的具體信息,對(duì)于論文的每個(gè)作者也能獲取到作者的研究方向、發(fā)文數(shù)量等。由于本文選取的論文數(shù)據(jù)量大,特征難以直接提取,所以采用Python爬蟲(chóng)的方式獲得了需要的字段。在所有的22個(gè)特征中,有些特征數(shù)值是可以從CNKI中直接獲取到或者根據(jù)基本字段信息進(jìn)行簡(jiǎn)單計(jì)算得到的,有些特征需要經(jīng)過(guò)比較復(fù)雜的處理才能獲取。易獲取到的字段信息在表2中(以“電子商務(wù)中在線評(píng)論內(nèi)容對(duì)評(píng)論有用性影響的實(shí)證研究”這篇文章為例)。除了以上指標(biāo),還有一些指標(biāo)的處理和計(jì)算比較復(fù)雜。對(duì)于參考文獻(xiàn)來(lái)自不同學(xué)科的程度X5這一指標(biāo),我們根據(jù)參考文獻(xiàn)的分類(lèi)號(hào)劃分參考文獻(xiàn)所屬的學(xué)科類(lèi)別,劃分好學(xué)科類(lèi)別后根據(jù)公式3-2計(jì)算出吸收的廣度這一指標(biāo)值。以“電子商務(wù)中在線評(píng)論內(nèi)容對(duì)評(píng)論有用性影響的實(shí)證研究”這篇文章為例,該文章的參考文獻(xiàn)有8篇,其中5篇是外文文獻(xiàn),無(wú)法獲取其分類(lèi)號(hào),其余3篇的分類(lèi)號(hào)分別是“F49”,“F274;F49”,“F224;F274;F713.36”。對(duì)于分類(lèi)號(hào)缺失的情況,將分類(lèi)號(hào)補(bǔ)充為文章本身的分類(lèi)號(hào),因?yàn)橐话阏J(rèn)為文章和其參考文獻(xiàn)所屬的學(xué)科領(lǐng)域相似,這里將5篇的分類(lèi)號(hào)補(bǔ)全為G202。當(dāng)分類(lèi)號(hào)的前三個(gè)字符相同,即將文獻(xiàn)歸為同一學(xué)科類(lèi)別。對(duì)于有多個(gè)分類(lèi)號(hào)存在的文章,可以隨機(jī)選擇一個(gè)分類(lèi)號(hào)劃分其所在的學(xué)科類(lèi)。對(duì)于指標(biāo)X14采取相同的處理辦法。在計(jì)算論文的新穎性X7時(shí),利用的是論文和其參考文獻(xiàn)的相似度。由于獲取全文比較困難,本文只獲取文章的標(biāo)題和摘要,因此將文章的標(biāo)題和摘要作為文章的主要內(nèi)容,并基于標(biāo)題和摘要計(jì)算相似度。整個(gè)公式的計(jì)算是基于單詞的,本文首先使用Pyhton中的中文分詞組件“Jieba”對(duì)標(biāo)題和摘要進(jìn)行分詞,繼而構(gòu)建詞集、進(jìn)行相似度計(jì)算。需要注意的是,論文的有些參考文獻(xiàn)是英文文獻(xiàn),很難計(jì)算中文詞匯和英文單詞之間的相似度,因此本文計(jì)算相似度時(shí)只使用了中文文獻(xiàn)。在計(jì)算論文主題分布的廣度X8時(shí),需要先使用LDA主題模型計(jì)算文檔在主題下的概率分布。這里仍然將論文的標(biāo)題和摘要作為主要內(nèi)容,使用Jieba組件對(duì)每個(gè)文檔進(jìn)行分詞。運(yùn)行LDA主題模型時(shí),將文檔的分詞列表轉(zhuǎn)化為向量作為輸入,設(shè)置主題個(gè)數(shù)是20,每個(gè)文檔在主題下的概率分布以向量的形式輸出。以上幾個(gè)比較難計(jì)算的字段信息見(jiàn)表3(仍以“電子商務(wù)中在線評(píng)論內(nèi)容對(duì)評(píng)論有用性影響的實(shí)證研究”為例)。44.4單個(gè)特征與學(xué)術(shù)創(chuàng)新力的相關(guān)性分析本部分用散點(diǎn)圖,考察各個(gè)單個(gè)特征與學(xué)術(shù)創(chuàng)新力的相關(guān)性,得出三類(lèi)特征,分別是單個(gè)特征與學(xué)術(shù)創(chuàng)新力無(wú)明顯相關(guān)性(14個(gè)),部分相關(guān)性(7個(gè))和密切相關(guān)(1個(gè))。4.4.1無(wú)明顯相關(guān)性。以參考文獻(xiàn)所在期刊的影響因子X(jué)3的均值與創(chuàng)新力的關(guān)系散點(diǎn)圖為例,無(wú)明顯相關(guān)性的特征散點(diǎn)圖如圖4所示。出現(xiàn)類(lèi)似散點(diǎn)圖的特征還有參考文獻(xiàn)中近三年的論文占比X4,參考文獻(xiàn)學(xué)科分布的廣度X5,論文的字?jǐn)?shù)X6,論文的新穎性X7,論文主題分布的廣度X8,發(fā)表期刊的影響因子X(jué)9,發(fā)表期刊的均被引量X10,被引頻次X11,擴(kuò)散到的學(xué)科廣度X14,第一作者論文的總被引頻次X17,第一作者發(fā)文數(shù)量X19,第一作者論文的平均被引頻次X21,基金等級(jí)X22。理論上認(rèn)為參考文獻(xiàn)來(lái)自不同學(xué)科的程度越大,作者參考的各個(gè)領(lǐng)域的知識(shí)越多,更易從知識(shí)的交叉點(diǎn)中找到創(chuàng)新點(diǎn),但從學(xué)科分布廣度X5和創(chuàng)新力的關(guān)系散點(diǎn)圖中沒(méi)有發(fā)現(xiàn)該規(guī)律,論文主題分布廣度X8以及擴(kuò)散到的學(xué)科廣度X14也同樣與創(chuàng)新力沒(méi)有直接相關(guān)關(guān)系。新穎性X7高的論文可能從新的角度去挖掘了某個(gè)問(wèn)題,但不一定具有理論或者實(shí)踐上的價(jià)值,所以與按照動(dòng)態(tài)網(wǎng)絡(luò)法計(jì)算出來(lái)的創(chuàng)新力沒(méi)有直接相關(guān)關(guān)系,這說(shuō)明,并不是新穎性越高,創(chuàng)新力越高,新穎性不等同于創(chuàng)新力。發(fā)表期刊的影響因子X(jué)9高的文章的創(chuàng)新力值也可能比較低,影響因子低的論文的創(chuàng)新力值也存在比較高的情況,這進(jìn)一步說(shuō)明,僅從影響因子來(lái)評(píng)判論文創(chuàng)新力是不科學(xué)的。發(fā)表期刊的均被引量X10與影響因子X(jué)9密切相關(guān),這一特征與創(chuàng)新力也沒(méi)有直接關(guān)系。論文被引頻次X11,第一作者論文的總被引頻次X17,以及第一作者論文的平均被引頻次X21與創(chuàng)新李均無(wú)直接關(guān)系,這些特征一般用來(lái)衡量影響力,這又一次論證了影響力高的不一定創(chuàng)新力強(qiáng)。此外,基金資助X22與創(chuàng)新力也無(wú)明顯關(guān)系,這說(shuō)明,至少在圖情領(lǐng)域,是否獲得基金資助并不直接影響創(chuàng)新力。4.4.2部分相關(guān)性。(1)參考文獻(xiàn)的數(shù)量X1與平均創(chuàng)新力相關(guān)性的特征散點(diǎn)圖如圖5所示。圖5參考文獻(xiàn)的數(shù)量與平均創(chuàng)新力從圖5可以看出,隨著參考文獻(xiàn)數(shù)量的增加,文章的創(chuàng)新力值減少,當(dāng)參考文獻(xiàn)的數(shù)量大于20時(shí),該指標(biāo)與創(chuàng)新力的相關(guān)性不明顯。這說(shuō)明一些原創(chuàng)文章提出了新的理論和觀點(diǎn),參考文獻(xiàn)較少,但是當(dāng)參考文獻(xiàn)達(dá)到一定數(shù)量時(shí),有些論文創(chuàng)新力高,表明這些論文在參考了大量文獻(xiàn)的基礎(chǔ)上提出了自己的改進(jìn)方法,有些論文創(chuàng)新力低,表明這些論文只是對(duì)前人的工作做了一些綜述和應(yīng)用,沒(méi)有提出新的理論和觀點(diǎn)。這種狀況與事實(shí)也是相吻合的。(2)所有參考文獻(xiàn)被引頻次的均值X2和創(chuàng)新力值的關(guān)系如圖6所示。參考文獻(xiàn)被引頻次的均值X2被引頻次的均值大部分集中在0-200之間,在這個(gè)區(qū)間中,兩者的相關(guān)性不明顯。當(dāng)被引頻次的均值大于600時(shí),對(duì)應(yīng)的文章基本都具備較高的創(chuàng)新力。圖6參考文獻(xiàn)被引頻次的均值與創(chuàng)新力(3)引證文獻(xiàn)被引頻次的均值X12和創(chuàng)新力值之間的關(guān)系如圖7所示。從圖中觀察到,引證文獻(xiàn)被引頻次的均值集中在0-6之間,在這個(gè)區(qū)間范圍內(nèi)兩指標(biāo)之間的相關(guān)性不明顯。當(dāng)x12的取值大于6時(shí),大部分文獻(xiàn)的創(chuàng)新力值比較高。這說(shuō)明當(dāng)論文的引證文獻(xiàn)的質(zhì)量都比較高時(shí),該論文一般具有較高的創(chuàng)新力。圖7引證文獻(xiàn)的平均被引頻次與創(chuàng)新力(4)合作者的數(shù)量X15與論文創(chuàng)新力值的關(guān)系如圖8所示。論文的創(chuàng)新力隨合作者數(shù)量的增加而減小,當(dāng)合作者數(shù)量超過(guò)4時(shí),論文創(chuàng)新力會(huì)隨著合作者數(shù)量的增加而增加,當(dāng)合作者數(shù)量超過(guò)8時(shí),論文的創(chuàng)新力值又降至最低。(5)合作者所在的機(jī)構(gòu)數(shù)X16與創(chuàng)新力的關(guān)系如圖9所示。從圖中可以看出當(dāng)機(jī)構(gòu)數(shù)為2時(shí),論文的創(chuàng)新力達(dá)到最低,機(jī)構(gòu)數(shù)超過(guò)2時(shí),論文的創(chuàng)新力隨機(jī)構(gòu)數(shù)增加,此時(shí)機(jī)構(gòu)數(shù)和創(chuàng)新力值呈正相關(guān)關(guān)系。(6)第一作者的h指數(shù)X18與論文的創(chuàng)新力之間的關(guān)系如圖10所示。觀察圖發(fā)現(xiàn),第一作者h(yuǎn)指數(shù)為0的論文幾乎不具備創(chuàng)新性。h指數(shù)在0-15之間的論文的創(chuàng)新力值比較穩(wěn)定,保持在0.5附近。當(dāng)h指數(shù)大于15時(shí),論文作者的聲望很高,但論文的創(chuàng)新力值相差較大,說(shuō)明學(xué)術(shù)地位較高的作者其產(chǎn)出的創(chuàng)新力不一定很高。(7)第一作者論文的最大被引量X20與創(chuàng)新力值的關(guān)系如圖11所示。從圖中可以看出,在一定范圍內(nèi),創(chuàng)新力值隨最大被引量的增加而增加。超過(guò)某個(gè)范圍后,論文的創(chuàng)新力值隨最大被引量的增加呈下降趨勢(shì)。4.4.3密切相關(guān)。引證文獻(xiàn)影響因子的均值X13和創(chuàng)新力的相關(guān)性關(guān)系如圖12所示。圖的大致趨勢(shì)是,創(chuàng)新力值隨著引證文獻(xiàn)影響因子的增加在不斷地增加。引證文獻(xiàn)影響因子的均值越大,說(shuō)明引證文獻(xiàn)的質(zhì)量越高,該文章為其他文章提供的參考價(jià)值越大。這個(gè)指標(biāo)對(duì)創(chuàng)新力值有比較明顯的影響。

5結(jié)論與展望

通過(guò)對(duì)單個(gè)特征與創(chuàng)新力值相關(guān)性的分析可以發(fā)現(xiàn),大部分特征對(duì)創(chuàng)新力值的作用規(guī)律不明顯,該結(jié)果不能說(shuō)明這些特征與論文的學(xué)術(shù)創(chuàng)新力不相關(guān)或者本文構(gòu)建的評(píng)價(jià)指標(biāo)體系無(wú)效,這說(shuō)明各個(gè)變量不是線性作用于創(chuàng)新力值,論文的學(xué)術(shù)創(chuàng)新力是多因素綜合作用的結(jié)果,但是多因素對(duì)創(chuàng)新力的綜合作用機(jī)制比較復(fù)雜,使用指標(biāo)體系法中的加權(quán)求和得出的結(jié)果也存在不合理之處。因此,使用機(jī)器學(xué)習(xí)模型讓數(shù)據(jù)以自適應(yīng)的方式學(xué)習(xí)根據(jù)各個(gè)特征評(píng)價(jià)創(chuàng)新力值很有必要,未來(lái)將對(duì)這類(lèi)方法進(jìn)行相關(guān)的探索。

作者:錢(qián)玲飛 賀婉瑩 楊建林 單位:1.南京航空航天大學(xué)經(jīng)濟(jì)與管理學(xué)院 2.南京大學(xué)信息管理學(xué)院