學(xué)術(shù)期刊影響力排序與分區(qū)方法

時(shí)間:2022-03-10 05:20:28

導(dǎo)語(yǔ):學(xué)術(shù)期刊影響力排序與分區(qū)方法一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

學(xué)術(shù)期刊影響力排序與分區(qū)方法

學(xué)術(shù)期刊(以下簡(jiǎn)稱“期刊冶)在促進(jìn)科學(xué)知識(shí)的創(chuàng)新、科技成果的轉(zhuǎn)化以及社會(huì)科技的進(jìn)步等方面發(fā)揮著重要作用。在一定時(shí)間內(nèi)某期刊所出版的學(xué)術(shù)論文對(duì)后續(xù)某段時(shí)間內(nèi)相關(guān)領(lǐng)域知識(shí)創(chuàng)新的促進(jìn)能力被稱之為期刊影響力[1]。期刊排序分區(qū)是衡量期刊影響力的重要指標(biāo),通常由某種或某些文獻(xiàn)計(jì)量學(xué)指標(biāo)(又稱“期刊表征因素冶)來(lái)度量,對(duì)總體評(píng)估期刊的學(xué)術(shù)質(zhì)量、宏觀考量期刊的辦刊定位與出版策略、學(xué)術(shù)績(jī)效短期評(píng)價(jià)、圖書(shū)機(jī)構(gòu)期刊采購(gòu)等具有非常重要的參考意義。特別地,從科研管理實(shí)踐來(lái)看,期刊排序分區(qū)是對(duì)于以數(shù)量勝質(zhì)量、賺取獎(jiǎng)金和應(yīng)付考核投機(jī)行為的低成本有效對(duì)策[2]。最常見(jiàn)的期刊影響力度量指標(biāo)是影響因子。普遍認(rèn)為,影響因子越大,期刊影響力就越大。因此,期刊排序分區(qū)方法通常與影響因子有關(guān)。例如,適用于SCI英文期刊的排序分區(qū)方法主要包括:科睿唯安公司的期刊引用報(bào)告分區(qū)方法(簡(jiǎn)稱“JCR分區(qū)冶)[3]和中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心的分區(qū)方法(簡(jiǎn)稱“中科院分區(qū)冶)[4]。在JCR分區(qū)方法中,將某一個(gè)學(xué)科的所有期刊都按照上一年的影響因子降序排列后,依據(jù)學(xué)科內(nèi)期刊總數(shù)目,平均將這些期刊分為4個(gè)區(qū),每個(gè)所占期刊數(shù)目比例為25%。在中科院分區(qū)方法中,采用期刊的前3年影響因子均值進(jìn)行降序排位,然后將這些期刊以固定但非平均的方式劃分為四個(gè)區(qū),期刊的區(qū)分位分別是5%,6%~20%,21%~50%,51%~100%。然而,隨著各個(gè)學(xué)科知識(shí)創(chuàng)新日漸加速、跨學(xué)科研究日趨普遍、文獻(xiàn)出版方式日呈多樣化,僅僅使用影響因子來(lái)進(jìn)行期刊分區(qū)存在一定的缺陷。研究工作者試圖開(kāi)發(fā)一個(gè)更為合理的期刊影響力度量指標(biāo),探索可以較為全面反映學(xué)術(shù)期刊質(zhì)量和影響力的新型期刊分區(qū)方法。在影響因子基礎(chǔ)上,人們已經(jīng)研究了多種新的指數(shù),如h指數(shù)[5,6]、及其改進(jìn)g指數(shù)[7]、特征因子[8-9]、f(x)指數(shù)[10]、PR8指數(shù)[11]以及學(xué)術(shù)期刊影響力指數(shù)(AcademicJournalCloutIndex,CI)[12]等。特別地,中國(guó)科學(xué)文獻(xiàn)評(píng)價(jià)研究中心的期刊影響力指數(shù)CI,目前已經(jīng)成為了國(guó)內(nèi)中文期刊文獻(xiàn)分區(qū)的重要依據(jù)。該指標(biāo)是一種依賴于將“總被引頻次冶和“影響因子冶的非線性綜合指標(biāo)[12]。CI分區(qū)方法首先將期刊的CI值作為排序度量值對(duì)特定學(xué)科的所有期刊進(jìn)行降序排位,然后采用與JCR分區(qū)相似的方式,依據(jù)某個(gè)學(xué)科內(nèi)所有期刊的數(shù)量來(lái)平均分割成四個(gè)分區(qū)。盡管影響因子是衡量期刊影響力的重要指標(biāo),但是期刊影響力是多個(gè)方面因素的綜合影響結(jié)果,其影響因素指標(biāo)體系是由一系列具有內(nèi)在關(guān)聯(lián)的評(píng)價(jià)指標(biāo)所構(gòu)成[13]。顯然,綜合各種指標(biāo)的期刊影響力評(píng)價(jià)方法能夠從多個(gè)層面反映出期刊影響力的真實(shí)水平。然而,當(dāng)前分區(qū)方法沒(méi)有反映出其它多種期刊因素(如即年指標(biāo)、半衰期、互引指數(shù)等)。近年來(lái),不少研究趨向于利用采用相關(guān)系數(shù)[14]、線性回歸[15]、因子分析[16-17]等線性分析方法綜合多種期刊表征因素,進(jìn)行期刊影響力綜合評(píng)價(jià)并排序。盡管文獻(xiàn)[14]中同時(shí)也使用TOPSIS來(lái)捕獲期刊表征因素之間非線性關(guān)系,但僅限于因素之間的二次關(guān)系??偟膩?lái)說(shuō),當(dāng)前方法難以捕獲多個(gè)期刊表征因素之間的非線性關(guān)系,而且難以描述特定學(xué)科內(nèi)期刊的全局和局部關(guān)系。另外,諸多期刊因素之間存在多重共線性關(guān)系會(huì)干擾期刊影響力評(píng)價(jià)。因此,針對(duì)目前的分區(qū)方法不足,本文利用相關(guān)系數(shù)矩陣和方差膨脹因子挑選高獨(dú)立性的若干重要期刊表征因素,并利用深度自編碼器的高維非線性刻畫(huà)能力,綜合集成這些因素,從而生成一種新的期刊排序度量指標(biāo)并基于此進(jìn)行期刊分區(qū)。

1方法

1.1實(shí)證數(shù)據(jù)選取與預(yù)處理。本文數(shù)據(jù)來(lái)源于2017年中國(guó)學(xué)術(shù)期刊影響因子年報(bào)(人文社會(huì)科學(xué))[12],總共選擇“圖書(shū)館學(xué);情報(bào)學(xué)冶(以下簡(jiǎn)稱“圖情冶)、“法律冶和“體育冶三個(gè)學(xué)科中的學(xué)術(shù)期刊為實(shí)證研究樣本,其中“圖情冶學(xué)科包含43種期刊,“法律冶學(xué)科包含94種期刊,“體育冶包含41種期刊。每一種期刊包含學(xué)術(shù)期刊影響力指數(shù)(AcademicJournalCloutIndex,簡(jiǎn)稱CI)和期刊分區(qū)(Q),以及35項(xiàng)學(xué)術(shù)期刊計(jì)量指標(biāo)或表征因素(簡(jiǎn)稱“因素冶)。例如,復(fù)合類指標(biāo)、綜合類指標(biāo)、人文社科影響因子指標(biāo)、出版指標(biāo)、引證指標(biāo)、網(wǎng)絡(luò)傳播指標(biāo)等。因?yàn)樯倭科诳笔€(gè)別因素的數(shù)據(jù),需要對(duì)數(shù)據(jù)進(jìn)行篩選。本文采用如下篩選方案:(1)剔除存在較多缺失因素?cái)?shù)據(jù)的期刊:“圖情冶期刊中的英文期刊《JournalofDataandInformationScience》,“法律冶期刊中的《中國(guó)法律評(píng)論》、《交大法學(xué)》、《蘇州大學(xué)學(xué)報(bào)(法學(xué)版)》、《國(guó)際法研究》、《醫(yī)學(xué)與法學(xué)》、《廣西政法管理干部學(xué)院學(xué)報(bào)》、《河南警察學(xué)院學(xué)報(bào)》、《中國(guó)律師》、《新疆警察學(xué)院學(xué)報(bào)》、《廣州市公安管理干部學(xué)院學(xué)報(bào)》、《遼寧公安司法管理干部學(xué)院學(xué)報(bào)》、《中國(guó)刑警學(xué)院學(xué)報(bào)》,“體育冶期刊中的英文期刊《JournalofSportandHealthScience》和《當(dāng)代體育科技》;(2)存在缺失單個(gè)因素?cái)?shù)據(jù)的期刊,采用該學(xué)科內(nèi)其它期刊該因素值的平均值作為其估計(jì)值,如《情報(bào)學(xué)報(bào)》的“web即年下載率冶;(3)用邊界值代替非確切數(shù)值,如“>20冶的數(shù)值均以“20冶替代;(4)刪除不必要的冗余因素和分區(qū)無(wú)關(guān)因素,如“影響因子排序冶是與“影響因子冶的冗余,“研究層次冶是與分區(qū)無(wú)關(guān)的因素。最終選用42種“圖情冶期刊,82種“法律冶期刊和39種“體育冶期刊為研究對(duì)象,每一種期刊均包含33個(gè)因素,如表1所示。根據(jù)中國(guó)學(xué)術(shù)期刊影響因子年報(bào)的方法,這些因素分為三組,分別是:“上年期刊主要影響因子冶,“其它各類計(jì)量指標(biāo)冶和“人文社科類影響因子、被引頻次及可被引文獻(xiàn)量冶,詳細(xì)信息如表1所示。因?yàn)樗衅诳绊懥σ蛩氐娜≈捣秶町惡艽?比如“復(fù)合總被引冶的數(shù)值量級(jí)可達(dá)上萬(wàn),而“復(fù)合影響因子冶的數(shù)值量級(jí)只有10左右,所以本文采用數(shù)據(jù)標(biāo)準(zhǔn)化來(lái)減少計(jì)算誤差。標(biāo)準(zhǔn)化的定義為:z(i)=x(i)-滋(i)滓(i)(1)其中為x(i)為期刊x的第i個(gè)因素的原始數(shù)值,滋(i)和滓(i)分別為數(shù)據(jù)中所有期刊的該因素的均值和標(biāo)準(zhǔn)差,z(i)為標(biāo)準(zhǔn)化之后該因素的數(shù)值。1.2深度自編碼器。深度自編碼器(以下簡(jiǎn)稱自編碼器)作為深度學(xué)習(xí)領(lǐng)域的重要組成部分,是一種無(wú)監(jiān)督的深度神經(jīng)網(wǎng)絡(luò)[18]。它不僅能夠表達(dá)高維非線性變量關(guān)系,而且能夠?qū)⑵鋲嚎s為低維關(guān)系,從而為衡量期刊的排序分區(qū)提供一個(gè)可視化的表達(dá)和分析。在實(shí)際應(yīng)用當(dāng)中,自編碼器具有重建過(guò)程簡(jiǎn)單、可堆疊多層等優(yōu)點(diǎn),通常由輸入層、編碼解碼隱含層和輸出層組成。其中,輸入層和輸出層維度(神經(jīng)元數(shù)目)相等,輸入層和隱含層之間構(gòu)成編碼器,輸入信號(hào)x沂Rd通過(guò)編碼過(guò)程在編碼隱含層產(chǎn)生含數(shù)據(jù)特征的激勵(lì)a沂Rm,解碼隱含層和輸出層之間構(gòu)成解碼器,a通過(guò)解碼過(guò)程得到重構(gòu)信號(hào)y沂Rd,解碼是編碼的逆向運(yùn)算。在本文中,x代表期刊,用d個(gè)期刊因素表示,y表示重構(gòu)之后的期刊。自編碼器的訓(xùn)練目標(biāo)是使原始輸入y抑x,從而捕獲數(shù)據(jù)中最重要的信息。如圖1所示,本文采用L層自編碼器,其過(guò)程可用如下公式表示:輸入層-編碼隱含層:a(1)=f(Wx+b)(2)編碼隱含層:a(i+1)=f(W(i)a(i)+b(i)),i=1,…,L(3)其中,W和b分別為各層的權(quán)值矩陣和偏置項(xiàng),L為編碼隱含層的數(shù)目,f(誗)為激活函數(shù),本文中采用sigmoid函數(shù),其定義為f(z)=11+e-z,值域?yàn)閇0,1]。在本文的自編碼器實(shí)現(xiàn)中,輸入層包含神經(jīng)元數(shù)目對(duì)應(yīng)于期刊因素的數(shù)目。同時(shí),也設(shè)計(jì)了包含不同隱層數(shù)目的自編碼器構(gòu)架,用來(lái)調(diào)查特定學(xué)科內(nèi)期刊的全局和局部關(guān)系以及期刊排序分區(qū)。在可視化當(dāng)中,最后一個(gè)編碼隱含層的神經(jīng)元輸出值分別作為期刊的坐標(biāo)值。該值又稱為隱空間主元值,簡(jiǎn)稱隱元值。

2實(shí)證分析

2.1期刊因素分析與選擇。盡管期刊擁有多達(dá)33個(gè)因素,然而有的因素與其它因素密切相關(guān),相互之間存在較高的相關(guān)性,導(dǎo)致因素之間存在共線性問(wèn)題。比如在2017年的“圖情冶期刊中,第2個(gè)因素“復(fù)合影響因子冶與第3個(gè)因素“復(fù)合他引影響因子冶之間的相關(guān)性高達(dá)0.9969,它與第4個(gè)“復(fù)合5年影響因子冶之間的相關(guān)性為0.9768。再如,第11個(gè)因素“可被引文獻(xiàn)量冶與第33個(gè)因素“可被引文獻(xiàn)量2016冶的相關(guān)系數(shù)等于1,其中的原因在于數(shù)據(jù)來(lái)源于2017年中國(guó)學(xué)術(shù)期刊影響因子年報(bào),所以這兩個(gè)因素包含相同的數(shù)據(jù)。指導(dǎo)期刊發(fā)展的首要任務(wù)是明確重要的因素、并剔除冗余的因素。以“圖情冶期刊為例,我們首先計(jì)算了方差膨脹因子(簡(jiǎn)稱VIF)。結(jié)果表明,“可被引文獻(xiàn)比冶(15.279)、“基金論文比冶(22.645)、“平均引文數(shù)冶(24.273)、“引用半衰期冶(20.735)和“被引半衰期冶(15.520)這五個(gè)因素的VIF在15和25之間,存在較嚴(yán)重的共線性現(xiàn)象,括號(hào)中數(shù)值為對(duì)應(yīng)的VIF值;更為嚴(yán)重的是,其它因素的VIF遠(yuǎn)大于25,甚至高達(dá)10的7次方,存在極度共線性現(xiàn)象。由此可見(jiàn),“圖情冶期刊的因素之間存在非常嚴(yán)重的多重共線性現(xiàn)象。其次,按照表1里面的因素編號(hào)順序,我們計(jì)算了建立因素之間的兩兩相關(guān)系數(shù)矩陣,從而挑選共線性程度較低的期刊因素。因?yàn)槲覀儾魂P(guān)注相關(guān)性的正負(fù),而是關(guān)注相關(guān)性的大小,所以相關(guān)系數(shù)矩陣包含的是相關(guān)系數(shù)的絕對(duì)值。為了進(jìn)一步分析這些因素之間的關(guān)系,我們應(yīng)用非負(fù)矩陣分解算法對(duì)該矩陣實(shí)施聚類。經(jīng)觀察發(fā)現(xiàn),這些因素可以形成4個(gè)聚類。其中,第1個(gè)聚類包含11個(gè)因素,包括10種綜合類、復(fù)合類以及社科統(tǒng)計(jì)源期刊引用的影響因子和即年指標(biāo)、以及“web即年下載率冶,其內(nèi)部的平均相關(guān)系數(shù)高達(dá)0.935。第2個(gè)聚類包含10個(gè)因素,包括8種復(fù)合類、綜合類總被引和各種統(tǒng)計(jì)源引用、“被引期刊數(shù)冶和“總下載量(萬(wàn)次)冶,其內(nèi)部的平均相關(guān)系數(shù)為0.841。第3個(gè)聚類包含7個(gè)因素,包括4種可被引文獻(xiàn)量、2種半衰期和“引用期刊數(shù)冶,其內(nèi)部的平均相關(guān)系數(shù)為0.545。第4個(gè)聚類包含5個(gè)因素,分別是“可被引文獻(xiàn)比冶、“基金論文比冶、“平均引文數(shù)冶、“他引總引比冶、“互引指數(shù)冶,其內(nèi)部的平均相關(guān)系數(shù)較低,僅為0.229。圖2(a)顯示了因素相關(guān)系數(shù)圖,其中節(jié)點(diǎn)表示期刊因素,連邊表示因素之間的相關(guān)系數(shù),粗連邊表示高相關(guān)性,細(xì)連邊表示低相關(guān)性;為了突顯聚類,因素聚類用虛線框和對(duì)應(yīng)的序號(hào)進(jìn)行標(biāo)定。最后,針對(duì)相關(guān)系數(shù)很高的聚類,只選擇其中第一個(gè)因素作為該聚類的代表因素。對(duì)于相關(guān)系數(shù)較低的聚類,選擇全部的因素。總共獲得了8個(gè)因素,包括“復(fù)合總被引冶、“復(fù)合影響因子冶、“可被引文獻(xiàn)量冶、“可被引文獻(xiàn)比冶、“基金論文比冶、“平均引文數(shù)冶、“他引總引比冶和“互引指數(shù)冶。在重新計(jì)算它們的VIF之后,我們發(fā)現(xiàn)由于“可被引文獻(xiàn)量冶的VIF值(4.314)相對(duì)其它的因素而言數(shù)值較大,而且與其他因素的相關(guān)性超過(guò)了0.600,因此為了降低共線性程度進(jìn)一步剔除了該因素。最終采用其它7個(gè)因素進(jìn)行期刊影響力分析。如圖2(b)所示,這些因素的VIF值均小于2.500,平均VIF值為1.693,“基金論文比冶具有最大的VIF值2.207。同時(shí),我們也統(tǒng)計(jì)了它們之間的相關(guān)系數(shù)。如圖2(c)表示,其相關(guān)性絕對(duì)值總體較低,平均相關(guān)系數(shù)僅為0.250;最大的相關(guān)性發(fā)生在“基金論文比冶因素,它分別與“平均引文數(shù)冶和“復(fù)合影響因子冶之間的相關(guān)系數(shù)值為0.557和0.520;最小的相關(guān)性發(fā)生在“復(fù)合影響因子冶和“他引總引比冶之間,兩者幾乎完全獨(dú)立。這些結(jié)果表明,所選因素之間具有很低的共線性程度,可以用來(lái)進(jìn)行下一步的期刊排序,從而可以用來(lái)指導(dǎo)期刊發(fā)展和提高期刊影響力。2.2基于深度自編碼器的期刊排序。在實(shí)證分析中,根據(jù)隱層數(shù)目與神經(jīng)元數(shù)目,設(shè)計(jì)了不同構(gòu)架的自編碼器,以將上一節(jié)選出的期刊因素拼接在一起作為自編碼器的輸入。采用了四種不同層數(shù)的自編碼器構(gòu)架,其隱層數(shù)目分別為1,2,3,4,并分別調(diào)查了每一種構(gòu)架對(duì)應(yīng)的隱層神經(jīng)元數(shù)目。通常隱層數(shù)目在3及以上的自編碼器被稱為深度自編碼器。為了描述方便,這里采用{A,B,C,D}的格式來(lái)表示自編碼器構(gòu)架,其中字母數(shù)目表示層數(shù),字母本身表示該層的神經(jīng)元數(shù)目。以“圖情冶期刊為例,我們?cè)O(shè)計(jì)了漸進(jìn)式的構(gòu)架設(shè)計(jì)策略,即先調(diào)查隱層數(shù)目為1時(shí)對(duì)應(yīng)的神經(jīng)元數(shù)目,然后在此基礎(chǔ)上調(diào)查隱層數(shù)目為2時(shí)對(duì)應(yīng)的神經(jīng)元數(shù)目,以此類推,直至確定最后一個(gè)自編碼器構(gòu)架中的神經(jīng)元數(shù)目。具體過(guò)程如下:(1)當(dāng)采用一個(gè)隱層{L}的時(shí)候,我們分別調(diào)查了L分別等于2~10、15、20、30、40、50和60條件下自編碼器的隱空間輸出結(jié)果。由于CI是目前最好的期刊影響力度量指標(biāo)之一,我們計(jì)算了第一個(gè)隱元與CI的相關(guān)系數(shù),并期望第一隱元能夠正向衡量期刊影響力,所以選擇這個(gè)相關(guān)系數(shù)為正且數(shù)值最大時(shí)對(duì)應(yīng)的神經(jīng)元數(shù)目作為該隱層的最佳神經(jīng)元數(shù)目。我們發(fā)現(xiàn),L=3對(duì)應(yīng)最好結(jié)果。同時(shí),該值也可為多個(gè)期刊的影響力分布提供了一種可視化手段。因此我們選擇3作為自編碼器{L}的隱層神經(jīng)元數(shù)目,同時(shí)也是自編碼器{L,3}中第二個(gè)隱層的神經(jīng)元數(shù)目。(2)當(dāng)自編碼器采用{L,3}構(gòu)架時(shí),我們分別調(diào)查了L在同樣條件下自編碼器的隱空間輸出結(jié)果。通過(guò)與上一步類似的方法,確立隱層神經(jīng)元數(shù)目L=5。(3)當(dāng)自編碼器采用{L,5,3}構(gòu)架時(shí),確立隱層神經(jīng)元數(shù)目L=50。(4)當(dāng)自編碼器采用{L,50,5,3}構(gòu)架時(shí),確定隱層神經(jīng)元數(shù)目L=30。雖然可以繼續(xù)增加層數(shù)時(shí),但是采用更多隱層構(gòu)架的自編碼所產(chǎn)生的隱元數(shù)值卻越來(lái)越小,趨向于過(guò)擬合。最終,我們最多只考慮采用四層的深度自編碼器構(gòu)架。此外,盡管最終獲得了三個(gè)維度的隱變量,但結(jié)果表明只取前兩個(gè)隱元來(lái)顯示期刊分布就足夠了。圖3(a)、(b)、(c)、(d)分別顯示了“圖情冶期刊由四種自編碼器生成的隱空間分布。為了方便可視化,使用CI分區(qū)作為期刊的標(biāo)記,其中圓點(diǎn)、方塊、三角和淺藍(lán)菱形分布表示1、2、3、4區(qū)期刊。由四個(gè)不同構(gòu)架自編碼器生成的期刊分布結(jié)果如下:(1)當(dāng)采用第1個(gè)自編碼構(gòu)架時(shí):對(duì)比CI分區(qū)結(jié)果,第一個(gè)隱元與CI值的Spearman相關(guān)系數(shù)等于0.7582。其中,CI值排名前三的1區(qū)期刊《中國(guó)圖書(shū)館學(xué)報(bào)》、《圖書(shū)情報(bào)工作》、《情報(bào)雜志》與其它1區(qū)期刊相對(duì)分散;有兩個(gè)1區(qū)期刊《大學(xué)圖書(shū)館學(xué)報(bào)》《圖書(shū)館論壇》與2區(qū)期刊靠近;大多數(shù)2區(qū)期刊與1區(qū)期刊鄰近,但《醫(yī)學(xué)信息學(xué)雜志》遠(yuǎn)離其它2區(qū)期刊;隸屬于3區(qū)的期刊與4區(qū)期刊和2區(qū)期刊均呈現(xiàn)較大重疊混雜。(2)當(dāng)采用第2個(gè)自編碼構(gòu)架時(shí):第一個(gè)隱元與CI值的Spearman相關(guān)系數(shù)等于0.8028。期刊分布更加突顯了1區(qū)期刊與其它期刊的不同,大部分1區(qū)期刊保持與其它期刊分離的狀態(tài);兩個(gè)2區(qū)期刊《情報(bào)學(xué)報(bào)》和《現(xiàn)代圖書(shū)情報(bào)技術(shù)》靠近1區(qū)期刊;此外,在2區(qū)期刊當(dāng)中,除了《醫(yī)學(xué)信息學(xué)雜志》之外,《現(xiàn)代情報(bào)》也略遠(yuǎn)離其它同分區(qū)期刊;4區(qū)期刊《圖書(shū)情報(bào)導(dǎo)刊》遠(yuǎn)離其它的同分區(qū)期刊。(3)當(dāng)采用第3個(gè)自編碼構(gòu)架時(shí):期刊的分布范圍進(jìn)一步縮小,期刊分區(qū)邊界初步顯現(xiàn),呈現(xiàn)出與第一個(gè)隱元相關(guān)的趨勢(shì),其與CI值的spearman相關(guān)系數(shù)為0.826;CI值排名第一和第二的1區(qū)期刊《中國(guó)圖書(shū)館學(xué)報(bào)》《圖書(shū)情報(bào)工作》突顯出了與其它期刊不同,而其他兩個(gè)2區(qū)期刊《情報(bào)學(xué)報(bào)》和《現(xiàn)代圖書(shū)情報(bào)技術(shù)》呈現(xiàn)靠近1區(qū)期刊的趨勢(shì),分別與《情報(bào)雜志》、《情報(bào)理論與實(shí)踐》和《情報(bào)科學(xué)》相近。(4)當(dāng)使用第4個(gè)自編碼構(gòu)架時(shí),所有期刊被映射成一條近似單調(diào)直線,能夠使用第一個(gè)隱元對(duì)期刊進(jìn)行排序和分區(qū),其中第一個(gè)隱元與CI值的Spearman相關(guān)系數(shù)為0.8503;1區(qū)期刊可分為三組,第一組包括《中國(guó)圖書(shū)館學(xué)報(bào)》和《圖書(shū)情報(bào)工作》;第二組包括《情報(bào)雜志》《情報(bào)理論與實(shí)踐》《情報(bào)資料工作》《情報(bào)科學(xué)》《圖書(shū)情報(bào)知識(shí)》《圖書(shū)與情報(bào)》,但是2區(qū)期刊《情報(bào)學(xué)報(bào)》和《現(xiàn)代圖書(shū)情報(bào)技術(shù)》位于其中;第三組包括《大學(xué)圖書(shū)館學(xué)報(bào)》《圖書(shū)館論壇》,但是它們與其他分區(qū)的期刊混雜在一起。此外,其它分區(qū)期刊存在不同程度的混雜重疊??偟膩?lái)說(shuō),自編碼器能夠一個(gè)以非線性方式綜合了多個(gè)高獨(dú)立性期刊因素的期刊排序度量,其第一個(gè)隱元可以用來(lái)作為期刊排序度量值(排序得分)。另外,也應(yīng)用深度自編碼器在“法律冶期刊和“體育冶期刊。由于篇幅限制,只選用了采用一個(gè)隱層和四個(gè)隱層這兩種自編碼器構(gòu)架的期刊排序結(jié)果,如圖4所示。期刊排序結(jié)果表明,這兩大類期刊表現(xiàn)為與“圖情冶期刊相似的規(guī)律。當(dāng)采用一個(gè)隱層時(shí),期刊較為分散,第一個(gè)隱元與CI的相關(guān)系數(shù)分別為0.748和0.501,但是該構(gòu)架利于發(fā)現(xiàn)離群期刊,如“法律冶期刊里面的《法制與社會(huì)》和《武漢公安干部學(xué)院學(xué)報(bào)》,“體育冶期刊中的《冰雪運(yùn)動(dòng)》。當(dāng)采用四個(gè)隱層時(shí),期刊分布呈現(xiàn)規(guī)律性,第一個(gè)隱元與CI的相關(guān)系數(shù)分別為0.796和0.838。再次說(shuō)明,第一個(gè)隱元可以用來(lái)作為分區(qū)得分。2.3分區(qū)方法對(duì)比?,F(xiàn)有分區(qū)方法均根據(jù)期刊順序和數(shù)量來(lái)實(shí)施,可分為基于平均劃分的方法和基于固定非平均劃分的方法。前者的代表方法包括JCR分區(qū)方法和CI分區(qū)方法,后者的代表方法有中科院分區(qū)?;诂F(xiàn)有的劃分策略,本節(jié)對(duì)應(yīng)地設(shè)計(jì)了深度學(xué)習(xí)平均分區(qū)方法(簡(jiǎn)稱DL平均分區(qū))和深度學(xué)習(xí)非平均方法(簡(jiǎn)稱DL非平均分區(qū)),并以“圖情冶期刊為例進(jìn)行對(duì)比分析。JCR分區(qū)和中科院分區(qū)分別使用影響因子作為期刊排序度量,而中國(guó)學(xué)術(shù)期刊影響因子年報(bào)(簡(jiǎn)稱“年報(bào)冶)提供的兩大類影響因子:復(fù)合類和綜合類。為了實(shí)施后續(xù)的期刊分區(qū)方法對(duì)比,首先調(diào)查了復(fù)合類影響因子與綜合類影響因子在JCR分區(qū)和中科院分區(qū)中的差異。對(duì)比結(jié)果表明,兩者無(wú)論是對(duì)于JCR分區(qū)還是對(duì)于中科院分區(qū)而言,結(jié)果非常接近,在42個(gè)“圖情冶期刊中只有2個(gè)期刊的分區(qū)不同。因此,在后續(xù)的分區(qū)方法對(duì)比當(dāng)中,只采用“復(fù)合影響因子冶(簡(jiǎn)稱“影響因子冶)來(lái)分析JCR分區(qū)和中科院分區(qū)結(jié)果。對(duì)應(yīng)于期刊分區(qū)策略,分區(qū)方法對(duì)比分為兩個(gè)部分。首先,以CI分區(qū)為基準(zhǔn),對(duì)比了采用平均劃分的JCR分區(qū)方法和DL平均分區(qū)方法。主要對(duì)比結(jié)果如下:(1)在CI的1區(qū)期刊列表中,JCR分區(qū)將《情報(bào)科學(xué)》和《圖書(shū)館論壇》分為2區(qū),DL平均分區(qū)將《大學(xué)圖書(shū)館學(xué)報(bào)》和《圖書(shū)館論壇》分為2區(qū);(2)在CI的2區(qū)期刊列表中,JCR分區(qū)將《圖書(shū)館雜志》《國(guó)家圖書(shū)館學(xué)刊》分為1區(qū),將《圖書(shū)館理論與實(shí)踐》和《醫(yī)學(xué)信息學(xué)雜志》為3區(qū);DL平均分區(qū)將《情報(bào)學(xué)報(bào)》和《現(xiàn)代圖書(shū)情報(bào)技術(shù)》分為1區(qū),將《圖書(shū)館雜志》、《圖書(shū)館工作與研究》和《圖書(shū)館理論與實(shí)踐》為3區(qū);(3)在CI的3區(qū)期刊列表中,JCR分區(qū)和DL平均分區(qū)同時(shí)將《中華醫(yī)學(xué)圖書(shū)情報(bào)雜志》分為2區(qū)、將《農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊》和《農(nóng)業(yè)網(wǎng)絡(luò)信息》分為4區(qū);此外,JCR分區(qū)將《文獻(xiàn)》為4區(qū),而DL平均分區(qū)卻將其分為2區(qū),將《圖書(shū)館學(xué)刊》和《四川圖書(shū)館學(xué)報(bào)》分為4區(qū);(4)在CI的4區(qū)期刊列表中,JCR分區(qū)將《大學(xué)圖書(shū)情報(bào)學(xué)刊》《圖書(shū)館界》為3區(qū),DL平均分區(qū)將《古籍整理研究學(xué)刊》《圖書(shū)館界》《數(shù)字圖書(shū)館論壇》《中國(guó)典籍與文化》分為3區(qū)。其次,以采用非平均劃分的中科院分區(qū)為基準(zhǔn),對(duì)照CI值和CI分區(qū),設(shè)計(jì)了一個(gè)CI非平均分區(qū),并對(duì)比了DL非平均分區(qū)。主要對(duì)比結(jié)果如下:(1)中科院分區(qū)的兩個(gè)1區(qū)期刊中,CI和DL非平均分區(qū)將《大學(xué)圖書(shū)館學(xué)報(bào)》分別分為2區(qū)和3區(qū);(2)在中科院分區(qū)的六個(gè)2區(qū)期刊中,CI和DL非平均分區(qū)都將《圖書(shū)情報(bào)工作》分為1區(qū),將《情報(bào)雜志》分為2區(qū);前者將《情報(bào)資料工作》《現(xiàn)代圖書(shū)情報(bào)技術(shù)》分為3區(qū);后者將《圖書(shū)情報(bào)知識(shí)》《圖書(shū)與情報(bào)》分為3區(qū);(3)在中科院分區(qū)的十三個(gè)3區(qū)期刊中,CI和DL非平均分區(qū)都將《情報(bào)理論與實(shí)踐》《情報(bào)科學(xué)》分為2區(qū);前者將《信息資源管理學(xué)報(bào)》分為4區(qū);后者將《情報(bào)學(xué)報(bào)》分為2區(qū),將《圖書(shū)館雜志》《圖書(shū)館工作與研究》分為4區(qū);(4)在中科院分區(qū)的二十一個(gè)4區(qū)期刊中,CI非平均分區(qū)將《圖書(shū)館理論與實(shí)踐》分為3區(qū),DL非平均分區(qū)將《中華醫(yī)學(xué)圖書(shū)情報(bào)雜志》和《文獻(xiàn)》分為3區(qū)。綜上所述,在給定平均劃分條件下,三種分區(qū)方法在1區(qū)和4區(qū)的分區(qū)結(jié)果差異不大;在給定非平均劃分條件下,由于非平均劃分條件下1區(qū)和2區(qū)期刊數(shù)目較小,三種分區(qū)方法的結(jié)果差異稍大;少量期刊主要表現(xiàn)為分區(qū)差值臨近,沒(méi)有出現(xiàn)跨越一個(gè)及以上分區(qū)的差異情況;此外,《中國(guó)圖書(shū)館學(xué)報(bào)》在所有分區(qū)結(jié)果中均排名第一。詳細(xì)對(duì)比結(jié)果如表2和表3所示。

3結(jié)論

現(xiàn)有分區(qū)方法(JCR分區(qū)、CI分區(qū)和中科院分區(qū))只使用單個(gè)期刊因素或兩個(gè)期刊因素對(duì)期刊進(jìn)行排序,而忽視了能夠充分反映期刊性質(zhì)的其它多種期刊因素。另外,在使用多種期刊因素來(lái)評(píng)價(jià)期刊影響力時(shí),因素之間的多重共線性關(guān)系會(huì)干擾評(píng)價(jià)的準(zhǔn)確性。針對(duì)這些問(wèn)題,本文以“圖書(shū)館學(xué);情報(bào)學(xué)冶為實(shí)例進(jìn)行研究。首先,利用相關(guān)系數(shù)矩陣和方差膨脹因子挑選了高獨(dú)立性的七個(gè)重要期刊因素,包括“復(fù)合總被引冶、“復(fù)合影響因子冶、“可被引文獻(xiàn)比冶、“基金論文比冶、“平均引文數(shù)冶、“他引總引比冶和“互引指數(shù)冶。然后,應(yīng)用漸進(jìn)式深度自編碼器構(gòu)架設(shè)計(jì)策略,提出了一種基于深度自編碼器的期刊排序方法。實(shí)例研究結(jié)果表明,本文方法不僅能提供一個(gè)多層次分析特定學(xué)科中期刊的全局和局部關(guān)系,而且能夠以非線性方式將多個(gè)期刊表征因素融合為單個(gè)期刊排序得分,進(jìn)而能進(jìn)行期刊影響力排序并實(shí)施期刊分區(qū)。