社會(huì)統(tǒng)計(jì)數(shù)據(jù)均勻指數(shù)分析

時(shí)間:2022-09-09 05:26:51

導(dǎo)語(yǔ):社會(huì)統(tǒng)計(jì)數(shù)據(jù)均勻指數(shù)分析一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢(xún)客服老師,歡迎參考。

社會(huì)統(tǒng)計(jì)數(shù)據(jù)均勻指數(shù)分析

影響經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)數(shù)據(jù)空間真實(shí)性的要素包括算法、區(qū)域內(nèi)部差異、統(tǒng)計(jì)單元規(guī)模大小、統(tǒng)計(jì)指標(biāo)的空間展布規(guī)律、統(tǒng)計(jì)指標(biāo)的空間規(guī)模、統(tǒng)計(jì)指標(biāo)的時(shí)間存在特征、統(tǒng)計(jì)指標(biāo)在經(jīng)濟(jì)社會(huì)構(gòu)成中的重要程度等多個(gè)方面。經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)數(shù)據(jù)表達(dá)對(duì)象的各種特征對(duì)于數(shù)據(jù)表達(dá)的區(qū)域內(nèi)部真實(shí)性有一定的影響。顯然地,以省級(jí)行政區(qū)域?yàn)榻y(tǒng)計(jì)單元,我國(guó)東部省區(qū)和西部省區(qū)區(qū)域內(nèi)部差異程度有很大不同,在軟件工具的支持下計(jì)算現(xiàn)有以行政單元為對(duì)象的統(tǒng)計(jì)數(shù)據(jù)所表現(xiàn)的區(qū)域平均狀況,為相應(yīng)的應(yīng)用提供數(shù)據(jù)空間均勻程度支持。

1經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)數(shù)據(jù)的空間化

以空間分析為手段,將總量數(shù)據(jù)離散到空間區(qū)域上已有很多應(yīng)用[1-3],以行政區(qū)域?yàn)閱卧慕y(tǒng)計(jì)數(shù)據(jù)分散到更接近真實(shí)情況的自然或經(jīng)濟(jì)區(qū)域上的做法也有一些嘗試[4],特別是對(duì)于區(qū)域面積很大,且內(nèi)部特征差異十分明顯的區(qū)域做這樣的工作更有實(shí)際意義。將社會(huì)經(jīng)濟(jì)信息進(jìn)行空間化處理是根據(jù)經(jīng)濟(jì)對(duì)象空間分布特征、影響經(jīng)濟(jì)對(duì)象分布的自然和社會(huì)經(jīng)濟(jì)要素分布,將一定空間單元上的對(duì)應(yīng)信息轉(zhuǎn)化成1km×1km柵格數(shù)據(jù)(或其他空間大小的單元,如500m×500m等),每個(gè)柵格上的值則表示在1km2內(nèi)的平均狀況。

1.1經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)數(shù)據(jù)空間離散化通用方法

經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)數(shù)據(jù)對(duì)應(yīng)的社會(huì)經(jīng)濟(jì)指標(biāo)在空間的分布和變化受多種因素的影響,這些因素就是該經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)指標(biāo)的影響因素,區(qū)域經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)數(shù)據(jù)在空間上分布的計(jì)算(離散化),必須考慮該指標(biāo)影響因素的空間分布情況,及其對(duì)該指標(biāo)的空間作用方式,才能將該經(jīng)濟(jì)社會(huì)指標(biāo)總量數(shù)據(jù)“分配”到區(qū)域內(nèi)不同的空間上[5]。經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)空間離散化處理的基本方法是,對(duì)于某個(gè)經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)指標(biāo),首先計(jì)算其每一種影響因子對(duì)該經(jīng)濟(jì)社會(huì)指標(biāo)的影響數(shù)值,該計(jì)算需要依賴(lài)地理信息系統(tǒng)軟件工具實(shí)現(xiàn),以ARCGIS軟件為例,其計(jì)算方法是利用GRID下的ZONALSTATS函數(shù)進(jìn)行SUM統(tǒng)計(jì),對(duì)于增長(zhǎng)百分比性質(zhì)的參數(shù)計(jì)算,采用平均值統(tǒng)計(jì)方法,公式(1)有:TEMPINFO1=ZONALSTATS(ADMGRD,ELEGRD)。其中:ADMGRD為ZONALGRID;ELEGRD為影響要素。公式(2)有:TEMPINFO2=ZONALSTATS(ADMGRD,STATGRD)。其中:ADMGRD為ZONAL-GRID;STATGRD為被統(tǒng)計(jì)對(duì)象。這樣可以逐個(gè)計(jì)算得到影響要素在每個(gè)行政單元內(nèi)的總分值、社會(huì)經(jīng)濟(jì)要素的總量。將TEMPINFO1,TEMPINFO2合并到一起,并用經(jīng)濟(jì)要素總量除以總分值,即可得到每個(gè)分值所代表的經(jīng)濟(jì)總量,并將該值添加到TEMPINFO1的一個(gè)屬性項(xiàng)SCORE中;將TEMPIN-FO1與行政區(qū)劃ADM屬性表連接,將SCORE項(xiàng)轉(zhuǎn)換成GRID數(shù)據(jù),結(jié)果為SCOREGRD;用SCOREGRD乘以要處理的社會(huì)經(jīng)濟(jì)要素?cái)?shù)據(jù)STATGRD,即可得到處理離散過(guò)社會(huì)經(jīng)濟(jì)指標(biāo)數(shù)據(jù)STATGRD。實(shí)際計(jì)算中沒(méi)有必要就每一種區(qū)域自然及社會(huì)經(jīng)濟(jì)條件對(duì)社會(huì)經(jīng)濟(jì)要素空間展布的影響分析,可以建立一種模型對(duì)某一種社會(huì)經(jīng)濟(jì)要素的所有影響因子及基礎(chǔ)條件進(jìn)行統(tǒng)計(jì)計(jì)算其影響力,模型為公式(3):AGRD=Vi×EiGRD。其中:Vi為第i種影響因子的權(quán)重值,其所有值的和為1;EiGRD為第i種影響因子對(duì)該社會(huì)經(jīng)濟(jì)要素的影響分值GRID。

1.2人口數(shù)據(jù)空間離散化

我國(guó)人口的空間分布是若干年來(lái)經(jīng)濟(jì)社會(huì)與自然相互作用的結(jié)果,其基本格局是西疏東密,但東南部地區(qū)密中有疏,西北部地區(qū)疏中有密[6]。根據(jù)全國(guó)人口統(tǒng)計(jì)實(shí)際狀況,人口空間分布數(shù)據(jù)的計(jì)算以縣級(jí)行政單元人口數(shù)據(jù)為基礎(chǔ),考慮人口空間分布的各種影響因素,特別是與產(chǎn)業(yè)結(jié)構(gòu)的空間分布有很大關(guān)聯(lián)度[7]。在人口離散化計(jì)算中,首先計(jì)算城鎮(zhèn)人口空間分布,然后計(jì)算農(nóng)村人口空間分布,兩之合即總?cè)丝诘目臻g分布。

1.2.1城鎮(zhèn)人口的空間離散模型。雖然在城鎮(zhèn)內(nèi)部人口的分布存在一定差異,全國(guó)范圍內(nèi)城鎮(zhèn)分布在空間上有很大的差別[8],但在全國(guó)尺度上,城鎮(zhèn)人口在城鎮(zhèn)斑塊上的分布可以視作是均勻的,因此城鎮(zhèn)人口的空間離散化可以將城鎮(zhèn)人口按照城鎮(zhèn)斑塊面積平攤,在全國(guó)尺度上具有一定可信任性。全國(guó)城鎮(zhèn)人口的離散化處理是以每個(gè)縣級(jí)行政區(qū)為單元計(jì)算的,然后進(jìn)行匯總,形成全國(guó)的城鎮(zhèn)人口分布數(shù)據(jù),對(duì)于任意一縣級(jí)行政單元來(lái)說(shuō),該縣級(jí)行政單元城鎮(zhèn)用地地塊中的任意柵格i,其上分布的人口(即城鎮(zhèn)人口,以2000年為例)可以表示CTPOP_2000i=CTPOP_2000×Si∑ni=1Si。(4)式中:CTPOP_2000i是2000年該縣級(jí)行政單元城鎮(zhèn)用地地塊柵格i上的人口;CTPOP_2000i為該縣的城鎮(zhèn)人口總量;Si為柵格i的面積,該縣級(jí)行政單元共有n個(gè)城鎮(zhèn)用地地塊柵格;∑ni=1Si即為該縣城鎮(zhèn)用地面積。

1.2.2農(nóng)村人口的空間離散模型。由于自然及社會(huì)經(jīng)濟(jì)條件的差異,在全國(guó)尺度上,農(nóng)村人口空間分布具有極大的不均勻性;農(nóng)村人口的分布依賴(lài)于土地利用類(lèi)型、居民點(diǎn)分布、距交通線遠(yuǎn)近、自然資源的分布情況等多種自然地理要素和人文地理要素的空間分布;為此,在縣級(jí)行政單元尺度上,為實(shí)現(xiàn)盡可能接近農(nóng)村人口分布的實(shí)際需要,采用加權(quán)多因子影響力距離衰減模型。加權(quán)多因子影響力距離衰減模型中,首先單獨(dú)考慮模擬各種影響因子對(duì)人口的影響,而后對(duì)各種因子影響力的相對(duì)大小進(jìn)行模擬,并以線性疊加的方式將各種影響因子的影響力綜合起來(lái)。由于數(shù)據(jù)的限制,這里主要考慮了城鎮(zhèn)居民點(diǎn)和農(nóng)村居民點(diǎn)中心的吸引作用、農(nóng)村居民點(diǎn)斑塊的限制作用,土地利用/覆蓋類(lèi)型的影響作用。對(duì)于任意一縣級(jí)行政單元來(lái)說(shuō),該縣級(jí)行政單元農(nóng)村用地地塊中的任意柵格i(以2000年為例),加權(quán)多因子綜合影響力可以表示為W_2000i=∑mj=1∑ni=1K_2000j×Dij。(5)式中:W_2000i為2000年?yáng)鸥駃上加權(quán)多因子綜合影響力;i為柵格序號(hào),該縣級(jí)行政單元內(nèi)共有n個(gè)農(nóng)村用地地塊柵格;j為因子編號(hào),該模型中共考慮m個(gè)因子;K_2000j為第j個(gè)因子在整個(gè)模型影響力的權(quán)重值;Dij為j因子在柵格i上的影響力。在得到各柵格點(diǎn)的影響力的總和值W_2000i之后,可以將W_2000i視作面積調(diào)整系數(shù),與城鎮(zhèn)人口空間離散模型相仿,可建立下面的數(shù)學(xué)模型進(jìn)行農(nóng)村人口的空間離散。得:COPOP_2000i=COPOP_2000×W_2000i×Si∑ni=1W_2000i×Si。(6)式中:COPOP_2000i是2000年某縣級(jí)行政單元農(nóng)村用地地塊柵格i上的人口;COPOP_2000是該縣級(jí)行政單元的農(nóng)村人口總量;Si為柵格面積,W_2000i為2000年的加權(quán)多因子綜合影響力,也即柵格i上的人口(農(nóng)村人口)調(diào)整系數(shù)。

1.2.3總?cè)丝诘目臻g分布模型。將城鎮(zhèn)人口空間分布數(shù)據(jù)和農(nóng)村人口空間分布數(shù)據(jù)進(jìn)行疊加,即可形成表征總?cè)丝诳臻g分布數(shù)據(jù)。數(shù)學(xué)模型表示為T(mén)POP_2000i=CTPOP_2000i+COPOP_2000i。(7)式(7)中:TPOP_2000i為任意柵格i處的人口;CTPOP_2000i為柵格i處的城鎮(zhèn)人口;COPOP_2000i為柵格i處的農(nóng)村人口數(shù);i為柵格序號(hào)。

2經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)數(shù)據(jù)空間均勻度計(jì)算

行政區(qū)域有若干級(jí)別,考慮到在諸多研究中大量使用以省級(jí)行政單元為對(duì)象的經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)數(shù)據(jù),為便于研究,這里以省級(jí)行政區(qū)域單元為對(duì)象計(jì)算區(qū)域GDP、人口、產(chǎn)業(yè)增加值等空間均衡性,各指標(biāo)值的空間均衡性以均勻指數(shù)表達(dá)。表達(dá)均勻程度有很多種方法,這里用自相關(guān)指數(shù)(ARCGIS中的MORAN指數(shù))來(lái)表示。MORAN指數(shù)是一種空間自相關(guān)描述方式,可以用于描述地理實(shí)體在空間的分布關(guān)系,可以用于發(fā)現(xiàn)和解釋物體在空間分布的原因,在模擬空間現(xiàn)象時(shí)可以確定空間臨近程度,該指數(shù)的使用有助于提高傳統(tǒng)統(tǒng)計(jì)方法分析能力。MORAN指數(shù)的計(jì)算為公式(8)C=∑∑WijCij/(∑∑Wij)[∑∑(Zi-Zm)2/n]。其中:C表示MORAN指數(shù);∑∑Wij=4×n;n表示GRID中格網(wǎng)的總數(shù),NROW×NCOLS;i,j指任意兩個(gè)相臨的格網(wǎng);Zi格網(wǎng)i的屬性值;Cij是格網(wǎng)i,j屬性的相似性(Zi-Zm)×(Zj-Zm);Wij是格網(wǎng)i,j位置的相似性,如果格網(wǎng)i,j直接相臨(4個(gè)方向上),則Wij=1,否則Wij=0。該模型算法中采樣變量σ2采用(∑Zi-Zm)2/n公式計(jì)算,其中Zm是GRID數(shù)據(jù)的格網(wǎng)平均值,其計(jì)算是根據(jù)空間位置及屬性的相似性進(jìn)行的。對(duì)于計(jì)算結(jié)果,有3種值可能出現(xiàn):C>0,表示空間上屬性相似,具有一定的區(qū)域性,屬性值在空間具有一定的平滑性;C=0,表示空間上相對(duì)獨(dú)立,空間上沒(méi)有關(guān)聯(lián)性,基本上是隨機(jī)出現(xiàn);C<0,表示完全不相同,具有相鄰空間區(qū)域上的屬性反差很大。借助于軟件工具,基于已空間化的經(jīng)濟(jì)社會(huì)各指標(biāo)數(shù)據(jù),可以計(jì)算每一省級(jí)行政單元上任何指標(biāo)的MO-RAN指數(shù)。社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)各指標(biāo)空間均勻指數(shù)計(jì)算過(guò)程:首先,對(duì)于某一社會(huì)經(jīng)濟(jì)要素及每一個(gè)省級(jí)行政單元,從對(duì)應(yīng)社會(huì)經(jīng)濟(jì)要素的全國(guó)1km×1km柵格數(shù)據(jù)中將各省級(jí)行政單元數(shù)據(jù)提取出來(lái);第二,在軟件工具支持下,計(jì)算每個(gè)省級(jí)行政單元的空間自相關(guān)指數(shù)MORAN指數(shù);第三,均勻指數(shù)計(jì)算,將MORAN指數(shù)值最小的省級(jí)行政單元的值設(shè)為1,MORAN指數(shù)值最大的省級(jí)行政單元的值設(shè)為100,其他省級(jí)行政單元的均勻指數(shù)利用公式(9)進(jìn)行計(jì)算:EQi=(MORANi-MORANmin)/MORANz×99+1。其中:EQ為均勻指數(shù);i為第i個(gè)省級(jí)行政單元;MORANi為第i個(gè)省級(jí)行政單元的MORAN指數(shù);MORANmin為所有省級(jí)行政單元中MORAN指數(shù)最小值;MORANz為所有省級(jí)行政單元中MORAN指數(shù)最大值與最小值的差值。

3經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)數(shù)據(jù)空間均勻度分析

基于上述算法,分別計(jì)算2000年以省區(qū)為統(tǒng)計(jì)單元的社會(huì)經(jīng)濟(jì)指標(biāo)GDP,第一產(chǎn)業(yè)、第二產(chǎn)業(yè)、第三產(chǎn)業(yè)增加值及其他指標(biāo)空間均衡情況,發(fā)現(xiàn)不同的經(jīng)濟(jì)社會(huì)指標(biāo)在相同區(qū)域的均衡性有很大的差異。三次產(chǎn)業(yè)結(jié)構(gòu)的空間上的差異受市場(chǎng)空間分布、區(qū)域經(jīng)濟(jì)發(fā)展階段和發(fā)展水平等多種因素影響[9]。在三次產(chǎn)業(yè)增加值計(jì)算的過(guò)程中,發(fā)現(xiàn)在省級(jí)行政區(qū)交接地帶,既有產(chǎn)業(yè)結(jié)構(gòu)明顯差異的一面,也有經(jīng)濟(jì)合作的烙印[10]。表1是我國(guó)2000年度GDP各指標(biāo)在省級(jí)行政單元上的均勻程度。對(duì)于GDP總量,就全國(guó)而言,其均勻指數(shù)為60.8;就各省區(qū)而言,均勻性最好的是北京市,其次是天津和上海;均勻指數(shù)最低的是西藏,其次是青海、貴州,這說(shuō)明在各直轄市內(nèi)區(qū)域內(nèi)部的差異相對(duì)較小,而在經(jīng)濟(jì)欠發(fā)達(dá)的西部地區(qū),GDP總量在空間分布極不均勻。對(duì)于第一產(chǎn)業(yè),均勻指數(shù)最高的是西藏,其次是青海,其主要原因是這些地區(qū)農(nóng)業(yè)相對(duì)較為落后,以畜牧業(yè)為主,由于普遍增加值較低,相對(duì)比較均勻;均勻指數(shù)較低的是上海、天津,這些區(qū)域農(nóng)業(yè)增加值比重相對(duì)較低,且主要分布在城市邊緣地區(qū),整體的空間均勻性較差。對(duì)于第二產(chǎn)業(yè),均勻指數(shù)最高的是北京,其次是黑龍江、上海、天津,由于第二產(chǎn)業(yè)主要集中在城市和城鎮(zhèn)區(qū)域,所以在直轄市及工業(yè)基礎(chǔ)較好的區(qū)域,均勻性較好;均勻性比較差的區(qū)域是西藏、青海。對(duì)于第三產(chǎn)業(yè),均勻性較好的是北京、天津、上海,這些區(qū)域的第三產(chǎn)業(yè)基礎(chǔ)較好,分布較為均勻,均勻性比較差的區(qū)域是廣東、西藏、云南等;廣東不均勻的原因主要是珠江三角洲地區(qū)與北部、西部山區(qū)地區(qū)的差異過(guò)大造成的,而西藏、云南等地則是人口、城鎮(zhèn)相對(duì)集中造成的。

4結(jié)論與討論

從我國(guó)以省級(jí)行政單元為對(duì)象的經(jīng)濟(jì)社會(huì)指標(biāo)分析數(shù)據(jù)表達(dá)的平均程度發(fā)現(xiàn),我國(guó)目前使用的經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)最主要的問(wèn)題是以大行政區(qū)域?yàn)榭臻g單元的統(tǒng)計(jì)數(shù)據(jù)掩蓋了區(qū)域內(nèi)部的差異和不均衡[11]。本研究方法本身有一定的不完整性,但定量化、空間化的嘗試本身則是值得肯定的。這種方法主要基于以下幾個(gè)方面的考慮:經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)對(duì)象的空間分布越是不均勻,統(tǒng)計(jì)數(shù)據(jù)的區(qū)域平均的真實(shí)性越差;統(tǒng)計(jì)對(duì)象的空間分布規(guī)律可以在一定程度上被模擬;統(tǒng)計(jì)對(duì)象的區(qū)域內(nèi)部不均衡性可以量測(cè),可以用統(tǒng)計(jì)區(qū)域內(nèi)部所有空間樣本中不同值域段樣本數(shù)占總樣本的比例表示;該方法通過(guò)分析統(tǒng)計(jì)數(shù)據(jù)隱含的不確定性,使政策措施決策者在以經(jīng)濟(jì)社會(huì)統(tǒng)計(jì)數(shù)據(jù)為依據(jù)制定相應(yīng)的政策措施時(shí),充分考慮統(tǒng)計(jì)數(shù)據(jù)所掩蓋下的區(qū)域差異和區(qū)域內(nèi)部差異。