大數(shù)據(jù)下公共政策實施評估研究

時間:2022-01-21 03:18:51

導(dǎo)語:大數(shù)據(jù)下公共政策實施評估研究一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

大數(shù)據(jù)下公共政策實施評估研究

摘要:公共政策涉及到對社會資源的分配和協(xié)調(diào),與社會大眾的利益密切相關(guān)。對公共政策實施進行科學(xué)評估有利于提升政府施政能力。傳統(tǒng)評估方式存在一定局限,利益相關(guān)方參與度不夠。本文基于互聯(lián)網(wǎng)大數(shù)據(jù)公共政策實施評估進行了研究。通過對論壇、微博等互聯(lián)網(wǎng)站點在政策出臺后一段時間(如半年)的海量數(shù)據(jù),以及部分用戶行為數(shù)據(jù),進行聚類分析,建立公共政策實施評估指數(shù)模型。

關(guān)鍵詞:公共政策;互聯(lián)網(wǎng)數(shù)據(jù);聚類分析;指數(shù)模型

公共政策從某種意義上說是公共權(quán)力機關(guān)經(jīng)由某個法定的程序所制定的為解決公共問題、達成公共目標(biāo)、實現(xiàn)公共利益,以協(xié)調(diào)經(jīng)濟社會活動及相互關(guān)系的實施方案。公共政策的評估主要從兩個方面著力,一是在公共政策出臺之前,對政策的可行性進行評估;二是在政策出臺之后,對政策的實時效果進行評估,找出與公共政策設(shè)計目標(biāo)的差距。傳統(tǒng)的評估方法有兩類,一類是現(xiàn)場調(diào)研考察。選取與公共政策相關(guān)的不同層次的利益相關(guān)方,通過深入座談、問卷調(diào)查、文檔查看、實地考察、專家打分等方式,形成評估報告。另一類是建立統(tǒng)計分析模型。運用數(shù)理經(jīng)濟學(xué)、計量經(jīng)濟學(xué)和統(tǒng)計學(xué)等多種數(shù)理經(jīng)濟模型和計量經(jīng)濟模型,對公共政策進行量化評估,通過數(shù)據(jù)分析對政策實施進行量化評估。近年來,互聯(lián)網(wǎng)技術(shù)發(fā)展迅速,產(chǎn)生了海量的數(shù)據(jù),為大數(shù)據(jù)的應(yīng)用打下了堅實的基礎(chǔ)。據(jù)有關(guān)文獻報道[1,4],國內(nèi)、外利用互聯(lián)網(wǎng)大數(shù)據(jù)對公共政策實施進行評估取得了較好的應(yīng)用效果。本文對基于互聯(lián)網(wǎng)大數(shù)據(jù)的公共政策實施評估進行了研究,通過對論壇、微博、微信、貼吧、博客、手機APP、平媒、政府網(wǎng)站互動欄目等互聯(lián)網(wǎng)站點在政策出臺后一段時間(如政策出臺后半年內(nèi))的海量數(shù)據(jù),以及部分用戶行為數(shù)據(jù),進行建模分析,將互聯(lián)網(wǎng)上的公眾意見引入到公共政策的實施效果評估中。

1公共政策實施評估方法簡述

[2]公共政策評估,從評估的范圍看,有對公共政策實施效果及價值進行判斷的專項評估,也有只對公共政策實施整個過程的分析和評判。從評估的過程看也有廣義和狹義之分。廣義的政策評估包含事前評估、執(zhí)行評估和事后評估三種類型,而狹義的政策評估常常指事后評估。從評估的方法看,有定性分析評估和定量分析評估,定性評估在國內(nèi)現(xiàn)有的評價模式中應(yīng)用較為廣泛。1.1定性評估方式。定性評估是基于經(jīng)驗的實證研究,常常采用訪問法、觀察法、案例研究法等非數(shù)字技術(shù)方法,依賴于評估方對公共政策實施的了解、調(diào)查和感性認識。如通過相關(guān)會議上的匯報交流、實地調(diào)研座談、上報材料、媒體報道、內(nèi)參反映、相關(guān)利益方來信/來訪等,歸納總結(jié)為政策實施評估報告。定性評估方式相對簡單,容易實施,速度快、方便、直接,比較受到各級政府的推崇。但定性評估方式易受各類條件的約束,其科學(xué)性、客觀性難有保障,評估人員的直覺和經(jīng)驗作用明顯,評估對象面較窄,利益相關(guān)方參與度不夠。1.2定量評估方式。定量評估是相對定性評估的另一種評估方法,通過數(shù)據(jù)歸集建立統(tǒng)計分析模型,把理論性概念量化成具體數(shù)據(jù),通過科學(xué)計算,對公共政策實施進行定量評估。定量研究在某些方面相比定性研究方法有優(yōu)勢,能夠用數(shù)據(jù)直觀表達評估結(jié)果,但也存在不可靠的風(fēng)險,過多地強調(diào)客觀性和普遍性,忽略了人的主觀性和特殊性。定量分析的方法對于解決常規(guī)性問題效果很好,對于非常規(guī)性的復(fù)雜問題,往往效果不佳。1.3互聯(lián)網(wǎng)大數(shù)據(jù)評估。隨著互聯(lián)網(wǎng)和自媒體的高速發(fā)展,互聯(lián)網(wǎng)本身的海量數(shù)據(jù)為基于大數(shù)據(jù)的公共政策評估帶來便利。盡管在數(shù)據(jù)處理方式上,大數(shù)據(jù)的分析方法與傳統(tǒng)定量分析的建模分析有相通之處,但存在較大差異。大數(shù)據(jù)評估由于數(shù)據(jù)采集方式、處理方式的變革,將會帶來評估模式革命性的變化。一是數(shù)據(jù)采集從樣本數(shù)據(jù)轉(zhuǎn)向全數(shù)據(jù),使評估更加接近事實本身;二是分析方法上由重視變量之間的因果性轉(zhuǎn)向更加關(guān)注相關(guān)性,通過分析、揭示公共政策制定、實施與效果之間的相關(guān)性,使政策評價更趨于科學(xué)、民主和客觀;三是參與對象更加廣泛,通過大量收集互聯(lián)網(wǎng)上利益相關(guān)者的情感、意愿、評價等信息,更多的了解公共政策實施對象參與的積極性和對公共政策實施效果的看法和評價。

2互聯(lián)網(wǎng)大數(shù)據(jù)評估基礎(chǔ)準(zhǔn)備

2.1數(shù)據(jù)準(zhǔn)備。2.1.1數(shù)據(jù)采集。根據(jù)行政區(qū)劃和政策評估有效時間和區(qū)間進行限定,采用互聯(lián)網(wǎng)爬蟲技術(shù)或以購買服務(wù)的方式從互聯(lián)網(wǎng)爬蟲公司采集數(shù)據(jù),包括新聞、論壇、微博、微信、貼吧、博客、手機APP、平媒、政府網(wǎng)站互動欄目、綜合網(wǎng)站互動欄目等互聯(lián)網(wǎng)站點在政策出臺后一段時間(如出臺后半年內(nèi)的數(shù)據(jù))的數(shù)據(jù),構(gòu)建基于輿情內(nèi)容的熱度、重點、焦點、敏感度、高頻詞、粘度等用戶關(guān)注的行為數(shù)據(jù),為多維度的輿情分析打基礎(chǔ)。2.1.2數(shù)據(jù)預(yù)處理?;ヂ?lián)網(wǎng)采集的數(shù)據(jù)與實際建模分析的要求相差甚遠,極易受噪聲、重復(fù)數(shù)據(jù)、缺失值和不一致數(shù)據(jù)的侵擾,必須進行預(yù)處理,數(shù)據(jù)預(yù)處理主要完成采集數(shù)據(jù)中的噪聲清洗,糾正不一致性。一是檢測、剔除重復(fù)數(shù)據(jù)。主要是記錄去重和特征去重。考慮到中文處理的復(fù)雜性,可以采用特征去重、哈希去重等技術(shù)消除重復(fù)記錄。二是異常數(shù)據(jù)處理??梢圆捎媒y(tǒng)計方法、關(guān)聯(lián)分析、聚類方法進行異常數(shù)據(jù)處理,如缺失值處理、異常值(離群點)處理、噪音數(shù)據(jù)處理等。三是特定領(lǐng)域的數(shù)據(jù)清洗。這種數(shù)據(jù)清洗方案和算法都是針對特定領(lǐng)域,通過聚集、刪除冗余、特征聚類來減少無關(guān)數(shù)據(jù),實現(xiàn)數(shù)據(jù)的規(guī)范化。在公共政策評估中,可以根據(jù)公共政策的關(guān)鍵描述,建立關(guān)鍵詞知識庫和清洗模型,進行定向采集或定向清洗。四是數(shù)據(jù)集成入庫。完成數(shù)據(jù)清洗后,通過規(guī)范、轉(zhuǎn)換和規(guī)整處理,把采集數(shù)據(jù)規(guī)范到可以進行比較分析的某一度量空間,進行數(shù)據(jù)入庫。2.1.3評估模型算法。由于互聯(lián)網(wǎng)漢字文本信息的特點,只能通過語義分析找到文本數(shù)據(jù)內(nèi)在的固有屬性?;诨ヂ?lián)網(wǎng)輿情對公共政策實施效果評估是一種常見的聚類分析評估,通過對海量數(shù)據(jù)的采集分析,按照輿情特點對公共政策評估進行聚類分析,通過關(guān)鍵詞頻度和特征表述并進行適度的加權(quán)值,實現(xiàn)類似滿意、比較滿意、一般、不滿意的聚類分析。聚類算法是一種典型的無監(jiān)督學(xué)習(xí)算法,根據(jù)樣本之間的相似程度,將樣本劃分到不同的類別中。聚類分析的主要算法有劃分聚類、層次聚類、基于密度的聚類、基于模型的聚類、基于網(wǎng)格的聚類和基于模糊的聚類。

3基于聚類分析的公共政策模型結(jié)構(gòu)研究

3.1研究準(zhǔn)備。一是建立大數(shù)據(jù)評估的相關(guān)知識庫。對已的公共政策建立關(guān)鍵詞知識庫,如公共政策主題(政府文件名稱、文號、會議名稱、政策主題),關(guān)鍵詞,主要內(nèi)容描述,利益相關(guān)對象描述等。二是數(shù)據(jù)抽取和基本清洗。選取公共政策出臺后一段時間(如出臺后半年內(nèi)的數(shù)據(jù)),選取特定的互聯(lián)網(wǎng)渠道作為數(shù)據(jù)采集來源,采用爬蟲技術(shù)或向第三方數(shù)據(jù)爬蟲公司購買相關(guān)數(shù)據(jù),經(jīng)去重、去噪、數(shù)據(jù)歸一化后集成入庫。三是數(shù)據(jù)定向抽取和建模清洗。按照評價模型體系評價指標(biāo)的要求和聚類分析的數(shù)據(jù)規(guī)范,對單個指數(shù)進行數(shù)據(jù)抽取和規(guī)范化建模清洗,形成每個指數(shù)聚類分析所需的數(shù)據(jù)集市。3.2評價模型指標(biāo)體系。采用傳統(tǒng)指數(shù)分析與大數(shù)據(jù)聚類分析相結(jié)合的方式建立評價模型指標(biāo)體系。評價模型為三級指標(biāo)模型,建立層次化結(jié)構(gòu)的公共政策評估指標(biāo)體系。一級指標(biāo)從政策關(guān)注度(A)、政策輿情評價(B)、利益相關(guān)者評價(C)、網(wǎng)上調(diào)查問卷(D)等四個層面反映互聯(lián)網(wǎng)大數(shù)據(jù)對公共政策實施評估的主題評價,二級指標(biāo)是對上一級影響因素的進一步細分,第三級指標(biāo)通過數(shù)據(jù)處理和聚類分析,采用可量化的數(shù)據(jù)對前一級指標(biāo)的每個方面進行描述。三級指標(biāo)的數(shù)據(jù)處理,主要是在對定向數(shù)據(jù)集進行分詞處理、語義分析的基礎(chǔ)上,通過聚類分析算法,得出量化評分。計算公式:P=k1*A+k2*B+k3*C+k4*D;0<P<100;根據(jù)P的計算值,將評估結(jié)果定位為非常滿意、滿意、基本滿意、不滿意四個等級;K1-k4為權(quán)重,取值范圍為0-1,且k1+k2+k3+k4=1;A-D為一級指標(biāo)取值,通過二級指標(biāo)加權(quán)計算得出,取值范圍0-100之間,如A=k11*A1+k12*A2,K11-k12為權(quán)重,取值范圍為0-1,且k11+k12=1。二級指標(biāo)取值通過三級指標(biāo)加權(quán)計算得出,取值范圍0-100之間,如A1=k111*a11+k112*a12+k113*a13+k114*a14,K111-k114為權(quán)重,取值范圍為0-1,且k111+k112+k113+k114=1。三級指標(biāo)取值通過聚類分析,統(tǒng)計計算和歸一化處理得到。3.3評價模型與大數(shù)據(jù)聚類分析。3.3.1指標(biāo)模型。⑴關(guān)注度指數(shù)關(guān)注度指數(shù)包括搜索指數(shù)和影響力指數(shù)。搜索指數(shù)和影響力指數(shù)的計算也有較為復(fù)雜的數(shù)據(jù)處理、分析建模過程。如百度指數(shù)a11的取值計算,以公共政策的覆蓋范圍為基礎(chǔ),圍繞政策的前后一段時間區(qū)間,以網(wǎng)民在百度的搜索量為數(shù)據(jù)基礎(chǔ),以建立的公共政策知識庫關(guān)鍵詞為統(tǒng)計對象,分析并計算出各個關(guān)鍵詞在百度網(wǎng)頁搜索中搜索頻次,并進行加權(quán)求和。360指數(shù)a12、微指數(shù)a13、騰訊指數(shù)a14都可以用類似的方法確定。影響力指數(shù)主要關(guān)注公共政策的、轉(zhuǎn)發(fā)、瀏覽、評論情況。通過分析公共政策后一段時間,微博、論壇、微信公眾號、貼吧、博客、手機APP等關(guān)注的程度,包括對關(guān)鍵信息的搜索量、相關(guān)網(wǎng)頁點擊數(shù)、轉(zhuǎn)發(fā)數(shù)、瀏覽數(shù)、評價數(shù)、關(guān)注數(shù)等分析,確定影響力指數(shù)[5]。⑵輿情評價指數(shù)輿情評價指數(shù)[3]是一個直接反映網(wǎng)民對政策評估的指標(biāo),權(quán)重系數(shù)高于關(guān)注度。強相關(guān)主要是采集數(shù)據(jù)與主題相關(guān)程度更加高,如直接對公共政策進行評價或有多關(guān)鍵詞同時出現(xiàn);弱相關(guān)主要是有關(guān)鍵詞出現(xiàn),但頻度、數(shù)量較少,與主題的相關(guān)程度相對較弱。強相關(guān)的權(quán)重明顯要高于弱相關(guān)權(quán)重。三級指標(biāo)的處理采用聚類分析和分類分析結(jié)合的方法,以論壇評價指數(shù)b12、b22為例,首先是語料選擇,采用前面敘述的方式,建立關(guān)鍵詞知識庫,依照知識庫關(guān)鍵詞,對預(yù)處理后的各類論壇原帖及跟帖進行分詞處理、智能過濾,形成供分析的語料數(shù)據(jù)集市。采用基于劃分的Kmeans聚類算法和基于層次的聚類算法對文本進行聚類,形成評價話題聚類。由于b12、b22指數(shù)值在0-100之間取值,取值按照正面評價*權(quán)重-負面評價*權(quán)重-中性評價*權(quán)重得到。其他輿情評價指數(shù)的計算類似。圖2為輿情評價指數(shù)聚類、分類處理流程示意圖。⑶利益相關(guān)者評價指數(shù)利益相關(guān)者輿情評價指數(shù)計算與輿情評價指數(shù)基本相同,只是對數(shù)據(jù)集市的內(nèi)容進行進一步定向篩選,根據(jù)利益相關(guān)者知識庫關(guān)鍵詞,通過IP地址分析、文本分詞和語義分析,在已經(jīng)建立的數(shù)據(jù)集市中建立子集,子集作為利益相關(guān)者輿情分析基本語料數(shù)據(jù),進行上述類似建模分析。利益相關(guān)者評價指數(shù)權(quán)重取值更高。⑷網(wǎng)上調(diào)查評價網(wǎng)上調(diào)查由政策者來組織,通過政府網(wǎng)站或其他綜合網(wǎng)站進行數(shù)據(jù)收集。網(wǎng)上調(diào)查的指標(biāo)設(shè)計可以更加具有針對性,但參與人數(shù)、填報數(shù)據(jù)質(zhì)量、不真實數(shù)據(jù)等也要認真考慮。

4結(jié)束語

應(yīng)用互聯(lián)網(wǎng)大數(shù)據(jù)對公共政策實施評估,是新的研究領(lǐng)域,具有直面利益相關(guān)者的優(yōu)點。本文提出的指數(shù)模型對公共政策實施大數(shù)據(jù)評估具有一定參考作用,但是數(shù)據(jù)采集質(zhì)量難以保證,各類權(quán)重的使用具有隨意性。所以,傳統(tǒng)定性分析、傳統(tǒng)定量分析、基于互聯(lián)網(wǎng)的大數(shù)據(jù)分析應(yīng)當(dāng)互相融合,取長補短,使公共政策實施的評估更加科學(xué)合理。

參考文獻:

[1]魏航,王建冬,童楠楠.基于大數(shù)據(jù)的公共政策評估研究:回顧與建議[J].電子政務(wù)E-GOVERNMENT,2016.1:11-17

[2]高峰.政策評估的通用模型研究[J].科技管理研究,2015.24:35-39

[3]連芷萱,蘭月新,夏一雪,劉茉,張雙獅.面向大數(shù)據(jù)的網(wǎng)絡(luò)輿情多維動態(tài)分類與預(yù)測模型研究[J].情報雜志,2018.5:123-133

[4]張達剛,陳海寧,陳華,張光怡.環(huán)境評估大數(shù)據(jù)管理平臺初探及技術(shù)綜述[J].計算機系統(tǒng)應(yīng)用,2019.28(4):205-211

[5]文馨,陳能成,肖長江.基于SparkGraphX和社交網(wǎng)絡(luò)大數(shù)據(jù)的用戶影響力分析[J].計算機應(yīng)用研究,2018.35(3):830-834

作者:楊志新 高翔 張慶 張狄 單位:1.湖南省政府發(fā)展研究中心 2.長沙市天心閣大數(shù)據(jù)研究院