群智感知網(wǎng)絡(luò)中高效數(shù)據(jù)收集策略

時間:2022-11-11 09:38:31

導(dǎo)語:群智感知網(wǎng)絡(luò)中高效數(shù)據(jù)收集策略一文來源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

群智感知網(wǎng)絡(luò)中高效數(shù)據(jù)收集策略

摘要:針對群智感知網(wǎng)絡(luò)數(shù)據(jù)收集中的效率問題,需要整合數(shù)據(jù)收集能量、延遲優(yōu)化節(jié)點(diǎn)、參數(shù)設(shè)置、網(wǎng)絡(luò)路由和通信協(xié)議等多方面優(yōu)勢,建立符合實(shí)際的群智感知網(wǎng)絡(luò)的智能高效數(shù)據(jù)收集策略。本文設(shè)計(jì)了一種能夠減少數(shù)據(jù)冗余、提高數(shù)據(jù)覆蓋率的群體感知策略,從如何選擇數(shù)據(jù)收集者,降低平臺開銷,提高網(wǎng)絡(luò)覆蓋率來保證應(yīng)用的服務(wù)質(zhì)量,為群智感知網(wǎng)絡(luò)高效數(shù)據(jù)收集提供參考依據(jù)。關(guān)鍵詞:群智感知;數(shù)據(jù)收集;高效;策略

1引言

隨著5G通信、物聯(lián)網(wǎng)、云計(jì)算及數(shù)據(jù)庫技術(shù)的飛速發(fā)展,人們對物理環(huán)境更大規(guī)模、更復(fù)雜、更全面的感知需求越來越強(qiáng)烈。近年來,隨著無線傳感器網(wǎng)絡(luò)、眾包計(jì)算、社會計(jì)算、機(jī)會網(wǎng)絡(luò)研究的不斷深入,人們提出了新型群智感知(CrowdSensing,CS)模式。群智感知模式主要應(yīng)用在智能交通管理、天氣監(jiān)測系統(tǒng)、噪聲污染監(jiān)測系統(tǒng)、醫(yī)療診斷、空間探索等領(lǐng)域。它可以高效對海量復(fù)雜的大數(shù)據(jù)進(jìn)行特征學(xué)習(xí),發(fā)現(xiàn)隱藏的知識和規(guī)律,挖掘大數(shù)據(jù)中潛在價值,極大促進(jìn)社會各領(lǐng)域的發(fā)展[1-2]。目前對高質(zhì)量的群集數(shù)據(jù)收集策略僅局限于某個特定區(qū)域的整體數(shù)據(jù)收集,特別是智能移動感知設(shè)備的多維目標(biāo)的數(shù)據(jù)收集策略還處于初級研究階段,多維數(shù)據(jù)收集的冗余量、網(wǎng)絡(luò)延遲以及能量消耗也是目前群體感知網(wǎng)絡(luò)亟需解決的問題,因此研究高服務(wù)質(zhì)量的群集數(shù)據(jù)收集策略,對于基于數(shù)據(jù)的基礎(chǔ)應(yīng)用具有重大意義。針對群智感知網(wǎng)絡(luò)數(shù)據(jù)收集的效率存在的問題,本文基于群智感知網(wǎng)絡(luò)框架來研究建立一種智能高效的數(shù)據(jù)收集策略,從數(shù)據(jù)收集能量、延遲優(yōu)化、路由選擇、通信協(xié)議等多方面進(jìn)行設(shè)計(jì),選擇能夠降低平臺開銷、提高網(wǎng)絡(luò)覆蓋率的數(shù)據(jù)收集者來保證應(yīng)用的服務(wù)質(zhì)量,為群體感知網(wǎng)絡(luò)高效數(shù)據(jù)收集和傳感網(wǎng)絡(luò)數(shù)據(jù)應(yīng)用提供參考。

2群智感知網(wǎng)中的應(yīng)用

2.1高效數(shù)據(jù)收集方法

群智感知是指一種能利用個體或社區(qū)共同感知信息來形成知識片段的新的感知模式。近年來,國內(nèi)外在體系結(jié)構(gòu)、數(shù)據(jù)收集、隱私保護(hù)、激勵機(jī)制、信譽(yù)模型、社會自私性等方面進(jìn)行了一些探索性研究,加利福尼亞大學(xué)、雷丁大學(xué)、東京大學(xué)、新南威爾士等大學(xué)關(guān)注度非常高。群智感知網(wǎng)絡(luò)中數(shù)據(jù)收集是指利用人們所使用的無處不在的智能傳感器設(shè)備如智能手機(jī)、iPad、車載傳感器和可穿戴設(shè)備等來采集數(shù)據(jù),將物理環(huán)境中相關(guān)的數(shù)據(jù)信息采集后向應(yīng)用后臺/云端上報,由后臺/云端進(jìn)行計(jì)算形成需要收集的數(shù)據(jù)。這些數(shù)據(jù)信息可為智能城市基于復(fù)雜數(shù)據(jù)傳感的應(yīng)用(如環(huán)境監(jiān)測、智能交通、公共安全、醫(yī)療保健中的遠(yuǎn)程病人護(hù)理系統(tǒng)等領(lǐng)域)里面的重要需求提供解決的新策略。在數(shù)據(jù)采集和收集過程中,盡量采用最少的投資來獲取最多的信息,或采用盡量少的信息采集點(diǎn)達(dá)到最大的全局信息覆蓋,或根據(jù)采集到的離散信息來構(gòu)造完整的全局信息描述。它們具有低成本、動態(tài)性強(qiáng)和擴(kuò)展性好等特點(diǎn)。(1)基于群體競爭感知模式的數(shù)據(jù)收集方法?;谌后w競爭感知模式的數(shù)據(jù)收集方法,有兩種感知模式。一種是以平臺為中心的感知模式。系統(tǒng)首先將獎勵金額設(shè)定好,然后數(shù)據(jù)收集者通過競爭來參與任務(wù)的執(zhí)行。另一種是以數(shù)據(jù)收集者為中心的感知模式。這種模式通過拍賣的方式來選合適的數(shù)據(jù)收集者。在實(shí)際的數(shù)據(jù)收集過程中,數(shù)據(jù)收集者的協(xié)作成本是很難提前獲取到的。因?yàn)椴煌臄?shù)據(jù)收集者的數(shù)據(jù)成本具有個體差異性,甚至使用的數(shù)據(jù)收集設(shè)備也不盡相同。因此獲取到數(shù)據(jù)收集者的真實(shí)成本是很困難的?;谌后w競爭感知模式的數(shù)據(jù)收集方法存在的不足主要是激勵機(jī)制同樣會給系統(tǒng)帶來一定的開銷。另外,它不能有效地解決離散數(shù)據(jù)收集問題。(2)基于群體線上、線下模式的數(shù)據(jù)收集方法。群智感知模式還可以分為線上模式和線下模式。線上模式中的數(shù)據(jù)收集者集合是動態(tài)變化的。而線下模式中的數(shù)據(jù)收集者集合在開始確定后則固定不變。在動態(tài)的感知模型中,為了滿足應(yīng)用在不同時期對感知任務(wù)的不同要求,需要不斷地增加或者減少數(shù)據(jù)收集者的數(shù)量。該模型的主要目的是為了選擇出具有較高穩(wěn)定性的數(shù)據(jù)收集者集合?;谌后w線上、線下模式的數(shù)據(jù)收集方法存在的不足主要為:線上模式雖然能夠提高數(shù)據(jù)收集者群體的協(xié)作靈活性,但線上動態(tài)的模型也相應(yīng)地會帶來大量的計(jì)算成本;而線下模式則無法保證數(shù)據(jù)的實(shí)時性。(3)基于局部網(wǎng)絡(luò)的數(shù)據(jù)收集方法。局部網(wǎng)絡(luò)的數(shù)據(jù)收集方法主要考慮網(wǎng)絡(luò)延遲和傳感器節(jié)點(diǎn)能耗問題[3-4]。網(wǎng)絡(luò)延遲是指從傳感節(jié)點(diǎn)感知到數(shù)據(jù)經(jīng)由多跳傳輸?shù)絪ink(匯聚結(jié)點(diǎn))并被sink接收所經(jīng)歷的時間,一般稱為端到端延遲(或延遲)。在群體感知網(wǎng)絡(luò)中,網(wǎng)絡(luò)延遲主要包括如下幾類:①睡眠延遲。睡眠延遲是指從數(shù)據(jù)包被發(fā)送節(jié)點(diǎn)發(fā)送出去到它被目標(biāo)接收節(jié)點(diǎn)接收所經(jīng)歷的時間間隔。②數(shù)據(jù)處理延遲。數(shù)據(jù)處理延遲是指節(jié)點(diǎn)計(jì)算與處理數(shù)據(jù)所需的時間。數(shù)據(jù)處理延遲通常要小于睡眠延遲。③數(shù)據(jù)傳輸延遲。傳輸延遲是指數(shù)據(jù)傳輸所需要的時間,包括排隊(duì)延遲和可能的數(shù)據(jù)重傳延遲?;诰植烤W(wǎng)絡(luò)的數(shù)據(jù)收集方法的不足主要體現(xiàn)在:經(jīng)典的路由算法如最短路徑算法只考慮節(jié)點(diǎn)與sink的距離,而沒有考慮節(jié)點(diǎn)睡眠所造成的延遲。(4)基于全局網(wǎng)絡(luò)的數(shù)據(jù)收集方法。數(shù)據(jù)收集者數(shù)量不足以及數(shù)據(jù)收集者在全局網(wǎng)絡(luò)區(qū)域分布不均勻是群體感知系統(tǒng)中面臨的難題。目前很少有研究人員將數(shù)據(jù)恢復(fù)技術(shù)應(yīng)用到全局網(wǎng)絡(luò)數(shù)據(jù)收集中。數(shù)據(jù)恢復(fù)技術(shù)是減少全局網(wǎng)絡(luò)數(shù)據(jù)收集系統(tǒng)中數(shù)據(jù)冗余問題以及數(shù)據(jù)缺失問題的一種有效解決方法。

2.2高效數(shù)據(jù)收集技術(shù)

群體感知網(wǎng)絡(luò)主要研究如何使數(shù)據(jù)收集成本降低,服務(wù)質(zhì)量得以提高;通過減少數(shù)據(jù)冗余來提高數(shù)據(jù)覆蓋率的群體感知策略。通過數(shù)據(jù)恢復(fù)技術(shù)和有效的激勵機(jī)制以及節(jié)點(diǎn)能量消耗和延遲計(jì)算模型設(shè)計(jì),來建立細(xì)粒度滿足消費(fèi)者需求的智能數(shù)據(jù)收集技術(shù)。(1)群體感知數(shù)據(jù)收集的框架建模。在群體感知網(wǎng)絡(luò)研究中,數(shù)據(jù)收集者在采集與報告時需要付出一定的成本,同時面臨著隱私泄露的風(fēng)險。因而平臺采用一定的激勵機(jī)制,通常是對數(shù)據(jù)報告者給予一定的貨幣、信任度、虛擬貨幣或者其它措施來激勵數(shù)據(jù)收集者參與數(shù)據(jù)的采集。它依據(jù)給予獎勵對象的粒度不同而有所不同。以單個數(shù)據(jù)包為獎勵的單位的報告數(shù)據(jù),平臺每獲得一個數(shù)據(jù)包就給予一定的獎勵。這種激勵機(jī)制的優(yōu)點(diǎn)是粒度比較細(xì),能夠有效地針對應(yīng)用的需求來招募數(shù)據(jù)收集者。但是,這種方式也存在著不足:由于參與數(shù)據(jù)感知的移動設(shè)備數(shù)量眾多,協(xié)商的成本超過了報告數(shù)據(jù)的成本。(2)數(shù)據(jù)收集策略所采用的激勵策略與方法。數(shù)據(jù)需求者通常以是否能收集到合適的數(shù)據(jù)為判斷依據(jù)。不論是數(shù)據(jù)采集、傳輸、獲取都會要求數(shù)據(jù)收集者付出一定的精力、時間、能量等方面的成本。如果數(shù)據(jù)收集者沒有得到足夠的激勵,其參與數(shù)據(jù)收集的積極很低,造成數(shù)據(jù)需求者并不能滿意地完成該任務(wù)。數(shù)據(jù)需求方,主要目標(biāo)是在支付代價最小或者支付代價可控的情況下既要激勵更多的參與者,提高參與者參與水平,又要保證參與者的感知數(shù)據(jù)是高質(zhì)可靠的。合適的激勵辦法對于群智感知數(shù)據(jù)具有重要意義。(3)保證服務(wù)質(zhì)量,降低數(shù)據(jù)收集開銷。在群智感知激勵機(jī)制中,僅通過招募大量參與者并不能保證感知任務(wù)被高質(zhì)量地完成。在提高參與率的同時,還要保證一定的任務(wù)完成質(zhì)量。保證構(gòu)建應(yīng)用的服務(wù)質(zhì)量的關(guān)鍵在于保證數(shù)據(jù)收集的覆蓋率。但是在保證數(shù)據(jù)覆蓋率的同時,往往意味著成本的增加。為了保證數(shù)據(jù)的覆蓋率,往往會有冗余數(shù)據(jù)的產(chǎn)生。如何突破傳統(tǒng)數(shù)據(jù)收集模式的限制,是群智感知應(yīng)用迫切需要解決的問題。(4)群智感知數(shù)據(jù)采集技術(shù)。在群智感知中數(shù)據(jù)采集技術(shù)中,有的源自多種異質(zhì)傳感器,有的源自復(fù)雜社會網(wǎng)絡(luò)。根據(jù)數(shù)據(jù)結(jié)構(gòu)的不同,可以分為結(jié)構(gòu)化的數(shù)據(jù)表格和非結(jié)構(gòu)化的數(shù)據(jù);根據(jù)數(shù)據(jù)形式的不同,可以分為文本數(shù)據(jù)、視頻數(shù)據(jù)、音頻數(shù)據(jù)等。這些數(shù)據(jù)在為時空分析帶來豐富數(shù)據(jù)源的同時,也增加了時空可視化分析數(shù)據(jù)的復(fù)雜性。由于數(shù)據(jù)規(guī)模越來越大,數(shù)據(jù)可視化所需的資源包括數(shù)據(jù)存儲、可視化計(jì)算資源的需求也越來越大。群智感知數(shù)據(jù)對社會性、隨機(jī)性、突發(fā)性、實(shí)時響應(yīng)要求高,事前無法預(yù)知其規(guī)模與地域,因而需要采用計(jì)算資源虛擬化技術(shù)來支持?jǐn)?shù)據(jù)處理的研究與應(yīng)用。(5)平臺構(gòu)建?;趹?yīng)用場景的感知任務(wù)管理可視化云服務(wù)系統(tǒng)平臺可在現(xiàn)有分布式基礎(chǔ)設(shè)施的基礎(chǔ)上,通過虛擬化以及云服務(wù)資源管理與調(diào)度技術(shù)形成支持任務(wù)管理的IaaS(InfrastructureasaService)服務(wù);通過云-端快速感知技術(shù),調(diào)用云存儲服務(wù)實(shí)現(xiàn)對物理世界和網(wǎng)絡(luò)世界感知數(shù)據(jù)的快速獲取;通過對海量數(shù)據(jù)的組織與管理,把各類數(shù)據(jù)按照時空特點(diǎn)中心組織,以PaaS(PlatformasaService)的形式進(jìn)入云服務(wù)池;通過模型服務(wù)于封裝技術(shù),支持多類型時空可視化感知模型的封裝,以PaaS的形式進(jìn)入云服務(wù)池;以公共SaaS(SoftwareasaService)的形式提供服務(wù);通過任務(wù)系統(tǒng)快速構(gòu)建技術(shù),面向特定目標(biāo)構(gòu)建任務(wù)軟件系統(tǒng),以專有IaaS的形式提供服務(wù)。為不同任務(wù)類型的個性化需求提供擴(kuò)展的服務(wù)接口,形成多種數(shù)據(jù)訪問標(biāo)準(zhǔn)。對于空間數(shù)據(jù),采用OGC(OpenGeospatialConsortium)標(biāo)準(zhǔn),它制定了數(shù)據(jù)和服務(wù)的一系列標(biāo)準(zhǔn),建立任務(wù)管理空間數(shù)據(jù)集成標(biāo)準(zhǔn)。在此標(biāo)準(zhǔn)下,提供UDDI/WMS/WCS/WFS/WPS等多種空間地理數(shù)據(jù)服務(wù)。對于具有隱性空間屬性的文本,通過geo-coling云服務(wù)方式進(jìn)行數(shù)據(jù)整合。(6)群智感知數(shù)據(jù)收集的組成。首先是數(shù)據(jù)收集者。它一般指裝備傳感設(shè)備的人或者設(shè)施,如車輛、智能手機(jī)、工業(yè)現(xiàn)場裝備的監(jiān)控傳感設(shè)備。然后是數(shù)據(jù)需求者。數(shù)據(jù)需求者是需要數(shù)據(jù)的一方,也稱為任務(wù)發(fā)布者。數(shù)據(jù)需求發(fā)布應(yīng)用需要采集數(shù)據(jù)的具體需求,并向數(shù)據(jù)報告者支付一定的酬勞來激勵他們?nèi)ナ占嚓P(guān)的數(shù)據(jù)。數(shù)據(jù)需求者的酬勞并不是直接支付給數(shù)據(jù)收集者,而是通過平臺來獲取滿足自己需求的數(shù)據(jù)。最后是應(yīng)用平臺。應(yīng)用平臺在群體感知網(wǎng)絡(luò)中起主導(dǎo)作用和調(diào)度作用。平臺需要依據(jù)市場的需求來制定滿足市場需求的大數(shù)據(jù)應(yīng)用。應(yīng)用對數(shù)據(jù)的需求可以定義為一組依賴于位置的感知任務(wù)。數(shù)據(jù)傳感任務(wù)將時間劃分為一系列的時隙。在每個時隙中,被選中的數(shù)據(jù)報告者執(zhí)行指定的數(shù)據(jù)感知任務(wù)并且將感知到的數(shù)據(jù)報告給平臺。大量基于數(shù)據(jù)的應(yīng)用都可以通過群體感知來滿足應(yīng)用的數(shù)據(jù)需求。為了降低數(shù)據(jù)收集成本,保證數(shù)據(jù)收集質(zhì)量,應(yīng)用平臺需要制定能夠優(yōu)化的選取數(shù)據(jù)收集者的數(shù)據(jù)收集策略,即選擇那些使系統(tǒng)付出的成本最小并且能夠保證構(gòu)造應(yīng)用質(zhì)量的數(shù)據(jù)收集者。(7)海量異構(gòu)數(shù)據(jù)特征提取。運(yùn)用特征提取技術(shù)排除冗余或無關(guān)因素是高效數(shù)據(jù)收集的基礎(chǔ)。針對傳統(tǒng)特征提取技術(shù)難以處理海量異構(gòu)數(shù)據(jù)的問題,使用基于并行計(jì)算智能方法的特征提取技術(shù)。將所提出的異構(gòu)數(shù)據(jù)首先在標(biāo)準(zhǔn)數(shù)據(jù)測試集上進(jìn)行實(shí)驗(yàn)。其實(shí)驗(yàn)結(jié)果與有文獻(xiàn)可考的方法進(jìn)行比較,以驗(yàn)證新技術(shù)有效、可靠。

2.3高效數(shù)據(jù)收集策略

(1)任務(wù)發(fā)布者功能。群智感知系統(tǒng)通過群體感知系統(tǒng)平臺發(fā)布相應(yīng)的感知任務(wù)后獲取數(shù)據(jù),并對數(shù)據(jù)進(jìn)行篩選、提煉和加工等操作。通過收集到的數(shù)據(jù)來構(gòu)建符合市場需求或者是特定要求的應(yīng)用。任務(wù)發(fā)布者需要承擔(dān)在數(shù)據(jù)收集過程中可能產(chǎn)生的相應(yīng)開銷。感知平臺分配感知任務(wù),選擇合適的數(shù)據(jù)收集者參與且通過平臺來對這些數(shù)據(jù)收集者進(jìn)行相應(yīng)的激勵支付。數(shù)據(jù)收集者是智能設(shè)備的持有者。這些智能設(shè)備主要是裝載了傳感器的車輛、手機(jī)、平板、可穿戴設(shè)備等。(2)數(shù)據(jù)收集者的策略選擇。在群智網(wǎng)絡(luò)應(yīng)用中,不同智能設(shè)備對于所收集到的數(shù)據(jù)的報價并不一定能夠真實(shí)地反應(yīng)出設(shè)備的實(shí)際工作量和對應(yīng)用的貢獻(xiàn)。在對數(shù)據(jù)收集者進(jìn)行選擇的時候,必須要對數(shù)據(jù)收集者進(jìn)行全面的考察。對于數(shù)據(jù)收集者,其收集到的所有數(shù)據(jù)的個數(shù)可以表示為:N=∑∑dimji=1Tj=1(1)在采集數(shù)據(jù)的時候,數(shù)據(jù)收集者只能提交一個位置上的數(shù)據(jù),可以表示為:∑dimji=1≤1,(2)因此,對于單個數(shù)據(jù)收集者來說,在數(shù)據(jù)收集的時間段內(nèi),其最多能夠收集到數(shù)據(jù)個數(shù)是數(shù)據(jù)收集者持有的智能設(shè)備在每個單位采樣時間所提交的數(shù)據(jù)。而對于單個數(shù)據(jù)收集者言,需要定義一個能夠衡量其效率高低的標(biāo)準(zhǔn)??梢远x其數(shù)據(jù)收集效率為:F=NT=∑∑dimji=1Tj=1T∈[0,1](3)式(3)中,N是數(shù)據(jù)收集者收集到的數(shù)據(jù)的個數(shù);Σ是數(shù)據(jù)收集者提交一個位置上的數(shù)據(jù)集和;T是在數(shù)據(jù)收集時間段內(nèi)最多能夠收集到數(shù)據(jù)個數(shù);F是數(shù)據(jù)收集效率;j是數(shù)據(jù)收集者的活動時間,j∈[1,T];i、m是數(shù)據(jù)采集軌跡位置收集到的數(shù)據(jù),i∈[1,m];dij=0ordij=1:表示數(shù)據(jù)收集者在時間T能到達(dá)位置。數(shù)據(jù)收集效率體現(xiàn)了數(shù)據(jù)收集者的活躍程度。如果數(shù)據(jù)收集者在每個單位采樣時間都提交數(shù)據(jù),則該數(shù)據(jù)收集者的效率為1,該數(shù)據(jù)收集者為比較活躍的數(shù)據(jù)收集者。但是不同的數(shù)據(jù)收集者在收集數(shù)據(jù)時所產(chǎn)生的開銷是不同的,如果僅根據(jù)數(shù)據(jù)收集效率來選擇,則有可能產(chǎn)生較高的成本。而且,如果選擇的標(biāo)準(zhǔn)只有數(shù)據(jù)收集效率,對于效率相同的兩個數(shù)據(jù)收集者,無法選擇出開銷更低的一方。系統(tǒng)需要一個選擇標(biāo)準(zhǔn),能夠在數(shù)據(jù)收集效率與數(shù)據(jù)收集開銷方面綜合對數(shù)據(jù)收集者進(jìn)行評定,來提供綜合較優(yōu)的選擇。(3)應(yīng)用數(shù)據(jù)恢復(fù)技術(shù)。采用傳統(tǒng)的數(shù)據(jù)收集模式,無法突破理想情況下數(shù)據(jù)收集的局限性。突破傳統(tǒng)數(shù)據(jù)收集模式的關(guān)鍵在于能夠通過某種方式在保證數(shù)據(jù)覆蓋率的前提下,降低數(shù)據(jù)的收集量。而將數(shù)據(jù)恢復(fù)技術(shù)應(yīng)用在數(shù)據(jù)收集的過程中可以較好地彌補(bǔ)傳統(tǒng)數(shù)據(jù)收集模式的問題。矩陣填充技術(shù)是一種較為成熟的數(shù)據(jù)恢復(fù)技術(shù)。將其應(yīng)用在數(shù)據(jù)收集中可以有效地減少需要采集的數(shù)據(jù)量。(4)構(gòu)建能量消耗模型。節(jié)能降耗是數(shù)據(jù)收集技術(shù)的重要研究內(nèi)容。通過挖掘群智感知環(huán)境中的數(shù)據(jù)時空相關(guān)性,可以減少數(shù)據(jù)傳輸量,有利于節(jié)省能耗,延長網(wǎng)絡(luò)生命周期。在群智網(wǎng)絡(luò)中,由于匯聚效應(yīng),sink節(jié)點(diǎn)附近的數(shù)據(jù)量急劇增加,從而形成網(wǎng)絡(luò)瓶頸。使用移動sink,可以避免多跳傳輸導(dǎo)致的匯聚效應(yīng)。采用移動sink覆蓋所有節(jié)點(diǎn),可能會存在移動sink路徑過長等問題??梢钥紤]動態(tài)路由結(jié)合的壓縮感知機(jī)制[4],通過將壓縮感知技術(shù)和隨機(jī)路由技術(shù)結(jié)合,可以提高網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)動態(tài)變化的自適應(yīng)能力。相對于傳統(tǒng)樹形或者簇型結(jié)構(gòu),它還可以延長網(wǎng)絡(luò)生命周期。壓縮感知技術(shù)要求所有測量結(jié)果最終到達(dá)服務(wù)器端,用于數(shù)據(jù)恢復(fù)。然而傳統(tǒng)隨機(jī)游走無方向性,可以是路由到網(wǎng)絡(luò)中的任何一個節(jié)點(diǎn)。目前有兩種思路可以解決存在的不足之處。思路一是在隨機(jī)游走路徑之后,增加一個靜態(tài)路由樹,用于傳輸壓縮感知測量結(jié)果到sink節(jié)點(diǎn)。這樣會增加額外的多跳傳輸開銷。思路二是構(gòu)建一個有向的隨機(jī)游走,即每一跳,都選擇離sink更近的點(diǎn)。但是各節(jié)點(diǎn)需要知道所有節(jié)點(diǎn)的全局性的位置信息。在大規(guī)模無線傳感器網(wǎng)絡(luò)中這類全局性信息獲取成本過高,且存在有向隨機(jī)游走匯聚效應(yīng)導(dǎo)致的空間分布不均勻等問題,會降低壓縮感知恢復(fù)性能??梢詰?yīng)用精細(xì)的微積分?jǐn)?shù)學(xué)分析方法來解決這個問題。建立依據(jù)節(jié)點(diǎn)通信半徑,將網(wǎng)絡(luò)劃分為多個圓環(huán),然后依據(jù)節(jié)點(diǎn)與sink的距離對不同圓環(huán)內(nèi)節(jié)點(diǎn)計(jì)算相應(yīng)的數(shù)據(jù)量,再依據(jù)數(shù)據(jù)量可以得到節(jié)點(diǎn)的能量消耗。對于網(wǎng)絡(luò)中的任意區(qū)域,可以通過選定一定距離、一定角度的扇形區(qū)域積分得到其能量消耗與總體延遲。對于靜態(tài)傳感器網(wǎng)絡(luò)的能量消耗、承擔(dān)的數(shù)據(jù)量、參數(shù)間的關(guān)系采用了數(shù)學(xué)上的精細(xì)微積分方法進(jìn)行分析,可得到更加準(zhǔn)確與細(xì)微化的結(jié)果,從而得到更加準(zhǔn)確的節(jié)點(diǎn)能量消耗模型[5]。(5)眾包(CrowdSourcing)。眾包是一種公開面向互聯(lián)網(wǎng)大眾的通過群體智慧分布式求解問題的新型模式,通過整合互聯(lián)網(wǎng)上未知的大眾,使用傳統(tǒng)的人本計(jì)算來完成計(jì)算機(jī)難以完成的任務(wù)[6]。眾包質(zhì)量直接體現(xiàn)在眾包問題的答案的質(zhì)量。在數(shù)據(jù)庫與信息檢索領(lǐng)域,基于眾包借助人類智慧來實(shí)現(xiàn)面向機(jī)器難問題的復(fù)雜查詢處理已經(jīng)成為了一個新的研究熱點(diǎn)。Skyline查詢是一種基本的偏好查詢類型,可以用來解決多目標(biāo)優(yōu)化問題以及支持用戶在復(fù)雜情況下進(jìn)行決策的重要手段,在數(shù)據(jù)探索、信息檢索、數(shù)據(jù)挖掘與可視化等方面具有不可替代的作用。眾包環(huán)境下執(zhí)行查詢處理需要考慮質(zhì)量和開銷金額的問題,面向質(zhì)量控制的眾包答案聚合模型,從工人篩選、答案聚合兩個方面著手,在滿足聚合答案置信度的條件下最小化參與眾包問題工人人數(shù),從而在保證質(zhì)量的同時減少單個眾包問題的開銷金額?;诳梢菩岳碚摰目刂脐P(guān)系和偏好關(guān)系判斷,既能實(shí)現(xiàn)屬性級別,又能實(shí)現(xiàn)對象級別來減少眾包問題,從而降低總開銷金額[7]。(6)數(shù)據(jù)融合技術(shù)。在移動群智感知網(wǎng)絡(luò)中的數(shù)據(jù)多源自不同機(jī)構(gòu),個體各異,來源多樣,格式不同。因此需要將分布在不同地點(diǎn)的多模態(tài)數(shù)據(jù)在統(tǒng)一的可視化平臺進(jìn)行高效集成融合。由于不同專業(yè)的數(shù)據(jù)格式、語義和展示方式有所不同,在可視化界面的層次上進(jìn)行數(shù)據(jù)集成需要解決統(tǒng)一的數(shù)據(jù)訪問接口、抽象數(shù)據(jù)類的定義、跨區(qū)域的服務(wù)聯(lián)動與集成以及多來源可視化服務(wù)的優(yōu)化與集成融合。

3總結(jié)

高效的數(shù)據(jù)收集策略是大數(shù)據(jù)網(wǎng)絡(luò)、群智感知網(wǎng)絡(luò)和參與式網(wǎng)絡(luò)的有效工作的基礎(chǔ)。目前對高質(zhì)量的群集數(shù)據(jù)收集策略僅局限于某個特定區(qū)域整體數(shù)據(jù)收集。智能移動感知設(shè)備的多維目標(biāo)的數(shù)據(jù)收集策略還處于初級研究階段。另外,多維數(shù)據(jù)收集的冗余量、網(wǎng)絡(luò)延遲以及能量消耗也是目前群智感知網(wǎng)絡(luò)亟需解決的問題,因此本文研究高服務(wù)質(zhì)量的群集數(shù)據(jù)收集策略,對于基于數(shù)據(jù)的基礎(chǔ)應(yīng)用具有重大意義。

作者:胡同花 單位:永州職業(yè)技術(shù)學(xué)院圖書館網(wǎng)絡(luò)中心