出租車GPS軌跡數(shù)據(jù)挖掘研究
時間:2022-02-22 08:35:15
導(dǎo)語:出租車GPS軌跡數(shù)據(jù)挖掘研究一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
1出租車gps軌跡數(shù)據(jù)挖掘技術(shù)分析
1.1數(shù)據(jù)預(yù)處理。初步的數(shù)據(jù)采集,往往都是不完整的或不一致的,數(shù)據(jù)當(dāng)中可能存在缺漏項或重復(fù)項,所以不能直接用于數(shù)據(jù)分析與數(shù)據(jù)挖掘,需要進一步進行數(shù)據(jù)的清理與冗余數(shù)據(jù)化簡操作。出租車的GPS軌跡數(shù)據(jù)當(dāng)中,可能存在的問題主要包括兩點,其一是軌跡點的經(jīng)緯度坐標越界;其二時軌跡點位置異常。對這兩種數(shù)據(jù)問題進行清理,可通過以下步驟:首先,處理經(jīng)緯度坐標越界問題,假設(shè)數(shù)據(jù)采集對象為沈陽市轄區(qū),則要劃分重點研究區(qū)域,若此次研究主要為主城區(qū)的交通道路規(guī)劃提供參考,則要將繞城高速以外的所有坐標記錄進行清除處理。其次,處理軌跡點異常的問題,需要進行異常值過濾處理,如,數(shù)據(jù)的來源出租車的行車速度要控制在合理范圍內(nèi);同時,還要有效剔除車載GPS的測量異常值,具體辦法可結(jié)合中位數(shù)濾波器進行有效處理。在數(shù)據(jù)采集過程中,受到交通擁堵、??康痊F(xiàn)實狀況的影響,地位系統(tǒng)當(dāng)中會出現(xiàn)大量的定位冗余點,若要保證數(shù)據(jù)分析的準確性,必須對其進行簡化處理。針對這一處理過程,可充分利用計算機圖形學(xué)與制圖學(xué)領(lǐng)域的研究成果,采用Douglas-Peucker即DP算法,針對出租車GPS軌跡數(shù)據(jù)中曲線節(jié)點密度較高的數(shù)據(jù)類型,能夠起到顯著的去冗余效果。1.2地圖匹配。在實際數(shù)據(jù)采集過程中,受到GPS定位精度問題的影響,獲取到的軌跡點可能存在一定的誤差,針對這種數(shù)據(jù)問題,就需要進一步采用地圖數(shù)據(jù)對其進行匹配糾正處理。較為簡單的匹配方法,就是將GPS軌跡點與距離最近的道路進行匹配,主要原理是幾何特性,基于道路拓撲關(guān)系進行匹配,能夠簡化匹配過程,且計算更為便捷、準確度更高。對初始數(shù)據(jù)進行相應(yīng)的處理,最終得到的軌跡數(shù)據(jù),應(yīng)能夠清晰的呈現(xiàn)為目標區(qū)域的道路網(wǎng)絡(luò)。
2利用出租車GPS軌跡數(shù)據(jù)挖掘居民出行特征的方案設(shè)計
2.1高斯定理與軌跡數(shù)據(jù)。采用高斯定律進行居民出行特征挖掘,是一種類比的應(yīng)用手段,主要原理是利用高斯定律描述目標場景,進而細致分析出租車軌跡方向與載客數(shù)量等特征。高斯定律數(shù)學(xué)表達公式如下:式中的Ω表示一個封閉曲面,而V則表示由這個封閉曲面所圍成的空間;0ε表示介電常數(shù);E表示空間V當(dāng)中的電場分布矢量函數(shù);而qi則表示空間V當(dāng)中所包含的電荷。對其進行直觀的理解,即公式所表示的的封閉曲面內(nèi)所包含的電荷之和,與穿過該曲面的電場線呈正比關(guān)系。將其類比于出租車GPS軌跡數(shù)據(jù)挖掘的過程當(dāng)中,即表示在出租車GPS軌跡數(shù)據(jù)當(dāng)中,一個載客段就對應(yīng)高斯定律當(dāng)中的一條電場線,而載客段所形成軌跡的起點與終點則為高斯定律當(dāng)中的正負電荷;假設(shè)研究范圍內(nèi)的出租車載客量趨于穩(wěn)定,皆為1/0λ,則能夠進一步得出出租車穿過制定區(qū)域的軌跡正比于區(qū)域內(nèi)所有載客段起點與終點之和。將高斯定律類比與出租車GPS軌跡數(shù)據(jù),針對尺度不同的區(qū)域,其起點與終點之和能夠進一步表現(xiàn)各個區(qū)域尺度下的載客凈流入量密度空間,具體表達公式如下:(count終點-count起點)式中的Ti表示目標區(qū)域內(nèi)的的載客段,當(dāng)載客段的終點在目標區(qū)域之內(nèi)時,δ(Ti)則為+1;若終點超出目標區(qū)域,則δ(Ti)的值為-1;1/0λ作為出租車的平均載客量,可將其假定為穩(wěn)定常數(shù)。2.2基于高斯定律的軌跡挖掘。類比于高斯定律的出租車GPS軌跡數(shù)據(jù)挖掘,通過對目標區(qū)域中出租車載客段在一定時間內(nèi)的軌跡進行分析,能夠進一步得到在這段時間內(nèi),目標區(qū)域內(nèi)出租車的載客凈流入量[1]。對于載客凈流入量這一數(shù)據(jù),能夠明確其數(shù)據(jù)分析指標包括出租車GPS軌跡數(shù)據(jù)當(dāng)中的數(shù)量特征與方向特征,能夠在一定程度上,客觀的反映出目標區(qū)域?qū)用癯霈F(xiàn)的“吸引力”程度??偨Y(jié)基于高斯定律的出租車GPS軌跡數(shù)據(jù)挖掘算法如下:(1)首先,初步獲取目標區(qū)域內(nèi)的出租車GPS軌跡數(shù)據(jù),并對其進行數(shù)據(jù)預(yù)處理操作;然后,將軌跡數(shù)據(jù)進行有效分割,分割的主要依據(jù)為出租者的載客狀態(tài),最終形成空車狀態(tài)數(shù)據(jù)與載客狀態(tài)數(shù)據(jù),從而提取出區(qū)域內(nèi)出租車載客軌跡的起點與終點。(2)得到有效的出租車GPS軌跡數(shù)據(jù)之后,進一步分割數(shù)據(jù)覆蓋區(qū)域,可采取柵格分割方式來設(shè)定分割尺寸。(3)以每個分割單元為單位,統(tǒng)計其中的載客軌跡起始點與終點,統(tǒng)計值即為count終點-count起點。(4)依據(jù)公式(count終點-count起點)•1/0λ,得出目標區(qū)域內(nèi),一定時間內(nèi)的乘客凈流入量。
3利用出租車GPS軌跡數(shù)據(jù)挖掘居民出行特征的實驗結(jié)果分析
以某城市交通局提供的,2017年9月1日至2日,城市主城區(qū)出租車GPS軌跡數(shù)據(jù)為例,對其進行數(shù)據(jù)挖掘?qū)嶒?,進一步分析居民出行特征。3.1數(shù)據(jù)分析。通過數(shù)據(jù)預(yù)處理后得到有效的軌跡數(shù)據(jù),分析得出以下內(nèi)容:統(tǒng)計時間間隔為10min,從早上5:00至中午12:00,出租車的載客次數(shù)呈現(xiàn)為先增加,后區(qū)域穩(wěn)定的趨勢;中午12:00至14:00,載客次數(shù)出現(xiàn)了明顯的下落,此后又逐漸上升;在16:00至19:00之間,再次出現(xiàn)了載客低谷狀態(tài)。通過分析,能夠明確此數(shù)據(jù)變化形式,與居民的常規(guī)出行行為特征基本符合。3.2軌跡挖掘?qū)嶒?。對?jīng)過預(yù)處理的數(shù)據(jù)進行分割處理,采用100m作為分割尺度,而500m作為搜索半徑,分別對每天5:00至10:30、16:30至22:00兩個時段進行分析,每個時段固定為5小時30分鐘。在得出9月2日輸出結(jié)果的基礎(chǔ)上,進一步結(jié)合山頂點提取法,分析乘客凈流入量、流出量峰值點進行提取,并得出其空間分布狀況,挖掘得出有利數(shù)據(jù)[2]。3.3實驗分析。在實驗觀察中發(fā)現(xiàn),在5:00至10:30這個時間段內(nèi),存在明顯的高值區(qū)域,這種數(shù)據(jù)形式說明,在目標區(qū)域內(nèi),這一時段的人流凈流量處于較高水平,可將其歸類為凈流入?yún)^(qū);通過實際地圖對比,該區(qū)域位于城市中心的商業(yè)區(qū)及鄰近區(qū)域;在數(shù)據(jù)當(dāng)中,外圍顯示出明顯的低值區(qū)域,即此區(qū)域內(nèi)的人流凈流量較低,說明為凈流出區(qū),與實際電子地圖進行對比發(fā)現(xiàn),此區(qū)域為城市的主要居民區(qū);數(shù)據(jù)載外圍一點,則出現(xiàn)了一些相對高值區(qū)域,與實際地圖相對照發(fā)現(xiàn),此區(qū)域內(nèi)包含城市火車站商圈,以及城市著名旅游風(fēng)景區(qū)。16:30至22:00時段對比于5:00至10:30這個時間段,高值區(qū)域的實際地址分布呈現(xiàn)為相反的狀態(tài),經(jīng)過思考分析,能夠得出,出租車GPS軌跡數(shù)據(jù)分析結(jié)果,與城市居民的日常生活行為習(xí)慣基本相符合,在早上,人們出行多數(shù)是去商務(wù)區(qū)上班,所以形成的商務(wù)區(qū)為高值區(qū)域、居民區(qū)為低值區(qū)域的數(shù)據(jù)特征;而傍晚時間,則是人們正常下班回家的時間,導(dǎo)致其高值區(qū)域與低值區(qū)域正好與早上相反。上述數(shù)據(jù)分析結(jié)果與Alain對城市通勤模式的相關(guān)分析基本符合:現(xiàn)階段的城市通勤模式,呈現(xiàn)為定性的單中心通勤模式,以就業(yè)崗位聚集的位置為主要中心,其周邊的商業(yè)設(shè)施以及基礎(chǔ)設(shè)施等,也可以作為中心區(qū)域的覆蓋位置;由此向外,呈現(xiàn)為放射性的通勤流格局,在上午時段,通過出租車GPS軌跡數(shù)據(jù),能夠進一步得出城市居民由外圍向中心聚集、傍晚時段由中心向外圍分散的行為特征。這種城市格局,是造成城市交通不暢的主要因素,在理想的城市規(guī)劃當(dāng)中,城市結(jié)構(gòu)應(yīng)該是多中心格局,這樣一來,通過多個“中心”分散原有城市單一中心的人流承載量,能夠顯著緩解城市的整體交通壓力。這就要求在城市規(guī)劃過程中,要充分利用城市外圍中心,吸引周邊居民的就業(yè)與消費等出行習(xí)慣,從而分解城市日常運行過程中的城市中心的交通壓力。這種城市規(guī)劃格局長久以來都未能得到有效實現(xiàn),屬于一種理想化的規(guī)劃目標。針對城市交通規(guī)劃,在多中心格局還無法全面實現(xiàn)的情況下,折中選擇了一種單一中心和多個次中心的組合結(jié)構(gòu)模式,即在規(guī)劃過程中不進行主次中心的明確劃分,相應(yīng)商務(wù)中心位置的就業(yè)崗位與商業(yè)設(shè)施等都進行均等分配建設(shè)的方式,在此基礎(chǔ)上,通勤流呈現(xiàn)為自由隨機的布置格局,長此以往,由于居民的日常行為習(xí)慣逐漸趨于穩(wěn)定,就會形成單一中心和多個次中心的組合結(jié)構(gòu)模式,而城市居民的出行特征,也就成為了放射狀與隨機共存的格局[3]。3.4實驗拓展。進一步拓展出租車GPS軌跡數(shù)據(jù)挖掘范圍,對其工作日與非工作日,同時段內(nèi)的軌跡數(shù)據(jù)進行分析,能夠發(fā)現(xiàn)在工作日,出租車的軌跡數(shù)據(jù)以及城市居民的出行特征,呈現(xiàn)為上述早上由外圍向中心聚集,傍晚由中心向外圍分散的形式;而在非工作日,城市居民有居民區(qū)向更外圍出的火車站商圈以及旅游景區(qū)的輸出率明顯增高。此種研究,不僅有利于城市總體的交通規(guī)劃,對出租車行業(yè)來說,還能進一步降低出租車死機巡游方式下,空載率高的問題,進而更好的為城市居民提供出行服務(wù),綜合提升出租車行業(yè)運營的經(jīng)濟效益與社會效益。
4結(jié)語
綜上所述,對基于出租車GPS軌跡數(shù)據(jù)挖掘的居民出行特征進行相關(guān)研究,有利于推動城市交通規(guī)劃與出租車行業(yè)的共同發(fā)展。通過上述分析,基于高斯定律的軌跡數(shù)據(jù)挖掘方法,能夠更好的進行出租車凈流入量密度空間的分析,從而得出城市居民的出行行為特征。在未來的應(yīng)用過程中,可改進文中所述方法存在的局限,充分利用GPS定位終端所產(chǎn)生的歷史軌跡數(shù)據(jù),與出租車GPS軌跡數(shù)據(jù)結(jié)合應(yīng)用,能夠得到更加精準的分析結(jié)果。
參考文獻:
[1]馮琦森.基于出租車軌跡的居民出行熱點路徑和區(qū)域挖掘[D].重慶:重慶大學(xué),2016.
[2]譚康.基于GPS軌跡的道路拓撲構(gòu)建和路徑選擇方法研究[D].湘潭:湖南科技大學(xué),2015.
[3]程靜,劉家駿,高勇.基于時間序列聚類方法分析北京出租車出行量的時空特征[J].地球信息科學(xué)學(xué)報,2016,18(09):1227~1239.
[4]付鑫,孫茂棚,孫皓.基于GPS數(shù)據(jù)的出租車通勤識別及時空特征分析[J].中國公路學(xué)報,2017,30(07):134~143.
作者:王瑤 單位:重慶城市職業(yè)學(xué)院