基于數(shù)據(jù)挖掘交通流預(yù)測(cè)分析

時(shí)間:2022-06-17 05:43:25

導(dǎo)語(yǔ):基于數(shù)據(jù)挖掘交通流預(yù)測(cè)分析一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

基于數(shù)據(jù)挖掘交通流預(yù)測(cè)分析

摘要:隨著社會(huì)的進(jìn)步道路交通狀況越來(lái)越擁擠,交通擁堵幾乎成為了所有發(fā)達(dá)城市所面臨的問題。因此改善交通狀況變得尤為重要。文章旨在從數(shù)據(jù)的角度建立模型,來(lái)進(jìn)行交通流預(yù)測(cè)。在閱讀了大量文獻(xiàn)的基礎(chǔ)上,首先對(duì)數(shù)據(jù)挖掘技術(shù)的國(guó)內(nèi)外研究情況進(jìn)行基本了解,對(duì)所有數(shù)據(jù)進(jìn)行預(yù)處理。然后通過線性回歸分析,分別研究了單一因素和多因素對(duì)交通流預(yù)測(cè)的影響,得到各因素的影響因子,建立了模型。并進(jìn)行了實(shí)例分析,結(jié)果擬合良好,驗(yàn)證了模型的準(zhǔn)確性。最后,對(duì)本次模擬進(jìn)行了總結(jié),為今后的改進(jìn)方向提供了思路。

關(guān)鍵詞:交通流預(yù)測(cè);線性回歸分析;單一因素分析;多因素分析

基于數(shù)據(jù)挖掘交通流預(yù)測(cè)系統(tǒng)研究就是將大量的數(shù)據(jù)運(yùn)用到交通流預(yù)測(cè)模型中,為決策者提供幫助來(lái)引導(dǎo)交通系統(tǒng)的暢通。從近幾年國(guó)內(nèi)交通治理的情況來(lái)看,單純?cè)黾咏煌ǖ缆芳奥访嬗不姆椒ㄒ呀?jīng)不可能從根源上解決交通壓力[1]。交通流數(shù)據(jù)采集系統(tǒng)在很長(zhǎng)一段時(shí)間內(nèi)通過人工和自動(dòng)數(shù)據(jù)收集、積累了大量數(shù)據(jù),使用數(shù)據(jù)挖掘技術(shù)人們不僅可以存儲(chǔ)歷史數(shù)據(jù),還可以為決策系統(tǒng)和導(dǎo)航系統(tǒng)提供數(shù)據(jù)等等。現(xiàn)在已經(jīng)有模型應(yīng)用于交通流預(yù)測(cè)中。為了提高預(yù)測(cè)的精度和可靠性,應(yīng)結(jié)合其他可靠的方法和模型來(lái)研究適合我國(guó)的交通流預(yù)測(cè)模型。智能交通系統(tǒng)研究的目的是使人、車、路與環(huán)境和諧共處[2]。將數(shù)據(jù)挖掘技術(shù)運(yùn)用到交通流預(yù)測(cè)對(duì)交通系統(tǒng)的擁堵、交通事故都會(huì)有很大的改善。

1方案設(shè)計(jì)

1.1數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘中一個(gè)非常重要的步驟。這個(gè)過程可以剔除異常數(shù)據(jù),使得數(shù)據(jù)挖掘的結(jié)果更加準(zhǔn)確。預(yù)處理方法一般包含有數(shù)據(jù)清洗、數(shù)據(jù)變換和數(shù)據(jù)規(guī)約等。它們各自有優(yōu)點(diǎn)和缺點(diǎn)[3]。1.2程序設(shè)計(jì)及計(jì)算。交通是一個(gè)大工程,影響它的因素有許多種。因此,需要從單一因素及多因素分別研究對(duì)交通流的影響。1.2.1單一因素對(duì)交通流的影響。一個(gè)地區(qū)如果要進(jìn)行土地開發(fā)利用,交通必將是先導(dǎo);反過來(lái)一個(gè)地區(qū)的交通便捷程度也決定著這個(gè)地區(qū)的土地利用率的大小[4]。土地利用是對(duì)交通影響最重要的因素之一。因此,本文首先選擇土地利用率作為單一因素,對(duì)交通流的影響進(jìn)行研究。先做散點(diǎn)圖以確定回歸函數(shù)的類型:用Matlab編程得出散點(diǎn)圖,如圖1所示:由圖1知其模擬結(jié)果符合線性回歸,運(yùn)用回歸分析在Matlab中實(shí)現(xiàn)。其殘差圖中存在數(shù)據(jù)對(duì)應(yīng)的殘差圖不過0線,因此去掉第16個(gè)數(shù)據(jù)后繼續(xù)做回歸。直至所有殘差圖過零線。如圖2。從圖2可知,數(shù)據(jù)可以使用。以此為數(shù)據(jù)庫(kù)進(jìn)行模擬,得到仿真結(jié)果為y=13.8986+78.1208X。其中X為土地利用率。1.2.2其它多因素對(duì)交通流的影響。眾所周知交通系統(tǒng)是一個(gè)復(fù)雜的系統(tǒng),影響交通流的因素非常之多,道路的寬敞程度、周圍商圈的繁華程度等等。它都影響著交通流,并對(duì)經(jīng)濟(jì)也有一定的促進(jìn)作用。交通是一個(gè)城市的基本骨架,它伴隨著城市的發(fā)展不斷地演化、擴(kuò)大;也是社會(huì)活動(dòng)的一個(gè)載體,影響著經(jīng)濟(jì)的發(fā)展。居民收入也是影響交通流的一個(gè)主要因素,經(jīng)濟(jì)情況的好轉(zhuǎn),對(duì)車輛的購(gòu)買欲增強(qiáng),也就是增加了交通流。交通流的影響因素如下表2所示:由圖3知所有的殘差圖均過0線,且顯著性概率為0,因此,回歸效果顯著。仿真結(jié)果為:y=22.4680+5.3205X1+3.9334X2-0.0092X3其中,X1為車道數(shù),X2為當(dāng)?shù)鼐用袷杖耄琗3為交通流量。

2實(shí)例分析

2.1單一因素驗(yàn)證。下表是臨泉縣濱河大道近幾年土地利用與交通流之間的關(guān)系,通過上一章所得出的方程來(lái)進(jìn)行數(shù)據(jù)驗(yàn)證,以此來(lái)驗(yàn)證方程的準(zhǔn)確性。如表3所示:將該表中的數(shù)據(jù)帶入上一章的一元線性回歸模型y=13.8986+78.1208X中進(jìn)行驗(yàn)證,得到驗(yàn)證結(jié)果。并且對(duì)于單一因素對(duì)交通流影響的預(yù)測(cè)值要進(jìn)行偏移率的計(jì)算來(lái)測(cè)定該方程的合理性及預(yù)測(cè)的準(zhǔn)確性,所以驗(yàn)證結(jié)果和偏移率如下表4所示:在此實(shí)驗(yàn)中,是一元線性回歸模型通過模擬出的散點(diǎn)圖可知道土地利用率與交通流呈線性關(guān)系,通過編程模擬出其殘差圖,根據(jù)結(jié)果繼續(xù)模擬,直到其數(shù)據(jù)都過0線為止,最后得到其回歸方程。通過數(shù)據(jù)驗(yàn)證及偏移率數(shù)值分析,其符合結(jié)果。2.2多因素驗(yàn)證。下表是濱河大道多種因素與交通流之間的關(guān)系,如表5所示:將該表中的數(shù)據(jù)代入上一章的多元線性回歸模型y=22.4680+5.3205X1+3.9334X2-0.0092X3驗(yàn)證結(jié)果。并且對(duì)于多因素對(duì)交通流影響的預(yù)測(cè)值要進(jìn)行偏移率的計(jì)算來(lái)測(cè)定該方程的合理性及預(yù)測(cè)的準(zhǔn)確性,所以驗(yàn)證結(jié)果和偏移率如下表6所示。在此實(shí)驗(yàn)中,是驗(yàn)證以上三種影響因素對(duì)交通流的影響,通過上一章的統(tǒng)計(jì)分析及編程得到模擬結(jié)果,并得到其多元線性回歸方程。通過數(shù)據(jù)驗(yàn)證和偏移率的數(shù)值分析,其符合結(jié)果。

3總結(jié)展望

數(shù)據(jù)挖掘已經(jīng)成為決策支持、道路交通、金融等行業(yè)的主要研究方向。在這個(gè)到處都是大數(shù)據(jù)的現(xiàn)代社會(huì)中,每年都會(huì)產(chǎn)生新的技術(shù)及方法,也由于人們對(duì)它的廣泛應(yīng)用和深入研究,算短了技術(shù)換代的時(shí)間,促進(jìn)了挖掘技術(shù)的快速發(fā)展。但是數(shù)據(jù)挖掘技術(shù)仍存在許多問題,如數(shù)據(jù)挖掘方法的效率有待提高,尤其是超大規(guī)模數(shù)據(jù)挖掘的效率。本文從數(shù)據(jù)挖掘的角度出發(fā),深入研究了數(shù)據(jù)挖掘中數(shù)據(jù)預(yù)處理技術(shù)及一元和多元線性回歸模型在交通流預(yù)測(cè)系統(tǒng)中的應(yīng)用,并對(duì)它們進(jìn)行了分析對(duì)比。

本文是基于數(shù)據(jù)挖掘的交通流預(yù)測(cè)并且得到一定的研究成果,但是由于時(shí)間及各種原因造成不能更進(jìn)一步的深入研究,況且交通系統(tǒng)本身就是一個(gè)巨大且復(fù)雜的系統(tǒng),所以還有很多地方需要完善和改進(jìn)。(1)交通流數(shù)據(jù)本身有其內(nèi)在的關(guān)系,速度、流量和占有率是最重要的三個(gè)屬性,它們之間是相互聯(lián)系、相互作用的,本文僅對(duì)流量的影響因素進(jìn)行分析,今后可以對(duì)三者之間的影響關(guān)系進(jìn)行分析預(yù)測(cè),并通過交通流預(yù)測(cè)模型為交通系統(tǒng)提供決策支持,同時(shí)它將更加的合理和準(zhǔn)確。(2)本文僅使用了線性回歸模型,可以考慮將多種模型混合使用,提高預(yù)測(cè)結(jié)果的準(zhǔn)確性。(3)今后還應(yīng)對(duì)不同路段、路面的種類因素等進(jìn)行分析研究。同時(shí)惡劣天氣、交通事故等因素也是未來(lái)需要進(jìn)一步研究的方向。

參考文獻(xiàn)

[1]高雅.短時(shí)交通流預(yù)測(cè)模型及預(yù)測(cè)方法的研究[D].上海:華東師范大學(xué),2011.4.

[2]許兆霞.基于數(shù)據(jù)挖掘技術(shù)的交通流數(shù)據(jù)分析研究[J].淮海:淮海工學(xué)院,2009.3.

[3]郭敏.道路交通流短時(shí)預(yù)測(cè)方法綜述[A].北京:北京科技大學(xué),2009.2.

[4]李明江.數(shù)據(jù)挖掘技術(shù)及應(yīng)用[A].都勻:黔南民族師范學(xué)院,2010.

[5]國(guó)家統(tǒng)計(jì)局.中國(guó)統(tǒng)計(jì)年鑒[J].北京:中國(guó)統(tǒng)計(jì)出版社,2010.

[6]國(guó)家統(tǒng)計(jì)局.中國(guó)統(tǒng)計(jì)年鑒[J].北京:中國(guó)統(tǒng)計(jì)出版社,2007.

作者:楊凱茜 劉瑋蔚 單位:1.西安航空學(xué)院車輛工程學(xué)院 2.中交第一公路勘察設(shè)計(jì)研究院有限公司