金融數(shù)據(jù)可視化應(yīng)用和探索

時(shí)間:2022-07-13 09:08:20

導(dǎo)語(yǔ):金融數(shù)據(jù)可視化應(yīng)用和探索一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

金融數(shù)據(jù)可視化應(yīng)用和探索

摘要:隨著金融數(shù)據(jù)容量和復(fù)雜度的不斷提高,使得用戶對(duì)金融數(shù)據(jù)的分析和理解產(chǎn)生了一定的困難。進(jìn)行金融數(shù)據(jù)可視化研究已成為金融市場(chǎng)的一個(gè)重要需求。本文基于Python可視化技術(shù),進(jìn)行金融數(shù)據(jù)可視化實(shí)例分析,并提出了金融數(shù)據(jù)可視化分析應(yīng)用模式。文中實(shí)例生成對(duì)應(yīng)的可視化圖形,用更直觀的方式對(duì)金融數(shù)據(jù)進(jìn)行多維度展示并加以分析。研究結(jié)果表明,在金融數(shù)據(jù)分析中應(yīng)用可視化技術(shù)可以讓研究人員和用戶迅速地洞察數(shù)據(jù)的內(nèi)涵和價(jià)值,為進(jìn)一步?jīng)Q策分析做出有利的技術(shù)支持。

關(guān)鍵詞:金融數(shù)據(jù)分析;可視化;Python;可視化庫(kù);應(yīng)用模式

1引言

目前,大數(shù)據(jù)技術(shù)已經(jīng)覆蓋至社會(huì)生產(chǎn)和生活的各個(gè)領(lǐng)域,數(shù)據(jù)科學(xué)帶來(lái)了新一輪科技革命和產(chǎn)業(yè)變革的機(jī)遇。經(jīng)濟(jì)金融領(lǐng)域是“數(shù)據(jù)金礦”。隨著大數(shù)據(jù)技術(shù)的發(fā)展,金融行業(yè)需要結(jié)合數(shù)據(jù)科學(xué)和金融業(yè)務(wù)進(jìn)行創(chuàng)新,整合結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),挖掘和分析客戶的消費(fèi)信息,預(yù)測(cè)客戶的行為和消費(fèi)習(xí)慣,從而提高金融行業(yè)服務(wù)的效率?;诖髷?shù)據(jù)技術(shù),金融機(jī)構(gòu)已在客戶畫像、精準(zhǔn)營(yíng)銷、業(yè)務(wù)審批、融資授信、風(fēng)險(xiǎn)防范和量化交易等領(lǐng)域取得較好的效果[1]。隨著數(shù)據(jù)科學(xué)和計(jì)算機(jī)存儲(chǔ)技術(shù)的發(fā)展,金融數(shù)據(jù)的產(chǎn)生和存儲(chǔ)量與日俱增[2]。在美國(guó)銀行(BankofAmerica,BOA)等一些金融機(jī)構(gòu)中,每天都會(huì)處理成千上萬(wàn)條的電子轉(zhuǎn)賬[3]。隨著這些金融基礎(chǔ)數(shù)據(jù)量的不斷增大,金融數(shù)據(jù)研究者和分析人員通過(guò)單純查看數(shù)據(jù)表格分析方式已經(jīng)捉襟見(jiàn)肘。普通用戶想通過(guò)金融數(shù)據(jù)進(jìn)行投資和理財(cái)分析更是一籌莫展。而可視化技術(shù)對(duì)于處理金融數(shù)據(jù)有著得天獨(dú)厚的優(yōu)勢(shì),可以幫助人們對(duì)海量、多維的金融數(shù)據(jù)進(jìn)行分析,使得人們能夠以相對(duì)直觀快速的方式對(duì)數(shù)據(jù)傳遞的信息加以理解,進(jìn)而為這些信息創(chuàng)造價(jià)值提供技術(shù)支持。本文主要研究可視化技術(shù)在金融數(shù)據(jù)的應(yīng)用優(yōu)勢(shì),首先基于Python中的可視化庫(kù)對(duì)金融數(shù)據(jù)實(shí)例進(jìn)行可視化設(shè)計(jì),然后對(duì)可視化的結(jié)果進(jìn)行進(jìn)一步的研究分析。

2技術(shù)路線研究

2.1可視化技術(shù)研究現(xiàn)狀

面對(duì)海量、高維、多源和紛繁復(fù)雜數(shù)據(jù)的分析挑戰(zhàn),可視化技術(shù)把數(shù)據(jù)挖掘技術(shù)、科學(xué)可視化、計(jì)算機(jī)圖形學(xué)和人機(jī)交互等方法結(jié)合起來(lái),并將人眼作為一個(gè)并行處理器,利用人眼的模式識(shí)別能力和感知能力對(duì)數(shù)據(jù)進(jìn)行交互的可視化表達(dá)以增強(qiáng)認(rèn)知。把不可見(jiàn)或難以顯示的數(shù)據(jù)轉(zhuǎn)化為可以感知的顏色、符號(hào)、圖形等輸入。研究新的可視化方法和理論模型,利用新的用戶交互手段輔助其從復(fù)雜矛盾或不完整的數(shù)據(jù)中挖掘出的信息之間的關(guān)系和隱藏模式,從而為決策提供有效的支持[4]。隨著全球范圍內(nèi)數(shù)據(jù)量劇增,數(shù)據(jù)可視化技術(shù)在生命科學(xué)、地理信息學(xué)、工業(yè)、軍事等各個(gè)領(lǐng)域得到了廣泛應(yīng)用。近年來(lái),它在網(wǎng)絡(luò)安全、金融和商業(yè)智能等領(lǐng)域的數(shù)據(jù)可視化也被大范圍應(yīng)用,成為數(shù)據(jù)可視化中新的熱點(diǎn)。目前國(guó)外學(xué)術(shù)界與工業(yè)界都沿著面向?qū)嶋H數(shù)據(jù)庫(kù)、基于可視化的分析推理與決策、解決實(shí)際問(wèn)題等方向發(fā)展。斯坦福大學(xué)提供了按需數(shù)據(jù)可視化Webinar[5]。在金融數(shù)據(jù)可視化領(lǐng)域,美國(guó)北卡羅萊納州立夏洛特分校的可視化中心開(kāi)發(fā)了基于識(shí)別特定關(guān)鍵詞的電子轉(zhuǎn)賬數(shù)據(jù)可視化系統(tǒng)和構(gòu)建了客戶信用風(fēng)險(xiǎn)分析系統(tǒng)RiskVA[6]。在國(guó)內(nèi)學(xué)者的可視化技術(shù)研究中,劉芳等提出一種基于引力場(chǎng)聚類的金融數(shù)據(jù)可視化方法[7],形成清晰的可視化聚類結(jié)果,發(fā)現(xiàn)數(shù)據(jù)變化規(guī)律。陳偉等采用R語(yǔ)言實(shí)現(xiàn)了基于大數(shù)據(jù)可視化技術(shù)的信息系統(tǒng)AC審計(jì)方法[8]。孫遠(yuǎn)波等利用疫情期間所發(fā)布的各階段疫情數(shù)據(jù)可視化作品[9],分析出疫情可視化設(shè)計(jì)的用戶分類、數(shù)據(jù)類型、特點(diǎn)和演化過(guò)程等。高莉莉等對(duì)中國(guó)知網(wǎng)(CNKI)檢索的文獻(xiàn)進(jìn)行計(jì)量分析[10],運(yùn)用Citespace軟件對(duì)檢索的相關(guān)文獻(xiàn)進(jìn)行可視化分析,繪制科學(xué)知識(shí)圖譜。綜上所述,可視化技術(shù)的研究已經(jīng)取得了一定的成果,并在各個(gè)應(yīng)用領(lǐng)域進(jìn)行了實(shí)踐。金融數(shù)據(jù)分析領(lǐng)域同樣需要可視化技術(shù)的幫助和支持。

2.2Python可視化庫(kù)簡(jiǎn)介

Python是目前最流行的程序設(shè)計(jì)語(yǔ)言之一。由于其簡(jiǎn)潔性和可擴(kuò)展性,自2004年以來(lái),使用率呈線性上升,目前已經(jīng)穩(wěn)定在編程語(yǔ)言前三名[11]。它的優(yōu)勢(shì)在于擁有豐富的擴(kuò)展庫(kù),可以實(shí)現(xiàn)數(shù)據(jù)的可視化。常見(jiàn)的Python數(shù)據(jù)可視化庫(kù)以matplotlib庫(kù)和NumPy庫(kù)為基礎(chǔ),還包括Pandas庫(kù)、Seaborn庫(kù)、Bokeh庫(kù)等。本文中重點(diǎn)使用了兩個(gè)基于Python的可視化庫(kù),具體如下:(1)Matplotlib庫(kù)。Matplotlib是Python語(yǔ)言中可視化的基礎(chǔ)庫(kù),具有十分強(qiáng)大和復(fù)雜的功能。它提供了一套和MATLAB類似的API,用戶可以調(diào)用函數(shù)實(shí)現(xiàn)快速繪圖和制表等功能。但相對(duì)而言,生成的可視化圖表缺少鮮明的特點(diǎn)。(2)Plotly庫(kù)。Plotly庫(kù)是一款開(kāi)源的繪圖庫(kù),主要使用js進(jìn)行圖形繪制。實(shí)現(xiàn)過(guò)程中主要是調(diào)用Plotly的函數(shù)接口,底層實(shí)現(xiàn)完全被隱藏,便于初學(xué)者的掌握。而且生成的可視化圖表可操作性強(qiáng),便于進(jìn)行多維數(shù)據(jù)的復(fù)雜性分析展示。

3金融數(shù)據(jù)可視化應(yīng)用實(shí)例

3.1金融數(shù)據(jù)分析

數(shù)據(jù)分析是數(shù)據(jù)科學(xué)的一個(gè)核心研究方向。它是指將收集到的各類數(shù)據(jù),采用一定原則和技術(shù)手段,進(jìn)行清洗、計(jì)算、分析、加工處理的過(guò)程。金融數(shù)據(jù)是在各項(xiàng)金融活動(dòng)中產(chǎn)生的數(shù)據(jù)。在金融部門開(kāi)展的金融業(yè)務(wù)中產(chǎn)生的數(shù)據(jù)既是對(duì)其自身經(jīng)營(yíng)狀況的客觀反映,也反映了國(guó)民經(jīng)濟(jì)的宏觀和微觀運(yùn)行。金融數(shù)據(jù)和金融數(shù)據(jù)處理具有自身的一些特征[12]。金融數(shù)據(jù)的數(shù)量巨大,信息來(lái)源廣泛,主要來(lái)自金融機(jī)構(gòu)內(nèi)部的數(shù)據(jù)、市場(chǎng)的數(shù)據(jù)和全社會(huì)的數(shù)據(jù)。本文實(shí)例中的數(shù)據(jù)集來(lái)源于中國(guó)人民銀行的調(diào)查統(tǒng)計(jì)司,屬于來(lái)自社會(huì)的數(shù)據(jù)。在金融數(shù)據(jù)可視化設(shè)計(jì)流程中,首先通過(guò)各種設(shè)備和技術(shù)手段采集相關(guān)的數(shù)據(jù);然后將采集的原始數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理;接著進(jìn)行可視化映射,把不同數(shù)據(jù)之間的聯(lián)系映射為視覺(jué)通道的不同元素;最后用戶可以從數(shù)據(jù)可視化結(jié)果中提取有用信息。

3.2Python可視化設(shè)計(jì)實(shí)例

本文以中國(guó)人民銀行調(diào)查統(tǒng)計(jì)司發(fā)布的2021年度中資大型銀行人民幣信貸收支表為例[13],進(jìn)行金融數(shù)據(jù)可視化分析設(shè)計(jì)實(shí)例分析。其中數(shù)據(jù)的字段包括境內(nèi)存款中的個(gè)人存款、單位存款、國(guó)庫(kù)定期存款和非存款類金融機(jī)構(gòu)存款。

3.2.1可視化餅圖設(shè)計(jì)實(shí)例

餅圖或圓環(huán)圖是由面積大小不一或顏色填充的扇形組成的圓形圖表,主要用于顯示數(shù)據(jù)中各項(xiàng)與總和的比例。它可以用于快速展示數(shù)據(jù)中各項(xiàng)數(shù)據(jù)在整體數(shù)據(jù)中的占比情況?;赑lotly庫(kù)繪制餅圖使用Pie函數(shù)。繪制環(huán)形圖時(shí),在Pie函數(shù)中設(shè)置控制環(huán)形中心空白大小的hole屬性即可完成。還有一類特殊的餅圖被稱為旭日?qǐng)D,是可以對(duì)各部分構(gòu)成進(jìn)行進(jìn)一步分析比對(duì)的可視化圖形,對(duì)數(shù)據(jù)的多維度、多層次分析很有幫助?,F(xiàn)對(duì)2021年度中資大型銀行人民幣信貸收支表中一月數(shù)據(jù)進(jìn)行可視化分析。把現(xiàn)有的數(shù)據(jù)進(jìn)行預(yù)處理。首先用Plotly庫(kù)繪制境內(nèi)存款四種情況數(shù)據(jù)進(jìn)行可視化設(shè)計(jì),對(duì)境內(nèi)存款的情況進(jìn)行一個(gè)概括分析。境內(nèi)存款情況如圖1所示。從圖中直觀看到在2021年1月份,境內(nèi)存款主要由單位存款、個(gè)人存款、非存款類金融機(jī)構(gòu)存款和國(guó)庫(kù)定期存款構(gòu)成。其中個(gè)人存款達(dá)到509,840.27億元,占比超過(guò)境內(nèi)存款一半。單位存款的占比也較大,但相對(duì)于個(gè)人存款而言還存在一定的差距。非存款類金融機(jī)構(gòu)存款所占的比例較小。而國(guó)庫(kù)定期存款占比非常小,幾乎可以忽略。這說(shuō)明,從2021年的存款數(shù)據(jù)來(lái)看,個(gè)人用戶傾向于保守的投資理財(cái)方案,因此個(gè)人存款數(shù)量巨大。而單位存款占比相對(duì)較大,主要是限于目前經(jīng)濟(jì)狀況的不穩(wěn)定期,持保守態(tài)度,沒(méi)有進(jìn)行大規(guī)模投入再生產(chǎn),應(yīng)該以活期存款的形式保持資金鏈的暢通。非存款類金融機(jī)構(gòu)存款占比較小屬于正?,F(xiàn)象,保有一定的存款額度,大筆現(xiàn)金流應(yīng)該出現(xiàn)在投資領(lǐng)域。國(guó)庫(kù)定期存款占比非常小,是由于國(guó)家對(duì)各項(xiàng)發(fā)展的大力支持,支出較大,存款構(gòu)成較小。接下來(lái)通過(guò)對(duì)境內(nèi)存款中占比較大的個(gè)人存款和單位存款情況設(shè)計(jì)可視化圖進(jìn)行對(duì)比展示。境內(nèi)個(gè)人存款和單位存款對(duì)比旭日?qǐng)D如圖2所示。從圖中可以看出,個(gè)人存款的數(shù)額大于單位存款。但在個(gè)人存款中,活期存款和定期存款數(shù)額差別不大,而單位存款中定期存款數(shù)額遠(yuǎn)遠(yuǎn)小于活期存款。這進(jìn)一步驗(yàn)證了圖1的分析結(jié)論,個(gè)人存款按保守的理財(cái)方案以定期存款為主;為了保持現(xiàn)金流的周轉(zhuǎn),單位存款以活期存款為主。

3.2.2可視化直方圖設(shè)計(jì)實(shí)例

上文中,旭日?qǐng)D對(duì)比了境內(nèi)個(gè)人存款和單位存款的占比,這對(duì)于各構(gòu)成部分的分層次對(duì)比一目了然。然而,為了更直觀地比較兩類存款相同構(gòu)成部分的具體數(shù)值,本文基于Plotly庫(kù)設(shè)計(jì)個(gè)人與單位存款對(duì)比直方圖如圖3所示。從圖3中可以直觀對(duì)比單位存款和個(gè)人存款在活期存款、定期存款、結(jié)構(gòu)性存款和保證金方面的具體數(shù)據(jù)。其中,除保證金外,個(gè)人存款的其他三個(gè)分支層次均大于單位存款。由此可見(jiàn),對(duì)于多構(gòu)成部分?jǐn)?shù)據(jù)的直接對(duì)比分析,直方圖與旭日?qǐng)D一起使用,更能說(shuō)明問(wèn)題的所在,使得這部分的數(shù)據(jù)分析和對(duì)比更為清晰明確,展示效果更容易被人接受和理解。

3.2.3可視化折線圖設(shè)計(jì)實(shí)例

折線圖將數(shù)據(jù)標(biāo)注成點(diǎn),并通過(guò)直線將點(diǎn)進(jìn)行連接,可以清楚直觀地展示數(shù)據(jù)的增減趨勢(shì)。在Python中使用Plotly庫(kù)中的plot()函數(shù)可以繪制折線圖。本文設(shè)計(jì)2021年度境內(nèi)存款折線圖如圖4所示,以用來(lái)研究2021年度境內(nèi)存款的走勢(shì)和之間的關(guān)系。從圖4可知,全部四種類型的境內(nèi)存款在2021年度均趨于平穩(wěn)狀態(tài),無(wú)大幅波動(dòng)現(xiàn)象發(fā)生。其中,國(guó)庫(kù)定期存款最為穩(wěn)定,是嚴(yán)格按照國(guó)庫(kù)管理的相關(guān)規(guī)定來(lái)執(zhí)行的。非存款類金融機(jī)構(gòu)的存款有輕微的波動(dòng),屬于金融機(jī)構(gòu)正常投資理財(cái)?shù)男袨?,說(shuō)明本年度內(nèi)不存在突現(xiàn)的大規(guī)模投資風(fēng)潮。單位存款在2月份時(shí)有明顯下降,這與我國(guó)農(nóng)歷新年單位發(fā)放年終績(jī)效獎(jiǎng)金對(duì)應(yīng)。其余時(shí)間相對(duì)平穩(wěn),說(shuō)明年度的發(fā)展居于穩(wěn)定狀態(tài)。春節(jié)假期后,個(gè)人生活和經(jīng)濟(jì)狀態(tài)回歸常態(tài),而相應(yīng)的個(gè)人存款數(shù)額會(huì)在3月有所上升。因個(gè)人用戶群體基數(shù)較大,整體情況在一年中會(huì)出現(xiàn)一些小幅波動(dòng)。

4結(jié)論

本文結(jié)合金融數(shù)據(jù)的特點(diǎn),基于Python語(yǔ)言的可視化庫(kù),以中國(guó)人民銀行調(diào)查統(tǒng)計(jì)司發(fā)布2021年度中資大型銀行人民幣信貸收支表為例,進(jìn)行了可視化分析設(shè)計(jì),分別從不同角度對(duì)2021年度的存款數(shù)據(jù)進(jìn)行可視化展示和細(xì)致的數(shù)據(jù)分析。這些可視化設(shè)計(jì)和分析能夠使研究人員和普通用戶更直觀、快速地對(duì)金融數(shù)據(jù)進(jìn)行分析和挖掘,以便得出有效的決策支持。綜上所述,本文對(duì)金融數(shù)據(jù)進(jìn)行的可視化研究和探索具有較好的應(yīng)用價(jià)值和實(shí)際意義。

作者:羅孟華 王可 單位:貴州財(cái)經(jīng)大學(xué)大數(shù)據(jù)應(yīng)用與經(jīng)濟(jì)學(xué)院(貴陽(yáng)大數(shù)據(jù)金融學(xué)院) 貴州財(cái)經(jīng)大學(xué)信息學(xué)院