金融數(shù)據(jù)可視化應(yīng)用和探索

時間:2022-07-13 09:08:20

導(dǎo)語:金融數(shù)據(jù)可視化應(yīng)用和探索一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

金融數(shù)據(jù)可視化應(yīng)用和探索

摘要:隨著金融數(shù)據(jù)容量和復(fù)雜度的不斷提高,使得用戶對金融數(shù)據(jù)的分析和理解產(chǎn)生了一定的困難。進(jìn)行金融數(shù)據(jù)可視化研究已成為金融市場的一個重要需求。本文基于Python可視化技術(shù),進(jìn)行金融數(shù)據(jù)可視化實例分析,并提出了金融數(shù)據(jù)可視化分析應(yīng)用模式。文中實例生成對應(yīng)的可視化圖形,用更直觀的方式對金融數(shù)據(jù)進(jìn)行多維度展示并加以分析。研究結(jié)果表明,在金融數(shù)據(jù)分析中應(yīng)用可視化技術(shù)可以讓研究人員和用戶迅速地洞察數(shù)據(jù)的內(nèi)涵和價值,為進(jìn)一步?jīng)Q策分析做出有利的技術(shù)支持。

關(guān)鍵詞:金融數(shù)據(jù)分析;可視化;Python;可視化庫;應(yīng)用模式

1引言

目前,大數(shù)據(jù)技術(shù)已經(jīng)覆蓋至社會生產(chǎn)和生活的各個領(lǐng)域,數(shù)據(jù)科學(xué)帶來了新一輪科技革命和產(chǎn)業(yè)變革的機(jī)遇。經(jīng)濟(jì)金融領(lǐng)域是“數(shù)據(jù)金礦”。隨著大數(shù)據(jù)技術(shù)的發(fā)展,金融行業(yè)需要結(jié)合數(shù)據(jù)科學(xué)和金融業(yè)務(wù)進(jìn)行創(chuàng)新,整合結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),挖掘和分析客戶的消費信息,預(yù)測客戶的行為和消費習(xí)慣,從而提高金融行業(yè)服務(wù)的效率?;诖髷?shù)據(jù)技術(shù),金融機(jī)構(gòu)已在客戶畫像、精準(zhǔn)營銷、業(yè)務(wù)審批、融資授信、風(fēng)險防范和量化交易等領(lǐng)域取得較好的效果[1]。隨著數(shù)據(jù)科學(xué)和計算機(jī)存儲技術(shù)的發(fā)展,金融數(shù)據(jù)的產(chǎn)生和存儲量與日俱增[2]。在美國銀行(BankofAmerica,BOA)等一些金融機(jī)構(gòu)中,每天都會處理成千上萬條的電子轉(zhuǎn)賬[3]。隨著這些金融基礎(chǔ)數(shù)據(jù)量的不斷增大,金融數(shù)據(jù)研究者和分析人員通過單純查看數(shù)據(jù)表格分析方式已經(jīng)捉襟見肘。普通用戶想通過金融數(shù)據(jù)進(jìn)行投資和理財分析更是一籌莫展。而可視化技術(shù)對于處理金融數(shù)據(jù)有著得天獨厚的優(yōu)勢,可以幫助人們對海量、多維的金融數(shù)據(jù)進(jìn)行分析,使得人們能夠以相對直觀快速的方式對數(shù)據(jù)傳遞的信息加以理解,進(jìn)而為這些信息創(chuàng)造價值提供技術(shù)支持。本文主要研究可視化技術(shù)在金融數(shù)據(jù)的應(yīng)用優(yōu)勢,首先基于Python中的可視化庫對金融數(shù)據(jù)實例進(jìn)行可視化設(shè)計,然后對可視化的結(jié)果進(jìn)行進(jìn)一步的研究分析。

2技術(shù)路線研究

2.1可視化技術(shù)研究現(xiàn)狀

面對海量、高維、多源和紛繁復(fù)雜數(shù)據(jù)的分析挑戰(zhàn),可視化技術(shù)把數(shù)據(jù)挖掘技術(shù)、科學(xué)可視化、計算機(jī)圖形學(xué)和人機(jī)交互等方法結(jié)合起來,并將人眼作為一個并行處理器,利用人眼的模式識別能力和感知能力對數(shù)據(jù)進(jìn)行交互的可視化表達(dá)以增強(qiáng)認(rèn)知。把不可見或難以顯示的數(shù)據(jù)轉(zhuǎn)化為可以感知的顏色、符號、圖形等輸入。研究新的可視化方法和理論模型,利用新的用戶交互手段輔助其從復(fù)雜矛盾或不完整的數(shù)據(jù)中挖掘出的信息之間的關(guān)系和隱藏模式,從而為決策提供有效的支持[4]。隨著全球范圍內(nèi)數(shù)據(jù)量劇增,數(shù)據(jù)可視化技術(shù)在生命科學(xué)、地理信息學(xué)、工業(yè)、軍事等各個領(lǐng)域得到了廣泛應(yīng)用。近年來,它在網(wǎng)絡(luò)安全、金融和商業(yè)智能等領(lǐng)域的數(shù)據(jù)可視化也被大范圍應(yīng)用,成為數(shù)據(jù)可視化中新的熱點。目前國外學(xué)術(shù)界與工業(yè)界都沿著面向?qū)嶋H數(shù)據(jù)庫、基于可視化的分析推理與決策、解決實際問題等方向發(fā)展。斯坦福大學(xué)提供了按需數(shù)據(jù)可視化Webinar[5]。在金融數(shù)據(jù)可視化領(lǐng)域,美國北卡羅萊納州立夏洛特分校的可視化中心開發(fā)了基于識別特定關(guān)鍵詞的電子轉(zhuǎn)賬數(shù)據(jù)可視化系統(tǒng)和構(gòu)建了客戶信用風(fēng)險分析系統(tǒng)RiskVA[6]。在國內(nèi)學(xué)者的可視化技術(shù)研究中,劉芳等提出一種基于引力場聚類的金融數(shù)據(jù)可視化方法[7],形成清晰的可視化聚類結(jié)果,發(fā)現(xiàn)數(shù)據(jù)變化規(guī)律。陳偉等采用R語言實現(xiàn)了基于大數(shù)據(jù)可視化技術(shù)的信息系統(tǒng)AC審計方法[8]。孫遠(yuǎn)波等利用疫情期間所發(fā)布的各階段疫情數(shù)據(jù)可視化作品[9],分析出疫情可視化設(shè)計的用戶分類、數(shù)據(jù)類型、特點和演化過程等。高莉莉等對中國知網(wǎng)(CNKI)檢索的文獻(xiàn)進(jìn)行計量分析[10],運用Citespace軟件對檢索的相關(guān)文獻(xiàn)進(jìn)行可視化分析,繪制科學(xué)知識圖譜。綜上所述,可視化技術(shù)的研究已經(jīng)取得了一定的成果,并在各個應(yīng)用領(lǐng)域進(jìn)行了實踐。金融數(shù)據(jù)分析領(lǐng)域同樣需要可視化技術(shù)的幫助和支持。

2.2Python可視化庫簡介

Python是目前最流行的程序設(shè)計語言之一。由于其簡潔性和可擴(kuò)展性,自2004年以來,使用率呈線性上升,目前已經(jīng)穩(wěn)定在編程語言前三名[11]。它的優(yōu)勢在于擁有豐富的擴(kuò)展庫,可以實現(xiàn)數(shù)據(jù)的可視化。常見的Python數(shù)據(jù)可視化庫以matplotlib庫和NumPy庫為基礎(chǔ),還包括Pandas庫、Seaborn庫、Bokeh庫等。本文中重點使用了兩個基于Python的可視化庫,具體如下:(1)Matplotlib庫。Matplotlib是Python語言中可視化的基礎(chǔ)庫,具有十分強(qiáng)大和復(fù)雜的功能。它提供了一套和MATLAB類似的API,用戶可以調(diào)用函數(shù)實現(xiàn)快速繪圖和制表等功能。但相對而言,生成的可視化圖表缺少鮮明的特點。(2)Plotly庫。Plotly庫是一款開源的繪圖庫,主要使用js進(jìn)行圖形繪制。實現(xiàn)過程中主要是調(diào)用Plotly的函數(shù)接口,底層實現(xiàn)完全被隱藏,便于初學(xué)者的掌握。而且生成的可視化圖表可操作性強(qiáng),便于進(jìn)行多維數(shù)據(jù)的復(fù)雜性分析展示。

3金融數(shù)據(jù)可視化應(yīng)用實例

3.1金融數(shù)據(jù)分析

數(shù)據(jù)分析是數(shù)據(jù)科學(xué)的一個核心研究方向。它是指將收集到的各類數(shù)據(jù),采用一定原則和技術(shù)手段,進(jìn)行清洗、計算、分析、加工處理的過程。金融數(shù)據(jù)是在各項金融活動中產(chǎn)生的數(shù)據(jù)。在金融部門開展的金融業(yè)務(wù)中產(chǎn)生的數(shù)據(jù)既是對其自身經(jīng)營狀況的客觀反映,也反映了國民經(jīng)濟(jì)的宏觀和微觀運行。金融數(shù)據(jù)和金融數(shù)據(jù)處理具有自身的一些特征[12]。金融數(shù)據(jù)的數(shù)量巨大,信息來源廣泛,主要來自金融機(jī)構(gòu)內(nèi)部的數(shù)據(jù)、市場的數(shù)據(jù)和全社會的數(shù)據(jù)。本文實例中的數(shù)據(jù)集來源于中國人民銀行的調(diào)查統(tǒng)計司,屬于來自社會的數(shù)據(jù)。在金融數(shù)據(jù)可視化設(shè)計流程中,首先通過各種設(shè)備和技術(shù)手段采集相關(guān)的數(shù)據(jù);然后將采集的原始數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理;接著進(jìn)行可視化映射,把不同數(shù)據(jù)之間的聯(lián)系映射為視覺通道的不同元素;最后用戶可以從數(shù)據(jù)可視化結(jié)果中提取有用信息。

3.2Python可視化設(shè)計實例

本文以中國人民銀行調(diào)查統(tǒng)計司發(fā)布的2021年度中資大型銀行人民幣信貸收支表為例[13],進(jìn)行金融數(shù)據(jù)可視化分析設(shè)計實例分析。其中數(shù)據(jù)的字段包括境內(nèi)存款中的個人存款、單位存款、國庫定期存款和非存款類金融機(jī)構(gòu)存款。

3.2.1可視化餅圖設(shè)計實例

餅圖或圓環(huán)圖是由面積大小不一或顏色填充的扇形組成的圓形圖表,主要用于顯示數(shù)據(jù)中各項與總和的比例。它可以用于快速展示數(shù)據(jù)中各項數(shù)據(jù)在整體數(shù)據(jù)中的占比情況。基于Plotly庫繪制餅圖使用Pie函數(shù)。繪制環(huán)形圖時,在Pie函數(shù)中設(shè)置控制環(huán)形中心空白大小的hole屬性即可完成。還有一類特殊的餅圖被稱為旭日圖,是可以對各部分構(gòu)成進(jìn)行進(jìn)一步分析比對的可視化圖形,對數(shù)據(jù)的多維度、多層次分析很有幫助?,F(xiàn)對2021年度中資大型銀行人民幣信貸收支表中一月數(shù)據(jù)進(jìn)行可視化分析。把現(xiàn)有的數(shù)據(jù)進(jìn)行預(yù)處理。首先用Plotly庫繪制境內(nèi)存款四種情況數(shù)據(jù)進(jìn)行可視化設(shè)計,對境內(nèi)存款的情況進(jìn)行一個概括分析。境內(nèi)存款情況如圖1所示。從圖中直觀看到在2021年1月份,境內(nèi)存款主要由單位存款、個人存款、非存款類金融機(jī)構(gòu)存款和國庫定期存款構(gòu)成。其中個人存款達(dá)到509,840.27億元,占比超過境內(nèi)存款一半。單位存款的占比也較大,但相對于個人存款而言還存在一定的差距。非存款類金融機(jī)構(gòu)存款所占的比例較小。而國庫定期存款占比非常小,幾乎可以忽略。這說明,從2021年的存款數(shù)據(jù)來看,個人用戶傾向于保守的投資理財方案,因此個人存款數(shù)量巨大。而單位存款占比相對較大,主要是限于目前經(jīng)濟(jì)狀況的不穩(wěn)定期,持保守態(tài)度,沒有進(jìn)行大規(guī)模投入再生產(chǎn),應(yīng)該以活期存款的形式保持資金鏈的暢通。非存款類金融機(jī)構(gòu)存款占比較小屬于正?,F(xiàn)象,保有一定的存款額度,大筆現(xiàn)金流應(yīng)該出現(xiàn)在投資領(lǐng)域。國庫定期存款占比非常小,是由于國家對各項發(fā)展的大力支持,支出較大,存款構(gòu)成較小。接下來通過對境內(nèi)存款中占比較大的個人存款和單位存款情況設(shè)計可視化圖進(jìn)行對比展示。境內(nèi)個人存款和單位存款對比旭日圖如圖2所示。從圖中可以看出,個人存款的數(shù)額大于單位存款。但在個人存款中,活期存款和定期存款數(shù)額差別不大,而單位存款中定期存款數(shù)額遠(yuǎn)遠(yuǎn)小于活期存款。這進(jìn)一步驗證了圖1的分析結(jié)論,個人存款按保守的理財方案以定期存款為主;為了保持現(xiàn)金流的周轉(zhuǎn),單位存款以活期存款為主。

3.2.2可視化直方圖設(shè)計實例

上文中,旭日圖對比了境內(nèi)個人存款和單位存款的占比,這對于各構(gòu)成部分的分層次對比一目了然。然而,為了更直觀地比較兩類存款相同構(gòu)成部分的具體數(shù)值,本文基于Plotly庫設(shè)計個人與單位存款對比直方圖如圖3所示。從圖3中可以直觀對比單位存款和個人存款在活期存款、定期存款、結(jié)構(gòu)性存款和保證金方面的具體數(shù)據(jù)。其中,除保證金外,個人存款的其他三個分支層次均大于單位存款。由此可見,對于多構(gòu)成部分?jǐn)?shù)據(jù)的直接對比分析,直方圖與旭日圖一起使用,更能說明問題的所在,使得這部分的數(shù)據(jù)分析和對比更為清晰明確,展示效果更容易被人接受和理解。

3.2.3可視化折線圖設(shè)計實例

折線圖將數(shù)據(jù)標(biāo)注成點,并通過直線將點進(jìn)行連接,可以清楚直觀地展示數(shù)據(jù)的增減趨勢。在Python中使用Plotly庫中的plot()函數(shù)可以繪制折線圖。本文設(shè)計2021年度境內(nèi)存款折線圖如圖4所示,以用來研究2021年度境內(nèi)存款的走勢和之間的關(guān)系。從圖4可知,全部四種類型的境內(nèi)存款在2021年度均趨于平穩(wěn)狀態(tài),無大幅波動現(xiàn)象發(fā)生。其中,國庫定期存款最為穩(wěn)定,是嚴(yán)格按照國庫管理的相關(guān)規(guī)定來執(zhí)行的。非存款類金融機(jī)構(gòu)的存款有輕微的波動,屬于金融機(jī)構(gòu)正常投資理財?shù)男袨?,說明本年度內(nèi)不存在突現(xiàn)的大規(guī)模投資風(fēng)潮。單位存款在2月份時有明顯下降,這與我國農(nóng)歷新年單位發(fā)放年終績效獎金對應(yīng)。其余時間相對平穩(wěn),說明年度的發(fā)展居于穩(wěn)定狀態(tài)。春節(jié)假期后,個人生活和經(jīng)濟(jì)狀態(tài)回歸常態(tài),而相應(yīng)的個人存款數(shù)額會在3月有所上升。因個人用戶群體基數(shù)較大,整體情況在一年中會出現(xiàn)一些小幅波動。

4結(jié)論

本文結(jié)合金融數(shù)據(jù)的特點,基于Python語言的可視化庫,以中國人民銀行調(diào)查統(tǒng)計司發(fā)布2021年度中資大型銀行人民幣信貸收支表為例,進(jìn)行了可視化分析設(shè)計,分別從不同角度對2021年度的存款數(shù)據(jù)進(jìn)行可視化展示和細(xì)致的數(shù)據(jù)分析。這些可視化設(shè)計和分析能夠使研究人員和普通用戶更直觀、快速地對金融數(shù)據(jù)進(jìn)行分析和挖掘,以便得出有效的決策支持。綜上所述,本文對金融數(shù)據(jù)進(jìn)行的可視化研究和探索具有較好的應(yīng)用價值和實際意義。

作者:羅孟華 王可 單位:貴州財經(jīng)大學(xué)大數(shù)據(jù)應(yīng)用與經(jīng)濟(jì)學(xué)院(貴陽大數(shù)據(jù)金融學(xué)院) 貴州財經(jīng)大學(xué)信息學(xué)院