上市公司財務(wù)預(yù)警模型對比分析
時間:2022-05-28 04:17:55
導(dǎo)語:上市公司財務(wù)預(yù)警模型對比分析一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
摘要:當(dāng)前我國上市公司信息披露仍存在著許多不規(guī)范的現(xiàn)象,個別上市公司在面臨財務(wù)危機時,粉飾其財務(wù)風(fēng)險,進行財務(wù)造假。本文利用上市超過3年的A股共3002家上市公司的財務(wù)數(shù)據(jù),通過對ST、*ST和10家2019年退市的公司樣本分析,根據(jù)不同的時間窗口,構(gòu)建了財務(wù)預(yù)警因子庫,共96個因子。分別采用機器學(xué)習(xí)中的邏輯斯蒂回歸、支持向量機、決策樹模型對因子數(shù)據(jù)進行訓(xùn)練。將數(shù)據(jù)集分為訓(xùn)練集和測試集,用訓(xùn)練集訓(xùn)練模型,并將模型應(yīng)用在測試集中進行預(yù)測。結(jié)果如下:(1)三種模型均有較好的預(yù)測能力,其準(zhǔn)確率都在94%以上;(2)決策樹模型的預(yù)測效果最佳,支持向量機模型次之,邏輯斯蒂回歸模型的預(yù)測效果最差;(3)三種模型都存在將較多的財務(wù)預(yù)警公司預(yù)測為正常公司的情況。本文通過將三種模型進行對比分析,以尋找更加優(yōu)質(zhì)的財務(wù)預(yù)警模型,來更好地幫助企業(yè)識別財務(wù)風(fēng)險。
關(guān)鍵詞:財務(wù)預(yù)警;機器學(xué)習(xí);邏輯回歸模型;支持向量機模型;決策樹模型
目前,我國宏觀經(jīng)濟正面臨著下行壓力,許多企業(yè)在大形勢下都面臨著融資困難和財務(wù)風(fēng)險暴露的問題,目前我國上市公司信息披露仍存在著許多不規(guī)范的現(xiàn)象,因此,識別可能進行財務(wù)造假的公司,有助于幫助投資者合理投資,更有利于維護經(jīng)濟社會的健康良性發(fā)展。由于企業(yè)財務(wù)風(fēng)險暴露是有征兆的,所以企業(yè)的財務(wù)危機是可以預(yù)測的,因此本文基于大數(shù)據(jù)和機器學(xué)習(xí)方法,構(gòu)建識別上市公司財務(wù)造假的三種不同的財務(wù)預(yù)警模型,通過對比分析得出更有價值的財務(wù)預(yù)警模型,這能幫助企業(yè)識別財務(wù)風(fēng)險,有助于實現(xiàn)財務(wù)狀況的良性循環(huán),具有巨大的應(yīng)用價值。
一、數(shù)據(jù)處理與因子庫構(gòu)建
1.數(shù)據(jù)來源。本文樣本公司的相關(guān)財務(wù)數(shù)據(jù)主要來自銳思RESSET數(shù)據(jù)庫以及同花順金融數(shù)據(jù)庫。我們選取了3002家A股上市公司以及10家2019年退市的上市公司的相關(guān)數(shù)據(jù)作為樣本,考慮到上市不滿三年的公司,業(yè)績變動幅度可能相對較大且業(yè)績表現(xiàn)不夠穩(wěn)定,因此將其剔除。2.構(gòu)造因子庫。根據(jù)國內(nèi)外已有的關(guān)于上市公司財務(wù)造假的相關(guān)研究成果,結(jié)合定性分析和定量分析,從企業(yè)的償債能力、營運能力、盈利能力以及其他能力等四方面,提取出30個相關(guān)財務(wù)指標(biāo)作為可提取因子。由于對出現(xiàn)風(fēng)險暴露或者已退市的上市公司來說,出現(xiàn)財務(wù)問題年度的前三年是公司財務(wù)狀況發(fā)生變化的重要轉(zhuǎn)折點,因此我們選取了最近3年-5年的上市公司年度數(shù)據(jù),將選取的財務(wù)指標(biāo)進行不同年度的處理,最終形成了包含96個可提取因子的因子庫。
二、模型構(gòu)建
根據(jù)現(xiàn)有研究,國內(nèi)學(xué)者建立的財務(wù)預(yù)警模型較多,不同模型具有其自身優(yōu)缺點,其中利用邏輯斯蒂回歸、支持向量機和決策樹方法的研究受到較多關(guān)注,因此本文選擇這三種模型進行對比分析。1.邏輯斯蒂回歸模型。(1)模型概述邏輯斯蒂回歸(LR)是在進行數(shù)據(jù)挖掘時經(jīng)常使用的一種分類模型,該方法的基本原理為:在線性回歸的基礎(chǔ)之上,與sigmoid函數(shù)兩者相結(jié)合,利用極大似然函數(shù)估計回歸參數(shù)w和b,公式如下所示:(2)模型的計算和結(jié)果分析本論文通過Matlab中的機器學(xué)習(xí)工具箱求解。LR模型所得結(jié)果的準(zhǔn)確率如下表所示:由上表可知,LR模型在訓(xùn)練集和測試集中所得的準(zhǔn)確率分別是94.8%和92.38%。由上表4可知,LR模型在全樣本中的準(zhǔn)確率為94.39%,精確度為38.58%,召回率為32.67%,F(xiàn)值為35.38%。由此可知,召回率并不高,其判斷的精確度為35.38%,相對較低。從總體結(jié)果看,無論是訓(xùn)練集還是測試集準(zhǔn)確率都在92%以上,體現(xiàn)出較好的總體準(zhǔn)確率,該模型對發(fā)生財務(wù)預(yù)警的公司預(yù)測結(jié)果則較差,而對未發(fā)生財務(wù)預(yù)警的公司預(yù)測較準(zhǔn)確。2.支持向量機模型。(1)模型概述支持向量機(SVM)是一類按監(jiān)督學(xué)習(xí)方式對數(shù)據(jù)進行二元分類的廣義線性分類器,其決策邊界是對學(xué)習(xí)樣本求解的最大邊距超平面。支持向量機屬于有監(jiān)督學(xué)習(xí)模型可以用于數(shù)據(jù)的分析、分類、回歸以及檢測異常值。(2)模型的計算和結(jié)果分析SVM模型所得結(jié)果的準(zhǔn)確率如下表所示:由上表5可知,SVM模型在訓(xùn)練集和測試集中所得的準(zhǔn)確率分別是95.72%和93.55%。與LR模型的準(zhǔn)確率相近。由表7可知,SVM模型在全樣本中的準(zhǔn)確率為95.35%,精確度為59.26%,召回率為21.33%,F(xiàn)值為31.37%。由此可知,比LR模型召回率低11.34%,其判斷的精確度為59.26%,相對LR模型較高。3.決策樹模型。(1)模型概述決策樹是在進行數(shù)據(jù)挖掘時經(jīng)常使用的分類和預(yù)測方法,該方法的基本原理為:根據(jù)算法規(guī)定的分類條件對整體數(shù)據(jù)進行分類,產(chǎn)生一個決策節(jié)點,仍然按照該算法規(guī)則分類,在下一個決策節(jié)點重復(fù)上述操作,運算到無法繼續(xù)分類為止。而對于BoostedTree算法為,每添加一次樹,即為學(xué)習(xí)一個新的目標(biāo)函數(shù),在這棵樹上尋找最佳節(jié)點進行特征分裂。(2)模型的計算和結(jié)果分析由上表可知,BoostedTree模型在全樣本中的準(zhǔn)確率為96.18%,精確度為68.82%,召回率為42.67%,F(xiàn)值為52.68%。
三、總結(jié)
本論文針對上市公司的財務(wù)預(yù)警問題,構(gòu)建因子庫,分別采用了機器學(xué)習(xí)中的邏輯斯蒂回歸法、支持向量機方法和決策樹方法,對訓(xùn)練集進行了分類,并用測試集進行預(yù)測,結(jié)果對比如下表所示。由上表可知,三種模型具有較高的準(zhǔn)確率,均在94%以上,其中BoostedTree準(zhǔn)確率最高;精確度則差距較大,BoostedTree模型最高;同時BoostedTree模型具有高達42.67%的召回率。從上表的結(jié)果對比可以看出,盡管三種模型都對財務(wù)預(yù)警問題具有相當(dāng)?shù)念A(yù)測能力,但上述三種模型預(yù)測能力由優(yōu)到劣依次為:決策樹模型、支持向量機模型、邏輯斯蒂回歸模型。因此通過本文論述研究,認(rèn)為決策樹模型對公司進行財務(wù)預(yù)警是較好的選擇。但是本文還有改進之處,一方面由于部分上市公司的財務(wù)數(shù)據(jù)不夠真實,另一方面可能來自數(shù)據(jù)的滯后性,致使對財務(wù)造假公司預(yù)測效果精確度有所不足,針對這一問題筆者將會進一步改進。
作者:李星辰 王青龍 林國慶 單位:天津科技大學(xué)