中小企業(yè)信貸評級和違約情況分析
時間:2022-05-18 11:58:02
導語:中小企業(yè)信貸評級和違約情況分析一文來源于網友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
[摘要]小微企業(yè)是國民經濟和社會發(fā)展的重要基礎,是創(chuàng)業(yè)富民的重要渠道,但由于中小微企業(yè)數(shù)據(jù)的可獲取性與可靠性較低,銀行及其他金融機構如何有效地為小微企業(yè)提供信貸融資服務是一個富有挑戰(zhàn)性且具有重要意義的課題。文章通過三種分類算法對中小企業(yè)的信貸評級和違約情況進行預測,運用經典判別分析和機器學習算法進行模型構建和比較,尋找信譽評級預測的最優(yōu)模型,對數(shù)據(jù)相對缺少的中小企業(yè)信譽評估有一定借鑒價值。
[關鍵詞]信譽評級;信貸策略;中小企業(yè);分類算法
1引言
在疫情期間,中小企業(yè)受到了巨大的沖擊,清華大學和北京大學于2020年2月關于995家中小企業(yè)聯(lián)合調研顯示,85%的企業(yè)撐不過三個月,67%撐不過兩個月,34%撐不過一個月。[1]市場避險情緒的加劇以及疫情對中小企業(yè)的影響會使信貸需求大幅增加。在此情形下,對企業(yè)數(shù)據(jù)不夠充足的中小企業(yè)資質和信譽評估就成了一大難題。關于企業(yè)信譽評級的建模方法,目前國內外學者主要使用Logistic回歸分析、[2]AHP模糊綜合評價法、[2]神經網絡算法等,[3]但仍存在精度較弱、程序復雜等問題。Hajek和Michalak(2013)綜合分析了世界范圍內的企業(yè)信用評級預測的建模算法,[4]包括經典統(tǒng)計方法和機器學習算法。Hajek和Michalak提到,經典統(tǒng)計模型的結果相對容易解釋,但是需要各種假設在理論上成立,而機器學習算法的預測能力更強。然而,在上述提及的研究中,模型的變量設置較為全面,包括流動比率、市凈率、總資產收益率、負債比率等公司金融數(shù)據(jù),而對于本文提供的中小企業(yè)數(shù)據(jù),變量類型存在局限性,且數(shù)據(jù)量較少。在這類問題上,文章優(yōu)先使用經典統(tǒng)計方法進行建模分析,在此基礎上引入機器學習算法進行模型比較。
2數(shù)據(jù)來源與變量說明
文章在123家有貸款記錄和302家沒有貸款記錄的中小微企業(yè)數(shù)據(jù)的基礎上(包含2016年10月—2020年2月全部的進項發(fā)票和銷項發(fā)票信息),定義了四個變量以評估企業(yè)的信譽評級。
2.1盈利能力
盈利能力代表一家企業(yè)獲得利潤的能力。文章的盈利能力定義為銷項發(fā)票價稅總額減去進項發(fā)票價稅總額,并按季度取平均值,當企業(yè)的盈利能力取值為負數(shù)時,說明企業(yè)平均運營虧損。
2.2發(fā)展能力
發(fā)展能力代表一家擴大規(guī)模的潛在能力,文章的發(fā)展能力定義為企業(yè)每個季度的盈利環(huán)比增長率均值。
2.3還款潛力
還款潛力指企業(yè)償還債務的能力。文章使用每季度企業(yè)的平均盈利與企業(yè)的平均進項發(fā)票價稅合計之比代表企業(yè)的還款能力。2.4發(fā)票作廢率發(fā)票作廢率在一定程度上體現(xiàn)出企業(yè)是否健康合法運營,是銀行需重點關注的指標。文章中發(fā)票作廢率定義為企業(yè)每個季度的作廢發(fā)票占每個季度發(fā)票總和的平均比例。表1給出了上述變量的數(shù)據(jù)結構,前兩列為變量名和對應的字母代號。
3模型構建與分析
根據(jù)已有部分帶標簽的數(shù)據(jù),需要對無信貸記錄標簽的企業(yè)進行是否放貸和信譽評級的兩步判斷。在處理二分類問題上,許多學者會優(yōu)先考慮使用二元Logistic回歸模型。然而,James(2013)發(fā)現(xiàn)在處理分類結果很確定的問題時,Logistic回歸的估計結果可能不穩(wěn)定。[5]他指出,當數(shù)據(jù)類較為離散時,線性判別分析不存在這一問題。因此,文章引入線性判別分析(LinearDiscriminantAnal-ysis,LDA),這也是一項分常用的分類技術。Fisher判別法是常用的一種線性判別法,該方法借鑒了方差分析的思想,將K組p維向量投影到某一個方向,使得它們投影后組與組之間盡可能地分開。該方法假定K個總體的協(xié)差陣矩陣滿秩且相等。
3.1是否放貸的判斷
對123家有信貸評級和違約記錄的企業(yè)按7∶3的比例進行訓練和測試。測試結果與測試集的原有標簽構建混淆矩陣,用于檢驗模型的預測效果。訓練得到的判別函數(shù)為:y1=-3.1989×10-09×PRO-1.1766×10-03×SOL+1.7192×10-03×POT+13.2854×INV(1)判別規(guī)則為:x∈Gl,若|y1-y—1≤i≤2i1|=min|y1-y—i1|l=1,2(2)當l=1時,G1代表給予貸款;當l=2時,G2代表不予貸款。模型效果如表2所示。準確率(Accuracy)=96.97%,真負利率(Specicity)=100%。對于測試集模型檢驗的結果,其準確度(Accuracy)高達96.97%,模型效果很好。然而,需要著重關注誤判的部分,因為錯誤地將不予貸款的企業(yè)識別為給予貸款與錯誤地將給予貸款的企業(yè)識別為不予貸款,兩種行為所造成的影響是不對等的,前者可能讓銀行因企業(yè)違約而面臨巨大損失。因此,對于此種不平衡的問題,借助一個新的指標———真負利率(Specicity)對模型結果進行判斷。由數(shù)據(jù)可知,真負利率為100%,說明該模型能很好地識別不予貸款的企業(yè)。即使在本模型中將一家本應該貸款的企業(yè)錯判為不該貸款,可能減少了相應的業(yè)務和利息收入,但卻準確地識別了不該貸款的企業(yè),盡可能地避免了銀行面臨企業(yè)違約的風險。
3.2信譽評級預測
文章首先使用Fisher判別模型來進行預測,但該模型準確率只有50%,為進一步提升分類模型的性能,考慮放寬K個總體具有相同協(xié)差陣的前提假設,引入二次判別分析(QuadraticDiscriminantAnalysis,QDA),模型準確率提升為66.7%。在此基礎上,建立樸素貝葉斯分類器(NaiveBayesClassier,NBC),與現(xiàn)有的模型進行比較。樸素貝葉斯的一個重要假設條件是樣本屬性之間相互獨立。由圖1可知,變量之間的相關系數(shù)絕對值均低于0.3,呈現(xiàn)低度相關,基本滿足該假設條件。樸素貝葉斯分類器的原理是對于給定的待分類項,求解在此項出現(xiàn)的情況下其他各個類別出現(xiàn)的概率,哪個最大,就認為待分類項屬于哪一類別,概率計算公式為:最終樸素貝葉斯分類模型的準確度為72.2%,超過了Fisher判別和二次判別分析的50%和66.7%,因此推薦采用樸素貝葉斯分類器模型。
4結論與建議
商業(yè)銀行有著調節(jié)經濟的職能,面對中小企業(yè)的資金需求變化要提前掌握并早做準備,完成良好的風險預估。文章提供的模型能依靠銀行可收集有限的數(shù)據(jù),在分類器得到良好訓練的情況下,進行初步的信譽評估,并建議銀行及時加入更多維的數(shù)據(jù)進行分析。在面對增加的資金需求和緊縮的信貸供給下,銀行也需要審慎地決定并及時地根據(jù)市場情況調整信貸策略,可加入專家的分析和判斷,發(fā)揮主觀能動性并綜合多角度對中小企業(yè)的信譽進行辨別。
作者:李文浩 付文強 吳易達 單位:華僑大學