中小企業(yè)信貸評級和違約情況分析
時間:2022-05-18 11:58:02
導(dǎo)語:中小企業(yè)信貸評級和違約情況分析一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
[摘要]小微企業(yè)是國民經(jīng)濟和社會發(fā)展的重要基礎(chǔ),是創(chuàng)業(yè)富民的重要渠道,但由于中小微企業(yè)數(shù)據(jù)的可獲取性與可靠性較低,銀行及其他金融機構(gòu)如何有效地為小微企業(yè)提供信貸融資服務(wù)是一個富有挑戰(zhàn)性且具有重要意義的課題。文章通過三種分類算法對中小企業(yè)的信貸評級和違約情況進行預(yù)測,運用經(jīng)典判別分析和機器學(xué)習(xí)算法進行模型構(gòu)建和比較,尋找信譽評級預(yù)測的最優(yōu)模型,對數(shù)據(jù)相對缺少的中小企業(yè)信譽評估有一定借鑒價值。
[關(guān)鍵詞]信譽評級;信貸策略;中小企業(yè);分類算法
1引言
在疫情期間,中小企業(yè)受到了巨大的沖擊,清華大學(xué)和北京大學(xué)于2020年2月關(guān)于995家中小企業(yè)聯(lián)合調(diào)研顯示,85%的企業(yè)撐不過三個月,67%撐不過兩個月,34%撐不過一個月。[1]市場避險情緒的加劇以及疫情對中小企業(yè)的影響會使信貸需求大幅增加。在此情形下,對企業(yè)數(shù)據(jù)不夠充足的中小企業(yè)資質(zhì)和信譽評估就成了一大難題。關(guān)于企業(yè)信譽評級的建模方法,目前國內(nèi)外學(xué)者主要使用Logistic回歸分析、[2]AHP模糊綜合評價法、[2]神經(jīng)網(wǎng)絡(luò)算法等,[3]但仍存在精度較弱、程序復(fù)雜等問題。Hajek和Michalak(2013)綜合分析了世界范圍內(nèi)的企業(yè)信用評級預(yù)測的建模算法,[4]包括經(jīng)典統(tǒng)計方法和機器學(xué)習(xí)算法。Hajek和Michalak提到,經(jīng)典統(tǒng)計模型的結(jié)果相對容易解釋,但是需要各種假設(shè)在理論上成立,而機器學(xué)習(xí)算法的預(yù)測能力更強。然而,在上述提及的研究中,模型的變量設(shè)置較為全面,包括流動比率、市凈率、總資產(chǎn)收益率、負債比率等公司金融數(shù)據(jù),而對于本文提供的中小企業(yè)數(shù)據(jù),變量類型存在局限性,且數(shù)據(jù)量較少。在這類問題上,文章優(yōu)先使用經(jīng)典統(tǒng)計方法進行建模分析,在此基礎(chǔ)上引入機器學(xué)習(xí)算法進行模型比較。
2數(shù)據(jù)來源與變量說明
文章在123家有貸款記錄和302家沒有貸款記錄的中小微企業(yè)數(shù)據(jù)的基礎(chǔ)上(包含2016年10月—2020年2月全部的進項發(fā)票和銷項發(fā)票信息),定義了四個變量以評估企業(yè)的信譽評級。
2.1盈利能力
盈利能力代表一家企業(yè)獲得利潤的能力。文章的盈利能力定義為銷項發(fā)票價稅總額減去進項發(fā)票價稅總額,并按季度取平均值,當企業(yè)的盈利能力取值為負數(shù)時,說明企業(yè)平均運營虧損。
2.2發(fā)展能力
發(fā)展能力代表一家擴大規(guī)模的潛在能力,文章的發(fā)展能力定義為企業(yè)每個季度的盈利環(huán)比增長率均值。
2.3還款潛力
還款潛力指企業(yè)償還債務(wù)的能力。文章使用每季度企業(yè)的平均盈利與企業(yè)的平均進項發(fā)票價稅合計之比代表企業(yè)的還款能力。2.4發(fā)票作廢率發(fā)票作廢率在一定程度上體現(xiàn)出企業(yè)是否健康合法運營,是銀行需重點關(guān)注的指標。文章中發(fā)票作廢率定義為企業(yè)每個季度的作廢發(fā)票占每個季度發(fā)票總和的平均比例。表1給出了上述變量的數(shù)據(jù)結(jié)構(gòu),前兩列為變量名和對應(yīng)的字母代號。
3模型構(gòu)建與分析
根據(jù)已有部分帶標簽的數(shù)據(jù),需要對無信貸記錄標簽的企業(yè)進行是否放貸和信譽評級的兩步判斷。在處理二分類問題上,許多學(xué)者會優(yōu)先考慮使用二元Logistic回歸模型。然而,James(2013)發(fā)現(xiàn)在處理分類結(jié)果很確定的問題時,Logistic回歸的估計結(jié)果可能不穩(wěn)定。[5]他指出,當數(shù)據(jù)類較為離散時,線性判別分析不存在這一問題。因此,文章引入線性判別分析(LinearDiscriminantAnal-ysis,LDA),這也是一項分常用的分類技術(shù)。Fisher判別法是常用的一種線性判別法,該方法借鑒了方差分析的思想,將K組p維向量投影到某一個方向,使得它們投影后組與組之間盡可能地分開。該方法假定K個總體的協(xié)差陣矩陣滿秩且相等。
3.1是否放貸的判斷
對123家有信貸評級和違約記錄的企業(yè)按7∶3的比例進行訓(xùn)練和測試。測試結(jié)果與測試集的原有標簽構(gòu)建混淆矩陣,用于檢驗?zāi)P偷念A(yù)測效果。訓(xùn)練得到的判別函數(shù)為:y1=-3.1989×10-09×PRO-1.1766×10-03×SOL+1.7192×10-03×POT+13.2854×INV(1)判別規(guī)則為:x∈Gl,若|y1-y—1≤i≤2i1|=min|y1-y—i1|l=1,2(2)當l=1時,G1代表給予貸款;當l=2時,G2代表不予貸款。模型效果如表2所示。準確率(Accuracy)=96.97%,真負利率(Specicity)=100%。對于測試集模型檢驗的結(jié)果,其準確度(Accuracy)高達96.97%,模型效果很好。然而,需要著重關(guān)注誤判的部分,因為錯誤地將不予貸款的企業(yè)識別為給予貸款與錯誤地將給予貸款的企業(yè)識別為不予貸款,兩種行為所造成的影響是不對等的,前者可能讓銀行因企業(yè)違約而面臨巨大損失。因此,對于此種不平衡的問題,借助一個新的指標———真負利率(Specicity)對模型結(jié)果進行判斷。由數(shù)據(jù)可知,真負利率為100%,說明該模型能很好地識別不予貸款的企業(yè)。即使在本模型中將一家本應(yīng)該貸款的企業(yè)錯判為不該貸款,可能減少了相應(yīng)的業(yè)務(wù)和利息收入,但卻準確地識別了不該貸款的企業(yè),盡可能地避免了銀行面臨企業(yè)違約的風(fēng)險。
3.2信譽評級預(yù)測
文章首先使用Fisher判別模型來進行預(yù)測,但該模型準確率只有50%,為進一步提升分類模型的性能,考慮放寬K個總體具有相同協(xié)差陣的前提假設(shè),引入二次判別分析(QuadraticDiscriminantAnalysis,QDA),模型準確率提升為66.7%。在此基礎(chǔ)上,建立樸素貝葉斯分類器(NaiveBayesClassier,NBC),與現(xiàn)有的模型進行比較。樸素貝葉斯的一個重要假設(shè)條件是樣本屬性之間相互獨立。由圖1可知,變量之間的相關(guān)系數(shù)絕對值均低于0.3,呈現(xiàn)低度相關(guān),基本滿足該假設(shè)條件。樸素貝葉斯分類器的原理是對于給定的待分類項,求解在此項出現(xiàn)的情況下其他各個類別出現(xiàn)的概率,哪個最大,就認為待分類項屬于哪一類別,概率計算公式為:最終樸素貝葉斯分類模型的準確度為72.2%,超過了Fisher判別和二次判別分析的50%和66.7%,因此推薦采用樸素貝葉斯分類器模型。
4結(jié)論與建議
商業(yè)銀行有著調(diào)節(jié)經(jīng)濟的職能,面對中小企業(yè)的資金需求變化要提前掌握并早做準備,完成良好的風(fēng)險預(yù)估。文章提供的模型能依靠銀行可收集有限的數(shù)據(jù),在分類器得到良好訓(xùn)練的情況下,進行初步的信譽評估,并建議銀行及時加入更多維的數(shù)據(jù)進行分析。在面對增加的資金需求和緊縮的信貸供給下,銀行也需要審慎地決定并及時地根據(jù)市場情況調(diào)整信貸策略,可加入專家的分析和判斷,發(fā)揮主觀能動性并綜合多角度對中小企業(yè)的信譽進行辨別。
作者:李文浩 付文強 吳易達 單位:華僑大學(xué)