保險新投保數(shù)據(jù)研究分析
時間:2022-06-23 09:39:52
導(dǎo)語:保險新投保數(shù)據(jù)研究分析一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
[摘要]以四川某保險公司的新投保數(shù)據(jù)為研究對象,使用SPSS作為工具,對該公司年度新投保數(shù)據(jù)進(jìn)行分析研究,通過相關(guān)性分析、探索分析、線性回歸分析找出總保費和各個變量間的關(guān)系,幫助公司找尋最優(yōu)方案,調(diào)整或改善策略以增加盈利。
[關(guān)鍵詞]數(shù)據(jù)分析;保險;新投保數(shù)據(jù)
疫情的爆發(fā),自然災(zāi)害的頻繁出現(xiàn),使得不確定風(fēng)險因素增加,對人們的生活產(chǎn)生較大的影響。投??梢栽跒?zāi)難發(fā)生時,對人們的生活有一定的保障[1]。如今保險業(yè)積累的大量數(shù)據(jù)在大數(shù)據(jù)技術(shù)的沖擊下又是一個新的風(fēng)口。保險行業(yè)希望通過利用新技術(shù)的運用在逆境中尋求更大的發(fā)展就成為了一種必然[2]。保險的本質(zhì)是要求保險產(chǎn)品確定尚未發(fā)生的風(fēng)險。在風(fēng)險預(yù)測過程中,往往需要將數(shù)據(jù)信息與相應(yīng)的分析技術(shù)結(jié)合起來,這就需要大數(shù)據(jù)分析來提高風(fēng)險預(yù)測的準(zhǔn)確性[3]。研究新投??蛻?,建立客戶畫像,是抓住老客戶、增加新客戶的有效方法,因此,要分析客戶選擇投保的因素,以及能增加盈利的因素。了解后公司就能針對性地調(diào)整策略,推出更符合消費者需求的產(chǎn)品。推出更多符合不同情況的大眾保險,提高保險對大眾的受用程度和保障度,從而提高有效保險的量,使得雙方受益程度實現(xiàn)最大化。
1.研究思路
分析工具采用SPSS軟件。SPSS(StatisticalPackagefortheSocialScience)軟件是世界上著名的統(tǒng)計分析軟件之一,2000年SPSS公司由于產(chǎn)品升級及業(yè)務(wù)拓展的需要,將其產(chǎn)品正式更名為SPSS(statisticalproductandservicesolutions),即統(tǒng)計產(chǎn)品與服務(wù)解決方案[4]。分析思路如下:以四川省某保險公司的新投保數(shù)據(jù)為研究對象,采用SPSS作為分析工具,對數(shù)據(jù)中年齡,性別,婚姻狀況,險種類型,保費等數(shù)據(jù)進(jìn)行分析比對,對新投保的客戶進(jìn)行畫像,分析保險的選擇是否和客戶的某種特征有關(guān),從而可以對不同的客戶選用不同的策略幫助公司收獲新客戶,也幫助新客戶選擇出好產(chǎn)品,實現(xiàn)雙方共贏。
2.數(shù)據(jù)說明
數(shù)據(jù)來源于四川某保險公司年度新投保數(shù)據(jù)。其中包含了機(jī)構(gòu)、險種、投保時間、繳費方式、繳費期限、投保份數(shù)、總保費、保額、客戶號、性別、年齡、婚姻狀況、過去三年平均年收入、教育程度、職業(yè)、家庭人口。共16列900648行。進(jìn)行數(shù)據(jù)清洗,因為在信息時代,數(shù)據(jù)即是資源。數(shù)據(jù)可靠無誤才能準(zhǔn)確地反映現(xiàn)實狀況,有效地支持組織決策[5]。因此首先應(yīng)該做的就是篩選有用的數(shù)據(jù),剔除無用數(shù)據(jù);還包括空值的清理,無效值、異常值的刪除。
3.數(shù)據(jù)分析
3.1總保費與職業(yè)、年齡等變量的相關(guān)關(guān)系
由于本數(shù)據(jù)集所持有的數(shù)據(jù)含有一定量的臟數(shù)據(jù)以及無效數(shù)據(jù),為提高分析的準(zhǔn)確度和有效度,所以在進(jìn)行數(shù)據(jù)分析之前,需要做出一定的數(shù)據(jù)清洗與處理,即刪除數(shù)據(jù)中不正確填寫的教育程度、家庭人口列。用SPSS中的自動重新編碼功能將字符串類型的值轉(zhuǎn)換為數(shù)字類型,便于后續(xù)的分析操作。然后進(jìn)行數(shù)據(jù)分析,首先將變量測量類型更改為標(biāo)度,然后通過相關(guān)分析得出與總保費相關(guān)性較高的變量(見表1)。結(jié)果顯示,其中與總保費相關(guān)性系數(shù)較高的變量有險種、繳費方式、性別、婚姻狀況、職業(yè)、保額、年齡、過去三年平均年收入、機(jī)構(gòu)、繳費期限,其中年齡和保額的相關(guān)性最強(qiáng),為正相關(guān);相關(guān)性系數(shù)較低的有投保時間、投保份數(shù)、客戶號。由此可得出年齡與總保費相關(guān)性強(qiáng),呈正相關(guān)。說明年齡大的人群在保險方面的支出大,而較年輕群體在保險方面的支出則較少。因此保險公司可以通過將年齡較大人群喜愛的產(chǎn)品進(jìn)行改進(jìn)或是保持其特色來穩(wěn)固在這一方面的收入;通過推出更適合較年輕人群的例如理財方面的產(chǎn)品來增加較年輕群體這部分的收入。保額與總保費相關(guān)性強(qiáng),呈正相關(guān)。說明人們對保險的投入與他們期望的保額有很大的關(guān)系,因此可以通過人們對保額的期望來增加產(chǎn)品的競爭力或是以此來推薦與客戶期望值相匹配的產(chǎn)品。
3.2具體分析總保費與年齡的關(guān)系
上文我們得出了總保費和年齡有很強(qiáng)的相關(guān)性,因此我們將年齡分化,進(jìn)一步分析。首先通過SPSS軟件中的頻率分析的功能計算出年齡的四分位數(shù)從而進(jìn)行分組(見表2)。由此我們可以將年齡分為四個區(qū)間:34歲及以下設(shè)置為第一個年齡組---青年組并把該組數(shù)據(jù)全部重新編碼為1;35歲到40歲設(shè)置為第二個年齡組---壯年組,并把該組數(shù)據(jù)全部重新編碼為2;41歲到48歲設(shè)置為第三個組---中年組,并把該組全部數(shù)據(jù)全部重新編碼為3;49歲及以上設(shè)置為第四個組---老年組,并把該組數(shù)據(jù)全部重新編碼為4。將總保費設(shè)為因變量、經(jīng)過重新編碼后的年齡段設(shè)置為因子進(jìn)行探索分析。分析結(jié)果得出:在4組年齡組中,5%剪除后平均值最高的組為第四組(49歲及以上),然后是第三組、第二組、第一組依次下降。這一結(jié)果也印證了上文所分析的年齡與總保費的強(qiáng)相關(guān)性,年齡越大的人在保險上的投入越多。其次中年組(41歲到48歲)的標(biāo)準(zhǔn)差最大,數(shù)據(jù)的離散程度最大,說明中年組對于不同價位的保險選擇更為分散。4組數(shù)據(jù)的偏度均大于0,為右偏分布(均值>中位數(shù)>眾數(shù)),說明同組里高保費的人較少,大部分人所交總保費是低于平均值的。且4組數(shù)據(jù)峰度均大于0,為尖峰分布,說明樣本之間差異較大,右邊(高保費區(qū)域)極端值較多,保費更多地集中在眾數(shù)周圍。青年組的四分位距和標(biāo)準(zhǔn)差最小,保費繳納情況最為集中。3.3總保費與年齡、保額等變量的線性關(guān)系通過上文的相關(guān)性分析,我們已經(jīng)得出了與總保費相關(guān)性較高的一些變量,下面我們找出是否這些變量具有某些線性關(guān)系。數(shù)據(jù)處理方面,線性回歸分析需要所有的參數(shù)都是屬于數(shù)字型的,然而險種、繳費方式、性別等變量都為字符型的變量,不能用于線性回歸分析,因此我們將險種、繳費方式、性別等變量自動重新編碼。線性分析,首先我們得出以下模型摘要表(表3)。發(fā)現(xiàn)第7、8、9種模型R方最大,且第9種模型標(biāo)準(zhǔn)估算的錯誤最小,所以最后選擇第九種模型進(jìn)行建模。接著是方差分析,發(fā)現(xiàn)顯著性都小于0.01,說明這些變量能夠建立有效模型??梢缘贸鼍€性回歸方程的常量是:-147262.49,保額的系數(shù)為0.601,繳費期限的系數(shù)為-760.667,繳費方式(編碼為數(shù)字型)的系數(shù)為-5550.119,職業(yè)(編碼為數(shù)字型)的系數(shù)為8.701,年齡的系數(shù)為56.481,婚姻狀況(編碼為數(shù)字型)的系數(shù)為404.014,險種(編碼為數(shù)字型)的系數(shù)為26.904,性別(編碼為數(shù)字型)的系數(shù)為105.779。得出如下線性回歸方程:總保費=保額*0.601+繳費期限*(-760.667)+繳費方式*(-5550.119)+職業(yè)*8.701+年齡*56.481+機(jī)構(gòu)*0.442+險種*26.904+性別*105.779-147262.49。從此線性回歸方程也能看出年齡與保額是和總保費呈正相關(guān)關(guān)系的。分析結(jié)果表明,總保費和年齡、保額等變量的關(guān)系,未重新編碼的變量中保額、年齡、繳費期限對于總保費的影響很大,客戶選擇產(chǎn)品時重點關(guān)注所選產(chǎn)品的保額和繳費期限。限公司和客戶都能運用這樣的方程針對自身的各項指標(biāo)來大致得出合適的保費,也能通過總保費、年齡、職業(yè)等等指標(biāo)來計算大致能獲得的保費。幫助公司和客戶實現(xiàn)共贏。
4.結(jié)論及建議
總保費主要受年齡和保額的影響,且多數(shù)購買保險的都是年齡較大的人群,較年輕群體購買保險的情況最為集中,選擇的都是近似價格的產(chǎn)品,而較大年齡的群體購買情況就比較分散,形成此結(jié)果的原因大概是因為較年輕群體身體狀況較良好,且較為均衡,發(fā)病率較低,所以對于保險的需求也較為均衡。而較大年齡群體的身體狀況較差、發(fā)病率較高且患病的情況更為復(fù)雜、離散,所以對于保險的需求也有較大的不同,但較大年齡群體的平均保費高于較年輕群體,說明目前保險的需求量在較大年齡群體中高一些。保額對總保費有較大影響,說明人們在購買保險時,對于該款保險的保額在客戶心里的比重是很大的,能夠付出多大的保費和人們心中想得到的保障有很大關(guān)系。公司在設(shè)計產(chǎn)品時,建議針對不同年齡的人群來推出不同類型的產(chǎn)品。較大年齡人群依然占保險市場的很大份額,想出更多辦法,結(jié)合保額對人們購買產(chǎn)品時的影響,推出更好的產(chǎn)品更能保持這一人群的支持。對于較年輕群體,市場的空間較大,推出針對年輕群體的產(chǎn)品,抓住較年輕群體的市場,能進(jìn)一步提升公司盈利。
【參考文獻(xiàn)】
[1]陳英.大數(shù)據(jù)時代下保險業(yè)發(fā)展趨勢及風(fēng)險應(yīng)對策略[J].今日財富,2020(24):51-52.
[2]廖偉革.大數(shù)據(jù)支撐保險業(yè)發(fā)展?fàn)顩r研究[J].現(xiàn)代經(jīng)濟(jì)信息,2019(04):361-363.
[3]李弘熙.淺析大數(shù)據(jù)背景下保險業(yè)發(fā)展[J].中國集體經(jīng)濟(jì),2020(21):98-99.
[4]吳占福,馬旭平,李亞奎.統(tǒng)計分析軟件SPSS介紹[J].河北北方學(xué)院學(xué)報(自然科學(xué)版),2006(06):67-69+73.
[5]郝爽,李國良,馮建華,等.結(jié)構(gòu)化數(shù)據(jù)清洗技術(shù)綜述[J].清華大學(xué)學(xué)報(自然科學(xué)版),2018,58(12):1037-1050.
作者:王智毅 楊杉 單位:四川大學(xué)錦城學(xué)院計算機(jī)與軟件學(xué)院
- 上一篇:自我管理教育對自護(hù)行為的影響
- 下一篇:綜合英語課堂構(gòu)建策略
熱門標(biāo)簽
保險論文 保險學(xué)論文 保險營銷渠道 保險營銷論文 保險營銷員 保險行業(yè)論文 保險實訓(xùn)報告 保險理賠 保險研究論文 保險理財論文 心理培訓(xùn) 人文科學(xué)概論
相關(guān)文章
6保險利益