情感分析及軒逸汽車銷售決策
時間:2022-07-26 11:23:23
導語:情感分析及軒逸汽車銷售決策一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
在電商無限發(fā)展的今天,面對著龐大、不規(guī)則的網(wǎng)絡評論文本數(shù)據(jù),如何從中尋找出對企業(yè)制作銷售決策有用的信息,已成為當下各大商家的關注熱點。本文就這一問題展開討論,試圖挖掘出對支撐車企制定或改善銷售決策有重要作用的信息。論文主要引用BERT模型并計算相關指標值,同時利用ROSTCM6軟件對負面情感文本進行社會網(wǎng)絡和語義網(wǎng)絡分析。結(jié)果表明,超過半數(shù)購車車主對軒逸汽車的態(tài)度明顯持積極情感,即該品牌汽車得到了多數(shù)使用車主的認可。最后,還運用了4Ps營銷理論對情感分析過程中發(fā)現(xiàn)的問題進行了總結(jié),并提出相關建議。
1研究背景及意義
在經(jīng)濟全球化的背景下,隨著人們生活質(zhì)量的不斷提高,人們對出行的代步工具的需求越來越大,在綜合方便、舒適等條件下,汽車便成為了廣大消費者的最優(yōu)選擇。據(jù)中國汽車工業(yè)協(xié)會統(tǒng)計數(shù)據(jù)顯示,2020年汽車產(chǎn)銷分別為2522.5萬輛和2531.1萬輛,產(chǎn)銷量在全球連續(xù)領先。據(jù)太平洋汽車網(wǎng)銷售統(tǒng)計數(shù)據(jù)顯示,2020年熱度最高的車型為東風日產(chǎn)系列的軒逸牌轎車,其2020年1~12月總銷量在各大轎車車型中排名第一,在緊湊型車車型中排名第一,綜合太平洋汽車網(wǎng)所提供數(shù)據(jù)分析,軒逸牌汽車已經(jīng)受到了廣大消費者的青睞。因此,本文將東風日產(chǎn)系列中的軒逸轎車作為研究對象。論文主要采用數(shù)據(jù)挖掘技術和數(shù)據(jù)分析方法,獲取太平洋汽車網(wǎng)上的軒逸轎車論壇相關評論文本信息,并對這些評論文本信息進行預處理后,分析出消費者對該型汽車產(chǎn)品的積極、消極或中性的情感,引用BERT模型算法并進行指標值計算,利用負面情感分析和詞云分析挖掘出消費者對車型本身的關注點,最后結(jié)合4P營銷策略和情感分析結(jié)果,對車企提出相關建議。論文研究有助于對有購車需求的潛在消費者提供做出購買決策的重要依據(jù);另一方面,還對汽車商家準確把握消費者的情感傾向、改善產(chǎn)品和服務、制定正確的銷售決策和增強企業(yè)在行業(yè)中的競爭力具有重要的戰(zhàn)略指導意義。
2研究現(xiàn)狀
目前,國內(nèi)外對情感分析的研究有很多,但大多都更偏向于社交網(wǎng)絡(諸如微博、微信等)的文本情感分析,專門針對汽車行業(yè)的研究卻寥寥無幾。根據(jù)論文研究內(nèi)容,由情感分析展開國內(nèi)外研究現(xiàn)狀的論述。情感分析又稱意見挖掘,是對有感情色彩的主觀性文本進行分析、處理、歸納和推理的過程。在國內(nèi),情感分析領域的研究已經(jīng)取得了巨大成果,有對微博等社交網(wǎng)站評論進行情感分析的,也有對互聯(lián)網(wǎng)上某一具體產(chǎn)品的評論文本進行細膩度情感分析的,一些學者更是專門針對汽車領域,就消費者消費價值取向與對汽車產(chǎn)品的情感傾向等問題做出了深入的研究與探討。蘇菊芳通過對圖書館讀者的評論文本進行情感分析,得出圖書館讀者情感極性從而采用本體的形式構建圖書館讀者情感畫像庫,為讀者的個性化推薦提供了新的研究思路,實現(xiàn)了讀者的情感知識語義檢索與共享[1]。楊立公等則以文本顆粒度為視角,從情感詞抽取等五個方面對文本情感分析文獻進行了梳理,并指出了當前情感分析系統(tǒng)準確率不足的問題[2]。王獻偉結(jié)合了Spark平臺提出應用文本情感分析來挖掘商品評論中的特征屬性信息,選取了京東商城上行業(yè)排名前五的智能冰箱評論作為研究對象,通過對評論語料中智能冰箱各屬性的情感傾向進行分析,獲取各屬性在市場上的褒貶評價[3]。周立柱等則對情感分析的研究對象和目標進行了定義,詳細地回顧和分析了主要的處理方法,簡要的介紹了一些相關的情感分析問題,并對情感分析現(xiàn)有的成就、不足和挑戰(zhàn)進行了總結(jié)[4]。王琛則通過獲取了商品以及電影評論數(shù)據(jù),提出了Word2vec的情感分析方法,并設計實現(xiàn)了一個在線實時情感分析系統(tǒng),方便了用戶實時查詢,具有可操作性、準確性、直觀性等優(yōu)點[5]。
3BERT模型
DevlinJ等于2018年時提出了BERT模型,并指出模型是一種NLP領域的與訓練模型。BERT模型的核心內(nèi)容是找出目標文本中每一個詞匯與其他任意詞匯的關系,在這基礎上,將詞匯與句子中或文本中其他詞匯的聯(lián)系充分表示出來,即BERT模型能更清楚地展現(xiàn)出詞匯在上下文的不同語義。其中,E1,E2,…EN表示需要進行訓練的目標文本中的文字的輸入,在經(jīng)過編碼層的雙向的Transformer編碼器后,輸出的就是目標文本的向量化表示結(jié)果,即T1,T2,…TN分別對應輸入字的向量化表示結(jié)果。BERT語言訓練模型和其他模型相比,層數(shù)更深,對詞向量表示的結(jié)果更加泛化,能夠?qū)δ繕宋谋局械娜我庠~匯或句子之間的關系進行更詳細地描述。但由于BERT模型在向量化時是經(jīng)過編碼層的雙向Transformer編碼器所進行操作的,其輸出結(jié)果中的詞包含了該詞在其他句子中的所有語義,這對預測結(jié)果會產(chǎn)生影響。為解決此問題,BERT模型提出了兩個預訓練任務模型:Masked語言模型(MaskedLanguageModule,MLM)和下一個句子預測(NextSentencePrediction,NSP)模型。
4數(shù)據(jù)分析模型構建及分析
4.1BERT模型相關指標值計算
BERT分類算法的任務中,官方代碼文件中給出的評價指標只有準確率(Acc)與損失(Loss),為使實驗結(jié)果更準確,論文在官方代碼基礎上,新增了召回率(R)與精準率(P)的計算,然后加入到Return字典中,部分代碼如圖1所示,輸出指標值如圖2所示。從圖2可以清晰看出,準確率(Acc)值為0.8901413,精準率(P)值為0.91316281,召回率(R)值為0.89652703。通過計算,最終得到的F1的值約為0.904768456,即F1為90.48%。實驗結(jié)果表明,BERT模型分類方法能夠有效地處理詞匯本身在文本中不同位置的語義,且對中文文本的分類效果比較顯著,對情感極性的預測準確。
4.2基于ROSTCM6軟件的情感傾向分析
本文采用了由武漢大學教授團隊開發(fā)的ROSTCM6軟件,對目標文本進行了情感傾向分析,分析過程如圖3所示。
作者:張龍 吳旖婷 周遵爽 蔣合領 單位:中國電信股份有限公司貴州分公司產(chǎn)品創(chuàng)新(客戶研究)中心 哈爾濱商業(yè)大學計算機科學與技術 貴州財經(jīng)大學信息學院