前言:想要寫出一篇引人入勝的文章?我們特意為您整理了保險行業關聯規則數據挖掘技術的運用范文,希望能給你帶來靈感和參考,敬請閱讀。
隨著科學信息時代的發展,大數據方向的計算機應用技術被越來越多的保險行業所熟知。近年保險市場的擴充發展加劇著各個保險公司之間的競爭,而今大數據技術的日趨成熟,正好使積累的數據信息得到有利開發并為未來發展提供數據支持。本文主要針對R保險公司續保產品銷售問題,運用SPSSModeler工具以及關聯規則算法對其續保的產品結構進行關聯性分析,最終依據分析結果給予公司相關產品開發及產品營銷意見與建議與意見等。隨著新時代生活消費結構及居民消費意識的晉級,財富家當的不斷累積,消費者對保險的投保的意識已逐漸增強。保險行業作為國家增長速度最快的行業之一,是國民經濟的重要組成部分,而如何在經濟快速發展的市場替代中占的一席之位便成為了各個保險公司需作出的重要商業決策。在大數據挖掘當熱的分析環境中,保險行業由于歷史數據信息爆炸而有效的信息匱乏,未能為公司決策者提供有效的支持,而利用計算機技術對保險公司中的大量客戶信息數據進行分析,協助公司作出業務調整、做出企業戰略安排等正是數據挖掘技術所體現的作用。本文主要利用數據挖掘技術對R保險公司提供的續保客戶數據中的保險產品進行相關分析,使用關聯規則算法分析續保客戶購買的不同產品險種之間的關聯性,依據參數閥值推斷其購買A險種的客戶是否會購買B險種,達到滿足客戶的多層次需要;通過分析結論給予特定人群改變推銷戰略,配合公司做出業務性調整,達到提高銷售效率的目的,并對此提出該領域的數據挖掘研究流程。
1保險險種的關聯銷售分析
1.1保險產品關聯銷售的概念
關聯銷售實質是指在通過特定的數據挖掘技術對客戶購買信息的篩選后,得到具有關聯性的產品組合和客戶特征,并借此為企業開展經營活動提供相關信息指導。關聯銷售是保險公司利潤收入的重要來源之一。關聯銷售形式除了靠以往傳統人為銷售經驗外,主要是通過對歷史保險銷售數據的挖掘,得到新的產品或產品銷售組合,再針對人群進行同進推薦,以此達到提高銷售效率降低企業銷售成本的目的。
1.2數據挖掘關聯規則方法應用
本文主要采用關聯規則算法,其主要反應事物之間的相互依賴關系或其各自間關聯性,采用的算法為著名的Apriori算法,處理速度快且對規則的數量沒有明確限制要求。其次,在算法中會給定兩個重要的參考閥值即評價指標,最小支持度和最小置信度。數據發掘目的就是從給定的數據庫中發掘出滿足兩者關聯規則。本次研究使用的數據挖掘軟件為SPSSModeler,方法關聯規則算法。整個數據挖掘流程如圖1所示:
1.3保險數據準備
數據準備即為對初始數據進行一定的采集、篩選、預處理功能等,以此在一定程度上提高模型的準確性。整個準備過程包括;數據采集、數據整理、數據清洗、數據集成、數據變換、數據規約。流程圖如圖2所示:依據數據準備的要求,將R公司續保客戶保險數據中的脫敏數據,無關變量數據進行一定的篩選與剔除。①由于原始續保數據集中顯示:投保時間、教育程度、家庭人數三個類別數據各自的值都是脫敏數據,所以通過分析得出這三類數據為無效數據,將其剔除。②在續保數據中,由于有職業但過去三年平均年收入低于10RMB的人群無法確定其特殊性,視為臟數據,將其剔除;其次存在著有職業人士但平均年收入為0RMB,為了保證數據的有效和準確性,所以本次分析剔除出有職業但過去三年平均年收入為0的客戶保險數據。③通過EXCEL數據處理過程后,R保險公司給予的原始數據約為21萬,最終續保數據約為15萬條。
1.4關聯規則模型建立
本次數據挖掘采用關聯規則算法中的Apriori算法分析歷史保險數據中客戶續保險種與險種之間潛在的關聯性。第一步,通過EXCE得到對應整理后的客戶續保數據,在SPSSModeler空白界面中創建流,導入選擇從EXCEL文件讀取輸入源;第二步,從字段選項中添加類型節點,讀取數據值并為其需要的指標設置所輸入字段的角色、類型和格式;第三步,添加設置標志節點,選取創建所有險種為標志字段并以客戶號為匯總關鍵字,為后續建模做好準備;第四步,建模之前可以通過設置添加圖形選項中的“網絡”節點使用戶直觀的感受各個險種之間的關聯程度;第五步,再次添加類型節點,為分析目標設置“兩者”角色,滿足建模要求;第六步,建立模型節點,選取關聯Apriori算法,其中最低條件支持度與最小規則置信度(%)一般選擇默認參數(最低條件支持度為10,最小規則置信度為80%,根據研究需求自行改變設置),建立模型。模型建立還可根據需求選擇專家模式,自行設置相關參數,最終輸出匯總并依據模型結果進行分析。
1.5模型結果分析
由圖4可以了解到(此時調節桿顯示范圍為900-1900)網絡的線條粗細能直接顯示不同險種之間的潛在聯系,比如可以直觀的分析出險種S42與險種S77關聯強度最高,但與險種S56程度較低;同時,險種S43與險種S50、險種B01關聯程度也較好;其余險種關聯性不強。通過分析結果可以看出,輸出的規則主要包括五個內容:支持度、置信度、規則前項與后項以及實例記錄數。本次關聯規則模型總共挖掘出了16條規則,有效的事務數為1萬多條,最大置信度可到達98.98%,最大支持度達到53.694%。例如圖5中規則ID為16顯示,此規則中的實例記錄有1373條,由購買前項險種S40、S43、S49的客戶可以給他推薦后項險種S42這類保險,該推薦可達到的置信度為98.98%,達到的支持度為12.744%,提升度為1.144,大于1且有意義,表示在此規則信息下的關聯程度是較強的,其他閥值參考類似。由此通過該規則信息得出向客戶推銷此類險種的成功率較高,客戶容易接受,其他規則分析同理。因此,根據分析結果可知,續保客戶所購買的不同險種之間的確存在關聯性,并且可以通過客戶歷史購買的險種數據推出關聯程度較強的險種進行針對性關聯銷售,以滿足客戶的多方面需要。因此,通過上述對續保險種之間的關聯規則分析結果得知,保險險種的關聯交叉銷售是有利于效提高企業的銷售率,提高保險企業的利潤率,并且有利于提升客戶的忠誠度,降低企業的銷售成本,實現資源的合理分配。
2研究結論與建議
2.1研究結論
綜上,保險公司在日常經營活動中,不僅要關注分析客戶的購買特征和消費習慣等,做好未來客戶預警流失,還需從客戶以往購買產品的記錄中挖掘出客戶新的購買欲望,并針對客戶群體推出新型產品或產品組合。總之,數據挖掘的目的是為了更好的為企業經營者提供良好信息支持,做出最好的相關性業務調整和營銷戰略決定,實現公司的可持續發展和更多的經濟利益目標。本文利用數據挖掘技術只探討了R公司同一客戶群體不同險種之間的關聯規則,是基于關聯規則的關聯銷售,且是從產品的角度出發發現各類產品之間的關聯關系和客戶同時購買產品的習慣和特性,同時只運用了著名的Aproti算法,還有Carma、序列算法可以實現等,所以本文具有一定的局限性,但不影響研究方法的應用。
2.2建議
無論是基于哪種模型分析方法,都需要加強自身保險公司高效的數據庫信息內部建設,以致未來更好的利用客戶信息數據建立模型。其次,大數據挖掘技術帶來的可靠性與可實現性可以將大量信息數據從多種、多維角度去提煉和壓縮出有效并且有價值的信息為公司所用。并且,利用數據挖掘技術的手段在各行各業都可實現精確定位客戶需求特征、客戶的預警流失、管控風險預測及評估、分析預測客戶未來需求,為其客戶制定個性化定制方案等大大的提高了各公司的運行效率,達到“用正確的方法做事”以及“做正確的事”的公司組織目標。所以,積極的借鑒與合理的引用先進科學技術可以是公司創新發展的一大動力源泉。另外,現在正是以“客戶為中心”的時代,要從客戶端分析為著手點和目標,精準服務于客戶群體、提高客戶的滿意度、可接受程度等,通過與其他分析方法的結合,構建客戶分析系統,并通過實驗有效的運用到實踐當中,為保險營銷人員提供一定的指導作用,為自身公司的長久立足逐步打下堅實基礎。
3結語
大數據時代的信息泛濫更真實的體現了建立客戶端數據庫是非常必要的,引用科學技術也是必不可少的,并且合理利用數據挖掘技術最大限度發揮其對信息的篩選作用是目前各保險公司刻不容緩需要做的事情。不僅在保險業務領域,各行各業幾乎都已與大數據環境下的各種數據挖掘技術相接觸。大數據數據挖掘技術作為企業客戶經營的一項重要工具,作為一種有效的手段,是企業更好的了解與掌握客戶需求的一個渠道,是企業改善自身發展提高競爭力的快速手段,是企業實現組織目標的必要途徑。
作者:袁楊欽 楊杉 單位:四川大學錦城學院