前言:想要寫出一篇引人入勝的文章?我們特意為您整理了談數據分析支持片區用戶服務范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:數據建模是數據挖掘的重要步驟,而高品質的數據是模型成立的堅實基礎。為了保持和保護原始數據的原貌不變,同時減少干擾因素對分析結果的影響,建立中間數據庫是有效、便捷的方案。特征寬表與關聯數據疊加形成多維度交織的關系凸顯特診數據是本文闡述的建模思路,中間數據庫的建設使得終端個體特征寬表、終端群體特征寬表成為可能,最終實現數據挖掘成果。
關鍵詞:中間數據庫終端個體特征寬表終端群體特征寬表
1前言
數據倉庫、網管系統、統計報表在廣電行業運營服務中的使用已非常成熟。為了更好發揮各個支撐系統的實際作用,支持好片區用戶服務開展,全新的、符合需求的數據建模方式的研究試驗工作相繼展開。
2試驗環境
選取一個在網PON業務板卡下的覆蓋范圍為10000戶的區域作為試驗分析對象,該覆蓋范圍以PON+EoC的組網,覆蓋小區有多層、高層等多種房屋類型(接入網設計風格多樣),主要觀察對象為使用TVOS2.0交互機頂盒的用戶。
3試驗用數據平臺模型
該數據平臺用于建模試驗及驗證,為簡潔、高效,僅搭建了數據倉庫所必須需要使用的幾個部分。數據平臺模型示意圖如圖1所示。
4平臺基本情況
4.1數據源
(1)業務數據來自公司已建成的數據倉庫資源,該部分數據已經過清洗處理,數據品質較高可直接使用(包括用戶基本信息、產品信息、業務變更、報修信息等)。(2)終端數據來自交互型機頂盒(STB)與寬帶終端(EoC)的網管采集數據。由于終端上線與開機的情況受到用戶使用習慣的影響,該部分數據經過去“空”、去“零”、異常去除等多種方式存入試驗用數據倉庫。(3)網絡拓撲及網管數據該部分數據描述了每組STB+EoC終端所在的廣播網和寬帶網絡關聯網元關系,與每個可管理網元的運行數據(性能采樣及告警等)。(4)其他關聯數據資源包括實驗覆蓋范圍內可能使用的各種網元及終端的硬件、軟件版本、業務產品關聯的業務邏輯、網絡規劃策略等,網絡主動維護改擴建等。
4.2處理層
(1)數據倉庫用于存儲清洗后的數據源。(2)中間庫用于對數據倉庫的數據預處理。根據建模的需求將不同數據預先整合,既提升整個平臺的性能,也有效減少數據倉庫中的冗余數量,能有效保護源數據的原貌。(3)試驗模型本次試驗的關鍵部分,下文詳述。
4.3展現層
根據片區服務的需求以三種形成展現方式使用。(1)可查詢定制清單。(2)定制報表。(3)可視化綜合分析。
5需要解決的問題和解決方案
最常見并實用的需求如單個用戶的歷史記錄分析。人工解讀單個用戶/終端數據非常簡單,但面對百萬級的用戶終端數量而言人工是不現實的,計算機面對單個用戶/終端的數據多樣性特點難度極大。綜合片區服務一些需求的特點和人工解讀單個用戶/終端數據方法。提出在中間庫建立終端個體特征寬表和終端群體特征寬表的設想,以這兩個寬表為基礎,疊加關聯數據(如用戶報修、網絡報修,網絡改建、升級,系統告警、用戶行為等),將特征數據凸顯出來。終端個體特征寬表主要解決因用戶使用習慣造成的采樣記錄的數量問題。將在線的每個終端的日數據記錄收斂成一條,寬表的特征信息包含用戶基本信息、網絡拓撲關系、性能指標等每項都設定收斂策略。終端群體特征寬表則主要解決指定/選定范圍群體數據集合問題。在指定/選定范圍內終端硬件型號差異、關聯網絡、網元差異、產品差異等原因都會導致數據無法收斂、離散無序、偏差極大等多因素混雜的狀況,使得特征數據淹沒。采樣逐項進行閾值設定和偏差補償、校驗弱化混雜因素作用的方式解決集合問題。
6試驗成果
6.1網絡衰減特征
網絡衰減問題是接入網運行及維護中最基本的指標,也是試驗中最難處理的數據。該項數據存在記錄數量巨大,波動不明顯,偶發數據容易被淹沉等問題。試驗通過個性寬表與群體寬表的對比,網絡拓撲的星型結構關聯關系,展現出某個群體(個體)與整體數據的偏差。以偏差量由大到小排列,提取用戶地址信息歸類。經片區服務人員驗證。用戶網絡隱患基本能指向到戶內、樓內、PON口下、光節點下等幾個層級。該模型可初步定型。
6.2終端軟件版本管理
終端個人寬表中軟件版本與軟件版本升級關聯識別出未升級成功用戶。片區服務驗證發現存在。(1)機頂盒硬件故障(更換后經廠商維修存儲器部分受損)。(2)網絡不穩定導致反復升級,后期實驗中將加入寬帶穩定性參數。(3)CPU負核過高。由于升級軟件BUG,導致升級后CPU負核過高,經升級軟件修復,現象消除。模型基本有效,可供軟件升級專項使用。
6.3寬帶用戶使用體驗
寬帶用戶反映網速慢、網卡是最常見的報障現象。從用戶群相寬表的寬帶數據與用戶業務數據比對發現,其關聯性并不完全吻合。用戶體驗與同一EoC頭端共有用戶使用情況,與同一PON口共有用戶使用相關聯,晚間高峰時間網絡資源不足的現象有特征數據出現,但不明顯。由于試驗范圍與暴滿需擴容案例,該模型將擴大試驗進一步驗證。視擴大試驗驗證情況完善模型。
6.4交互應用情況
交互應用與用戶使用習慣關聯的試驗,試驗數據中表現出用戶交互使用時CPU負核的變化。但在與用戶產品等相關數據關聯時未發現特征數據,也未發現其他特征,模型試驗失敗。試驗通過五個模型的試探,三個達到了預期的成果,一項可繼續擴展,一項失敗。經過這五項的試驗,證明以網絡拓撲為主線,以個體特征、群體特征二個寬表為基礎,疊加各種維度的數據可以顯現出運營服務所需要的特征數據。這些數據能夠給到服務具體的幫助。
7結束語
上述試驗只是建模思路的初步探索的第一階段,后期將向二個方向推進。方向一,將成功建模的實驗擴大范圍驗證,完善并推廣使用,對仍有問題和失敗的模型調整補充;疊加新的數據維度尋找新的特征數據。方向二,選取有特殊片區服務需求和資深專家給到的片區服務建議用數據模型顯示出來,供片區使用。
作者:徐沁 單位:東方有線網絡有限公司