前言:想要寫出一篇引人入勝的文章?我們特意為您整理了蜂窩移動網絡數據用量預測方法淺析范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:目前,蜂窩移動網絡數據用量預測技術與方法上,主要采用統計和深度學習方法,由于用戶的蜂窩移動網絡數據用量變異較大,所以將可能有較大的蜂窩移動網絡數據用量估計誤差。因此,本文研究提出一套蜂窩移動網絡數據用量預測方法,分析目標客戶前幾個周期的蜂窩移動網絡數據用量集合,預測目標客戶下一周期的蜂窩移動網絡數據用量,并可依估計的蜂窩移動網絡數據用量提供營銷信息予客戶,增加客戶對蜂窩移動網絡數據用量的購買量,降低客戶費率,增加移動網絡運營商收入,建立雙贏。在實驗中,本研究取得7月份56萬個用戶記錄進行分析,并與傳統預測方法進行比較,證實此方法確實較為優越,且平均正確率可達87.97%。
關鍵詞:蜂窩移動網絡數據用量;賬務計算;k個最近鄰居算法
4G/5G蜂窩移動網絡日益普及,分析和預測蜂窩移動網絡用戶的數據用量也越來越受到重視,其將有助于移動網絡運營商進行網絡策略部署和客戶方案推薦。在目前蜂窩移動網絡數據用量預測上,主要采用統計和深度學習方法來進行預測,需要進行大量統計,由于用戶個人的通訊行為使蜂窩移動網絡數據用量差異較大,且統計僅能得到同一資費方案中的平均值及趨勢,若在同一資費方案中蜂窩移動網絡數據用量變異大,則統計和深度學習方法將可能得到較大的蜂窩移動網絡數據用量估計誤差。因此,本研究提出蜂窩移動網絡數據用量預測法,分析目標客戶前幾個周期的蜂窩移動網絡數據用量集合,以預測目標客戶下一周期的蜂窩移動網絡數據用量,并可依此蜂窩移動網絡數據預估用量提供營銷信息予客戶,增加客戶對蜂窩移動網絡數據用量的購買量,以增加企業收入。本研究提出蜂窩移動網絡數據用量預測系統,包含手機端設備、核心網絡端、賬務計算服務器、數據庫、預測服務器以及決策服務器。手機端設備進行蜂窩移動網絡數據通信將通過核心網絡端鏈接至因特網,并且該通信記錄由核心網絡端傳送至賬務計算服務器,由賬務計算服務器統計每個用戶每個周期的蜂窩移動網絡數據用量,并將此用量儲存于數據庫。預測服務器將可運用蜂窩移動網絡數據用量預測方法,分析目標客戶前幾個周期的蜂窩移動網絡數據用量集合,并將此集合與數據庫中相同資費方案的歷史數據集合進行比對,找出最相似的幾筆蜂窩移動網絡數據用量集合,令最相似的數據權重最高,再將這幾筆蜂窩移動網絡數據用量集合進行加權平均,以取得目標客戶下一周期的蜂窩移動網絡數據預估用量,再傳送至決策服務器。決策服務器將依據預測的蜂窩移動網絡數據用量,經過決策運算產生相關的營銷、預警、網絡部署等策略,提供相關建議信息予企業主管和客戶參考。此論文以下分為四個章節,在第二節中將說明蜂窩移動網絡數據用量預測方法,各個步驟的作法和設計原理。第三節則針對本研究提出的蜂窩移動網絡數據預測方法進行實證和分析。最后一節則說明此論文之結論與未來研究方向。
1蜂窩移動網絡數據用量預測方法
本研究設計蜂窩移動網絡數據用量預測方法,主要包含5個步驟:(1)設定相關參數值;(2)收集和統計每個用戶每個周期的蜂窩移動網絡數據用量;(3)取得前n個周期之蜂窩移動網絡數據用量,并轉換為向量集合;(4)與歷史數據進行比對,取得最相似的k筆數據;(5)依每筆數據向量距離進行加權平均,估計蜂窩移動網絡數據用量,分述如下。
1.1設定相關參數值
蜂窩移動網絡數據用量預測方法將分析每個客戶每個周期(m天)的蜂窩移動網絡數據用量、每個客戶前n個周期的蜂窩移動網絡數據用量集合以及取得歷史數據中最相似的k筆數據,在此步驟中將先設定m、n、k等參數值,以進行后續預測計算。其中,在本研究案例中,設定m值為5(即一個周期5天),n值為5(即分析前5個周期),以及k值為2(即取得數據庫中最相似的2筆記錄),以進行蜂窩移動網絡數據用量預測方法說明。
1.2收集和統計每個用戶每個周期的蜂窩移動網絡數據用量
在此步驟中,由核心網絡端實時收集和記錄每個用戶的蜂窩移動網絡數據通信記錄,并由賬務計算服務器依設定之每5天為1個周期,計算每個用戶每個周期的蜂窩移動網絡數據用量,并將此數據儲存至數據庫。在本研究案例中,以封包數為蜂窩移動網絡數據用量的單位,如表1,賬務計算服務器統計使用者編號1在7月1日到7月5日這個周期共傳收1,881,531個封包
1.3取得前n個周期之蜂窩移動網絡數據用量,并轉換為向量集合
在此步驟中,由預測服務器依參數值設定取出數據庫中的數據,取得目標客戶前5個周期的蜂窩移動網絡數據用量集合,并將此集合作為該用戶蜂窩移動網絡上網行為的參考依據,依此進行后續的分析與判斷使用。在本研究案例中,將預測使用者編號1在7月26日到7月31日這個周期(第i個周期)的蜂窩移動網絡數據用量q1,i,故將取得其前5個周期的蜂窩移動網絡數據用量集合Q1,i-1,i-5={q1,i-5,q1,i-4,q1,i-3,q1,i-2,q1,i-1}(即7月1日到7月25日期間的蜂窩移動網絡數據用量),如公式(1)、(2)、以及表2所示。{}1,12,13,14,15,15,1,1,,,,−−−−−−−=iiiiiiiqqqqqQ(1){}1,1,51881531,5651084,1875929,3116748,1808503iiQ−−=(2)
1.4與歷史數據進行比對,取得最相似的k筆數據
在此步驟中,將向數據庫取出目標客戶相同資費群組(使用者編號1的資費群組為Group1)的歷史蜂窩移動網絡數據用量數據,不同資費群組的客戶蜂窩移動網絡數據用量數據將不被考慮,如表3所示。例如,用戶編號c的歷史蜂窩移動網絡數據用量數據集合為Qc,i-6,i-11={qc,i-11,qc,i-10,qc,i-9,qc,i-8,qc,i-7,qc,i-6}(即6月1日到6月30日期間的蜂窩移動網絡數據用量),如公式(3)、(4)所示。{},6,,16,7,8,9,10,1,,,,,−−−−−−−−=iciciciciciciicqqqqqqQ(3){},6,111731307,4234143,2018105,3696109,2513784,3622136ciiQ−−=(4)預測服務器將目標客戶前5個周期的蜂窩移動網絡數據用量集合Q1,i-1,i-5與歷史數據每筆蜂窩移動網絡數據用量集合進行比對,而在本研究案例中,相似度權重計算主要采用歐幾里德距離的倒數,例如,為使用者編號1與使用者編號j的歐幾里德距離(),7,5,1,11,iijii−−−−QQd如公式(5),以及為使用者編號1與使用者編號j的相似度權重jw,1如公式(6)。其中,M為一個極大數,在本研究案例中,設定為1000000。依此可計算出使用者編號1前5個周期的蜂窩移動網絡數據用量集合Q1,i-1,i-5={q1,i-5,q1,i-4,q1,i-3,q1,i-2,q1,i-1}(即7月1日到7月25日期間的蜂窩移動網絡數據用量)與歷史數據每筆蜂窩移動網絡數據用量集合計算的相似度權重如表4所示。當與每一筆歷史蜂窩移動網絡數據用量數據集合比對得到權重jw,1后,取得權重最大的k筆(在本研究案例中k為2),其中權重最大值為f1和其對應的前第i-(n+1)個周期蜂窩移動網絡數據用量為g1、權重第二大值為f2和其對應的前第i-(n+1)個周期蜂窩移動網絡數據用量為g2,依此類推如公式(7)所示。jcjwf,111max≤≤=(7)
1.5依每筆數據向量距離進行加權平均,估計蜂窩移動網絡數據用量
在此步驟中,分別將相似度最大的k筆數據所對應的前第i-(n+1)個周期蜂窩移動網絡數據用量依權重進行加權平均,如公式(8)所示。在本研究案例中,與使用者編號1前5個周期的蜂窩移動網絡數據用量集合Q1,i-1,i-5相似度最高的2筆分別為使用者編號c的歷史蜂窩移動網絡數據用量數據集合,7,iic−−1Q和用戶編號1的歷史蜂窩移動網絡數據用量數據集合,7,1ii−−1Q,故f1為9770.00000048,1=cw、g1為36221366,=ic−q、f2為0740.000000201,1w=、g2為34235946,1=i−q。因此,使用者編號1于7月26日到7月31日這個周期(第i個周期)的蜂窩移動網絡數據估計用量q1,i’為3,140,242,如公式(9)所示。∑∑==×=kbbkbbbifgfq11,1'(8)31402420740.000000209770.0000004834235940740.0000002036221369770.00000048',1=+×+×=iq(9)當預測服務器完成目標客戶蜂窩移動網絡數據用量預測后,可將此預測值傳送至決策服務器,并依據預測的蜂窩移動網絡數據用量,經過決策運算產生相關的營銷、預警、網絡部署等策略,并提供相關建議信息予企業和客戶參考。在本研究案例中,使用者編號1的資費群組允許之封包數量為15,000,000,而目前使用者編號1已使用封包數量14,333,795,并且估計使用者編號1到7月31日時,將累計使用封包數量為17,474,037,故由決策服務器提供預警信息予用戶編號1,并推薦使用者編號1其他資費方案以供參考。
2實驗結果與討論
本研究中主要收集7月份某地區北部用戶不同資費方案,共涵蓋565,606個用戶記錄,設定算法中的k值為10,并與傳統預測方法(資費方案之用量平均值方法、深度神經網絡)進行比較。由實驗數據顯示,本研究提出的方法正確率較其他算法高,正確率達87.97%,如表5所示。
3結語
本研究提出蜂窩移動網絡數據用量預測方法,分析目標客戶前幾個周期的蜂窩移動網絡數據用量集合,并將此集合與數據庫中相同資費方案的歷史數據集合進行比對,找出最相似的幾筆蜂窩移動網絡數據用量集合,令最相似的資料權重最高,再將這幾筆蜂窩移動網絡數據用量集合進行加權平均,以取得目標客戶下一周期的蜂窩移動網絡數據預估用量。實驗中與傳統預測方法進行比較,證實此方法確實較為優越,且平均正確率可達87.97%。未來可將此方法應用于4G/5G蜂窩移動網絡數據用量預測,并依此蜂窩移動網絡數據預估用量提供營銷信息予客戶,增加客戶對蜂窩移動網絡數據用量的購買量,同時,降低客戶費率、增加移動網絡運營商收入,達到雙贏效果。
參考文獻:
[1]倪志剛.一種網絡指標數據預測的方法,電信科學,第29卷,第3期,第141-146頁,2013.
[2]丁章,于德成.基于循環神經網絡的無線通信指標預測應用研究,山東通信技術,第40卷,第1期,第18-20頁,2020.
[3]丁尹,桑楠,李曉瑜,吳飛舟.基于循環神經網絡的電信行業容量數據預測方法,計算機應用,第41卷,第8期,第2373-2378頁,2021.
作者:陳志華 單位:福州大學計算機與大數據學院