前言:想要寫出一篇引人入勝的文章?我們特意為您整理了機器學習多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全淺析范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:為了減少多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸時延,設(shè)計一個基于機器學習的多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸技術(shù)。通過選擇數(shù)據(jù)源與數(shù)據(jù)屬性的重要性定義,對多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)預(yù)處理,并建立多徑并行傳輸架構(gòu),在此基礎(chǔ)上,采用機器學習方法進行有效帶寬估計與參數(shù)濾波處理,最后進行帶寬調(diào)度與信道安全協(xié)議體系建立,從而完成基于機器學習的多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸。實驗結(jié)果表明,此次研究的基于機器學習的多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸有效減少了數(shù)據(jù)傳輸時延,并減少了數(shù)據(jù)傳輸中斷情況與數(shù)據(jù)丟包率,滿足數(shù)據(jù)傳輸技術(shù)的設(shè)計需求。
關(guān)鍵詞:機器學習;多元異構(gòu)網(wǎng)絡(luò);數(shù)據(jù)安全傳輸;網(wǎng)絡(luò)數(shù)據(jù)預(yù)處理;并行傳輸構(gòu)架
1引言
當前,通信技術(shù)發(fā)展迅速,多種網(wǎng)絡(luò)特點明顯,并經(jīng)過多年的改革創(chuàng)新,使無線接入技術(shù)的傳輸速率逐漸逼近極限。在這種背景下,為滿足多種業(yè)務(wù)需求,需要進行多網(wǎng)寫作。但是,傳統(tǒng)的寫作機制在網(wǎng)絡(luò)傳輸資源使用上,不能同時、高效的使用,不能有效保證高效傳輸業(yè)務(wù),并且會增加傳輸中的能耗問題,從而導(dǎo)致傳輸過程中發(fā)生干擾問題。因此,很多學者開展了關(guān)于多元網(wǎng)絡(luò)數(shù)據(jù)傳輸方法的研究。文獻[1]中,石玲玲,李敬兆研究了異構(gòu)網(wǎng)絡(luò)中安全數(shù)據(jù)傳輸機制,該機制主要采用一種基于優(yōu)化的AES-GCM認證加密算法和基于SHA的數(shù)字簽名算法相結(jié)合的安全數(shù)據(jù)傳輸機制進行數(shù)據(jù)的傳輸;文獻[2]中,周靜,陳琛研究了基于異構(gòu)網(wǎng)的一種數(shù)據(jù)安全模型,該模型預(yù)先對數(shù)據(jù)加密處理,然后建立安全傳輸信道進行了數(shù)據(jù)的傳輸。上述兩種方法能夠獲得一定的效果,但是還存在一定的不足。針對上述的不足,為此本文將機器學習方法應(yīng)用到多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸中,以解決目前存在的問題。實驗結(jié)果表明,此次研究的多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸技術(shù)有效解決了目前存在的問題,具備一定的實際應(yīng)用意義。
2多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)預(yù)處理
在多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸中,有很多數(shù)據(jù)是沒有用的,為此需要從多元網(wǎng)絡(luò)數(shù)據(jù)中選取相關(guān)的數(shù)據(jù)源進行傳輸,從而提高數(shù)據(jù)傳輸?shù)臏蚀_率與效率。在有效數(shù)據(jù)源選擇過程中,采用重要性衡量數(shù)據(jù)屬性之間的關(guān)系[3-4],捕獲關(guān)聯(lián)性較強的數(shù)據(jù),其計算表達式如下所示:(1)公式(1)中,T表示所有數(shù)據(jù)源的綜合表數(shù),(i,j)表示示例源類間的相關(guān)性。根據(jù)對數(shù)據(jù)源重要性的判斷,可以選擇關(guān)聯(lián)程度最高的數(shù)據(jù)表集合,減少不相關(guān)表。在上述重要數(shù)據(jù)源選擇完成后,分析數(shù)據(jù)屬性,由于一個數(shù)據(jù)源是有一組數(shù)據(jù)屬性組成的,通過這些屬性特征能夠反映出待傳輸數(shù)據(jù)的基本信息。主要通過數(shù)據(jù)元組的相關(guān)性進行衡量,分析元組數(shù)據(jù)出現(xiàn)的次數(shù),即通過元組數(shù)據(jù)密度進行定義,數(shù)據(jù)元組密度圖如圖1所示。圖1中,ε表示指定鄰域的半徑。按照這種思路,對上述數(shù)據(jù)集中的每個元組數(shù)據(jù)進行權(quán)重的分配[5-7],它的表達式如下:(2)公式(2)中,w(C)表示屬性權(quán)重,w(tk)表示核心元組的數(shù)目,δ表示異常值,w(tb)表示邊的元組數(shù)目。
3多徑并行傳輸架構(gòu)
在上述預(yù)處理完成后,建立多徑并行傳輸架構(gòu),主要內(nèi)容如下:預(yù)先對流量分割,通信流分割是發(fā)送端用來將大型數(shù)據(jù)塊分割成不同大小或相同大小的數(shù)據(jù)單元[8],其大小由通信流分割的粒度決定,主要分為以下幾類:第一,在分組級業(yè)務(wù)分割中,分組是數(shù)據(jù)流的最小構(gòu)成單元,因此,分割方法粒度最小,且分組概率相互獨立,可以發(fā)送到發(fā)送端;第二,流層面的流量分割[9],將特定目標地址封裝在包頭部,然后將具有相同目標地址的包聚合為數(shù)據(jù)流,這些不同的數(shù)據(jù)流彼此獨立,并通過唯一的流標識符加以區(qū)別。利用流級分割技術(shù)可以有效地解決數(shù)據(jù)失真對多徑傳輸?shù)挠绊慬10]。第三,子流層面的流量分割,同一目的地頭部的數(shù)據(jù)流被分成多個子流,所有子流中的包都有相同的目的地地址,在一定程度上解決了流分割算法中的負載不平衡問題。多徑并行傳輸架構(gòu)如圖2所示。除此之外,在帶寬聚合體系結(jié)構(gòu)中,調(diào)度算法是決定業(yè)務(wù)傳輸方式和業(yè)務(wù)子流調(diào)度次序[11],確保業(yè)務(wù)子流有序到達接收端的核心,接下來我們將討論數(shù)據(jù)調(diào)度。
4帶寬調(diào)度方案制定
對于多元異構(gòu)網(wǎng)絡(luò)的數(shù)據(jù)傳輸,當某個路徑的帶寬達到一定值時,網(wǎng)絡(luò)的帶寬會不斷增加,傳輸性能會相對穩(wěn)定。為提高吞吐量,分配過多帶寬會降低頻譜利用率,從而導(dǎo)致頻譜資源的浪費。在當前頻譜資源日益緊張的情況下,對多徑并行傳輸中各路帶寬進行調(diào)度和管理,不僅能保證多徑并行傳輸?shù)膫鬏斝阅?,而且能有效地利用資源。為此進行處理,實現(xiàn)的主要步驟如下:第一,采用機器學習方法進行有效帶寬估計,合理地估計每個子流可充分利用的無線帶寬資源,以及以較少的帶寬資源達到高吞吐率的要求,是帶寬調(diào)度算法的關(guān)鍵。為此采用耦合擁塞控制算法,對各個子流聯(lián)合控制,其表達式如下:(3)公式(3)中,MSS表示報文最大長度的常數(shù),由協(xié)議設(shè)置,RTTi、PLRi分別表示子流所處路徑的往返延遲和丟包率。第二,參數(shù)濾波處理,因為無線信道的多樣性和時變特性,鏈路參數(shù)和路徑有效帶寬都會發(fā)生動態(tài)變化,且存在誤差。為去除誤差,對網(wǎng)絡(luò)參數(shù)進行卡爾曼濾波器濾波,以獲得精確的估計值。卡爾曼濾波是一種離散時間遞推估計算法,通過對當前時刻的差分遞推,根據(jù)當前狀態(tài)的測量值、最后時刻的狀態(tài)以及預(yù)測誤差,計算出更精確的當前時刻狀態(tài)作為輸出。研究離散控制系統(tǒng)時,采用線性隨機微分方程如下:(4)公式(4)中,xk、xk-1分別代表k時刻與k-1時刻的狀態(tài)參數(shù),Ak、Bk分別代表系統(tǒng)參數(shù),在多模型系統(tǒng)中為矩陣,分別表示狀態(tài)轉(zhuǎn)移矩陣和輸入矩陣,uk表示控制的輸入?yún)?shù),wk表示計算時的噪聲。第三,帶寬調(diào)度,假設(shè)一多徑連接C包含n條子流,每個子流都彼此獨立,每條子流占用一個路徑進行數(shù)據(jù)傳輸,下面是它的調(diào)度過程如圖3所示。依據(jù)上述過程對帶寬調(diào)度,最后建立信道安全協(xié)議,以保證多元異構(gòu)數(shù)據(jù)安全傳輸。安全協(xié)議由SSL協(xié)議、規(guī)則建立協(xié)議、隧道信息協(xié)議等構(gòu)成。其中,SSL協(xié)議主要包括認證算法和加密算法兩大部分,所有服務(wù)器端的數(shù)據(jù)包都將通過SSL協(xié)議進行加密,以保證消息通信的安全性,規(guī)則建立協(xié)議包括連接信息和消息識別,記錄表匹配成功生成socket,轉(zhuǎn)發(fā)布保證數(shù)據(jù)信息在VPN技術(shù)通道上的轉(zhuǎn)發(fā)和應(yīng)用。采用OpenVPN編程是實現(xiàn)隧道消息協(xié)議的主要方法??蛻舳税l(fā)送請求命令消息,以建立與服務(wù)器的連接。通過連接后,服務(wù)器根據(jù)SSL協(xié)議將經(jīng)過加密驗證的數(shù)據(jù)信息寫入隧道信息數(shù)據(jù)區(qū),實現(xiàn)與客戶端的數(shù)據(jù)交換和傳輸。信道安全協(xié)議結(jié)構(gòu)如圖4所示。在數(shù)據(jù)傳輸過程中,按照上述信道安全協(xié)議進行傳輸,以此完成基于機器學習的多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸。
5實驗對比
為了驗證所設(shè)計的基于機器學習的多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸技術(shù)的有效性,進行實驗分析,并將文獻[1]的異構(gòu)網(wǎng)絡(luò)中安全數(shù)據(jù)傳輸機制、文獻[2]的基于異構(gòu)網(wǎng)的一種數(shù)據(jù)安全模型做對比,對比三種系統(tǒng)的有效性。此次實驗中的實驗數(shù)據(jù)集如表1所示。通過上述采集的實驗數(shù)據(jù)能夠看出,實驗選取的數(shù)據(jù)是越來越多的,從而更好的驗證三種方法的有效性,主要對比三種方法的傳輸時延、數(shù)據(jù)傳輸中斷情況以及鏈路丟包率,具體內(nèi)容如下所示。
5.1傳輸時延對比
分別對比三種方法的傳輸時延,其對比結(jié)果如圖5所示。通過分析圖5發(fā)現(xiàn),在谷歌公開數(shù)據(jù)集傳輸上,三種方法傳輸時延均較小,隨著傳輸數(shù)據(jù)量的增加三種方法的數(shù)據(jù)傳輸時延都有所增加,但經(jīng)過對比能夠發(fā)現(xiàn),此次研究的基于機器學習的多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸技術(shù)傳輸時延最小,少于傳統(tǒng)的兩種方法。
5.2數(shù)據(jù)傳輸中斷情況對比
分別對比應(yīng)用三種傳輸技術(shù)后,數(shù)據(jù)傳輸中斷情況,其對比結(jié)果如圖6所示。通過圖6能夠發(fā)現(xiàn),此次研究的傳輸技術(shù)發(fā)生數(shù)據(jù)傳輸中斷情況最少,在幾次實驗中均少于傳統(tǒng)兩種傳輸技術(shù)。
5.3鏈路丟包率對比
分別采用此次研究的基于機器學習的多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸技術(shù)與傳統(tǒng)兩種傳輸技術(shù)進行數(shù)據(jù)傳輸,三種方法的丟包率對比結(jié)果如圖7所示。通過分析圖7能夠發(fā)現(xiàn),傳統(tǒng)的異構(gòu)網(wǎng)絡(luò)中安全數(shù)據(jù)傳輸機制的鏈路丟包率最高,高于基于異構(gòu)網(wǎng)的一種數(shù)據(jù)安全模型與此次研究的傳輸技術(shù)。綜上所述,此次研究的基于機器學習的多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸技術(shù)較傳統(tǒng)兩種傳輸技術(shù)傳輸時延少,丟包率少。其原因在于該研傳輸技術(shù)預(yù)先對多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)進行了預(yù)處理,并制定帶寬調(diào)度方案,建立了安全傳輸協(xié)議,從而提高了多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸效果。
6結(jié)束語
本文設(shè)計了一個基于機器學習的多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸技術(shù),并通過實驗驗證此次研究技術(shù)的有效性。該技術(shù)能夠提高數(shù)據(jù)傳輸?shù)男剩€能夠減少數(shù)據(jù)傳輸丟包率,實際應(yīng)用意義較強。但由于研究時間的限制,此次研究的多元異構(gòu)網(wǎng)絡(luò)數(shù)據(jù)安全傳輸技術(shù)還存在一定的不足,為此在后續(xù)研究中,還需要進一步優(yōu)化。
作者:方國強 吳雪霽 包森成 單位:中國移動通信集團浙江有限公司