前言:想要寫出一篇引人入勝的文章?我們特意為您整理了基于數據挖掘的網絡異常檢測技術范文,希望能給你帶來靈感和參考,敬請閱讀。
1網絡異常檢測技術概述
如今,我們已經處于網絡時代,生活的方方面面都離不開網絡,而且網絡的穩定與否直接影響著人們生活質量的高低。在日常生活中,由于受到外界因素的影響以及網絡本身的問題,常常會出現網絡異常的情況,為了解決這一問題,保證用戶上網的流暢性,需要針對發生異常的網絡進行檢測,這種技術就是網絡異常檢測技術。網絡異常這種情況在生活中較為常見,但是產生的原因卻十分復雜,一旦找不到問題的原因,就會造成網絡大范圍的崩潰,進而影響人們的工作和生活。
數據挖掘就是人們常說的知識發現,通過對海量的、雜亂無章的、不清晰的并且隨機性很大的數據進行挖掘,找到其中蘊含的有規律并且有價值和能夠理解應用的知識,這一過程就是數據挖掘。它主要是借助分析工具找到數據和模型之間的關心,之后進行預測,并將數據回歸到真實變量。在網絡異常檢測技術中應用數據挖掘技術,能夠從海量數據中找到需要的信息,并且根據數據信息建立模型,從而對入侵行為和正常操作進行分類了,數據挖掘的方法有兩種:一種是分類分析,一種是聚分析。分類分析需要找到數據之間的依賴關系,并且進行預判斷,這一過程需要興趣度的介入,也就是對規則的可行性和適用性進行衡量,確保滿足最小閾值,之后建立一個數據映射分類模型,從而輸出離散類別。分類的效果與數據的特點息息相關,有的數據噪聲較大,有的數據缺失不全,有的數據密集分布,有的數據字段離散,所以還需要具體情況具體分析。聚類分析是通過反復的分區從而找到解決辦法,它的輸出是各個不同類型的數據,也就是先對數據進行初始歸類,之后去粗取精進行合并,最后使得對象之間能夠彼此聯系,歸于一類。值得一提的是,通過對數據和對象之間的距離進行聚類,能夠消除數據的噪聲,完成不同形狀的聚類,也可以對數據的空間分布進行劃分,形成網格單元,對數據分布情況進行更直觀的判斷。
3基于機器學習方法的網絡異常檢測技術
機器學習指的是根據人類學習的情況,對機器進行研究,使得機器掌握學習的能力,從而獲取新的知識,并通過一系列的模擬學習,讓機器能夠自主解決問題。機器學習是人工智能的最新成果,由環境、執行和數據庫構成,首先環境為機器學習系統提供信息,之后機器學習系統對這些信息進行識別,和數據庫進行對比,最后加以執行,網絡異常檢測技術應用機器學習方法主要有兩種情況:監督學習和無監督學習。監督學習指的是通過之前的異常情況和數據分析進行練習和研究,找到一個固定的模板,從而對輸入信息進行檢測,根據檢測結果進行判斷,對異常情況進行分類。這種方法需要研究人員熟悉網絡異常的特征,并且能夠準確區分數據,從而使得機器學習系統能夠檢測出不同類型的異常,同時,如果是新型的異常,系統也能夠檢測出來。下面介紹一些檢測的方法:第一種,KNN算法,這種算法是比較簡單的機器學習方法,并且能夠對異常行為直接進行計算,并根據最近的K個樣本找到相似的類型,尤其是在動態網絡中,應用比較成熟。但是樣本需要均勻分布,如果測量不準確就可能出現一定的誤差,所以也可以結合其他算法同時使用。第二種,決策樹法,這種方法和流程圖比較像,每個節點代表者檢測的屬性,每個分支則是檢測結果,每片葉子就是異常的類型。在檢測過程中通過對沒有標記的數據進行分類,由上到下測試,之后選擇合理的分支和節點,最后在葉片上判斷類型。但是隨著網絡數據的不斷增多,需要對內存資源進行優化,從而提高系統檢測的精準性。無監督學習不需要對異常情況做標記,只需要根據目前的網絡進行建模,這樣極大地減少了工作量,同時能夠將數據聚集情況進行分類,之后由研究者進行判斷,雖然準確度不如監督學習的高,但是操作便捷,簡單易行,它的檢測方法如下:第一種,Apriori方法,這種算法能夠第一時間檢測到網絡的異常,并且直接鎖定攻擊來源,主要是找到滿足設定的頻集,之后根據頻集的相關規則,對數據進行保留處理,之后生成動態的檢測規則,提高系統的穩定性。第二種,EM方法,在對網絡異常進行檢測時,數據可能會有缺失或者是處于隱性狀態,所以需要根據檢測對象的屬性對其權重進行分配,找到屬性期望,之后根據似然估計進行計算,從而實現交替循環。
4結論
綜上所述,網絡異常直接影響著用戶的信息安全,所以需要認真做好網絡異常的檢測工作,通過創新和應用相關的檢測技術,在最快的時間內找到產生的問題的原因,從而加以解決,滿足人們使用網絡的需求。
參考文獻
[1]黃煜坤.網絡安全異常檢測技術探究[J].電子測試,2015(05):40-42+45.
[2]廖國輝,劉嘉勇.基于數據挖掘和機器學習的惡意代碼檢測方法[J].信息安全研究,2016,2(01):74-79.
作者:秦振凱 單位桂林電子科技大學海洋信息工程學院