前言:想要寫出一篇引人入勝的文章?我們特意為您整理了軟件工程數據挖掘技術應用分析范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:數據挖掘是90年代初期出現的新型數據庫技術,經過多年發展,現階段,數據挖掘技術已經成為數據庫研究主要分支,在軟件工程中,利用數據挖掘技術,可以對軟件運行軌跡、代碼庫、bug數據庫、修改歷史數據進行有效處理。本文首先對數據挖掘技術對于軟件工程開發的重要作用做出闡述,然后說明數據挖掘技術運作流程、應用范圍,最后結合實際情況,對數據挖掘技術在軟件工程中的應用展開分析,希望可以對業內起到一定參考作用。
關鍵詞:數據挖掘技術;軟件工程;重要作用;應用分析
隨著互聯網技術、信息技術的迅速發展,現階段,計算機數據存儲能力、處理能力不斷提升,應用計算機與信息技術管理數據信息已經成為各行各業信息管理的主要方式,與此同時,人們所面臨的信息數據海洋也在迅速擴張。在信息爆炸時代中,如何在大量數據信息中提取有用信息、真實信息,會直接影響人們的工作效率與企業的生產效率。在此背景下,數據挖掘技術得到了社會各界的廣泛關注,數據挖掘技術本身融合了人工智能技術、數據庫技術、機器學習技術、知識工程技術、統計學技術以及信息檢索技術、數據可計算技術,在軟件工程中,通過對數據挖掘技術進行合理應用,可以有效提升數據信息處理效率,以為軟件工程高質量開發奠定基礎。
1數據挖掘技術對于軟件工程開發的重要作用
數據挖掘技術對于軟件工程開發的重要作用可以歸納為:(1)增強數據信息理解。在軟件工程開發工作開展中,數據挖掘技術應用具有增強數據信息理解的重要作用,對于同一條信息而言,每個人都有著不同理解,如果利用人力方法開展數據采集工作、數據理解工作,那么就會讓整體時間成本增加,對數據信息權威性造成不利影響,利用數據挖掘技術,可以對數據信息進行科學分類處理,讓數據就權威性、準確性得到保證。(2)提高數據處理質量。應用數據挖掘技術,可以在短時間內多次篩選、處理無效數據、混亂數據,讓數據處理質量、處理效率得到保證。和傳統技術相比,數據挖掘技術還可以防止數據丟失情況產生,避免企業損失。(3)增強數據利用效率。應用數據挖掘技術,可以從多個角度分類、整理數據信息,讓無用數據信息轉化為可理解信息資源,以為企業商業決策工作有效開展提供幫助,以增強數據利用效率。
2數據挖掘技術的基本概述
2.1運作流程
數據挖掘,主要指的是從不完全、模糊、大量、隨機數據中挖掘潛在、有價值、易被理解信息的過程。數據挖掘技術運作流程主要是利用計算機程序、綜合算法進行復雜運算,在預處理數據信息后,開展數據挖掘工作,最后對信息進行收集、整合。在數據選擇中,需使用具有強大運算后臺的軟件,以此來保證信息選擇準確性、有效性;在數據預處理中,需要針對選擇、收集原始數據信息,采用科學算法轉碼數據、識別數據,保證用戶可以直接得到數據信息;在數據挖掘中,應利用軟件智能算法以及計算機快速運算優勢,采集處理數據信息,以在海量數據信息中得到真實數據、原始數據,在數據挖掘工作開展中,一方面,需要依照數據信息不同特點,選擇科學挖掘算法,另一方面,需要對實際運行系統要求、用戶要求,挖掘用戶容易理解、描述性知識,或是用戶想得到預測性、前瞻性知識;在模式評價和知識表示過程中,根據某種興趣度量,可以對表示知識真正有趣模式予以識別,以完成模式評價工作,由特定領域用戶、專家、領域標準可以得出度量具體數值,利用可視化技術可以轉換結果為用戶易接受形式,并提交給用戶。值得注意的是,數據挖掘流程本身具有反復性特點,例如,在對數據信息進行清洗、準備過程中,就有可能在某數據源中發現挖掘數據不可用,或是數據信息來源于異構數據源,對此,需要開展預處理工作,通過反復挖掘提升數據信息充分性、準確性。
2.2應用范圍
數據挖掘技術可以完成概念描述工作、關聯分析工作、分類與預測工作、聚類分析工作、異類分析與檢測工作、演化分析工作以及數據約簡工作。現階段,數據挖掘技術的應用具有面向實際特點,在電信領域、銀行領域、醫學領域、保險領域、交通領域中均得到了廣泛應用,利用數據挖掘技術,可以完成數據庫營銷工作、背景分析工作、客戶群體分類工作、市場交叉銷售工作、客戶關系管理工作等。如在銀行領域中,利用數據挖掘技術就可以分析客戶信譽度情況,避免信用卡欺詐問題產生;如在醫學領域中,利用數據挖掘技術就可以完成醫療診斷工作。除此之外,數據挖掘技術還可以應用在農業領域、工業領域、互聯網領域以及軍事領域。
3數據挖掘技術在軟件工程中的應用分析
3.1軟件版本信息挖掘
在軟件工程中,軟件版本信息挖掘管理是關鍵工作內容,當前,幾乎所有企業都會使用版本控制系統維護軟件,保證團隊成員得到一致代碼。在大型軟件開發團隊中,軟件版本信息管理具有復雜性,每次更新都有可能產生代碼管理混亂問題。應用數據挖掘技術,可以有效挖掘軟件變更歷史信息,通過對比分析大量代碼,可以對各個版本、模塊之間內部聯系予以確認,在保證代碼融合效率基礎上,可以避免漏洞問題產生。
3.2軟件執行記錄挖掘
利用數據挖掘技術挖掘軟件執行記錄,可以對程序進行全面分析,利用程序預定安裝路徑,可以挖掘運行數據信息,利用科學算法,可以對軟件運行是否符合預期進行判斷。在執行記錄挖掘工作開展中,需要全面查詢安裝路徑,逆向建模處理數據結構,以對軟件開展維護工作、檢測工作,讓軟件運行存在的漏洞問題得到提前發現,讓軟件運行穩定性得到保證。與此同時,需要全面分析安裝系統,利用系統、軟件數據接口訪問系統,可以挖掘相應軟件信息,并提取運行需要數據信息。
3.3檢測漏洞
在軟件工程中,利用數據挖掘技術可以對軟件漏洞進行有效檢測,以提升數據信息穩定性、安全性,在錯誤造成嚴重后果之前修復漏洞。通常情況下,在技術應用中,首先,應結合軟件特點進行合理調整,在用戶基本需求得到滿足的前提條件下,可以對軟件測評方式進行科學確認;其次,應利用此測評方式,對軟件數據錯誤進行排查、修復,以完成數據加密工作、保護工作。值得注意的是,針對軟件所需后臺信息,還應開展處理工作,對后臺冗余數據進行定期清除,針對長時間運行出現數據,應對其進行過濾處理,針對必要關鍵信息,應對其予以保留,讓軟件運行穩定性、安全性得到保證。在建模工作中,應結合數據信息大小情況、特性對數據模型進行合理選擇、對比驗證,讓信息真實性、安全性得到保證。除此之外,應針對軟件多種用途,結合項目需要,對數據挖掘方式進行科學選擇,對多種數據信息進行比較分析,保證軟件可以為用戶帶來最佳體驗。
3.4軟件故障檢測中的數據挖掘
在軟件故障檢測工作中,通過科學應用數據挖掘技術,可以對軟件故障進行有效檢測,并針對故障產生原因、常見類型,開展修復工作、維護工作。
3.4.1故障檢測在軟件工程中,數據挖掘技術不僅可以提升挖掘任務完成效率、挖掘程序執行記錄具體說明,同時還可以完成故障檢測工作。在程序挖掘過程中,首先,應設定挖掘主要目標,對信息進行跟蹤了解,提升程序熟悉度,為后續工作高質量開展提供保證;其次,應對數據挖掘方式進行合理選擇,如利用基于規則和自動化類數據挖掘技術,就可以讓抽象處理、抽象挖掘工作得以高質量完成。當前,軟件因多種因素影響,可能會產生故障問題,傳統定位技術固然可以對故障進行處理,但其具有一定煩瑣性、低效性,定位精準度可能存在問題。而利用數據挖掘技術,結合新的定位方法,如使用程序譜抽象定位處理運行軌跡,利用對比方法對故障進行有效排除,就可以讓故障源頭得以迅速找出,讓故障排查效率、檢測準確性得以提升。
3.4.2軟件維護在數據挖掘技術支持下,通過鑒別該評估軟件缺陷程序,可以對軟件修復環節缺陷進行分析,對修復優先順序予以判斷,讓各個缺陷最佳修復方法得以確定。為保證修復效率,應強化處理檢測重復缺陷報告技術,在缺陷報告中融入自然語言、執行語言相似度信息,保證依照定義向量維度可以完成描述軟件缺陷工作。最后,可以加權求和處理相似度,以開展缺陷修復工作。
4結語
綜上所述,數據挖掘技術的科學應用是信息化時代數據信息處理的關鍵,在軟件工程中,應用數據挖掘技術可以高質量開展軟件版本信息挖掘工作、軟件執行記錄挖掘工作、檢測漏洞工作、故障檢測工作以及軟件維護工作,以提升軟件工程開發效率、開發質量,降低軟件工程開發成本,提升軟件工程開發經濟效益。
參考文獻:
[1]周鶴.數據挖掘技術在軟件工程中的應用探究[J].計算機產品與流通,2020(8):22.
[2]李金召.數據挖掘技術在軟件工程中的應用與研究[J].計算機產品與流通,2020(5):30.
[3]余世文,王渝波,劉啟明.軟件工程數據挖掘研究進展探析[J].農家參謀,2020(7):139.
[4]豐婉伊.數據挖掘技術在軟件工程中的應用分析[J].信息通信,2020,33(3):192-193.
[5]黃俊.數據挖掘技術在軟件工程中的應用[J].信息通信,2020(02):254-256.
[6]李怡.淺析軟件工程中數據挖掘技術的應用[J].中國新通信,2018,20(4):102.
作者:王鵬 胥司祿 陳夢杰 孫曉康 金蔓 單位:大連理工大學城市學院計算機工程學院