前言:想要寫出一篇引人入勝的文章?我們特意為您整理了軟件工程數(shù)據(jù)挖掘技術(shù)應(yīng)用分析范文,希望能給你帶來靈感和參考,敬請(qǐng)閱讀。
摘要:數(shù)據(jù)挖掘是90年代初期出現(xiàn)的新型數(shù)據(jù)庫技術(shù),經(jīng)過多年發(fā)展,現(xiàn)階段,數(shù)據(jù)挖掘技術(shù)已經(jīng)成為數(shù)據(jù)庫研究主要分支,在軟件工程中,利用數(shù)據(jù)挖掘技術(shù),可以對(duì)軟件運(yùn)行軌跡、代碼庫、bug數(shù)據(jù)庫、修改歷史數(shù)據(jù)進(jìn)行有效處理。本文首先對(duì)數(shù)據(jù)挖掘技術(shù)對(duì)于軟件工程開發(fā)的重要作用做出闡述,然后說明數(shù)據(jù)挖掘技術(shù)運(yùn)作流程、應(yīng)用范圍,最后結(jié)合實(shí)際情況,對(duì)數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用展開分析,希望可以對(duì)業(yè)內(nèi)起到一定參考作用。
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù);軟件工程;重要作用;應(yīng)用分析
隨著互聯(lián)網(wǎng)技術(shù)、信息技術(shù)的迅速發(fā)展,現(xiàn)階段,計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)能力、處理能力不斷提升,應(yīng)用計(jì)算機(jī)與信息技術(shù)管理數(shù)據(jù)信息已經(jīng)成為各行各業(yè)信息管理的主要方式,與此同時(shí),人們所面臨的信息數(shù)據(jù)海洋也在迅速擴(kuò)張。在信息爆炸時(shí)代中,如何在大量數(shù)據(jù)信息中提取有用信息、真實(shí)信息,會(huì)直接影響人們的工作效率與企業(yè)的生產(chǎn)效率。在此背景下,數(shù)據(jù)挖掘技術(shù)得到了社會(huì)各界的廣泛關(guān)注,數(shù)據(jù)挖掘技術(shù)本身融合了人工智能技術(shù)、數(shù)據(jù)庫技術(shù)、機(jī)器學(xué)習(xí)技術(shù)、知識(shí)工程技術(shù)、統(tǒng)計(jì)學(xué)技術(shù)以及信息檢索技術(shù)、數(shù)據(jù)可計(jì)算技術(shù),在軟件工程中,通過對(duì)數(shù)據(jù)挖掘技術(shù)進(jìn)行合理應(yīng)用,可以有效提升數(shù)據(jù)信息處理效率,以為軟件工程高質(zhì)量開發(fā)奠定基礎(chǔ)。
1數(shù)據(jù)挖掘技術(shù)對(duì)于軟件工程開發(fā)的重要作用
數(shù)據(jù)挖掘技術(shù)對(duì)于軟件工程開發(fā)的重要作用可以歸納為:(1)增強(qiáng)數(shù)據(jù)信息理解。在軟件工程開發(fā)工作開展中,數(shù)據(jù)挖掘技術(shù)應(yīng)用具有增強(qiáng)數(shù)據(jù)信息理解的重要作用,對(duì)于同一條信息而言,每個(gè)人都有著不同理解,如果利用人力方法開展數(shù)據(jù)采集工作、數(shù)據(jù)理解工作,那么就會(huì)讓整體時(shí)間成本增加,對(duì)數(shù)據(jù)信息權(quán)威性造成不利影響,利用數(shù)據(jù)挖掘技術(shù),可以對(duì)數(shù)據(jù)信息進(jìn)行科學(xué)分類處理,讓數(shù)據(jù)就權(quán)威性、準(zhǔn)確性得到保證。(2)提高數(shù)據(jù)處理質(zhì)量。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以在短時(shí)間內(nèi)多次篩選、處理無效數(shù)據(jù)、混亂數(shù)據(jù),讓數(shù)據(jù)處理質(zhì)量、處理效率得到保證。和傳統(tǒng)技術(shù)相比,數(shù)據(jù)挖掘技術(shù)還可以防止數(shù)據(jù)丟失情況產(chǎn)生,避免企業(yè)損失。(3)增強(qiáng)數(shù)據(jù)利用效率。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以從多個(gè)角度分類、整理數(shù)據(jù)信息,讓無用數(shù)據(jù)信息轉(zhuǎn)化為可理解信息資源,以為企業(yè)商業(yè)決策工作有效開展提供幫助,以增強(qiáng)數(shù)據(jù)利用效率。
2數(shù)據(jù)挖掘技術(shù)的基本概述
2.1運(yùn)作流程
數(shù)據(jù)挖掘,主要指的是從不完全、模糊、大量、隨機(jī)數(shù)據(jù)中挖掘潛在、有價(jià)值、易被理解信息的過程。數(shù)據(jù)挖掘技術(shù)運(yùn)作流程主要是利用計(jì)算機(jī)程序、綜合算法進(jìn)行復(fù)雜運(yùn)算,在預(yù)處理數(shù)據(jù)信息后,開展數(shù)據(jù)挖掘工作,最后對(duì)信息進(jìn)行收集、整合。在數(shù)據(jù)選擇中,需使用具有強(qiáng)大運(yùn)算后臺(tái)的軟件,以此來保證信息選擇準(zhǔn)確性、有效性;在數(shù)據(jù)預(yù)處理中,需要針對(duì)選擇、收集原始數(shù)據(jù)信息,采用科學(xué)算法轉(zhuǎn)碼數(shù)據(jù)、識(shí)別數(shù)據(jù),保證用戶可以直接得到數(shù)據(jù)信息;在數(shù)據(jù)挖掘中,應(yīng)利用軟件智能算法以及計(jì)算機(jī)快速運(yùn)算優(yōu)勢(shì),采集處理數(shù)據(jù)信息,以在海量數(shù)據(jù)信息中得到真實(shí)數(shù)據(jù)、原始數(shù)據(jù),在數(shù)據(jù)挖掘工作開展中,一方面,需要依照數(shù)據(jù)信息不同特點(diǎn),選擇科學(xué)挖掘算法,另一方面,需要對(duì)實(shí)際運(yùn)行系統(tǒng)要求、用戶要求,挖掘用戶容易理解、描述性知識(shí),或是用戶想得到預(yù)測性、前瞻性知識(shí);在模式評(píng)價(jià)和知識(shí)表示過程中,根據(jù)某種興趣度量,可以對(duì)表示知識(shí)真正有趣模式予以識(shí)別,以完成模式評(píng)價(jià)工作,由特定領(lǐng)域用戶、專家、領(lǐng)域標(biāo)準(zhǔn)可以得出度量具體數(shù)值,利用可視化技術(shù)可以轉(zhuǎn)換結(jié)果為用戶易接受形式,并提交給用戶。值得注意的是,數(shù)據(jù)挖掘流程本身具有反復(fù)性特點(diǎn),例如,在對(duì)數(shù)據(jù)信息進(jìn)行清洗、準(zhǔn)備過程中,就有可能在某數(shù)據(jù)源中發(fā)現(xiàn)挖掘數(shù)據(jù)不可用,或是數(shù)據(jù)信息來源于異構(gòu)數(shù)據(jù)源,對(duì)此,需要開展預(yù)處理工作,通過反復(fù)挖掘提升數(shù)據(jù)信息充分性、準(zhǔn)確性。
2.2應(yīng)用范圍
數(shù)據(jù)挖掘技術(shù)可以完成概念描述工作、關(guān)聯(lián)分析工作、分類與預(yù)測工作、聚類分析工作、異類分析與檢測工作、演化分析工作以及數(shù)據(jù)約簡工作?,F(xiàn)階段,數(shù)據(jù)挖掘技術(shù)的應(yīng)用具有面向?qū)嶋H特點(diǎn),在電信領(lǐng)域、銀行領(lǐng)域、醫(yī)學(xué)領(lǐng)域、保險(xiǎn)領(lǐng)域、交通領(lǐng)域中均得到了廣泛應(yīng)用,利用數(shù)據(jù)挖掘技術(shù),可以完成數(shù)據(jù)庫營銷工作、背景分析工作、客戶群體分類工作、市場交叉銷售工作、客戶關(guān)系管理工作等。如在銀行領(lǐng)域中,利用數(shù)據(jù)挖掘技術(shù)就可以分析客戶信譽(yù)度情況,避免信用卡欺詐問題產(chǎn)生;如在醫(yī)學(xué)領(lǐng)域中,利用數(shù)據(jù)挖掘技術(shù)就可以完成醫(yī)療診斷工作。除此之外,數(shù)據(jù)挖掘技術(shù)還可以應(yīng)用在農(nóng)業(yè)領(lǐng)域、工業(yè)領(lǐng)域、互聯(lián)網(wǎng)領(lǐng)域以及軍事領(lǐng)域。
3數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析
3.1軟件版本信息挖掘
在軟件工程中,軟件版本信息挖掘管理是關(guān)鍵工作內(nèi)容,當(dāng)前,幾乎所有企業(yè)都會(huì)使用版本控制系統(tǒng)維護(hù)軟件,保證團(tuán)隊(duì)成員得到一致代碼。在大型軟件開發(fā)團(tuán)隊(duì)中,軟件版本信息管理具有復(fù)雜性,每次更新都有可能產(chǎn)生代碼管理混亂問題。應(yīng)用數(shù)據(jù)挖掘技術(shù),可以有效挖掘軟件變更歷史信息,通過對(duì)比分析大量代碼,可以對(duì)各個(gè)版本、模塊之間內(nèi)部聯(lián)系予以確認(rèn),在保證代碼融合效率基礎(chǔ)上,可以避免漏洞問題產(chǎn)生。
3.2軟件執(zhí)行記錄挖掘
利用數(shù)據(jù)挖掘技術(shù)挖掘軟件執(zhí)行記錄,可以對(duì)程序進(jìn)行全面分析,利用程序預(yù)定安裝路徑,可以挖掘運(yùn)行數(shù)據(jù)信息,利用科學(xué)算法,可以對(duì)軟件運(yùn)行是否符合預(yù)期進(jìn)行判斷。在執(zhí)行記錄挖掘工作開展中,需要全面查詢安裝路徑,逆向建模處理數(shù)據(jù)結(jié)構(gòu),以對(duì)軟件開展維護(hù)工作、檢測工作,讓軟件運(yùn)行存在的漏洞問題得到提前發(fā)現(xiàn),讓軟件運(yùn)行穩(wěn)定性得到保證。與此同時(shí),需要全面分析安裝系統(tǒng),利用系統(tǒng)、軟件數(shù)據(jù)接口訪問系統(tǒng),可以挖掘相應(yīng)軟件信息,并提取運(yùn)行需要數(shù)據(jù)信息。
3.3檢測漏洞
在軟件工程中,利用數(shù)據(jù)挖掘技術(shù)可以對(duì)軟件漏洞進(jìn)行有效檢測,以提升數(shù)據(jù)信息穩(wěn)定性、安全性,在錯(cuò)誤造成嚴(yán)重后果之前修復(fù)漏洞。通常情況下,在技術(shù)應(yīng)用中,首先,應(yīng)結(jié)合軟件特點(diǎn)進(jìn)行合理調(diào)整,在用戶基本需求得到滿足的前提條件下,可以對(duì)軟件測評(píng)方式進(jìn)行科學(xué)確認(rèn);其次,應(yīng)利用此測評(píng)方式,對(duì)軟件數(shù)據(jù)錯(cuò)誤進(jìn)行排查、修復(fù),以完成數(shù)據(jù)加密工作、保護(hù)工作。值得注意的是,針對(duì)軟件所需后臺(tái)信息,還應(yīng)開展處理工作,對(duì)后臺(tái)冗余數(shù)據(jù)進(jìn)行定期清除,針對(duì)長時(shí)間運(yùn)行出現(xiàn)數(shù)據(jù),應(yīng)對(duì)其進(jìn)行過濾處理,針對(duì)必要關(guān)鍵信息,應(yīng)對(duì)其予以保留,讓軟件運(yùn)行穩(wěn)定性、安全性得到保證。在建模工作中,應(yīng)結(jié)合數(shù)據(jù)信息大小情況、特性對(duì)數(shù)據(jù)模型進(jìn)行合理選擇、對(duì)比驗(yàn)證,讓信息真實(shí)性、安全性得到保證。除此之外,應(yīng)針對(duì)軟件多種用途,結(jié)合項(xiàng)目需要,對(duì)數(shù)據(jù)挖掘方式進(jìn)行科學(xué)選擇,對(duì)多種數(shù)據(jù)信息進(jìn)行比較分析,保證軟件可以為用戶帶來最佳體驗(yàn)。
3.4軟件故障檢測中的數(shù)據(jù)挖掘
在軟件故障檢測工作中,通過科學(xué)應(yīng)用數(shù)據(jù)挖掘技術(shù),可以對(duì)軟件故障進(jìn)行有效檢測,并針對(duì)故障產(chǎn)生原因、常見類型,開展修復(fù)工作、維護(hù)工作。
3.4.1故障檢測在軟件工程中,數(shù)據(jù)挖掘技術(shù)不僅可以提升挖掘任務(wù)完成效率、挖掘程序執(zhí)行記錄具體說明,同時(shí)還可以完成故障檢測工作。在程序挖掘過程中,首先,應(yīng)設(shè)定挖掘主要目標(biāo),對(duì)信息進(jìn)行跟蹤了解,提升程序熟悉度,為后續(xù)工作高質(zhì)量開展提供保證;其次,應(yīng)對(duì)數(shù)據(jù)挖掘方式進(jìn)行合理選擇,如利用基于規(guī)則和自動(dòng)化類數(shù)據(jù)挖掘技術(shù),就可以讓抽象處理、抽象挖掘工作得以高質(zhì)量完成。當(dāng)前,軟件因多種因素影響,可能會(huì)產(chǎn)生故障問題,傳統(tǒng)定位技術(shù)固然可以對(duì)故障進(jìn)行處理,但其具有一定煩瑣性、低效性,定位精準(zhǔn)度可能存在問題。而利用數(shù)據(jù)挖掘技術(shù),結(jié)合新的定位方法,如使用程序譜抽象定位處理運(yùn)行軌跡,利用對(duì)比方法對(duì)故障進(jìn)行有效排除,就可以讓故障源頭得以迅速找出,讓故障排查效率、檢測準(zhǔn)確性得以提升。
3.4.2軟件維護(hù)在數(shù)據(jù)挖掘技術(shù)支持下,通過鑒別該評(píng)估軟件缺陷程序,可以對(duì)軟件修復(fù)環(huán)節(jié)缺陷進(jìn)行分析,對(duì)修復(fù)優(yōu)先順序予以判斷,讓各個(gè)缺陷最佳修復(fù)方法得以確定。為保證修復(fù)效率,應(yīng)強(qiáng)化處理檢測重復(fù)缺陷報(bào)告技術(shù),在缺陷報(bào)告中融入自然語言、執(zhí)行語言相似度信息,保證依照定義向量維度可以完成描述軟件缺陷工作。最后,可以加權(quán)求和處理相似度,以開展缺陷修復(fù)工作。
4結(jié)語
綜上所述,數(shù)據(jù)挖掘技術(shù)的科學(xué)應(yīng)用是信息化時(shí)代數(shù)據(jù)信息處理的關(guān)鍵,在軟件工程中,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以高質(zhì)量開展軟件版本信息挖掘工作、軟件執(zhí)行記錄挖掘工作、檢測漏洞工作、故障檢測工作以及軟件維護(hù)工作,以提升軟件工程開發(fā)效率、開發(fā)質(zhì)量,降低軟件工程開發(fā)成本,提升軟件工程開發(fā)經(jīng)濟(jì)效益。
參考文獻(xiàn):
[1]周鶴.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用探究[J].計(jì)算機(jī)產(chǎn)品與流通,2020(8):22.
[2]李金召.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用與研究[J].計(jì)算機(jī)產(chǎn)品與流通,2020(5):30.
[3]余世文,王渝波,劉啟明.軟件工程數(shù)據(jù)挖掘研究進(jìn)展探析[J].農(nóng)家參謀,2020(7):139.
[4]豐婉伊.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析[J].信息通信,2020,33(3):192-193.
[5]黃俊.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用[J].信息通信,2020(02):254-256.
[6]李怡.淺析軟件工程中數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J].中國新通信,2018,20(4):102.
作者:王鵬 胥司祿 陳夢(mèng)杰 孫曉康 金蔓 單位:大連理工大學(xué)城市學(xué)院計(jì)算機(jī)工程學(xué)院