• <input id="zdukh"></input>
  • <b id="zdukh"><bdo id="zdukh"></bdo></b>
      <b id="zdukh"><bdo id="zdukh"></bdo></b>
    1. <i id="zdukh"><bdo id="zdukh"></bdo></i>

      <wbr id="zdukh"><table id="zdukh"></table></wbr>

      1. <input id="zdukh"></input>
        <wbr id="zdukh"><ins id="zdukh"></ins></wbr>
        <sub id="zdukh"></sub>
        公務員期刊網 論文中心 正文

        計算機數據挖掘技術的開發

        前言:想要寫出一篇引人入勝的文章?我們特意為您整理了計算機數據挖掘技術的開發范文,希望能給你帶來靈感和參考,敬請閱讀。

        計算機數據挖掘技術的開發

        摘要:在信息化時代下,大數據的到來為社會變革提供了新的思路,從中也衍生出了數據挖掘技術,提高了數據處理效率和質量。數據挖掘技術能夠從海量數據中找出用戶所需數據,并保障數據挖掘的精度和利用率,是推動社會、產業發展的重要技術之一。基于此,筆者首先提出了數據挖掘的概念,然后分析了數據挖掘的相關技術,最后探究了數據挖掘的開發與應用。

        關鍵詞:數據挖掘技術;大數據;數據規約

        1引言

        計算機不斷發展背景下,人們也正式步入了信息時代,計算機挖掘技術作為大數據時代的衍生品,在各個領域中的應用都十分廣泛,很大程度上推動了社會效益增長。數據挖掘技術讓數據庫技術發展到了更高階段,通過該項技術的應用不僅能夠查詢相關數據信息,而且能夠識別數據之間潛在數據,保證數據挖掘的有效性,促進數據傳播。計算機挖掘技術發展不僅能夠豐富人們的生活,推動企業市場發展和調查工作,在各個領域中都發揮著極大的作用。所以,需要重點考慮如何充分利用數據挖掘技術發揮數據價值,從而推動行業、社會發展。

        2數據挖掘技術

        數據挖掘也被稱為資料探勘、數據采礦。作為數據庫知識發現的一個步驟。數據挖掘技術通常是指在大量數據中采用相關算法搜索隱藏在大數據信息的過程。數據挖掘技術通常和計算機科學有著直接關系,采用統計、在線分析、檢索、機械學習以及模糊識別等技術實現信息搜索目標。數據挖掘技術的流程如下。第一步,信息收集。結合所確定的數據分析對象抽象出在數據分析中所需的特殊信息,之后采用相關信息收集方法,將自動搜索的信息存入到數據庫中。在大數據當中,選擇合適的數據管理和數據存儲技術是極為重要的。第二步,數據集成。將不同格式、領域與性質的數據在物理層或邏輯層上集中,即可為企業或組織提供更加全面的信息數據。第三步,數據規約。采用數據挖掘相關算法,由于數據挖掘技術并未成熟,所以在數據挖掘效率上還有待提高,而商業運營數據往往較多,這就增加了數據挖掘難度。在此基礎上衍生出了數據規約技術,數據集可以應用規約表示,雖然數據體積變小;但是,可以保證數據的原始性,在規約后執行數據挖掘結果和規約前執行結果大致相同。第四步,數據清理。數據庫中并不一定是完整數據,也有含噪聲數據、不一致數據,這些數據需要過濾掉,精準的把完整、正確、一致的數據信息存儲到數據庫當中。第五步,數據變換。采用科學的聚集方法、數據概化法,將數據轉化成為可挖掘的數據形式。對于部分實數型的數據,可以采用概念分層、數據離散化轉換數據方法實現轉化。第六步,數據挖掘(過程)。結合數據庫提供的數據信息,采用更加合理、適當的分析該工具,包括統計方法、決策樹、事例推理、規則推理、模糊集、精神網絡以及模糊算法等技術,從而得出最終的有效信息。第七步,模式評估。從商業角度發展,各個行業專家對所挖掘的數據精準性進行評估。第八步,知識表示。將所挖掘的數據信息采用可視化技術呈現給用戶或者采用新型知識形式存放到數據庫當中,供其他程序使用。總之,數據挖掘技術在應用中適應反復循環的過程,如果其中一個步驟沒有達到預期目標,都要回到之前的步驟,重新執行并調整。并不是每個數據挖掘工具都會在這里列出每一個步驟,如某個數據源中存在著多項數據種類,第二步的數據集成即可省略掉。在以上步驟當中,第三步三到第五步統稱之為數據預處理。在數據挖掘當中,主要的經費都消耗在了第一步中,大量精力都要花費在數據預處理階段。

        3數據挖掘技術開發工具分析

        3.1神經網絡

        神經網絡技術自身帶有十分強的組織適應性、魯棒性、處理能力、存儲能力(分布)以及高度容錯等,這些優勢十分適用于數據挖掘體系。可以對大數據信息進行分類、預測、挖掘和識別,構建前饋式神經網絡模型。其中,以hopfield的離散模型和連續模型為代表,可以實現優化計算、聯想記憶的反饋式神經網絡模型。以art模型、koholon模型為代表,主要應用在聚類自組織映射方法。但是,神經網絡技術也存在弊端,就是其“黑箱”性,人們在應用神經網絡時無法理解學習與決策的過程,執行起來較為困難[1]。

        3.2遺傳算法

        該項技術作為一種基于生物自然選擇、遺傳機理的隨機搜索算法。遺傳算法決定了其“遺傳性”,也就是適應性,具有隱含并行性、可以和其他模型性質結合等優勢;因此,在數據挖掘技術中的應用十分廣泛。Sunil成功開發了一種以遺傳算法為核心的數據挖掘工具,通過利用該項技術對兩個飛機失事真實數據展開了數據挖掘試驗,結果證明遺傳算法是有效實現數據挖掘的技術之一。遺傳算法由于自身的遺傳性,注定了需要和相關技術結合使用,如神經網絡、粗集等技術。遺傳算法的應用還能夠優化神經網絡結構,在能夠增加容錯率的前提下,將隱藏單元、多余連接刪除。結合bp算法可以訓練神經網絡,并在網絡當中提取規則。遺傳算法的缺陷是自身結構十分復雜,很多較早的收斂問題尚未解決。

        3.3決策樹

        決策樹作為一種預測模型算法之一,該項技術可以將海量數據進行分類,并從數據當中找出更具價值、潛在優勢的信息。決策樹在使用中具有分類效率高、描述簡單等優勢,可以對大規模數據進行處理。最具影響、最早的決策樹是由quinlan提出的基于信息熵的id3算法,其主要的問題包括:id3是一種非遞增的學習方法;id3決策樹作為一種單變量決策樹,表達復雜概念較為困難;同性相互關系強調性能不足;缺乏抗噪性。針對這些問題,也在id3模型算法基礎上進行了升級,如有人提出了id4遞增式算法;有人提出了ible算法等。

        3.4粗集

        粗集作為一種結合理論,主要是用于研究不確定、不精準的數學工具。該項理論的優勢表現在:不需要給出額外信息;簡化輸入信息的表達空間;算法簡單、容易操作。該項技術處理對象類似二維關系信息表。粗集數學基礎作為一種集合論,無法直接處理連續的信息屬性。并且在現實的信息表當中連續屬性普遍存在。所以,制約粗集理論實用化的因素就是連續屬性離散問題[2]。

        4數據挖掘技術的應用

        4.1市場營銷方面的應用

        在市場營銷方面上,用戶購買貨物情況可以采用信息管理系統、POS系統,特別是條形碼技術在零售行業中的應用十分廣泛。由于可以搜集的用戶信息量越來越多,甚至無法實現人為管控,需要在市場營銷中收集到各類相關數據,包括購物行為、習慣性分析,總結各類信息數據的特征,對推動市場營銷能力提升有著巨大的作用,對提高企業市場競爭力有著積極的影響。在用戶數據分析中,通過采用高效的數據挖掘技術可以精準地分析客戶購買取向和興趣,提高商業決策的精準性,市場營銷上的數據挖掘可以分為兩大類:數據庫營銷和貨籃分析,前者主要采用了交互式查詢、模型預測方法選擇潛在的用戶,這也是該項技術在應用中的主要任務,向潛在客戶自動推向內心所需的產品[3]。還能夠系統地分析客戶層之間的關系,強化客戶管理,分析零售行業的發展趨勢,包括市場購買走向、季節性特點等因素。針對客戶的購買商品行為中發覺一系列關系。例如,如何采用打折券的形式提高銷售額度等。

        4.2電信行業的應用

        電信行業本身就與數據掛鉤;因此,在數據挖掘技術應用中有著巨大的優勢。從行業整體情況來看,電信行業在價格競爭方面空前激烈,語音業務增長態勢放緩,急速增長的中國移動通信市場也面臨著很大的發展壓力。在中國電信行業改革背景下,加強了市場的競爭,電信市場競爭在未來會進一步增強,特別是在集團客戶領域層面上。電信信息化、集團客戶已成為了未來各大運營商的競爭對手和實現經濟增長的新引擎。隨著電信、移動、聯通全球業務競爭以及5G拍照的發放,各大運營商給客戶提供更加精準的解決方案也是大勢所趨,移動信息化已成為全球信息化服務的先導力量[4]。通過數據挖掘技術對大數據信息進行挖掘,包括數據統計分析、業務數據分析、銷售數據分析、網絡數據分析、流量數據分析、交易數量分析、情報數據分析以及日常數據分析等,結合預測預警模型、數據試驗模型等,為客戶提供精準、優質的服務,從而帶動新一輪的經濟發展;但是,數據挖掘工具都是共享形式,運營商也需要在基礎工具形式上進行創新才能夠提高自身的市場競爭力。

        4.3金融投資領域的應用

        投資評估與股票交易市場預測作為金融業發展的重要趨勢,通常采用模型預測技術展開分析,包括統計回歸技術等。由于金融市場風險較大,在展開投資之前需要對各項數據進行分析,有效規避這種風險,明確最佳的投資方向。從客觀角度分析,任何事物發生都有一定趨勢和規律,可以進行預測,從投資評估到股票預測等諸多領域,可以通過挖掘數據信息推導出各個領域的發展情況,有效處理數據,深度挖掘數據間的關系,采用相關模式進行合理預測。鑒別金融信息中的欺詐行為。例如,商業銀行領域存在諸多惡意詐騙行為、惡意透支行為,這對銀行發展有著極大的威脅,通過數據挖掘和預測預警模型可以鑒別惡意行為,一旦發現會發出警報提醒決策人員,當今很多軟件都是針對銀行欺詐展開科學評估,探究交易風險發生的可能[5]。

        5結語

        數據挖掘技術作為一種十分重要的工具和手段,雖然受到技術的制約數據挖掘技術還不夠成熟;但是,可以挖掘一些風險行為、風險用戶、行業趨勢等信息。數據挖掘技術在當今各個行業中的應用都十分廣泛,可以解決一些十分棘手的問題,并且在未來發展中會發揮更大的效益。

        參考文獻

        [1]李卓陽.計算機數據挖掘技術的開發及應用[J].電腦迷,2016(10):111-112.

        [2]王洪飛.計算機數據挖掘技術的開發及其應用探究[J].中小企業管理與科技,2016(9):147-148.

        [3]米娜瓦爾,努拉合買提.計算機數據挖掘技術的開發及其應用探究[J].信息與電腦,2016(20):146-147.

        [4]夏天維.計算機數據挖掘技術的開發及其應用探究[J].決策與信息,2016(9):233-234.

        [5]沈文淵,丁穎.計算機數據挖掘技術的開發及其應用探究[J].信息系統工程,2014(6):130-132.

        作者:楊繼武 單位:河北旅游職業學院

        无码人妻一二三区久久免费_亚洲一区二区国产?变态?另类_国产精品一区免视频播放_日韩乱码人妻无码中文视频
      2. <input id="zdukh"></input>
      3. <b id="zdukh"><bdo id="zdukh"></bdo></b>
          <b id="zdukh"><bdo id="zdukh"></bdo></b>
        1. <i id="zdukh"><bdo id="zdukh"></bdo></i>

          <wbr id="zdukh"><table id="zdukh"></table></wbr>

          1. <input id="zdukh"></input>
            <wbr id="zdukh"><ins id="zdukh"></ins></wbr>
            <sub id="zdukh"></sub>
            亚洲成A人片在线观看57 | 最新国产精品大片在线播放 | 亚洲中文字幕精品久久久久久 | 日本欧美亚洲另类 | 久久亚洲性爱视频 | 中文字幕日本一区 |