前言:想要寫出一篇引人入勝的文章?我們特意為您整理了決策樹對構造領域本體的作用范文,希望能給你帶來靈感和參考,敬請閱讀。
本文作者:王夙娟 單位:菏澤學院計算機與信息工程系
領域本體是專業(yè)性的本體,提供了某個專業(yè)學科領域中概念的詞表以及概念間的關系,或在該領域里占主導地位的理論。領域本體構建的方法:知識工程方法、企業(yè)建模法、循環(huán)獲取法、methontology、IDEF-5、Bemerasetal等。然而,要了解本體構建完整的過程,骨架法在所有方法中最具有參考性,它提供一個本體構建的方法學框架,所以本文使用數(shù)據(jù)倉庫中的一些相關技術、數(shù)據(jù)挖掘中決策樹的分類與預測的技術,以骨架法的中心思想作為參考和指導方針來構建領域本體,最后對構建好的本體模型進行文檔化。以下提到的本體均指領域本體。
1決策樹的相關知識
決策樹是一種類似于流程圖的樹結(jié)構;其中,每個內(nèi)部節(jié)點(非樹葉節(jié)點)表示在一個屬性上的測試,每個分枝代表一個測試輸出,而每個樹葉節(jié)點(終點)存放一個類標號,樹的最頂層節(jié)點是根節(jié)點。在本體的構建過程中樹節(jié)點代表類或者屬性,節(jié)點間的連接線代表類與類或者類與屬性或者屬性與屬性之間的關系,即可傳遞性、單繼承性。決策樹的構造不需要任何領域知識或參數(shù)設置,因此適合于探測知識發(fā)現(xiàn);獲取的知識用樹的形式表示是直觀的,并且容易被人理解;決策樹歸納的學習和分類步驟是簡單和快速的;一般情況下,決策樹分類器具有很好的準確率。
1.1骨架法方法的研究
骨架法(MikeUsholddede&KingUsc95)又稱ENTERISE法,是英國愛丁堡大學人工智能應用研究所根據(jù)用于企業(yè)建摸的Enter-priseOntology所得出來的。
1.2骨架法的步驟:
a.確定構建本體的目的和范圍;b.構建本體;c.本體評估;d.文檔化本文使用數(shù)據(jù)倉庫中的一些相關技術、數(shù)據(jù)挖掘中分類與預測的決策樹技術,以骨架法的中心思想作為參考和指導方針來構建領域本體,最后對構建好的本體根據(jù)決策數(shù)提取規(guī)則的特點進行文檔化。
2構建本體的過程———以構建現(xiàn)代交通工具本體為例
2.1領域需求分析
領域需求分析是構建本體的重要階段,沒有充足的領域分析就不可能構建出好的本體.交通工具是為了滿足人們出行的需求而研制的,并且在不段的發(fā)展變化。所以在進行領域分析的時候要以發(fā)展創(chuàng)造的觀點來進行領域需求分析,即進行領域分析的同時要進行趨勢的預測。層次一:客觀描述與記錄(objectivedescriptionandrecord)———對領域需求進行精確、全面地搜集與記錄客戶的需求或相關的業(yè)務、數(shù)據(jù)。層次二:模式歸納與發(fā)現(xiàn)(patternsinductionanddiscovery)———按照一定的建模方法論及框架進行歸納\建模,并盡量揭示在包含在快照的客觀記述中并非顯而易見的模式或規(guī)律;層次三:模式分析與預測(patternsanalysisandinnovation)———在現(xiàn)存模式的基礎上總結(jié)不同模式背后隱含的規(guī)律,研究應用對需求的異化作用,發(fā)覺深層次規(guī)律,預測需求變化,揭示新的工作方式,創(chuàng)建新的、有價值的模式。
2.2利用決策樹算法創(chuàng)建本體
本體模型的表示形式有多種,這里采用分類決策樹來表示;本體的生成方法有三種,這里采用自頂向下的生成方法。根據(jù)領域需求分析,經(jīng)過屬性的不斷疊加、迭代,得到本體的決策樹。
2.2.1領域本體集成。領域本體集成的關鍵技術是本體映射,而本體映射定義一套規(guī)則,指明一個本體中的術語在另一個本體中的相關含義,由中介(mediator)在應用程序運行時執(zhí)行。本體決策樹所提取的規(guī)則之間都是互斥的,每個樹葉都有一個規(guī)則,并且任何一個屬性都只能映射到一個樹葉。
2.2.2本體構建工具。在這里使用Protégé,它是由斯坦福大學研制開發(fā)的、基于Java環(huán)境的本體開發(fā)工具,它允許用戶自己定制知識獲取界面的特點來構建本體。
2.3本體評估
本體構建過程中使用決策樹構建的原理,使用分類決策樹所構建的本體具有很多優(yōu)點,如下;利用分類決策樹所構建本體的學習和分類步驟是簡單和快速的,而且本體類中屬性的分類具有很好的準確率;這種本體的構建適合于探測知識發(fā)現(xiàn);本體分類決策樹模型表示是直觀的,并且容易被人理解。
2.4文檔化
對上面本體的分類決策樹模型使用IF-THEN規(guī)則分類。使用IF-THEN規(guī)則得到文檔圖,每一條分支為一個元組,所有的分支數(shù)為數(shù)據(jù)集|D|,設ncovers為乘坐R交通工具的元組數(shù),ncorrect為正確分類的元組數(shù),則我們可以得到乘坐這種交通工具的覆蓋率和準確率,公式:Coverage(R)=ncovers/|D|,Accuracy(R)=ncorrect/ncovers,結(jié)果如表1所示。
結(jié)束語
領域本體的構建是一個增量迭代的開發(fā)過程,也是一個創(chuàng)造性的過程,對任何專業(yè)領域來說,由于應用平臺不同,設計者對專業(yè)領域的理解不同,構建出來的本體也不同。本文提出的是以骨架法作為參考,運用數(shù)據(jù)挖掘中有關分類與預測的決策樹技術來實現(xiàn)一種具體的領域本體構建方法,希望對大家在本體開發(fā)方面有些參考性。