前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經網絡基本知識主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞:功率放大器; 預失真技術; 神經網絡; 單入雙出; 互調失真
中圖分類號:TP18 文獻標識碼:A
文章編號:1004-373X(2010)09-0107-05
Research of Self-adaptive Digital Predistortion Technology Based on SIDO-neural Network
QIU Wei, LIU Yu-peng, ZHANG Lei-lei
(The base of China Ocean Measure, Jiangyin 214431, China)
Abstract: Because of inherent nonlinearity of high-power amplifier, which may cause bad influence on communication systems, it is necessary to make a linearization processing to overcome or weaken it. The math analysis of nonlinear distortion for the high-power amplifier(HPA) is performed. The basic principle of digital predistortion and the foundamental knowledge of neural network are described. A self-adaptive digital predistortion technology based on SIDO-neural network is proposed according to the amplifying amplitude and the distortion characteristic of phase, which can be improved by the technology. Taking a double-sound signal and 16QAM signal as an example, the Matlab simulation is carried out, The result proves that this technology is superior.
Keywords: power amplifier; predistortion technology; neural network; SIDO; intermodulation distortion
0 引 言
無線通信技術迅猛發展,人們對通信系統的容量要求也越來越大。為了追求更高的數據速率和頻譜效率,現代通信系統都普遍采用線性調制方式,如16QAM和QPSK方式,以及多載波配置[1]。
但這些技術產生的信號峰均比都較大,均要求功率放大器具有良好的線性特性,否則就會出現較大的互調失真,同時會導致頻譜擴展,造成臨道干擾,使誤碼率惡化,從而降低系統性能。
預失真技術是一項簡單易行的功放線性化技術,具有電路形式簡單,調整方便,效率高,造價低等優點[2]。其中,基帶預失真還能采用現代的數字信號處理技術,是最為看好的一項功放線性化技術。這里利用一種簡單的單入雙出三層前向神經網絡來進行自適應預失真處理,同時補償由高功率放大器非線性特性引起的幅度失真和相位失真,從而實現其線性化。
文中分析了基于這種結構的自適應算法,并做了相應的仿真。仿真結果表明,該方法能有效克服功放的非線性失真,且收斂速度比一般多項式預失真更快,具有一定的優勢。
1 高功率放大器非線性分析
高功率放大器一般都是非線性器件,特別是當輸入信號幅度變化較大時,放大器的工作區將在飽和區、截止區、放大區之間來回轉換,非線性失真嚴重,會產生高次諧波和互調失真分量。由于理論上任何函數都可以分解為多項式的形式,故放大器的輸入和輸出關系表示為:
Vo=a1Vi+a2V2i+a3V3i+…+anVni(1)
假設輸入的雙音信號為:
Vi=V1cos(ω1t)+V2cos(ω2t)(2)
把式(2)代入式(1),得到輸出電壓為:
Vo=a22(V21+V22)+a1V1+a334V31+32V1V22+…cos(ω1t)+a2V2+a334V32+32V2V21+…cos(ω2t)+12a2V21+…cos(2ω1t)+12a2V22+…cos(2ω2t)+14a3V31+…cos(3ω1t)+14a3V32+…cos(3ω2t)+a2V1V2[cos(ω1+ω2)t+cos(ω1-ω2)t]+34a3V21V2[cos(2ω1+ω2)t+cos(2ω1-ω2)t]+
34a3V22V1[cos(2ω2+ω1)t+cos(2ω2-ω1)t]+58a5V31V22cos(3ω2-2ω1)t+58a5V21V32cos(3ω1-2ω2)t+…
從上式可以看出,輸出信號中不僅包含了2個基頻ω1,ω2,還產生了零頻,2次及高次諧波以及互調分量。通常2ω1-ω2,2ω2-ω1,3ω1-2ω2和2ω1-3ω2會落在通頻帶內,一般無法濾除,是對通信影響最大的非線性失真分量,即所謂的三階互調和五階互調。放大器線性化的目標就是在保證一定效率的前提下最大地減小┤階和┪褰諄サ鞣至俊
2 預失真基本原理及其自適應
預失真就是在信號通過放大器之前通過預失真器對信號做一個與放大器失真特性相反的失真,然后與放大器級聯,從而保證輸出信號相對輸入信號是線性變化。預失真器產生一個非線性的轉移特性,這個轉移特性在相位上與放大器轉移特性相反,實質上就是一個非線性發生器。其原理圖如圖1所示。
圖1 預失真基本原理
預失真器的實現通常有查詢表法和非線性函數兩種方式[2]。由于查表法結構簡單,易于實現,早期的預失真多采用此方法,但它對性能的改善程度取決于表項的大小,性能改善越大,需要的表項越大,所需要的存儲空間也越大,每次查找遍歷表項的每個數據和更新表項所需要的時間和計算時間也越長,因此在高速信息傳輸的今天已經不可取。非線性函數法是用一個非線性工作函數來擬合放大器輸出信號采樣值及其輸入信號的工作曲線,然后根據預失真器特性與放大器特性相反,求出預失真器的非線性特性函數,從而對發送信號進行預失真處理。這種方法只需要更新非線性函數的幾個系數,而不需要大的存儲空間,因此是近年來研究的熱點。
假設預失真器傳輸函數為F(x),放大器傳輸函數為G(x),F和G均為復函數。若輸入信號為x(t),則經過預失真器之后的信號為u(t)=F[x(t)],放大器輸出函數為y(t)=G[u(t)]=G{F[x(t)]},預失真的目的就是使x(t)通過預失真器和放大器級聯后輸出y(t)=ax(t),a為放大器增益。通過一定的方法可以找到合適的F,使實際輸出和期望輸出的誤差最小。
由于溫度、電器特性、使用環境等因素的不斷變化,放大器的傳輸特性也會發生變化,從而預失真器傳輸函數F(x)的各參數也會隨之而變化,因此現代數字預失真技術一般都要采用自適應技術以跟蹤調整參數的變化。目前常用的兩種自適應預失真結構如圖2、圖3所示。
圖2 自適應預失真系統結構圖
圖3 復制粘帖式自適應預失真系統結構圖
圖2是一般的通用自適應結構,結構簡單,思路明確,但一些經典的自適應算法由于多了放大器求導項而不能直接應用,且需要辨識放大器的傳輸特性,而圖3的復制粘帖式結構(非直接學習)則不存在這些問題,關于這種結構的優缺點比較和具體性能分析見文獻[3]。本文將采用后一種自適應結構。
3 基于一種單入雙出式神經網絡的自適應預失真技術
3.1 神經網絡
神經網絡是基于生物學神經元網絡的基本原理而建立的。它是由許多稱為神經元的簡單處理單元組成的一類自適應系統,所有神經元通過前向或回饋的方式相互關聯、相互作用。由Minsky和Papert提出的多層前向神經元網絡是目前最為常用的網絡結構,已廣泛應用到模式分類和函數逼近中,且已證明含有任意多個隱層神經元的多層前向神經元網絡可以逼近任意的連續函數[4]。本文利用神經網絡的這種功能來擬合預失真器的特性曲線,并且用改進的反向傳播算法來自適應更新系數。
多層前向神經元網絡由輸入層、一個或多個隱層和輸出層并以前向方式連接而成,其每一層又由許多人工神經元組成,前一層的輸出作為下一層神經元的輸入數據。三層前向神經元網絡示意圖如圖4所示,其中輸入層有M個人工神經元,隱層有K個神經元,輸出層有N個神經元。關于人工神經元的具體介紹參考文獻[5-6]。
圖4 三層前向神經元網絡
3.2 基于單入雙出式神經網絡的自適應預失真系統模型
對于圖5所示的單入雙出式三層前向神經網絡,假設隱層包含K個神經元。輸入數據經過一系列權系數{w11,w12,…w1K}加權后到達隱層的各個神經元。隱層中的神經元將輸入進來的數據通過一個激勵函數(核函數),將其各神經元的輸出經過一系列權系數{w21,w22,…,w2K}和{w31,w32,…,w3K}加權并求和后分別作為輸入層第一個神經元和第二個神經元的輸入,然后各神經元的輸入通過激勵函數得到兩個輸出。
將圖5代替圖3中的函數發生器,即得到本文中所提到的基于單入雙出式前向神經網絡的預失真器結構圖,如圖6所示。
神經網絡的三組系數向量開始都隨機初始化。設輸入序列為xi(i=1,2,…),通過幅度提取和相位提取后得到信號的幅度序列和相位序列。若神經網絡的輸入為原始輸入序列的幅度序列ri(i=1,2,…),則隱層各單元輸入I1k=w1kri-θ1k。經過核函數后,隱層各單元的輸出為J1k=f(I1k),其中f(x)=11+e-x為核函數,輸出層的靜輸入為z1=∑Kk=1w2k*J1k-θ1,z2=∑Kk=1w3k*J1k-θ2,輸出層神經元1的輸出,即預失真器幅度預失真分量為U1=f(z1)。
圖5 單入雙出三層前向神經元網絡
圖6 單入雙出式前向神經網絡預失真器結構圖
由于相位失真分量的輸出范圍沒有限制在0和1之間,因此不能用核函數加以限制,這里設定輸出層神經元2的輸出等于其輸入,即預失真器相位預失真分量為U2=z2,最后預失真后的幅度和相位和的指數相乘得到送入功放的復信號。功率放大器的輸出信號設為yi(i=1,2,…),其幅度和相偏分別為yai(i=1,2,…)和ypi(i=1,2,…)。最后整個系統的幅度絕對誤差為ea(i)=Gri-ya(i),相位絕對誤差為ep(i)=U2(i)+yp(i),整個系統的絕對誤差和為e(i)=ea(i)+ep(i),然而直接把此誤差運用到反向傳播算法(BP算法)中會導致算法出現局部收斂且收斂速度極慢。因此本文對誤差信號做了改進,即把誤差信號改為:
e(i)=12[λ(ea(i)]2+(1-λ)φ[ea(i)]+
λ[ep(i)]2+(1-λ)φ[ep(i)]
其中:φ(x)=In[cos(βx)]/β,加入的調整因子λ和輔助項φ,能把算法從局部收斂點拉出來,且收斂速度得到一定的提高。最后根據反向傳播算法,得到訓練神經網絡的權系數更新式如下(下標2為隱層到輸出層權系數,下標1為輸入層到隱層權系數):
δ2a(i)=ca(i)*[1+U1(i)]*[1-U1(i)](3)
δ2p(i)=cp(i)(4)
w2(i)=α*δ2a(i)*J1+η*w2(i-1)(5)
θ2(i)=α*δ2a(i)+η*θ2(i-1)(6)
w3(i)=-α*δ2p(i)*J1+η*w3(i-1)(7)
θ3(i)=-α*δ2p(i)+η*θ2(i-1)(8)
δ1(i)=(δ2a(i)*w2-δ2p(i)*w3)*
J1(i)*[1-J1(i)](9)
w1(i)=β*δ1(i)*ri+η*w1(i-1)(10)
θ1(i)=β*δ1(i)+η*θ1(i)(11)
式中:ca(i)=λea(i)-1-λ2tan[β*ea(i)];cp(i)=λ*ep(i)-1-λ2tan[β*ep(i)]。
預失真權系數可分為訓練和跟蹤兩個階段。根據上面的迭代公式,得到一組訓練神經網絡的權系數,用當前的權系數替代預失真器神經網絡中原來的權系數,得到一組新的預失真系數,之后重新計算誤差,繼續上面的過程循環迭代運算,直到誤差小于規定的范圍,即整個系統收斂,則預失真器訓練完成,此時為訓練階段。之后隨著溫度、輸入的調制信號不同,以及環境等變化可能引起功放特性的變化,可以設置一個誤差門限值,一旦發現誤差超過此門限,立即重新啟動上面的循環迭代,重新訓練,直到滿足條件,此時為跟蹤階段。這種改進型BP算法的收斂速度快,能滿足實時運算的要求。同時在硬件實現上,只要做一個核函數發生器,其他都是乘累加運算,硬件實現要簡單得多,因此具有一定的實用性。
4 性能仿真
文中使用雙音信號進行了仿真分析,雙音信號為:
xs=0.5[sin(2π×10×t)+sin(2π×8×t)]
放大器模型采用經典salef[9]模型,神經網絡的隱層數設為15。圖7為雙音信號原始頻譜。
圖8是為雙音信號直接通過放大器和通過文中所提的預失真網絡后再通過放大器的頻譜圖對比。由此可見,雙音信號直接通過放大器后產生了較大的失真,其中的三階互調達到了-16 dB,五階互調也有-29 dB。通過對文中所提神經網絡預失真系統進行處理后,即信號通過預失真器再通過放大器后,三階互調被抑制到-42 dB,五階互調也被抑制到-48 dB以下,此時三階互調改善26 dB,五階互調改善19 dB,使放大器的非線性失真得到較大的抑制。
圖7 原始信號歸一化頻譜圖
圖8 預失真前后信號歸一化頻譜圖
下面以16QAM信號為例,說明這種預失真技術對功放非線性特性的改善,如圖9所示。
圖9(a)為16QAM信號規則星座圖,調制信號均勻地分布在正方形的16個點上;圖9(b)為16QAM信號經過功率放大器后解調的星座圖。由圖可見,信號經過放大器后,幅度受到壓縮,相位發生偏移,并且輸入信號幅度越大,輸出信號幅度壓縮越大,相位偏移越嚴重,最后出現嚴重的“云團效應”,使得接收端不能正確解調信號。圖9(c)是經過本節所提出的單入雙出式神經網絡預失真器處理后解調信號的星座圖。由圖可見,經過預失真處理后,由于放大器非線性引起的幅度壓縮和相位旋轉都得到較好的糾正,“云團效應”明顯減弱,最后各個點基本都在理想點上,與┩9(a)對比,基本消除了失真。
5 結 語
針對放大器固有的非線性特性問題,從數學上分析了放大器的非線性失真,介紹了基于預失真基本原理和神經網絡基本概念,提出了一種單入雙出式神經網絡自適應預失真技術。仿真結果表明,該技術能對三階互調能抑制29 dB左右,對五階互調能抑制19 dB左右,對QAM調制信號由于放大器非線性引起的幅度壓縮和相位旋轉都得到較好的糾正,在很大程度上克服了放大器非線性特性,改善了通信系統的性能。
圖9 16QAM信號星座圖失真及改善對比
參考文獻
[1]趙慧,漆蘭芬.射頻放大器的工作函數預失真線性化[J].無線電工程,2001,31(12):58-61.
[2]賈建華,劉戰勝.關于自適應預失真射頻功率放大器線性化研究[J].微波學報,2005,21(3):48-50.
[3]錢業青.一種高效的用于RF功率放大器線性化的自適應預失真結構[J].通信學報,2006,27(5):35-40,46.
[4]CYBENKO G. Approximations by superpositions of a sigmoidal function[J]. Mathematics of Control, Signals and Systems, 1989(2): 183-192.
[5]劉寶碇,趙瑞清,王綱.不確定規劃及應用[M].北京:清華大學出版社,2003.
[6]朱劍英.只能系統非經典數學方法[M].武漢:華中科技大學出版社,2001.
[7]WU Shan-yin, SIMON H S F, WONG Y M. The use of nonlinear curvefitting in digital predistortion for linearizing RF power amplifiers[J]. IEEE ICICS, 2005, 3: 960-963.
[8]GLENTIS G O, BERBERDIS K, THEODORIDID S. Efficient least sqares adaptive algorithms for FIR transversal filtering[J].IEEE Signal Processing Magazine,1999,16(4):13-41.
關鍵詞:繼電保護;供電系統;原理
在電力系統中,各種類型的、大量的電氣設備通過電氣線路緊密地聯結在一起。由于其覆蓋的地域廣闊、運行環境又很復雜以及各種人為因素的影響,電氣故障的發生是不可避免的。在電力系統中任何一處發生事故,都有可能對電力系統的運行產重大影響,因此繼電保護系統就是電力系統中的一個重要環節。
1 繼電保護裝置類型
1.1 距離保護
所謂距離保護是指相同故障、接地故障時采取的保護措施。當故障發生后,如相同短路、單相接地、缺相運行籌故障,CPU首先會接到相應回路點發來的中斷信號,然后根據其中所包含的故障信息作出相應的判斷,并向執行部件發出動作指令。
1.2 零序保護邏輯
當系統出現某相接地發生零序保護元件發出開口三角電壓UO,而軟件可根據三相電壓信號自產出U=Ua+Uh+Uc 若Ua+Uh+Uc=U不成立,而U≠0,則故障仍采用U:若UO=O則采用UO。
1.3 負荷控制通常
此邏輯中,根據各回路中的負荷情況,將數據進行匯總向上級電業部門進行報送,當出現電力負荷不均衡時,電力部門按照有關規定,根據負荷等級向用電部門發出指令進行統一調配,單片機在此進行數據匯總,并與上級電業管理部門進行通訊郵遞聯絡。三相重合閘該邏輯用于同路中突發性短時故障時,故障發能在發生后自動消除情況下,若再次送電不會發生故障時能及時恢復電網供電,此類故障,如相間因細小的金屬線等雜物短路,當金屬線燒短后,再次送電并不影響系統正常運行。
2 繼電器保護裝置的功能
在供電系統中運行正常時,它應能完善地、安全地監視各種設備的運行狀況,為值班人員提供可靠的運行依據;如供電系統中發生故障時,它應能自動地、迅速地、有選擇性地切除故障部分,保證非故障部分繼續運行;當供電系統中出現異常運行工作狀況時,它應能及時地、準確地發出信號或警報,通知值班人員盡快做出處理;對繼電保護裝置的基本要求。對繼電保護裝置的基本要求主要有四點:即選擇性、靈敏性、速動性和可靠性。
2.1 選擇性
當供電系統中發生故障時,繼電保護裝置應能有選擇性地將故障部分切除。也就是它應該首先斷開距離故障點最近的斷路器,以保證系統中其它非故障部分能繼續正常運行。系統中的繼電保護裝置能滿足上述要求的,就稱為有選擇性否則就稱為沒有選擇性。
2.2 速動性
速動性是指保護裝置應能盡快地切除短路故障縮短切除故障的時間,就可以減輕短電流對電氣設備的損壞程度,加快系統電壓的恢復,從而為電氣設備的自啟動創造了有利條件,同時還提高了發電機并列運行的穩定性。所謂故障的切除時間是指保護裝置的動作時間與斷路器的跳閘時間之和。由于斷路器一經選定,其跳閘時間就已確定,目前我國生產的斷路器跳閘時間均在O.02S以下。所以實現速動性的關鍵是選用保護裝置應能快速動作。保護裝置應能正確的動作,并隨時處于準備狀態。如不滿足可靠性的要求,保護裝置反而成為了擴大事故或直接造成故障的根源。為確保保護裝置動作的可靠性,則要求保護裝置的設計原理、整定計算、安裝調試要正確無誤;同時要求組成保護裝置的各元件的質量要可靠、運行維護要得當、系統應盡可能的簡化有效,以提高保護的可靠性。
3 繼電器保護的應用分析
3.1 繼電保護的網絡自動化
隨著計算機硬件的迅猛發展,微機保護硬件也在不斷發展。電力系統對微機保護的要求不斷提高,除了保護的基本功能外,還應具有大容量的故障信息和數據的長期存放空間,快速的數據處理功能,強大的通信能力,與其它保護、控制裝置和調度聯網以共享全系統數據,信息和網絡資源的能力,高級語言編程。計算機網絡作為信息和數據通信工程已成為信息時代的技術支柱,使人類生產和社會生活的面貌發生了重大變化,微機保護裝置網絡化可大大提高保護性能和可靠性,這是微機保護發展的必然趨勢。在實現繼電保護的計算機化和網絡化的條件下,保護裝置實際上就是一臺高性能、多功能的計算機,是整個電力系統計算機網絡上的一個智能終端。它可從網上獲取電力系統運行和故障的任何信息和數據,也可將它所獲得的被保護元件的任何信息和數據傳送給網絡控制中心或任一終端。因此,每個微機保護裝置不但可完成繼電保護功能,而且在無故障正常運行隋況下還可完成測量、控制、數據通信功能亦即實現保護、控制、測量、數據通信一體化。
3.2 繼電保護的智能化
近年來,人工智能技術如神經網絡、遺傳算法、進化規劃、模糊邏輯等在電力系統各個領域得到了廣泛的應用,在繼電保護領域應用的研究也已開始。神經網絡是一種非線性映射的方法,很多難以列出方程式或難以求解的復雜的非線性問題,應用神經網絡方法則可迎刃而解。
4 如何提高繼電保護技術
掌握相關技術知識,電子技術知識,由于電網中微機保護的使用越來越多,作為一名繼電保護工作者,學好電子技術及微機保護知識是當務之急。微機保護的原理和組成,為了根據保護及自動裝置產生的現象分析故障或事故發生的原因,迅速確定故障部位,工作人員必須具備微機保護的基本知識,必須全面掌握和了解保護的基本原理和性能,熟記微機保護的邏輯框圖,熟悉電路原理和元件功能。具備相關技術資料,要順利進行繼電保護事故處理,離不開諸如檢修規程、裝置使用與技術說明書、調試大綱和調試記錄、定值通知單、整組調試記錄,二次回路接線圖等資料。運用正確的檢查方法。一般繼電保護事故往往經過簡單的檢查就能夠被查出,如果繹過一些常規的檢查仍未發現故障元件,說明該故障較為隱蔽,應當引起充分重視,對此可采用逐級逆向檢查法,即從故障現象的暴露點入手去分析原因,由故障原因判斷故障范圍。如果仍不能確定故障原因,就采用順序檢查法,對裝置進行全面檢查。掌握微機保護事故處理技巧,在微機保護的事故處理中,以往的經驗是非常寶貴的,它能幫助工作人員快速消除重復發生的故障,但技能更為重要。
5 結束語
這里從微機保護自身特點和現場實際經驗出發,結合長期處理繼電保護事故的故障的經驗和方法,對微機保護發生事故或故障的共性原因進行了一般性分類,并在一定范圍內總結了處理事故的思路及方法,介紹了提高處理事故和故障能力的基本途徑。
參考文獻:
關鍵詞: 語音識別; 識別原理; 聲學建模方法; 多維模式識別系統
中圖分類號: TN912.3?34 文獻標識碼: A 文章編號: 1004?373X(2013)13?0043?03
Summary of speech recognition technology and its application
YU Lin?lin
(Naval Aviation Military Representative Office Stationed in Beijing, Beijing 100041, China)
Abstract: As a key technology of human?computer interface in information technology, speech recognition has great research significance and broad application value. the development history of speech recognition technology is introduced, the basic knowledge of speech recognition is expounded, such as concept, basic principle, the acoustic modeling approach. The application of speech recognition technology in various fields are briefly introduced.
Keywords: speech recognition; recognition principle; acoustic modeling approach; multi?dimension pattern recognition system
0 引 言
語言是人類相互交流最常用、最有效、最重要和最方便的通信形式,語音是語言的聲學表現,與機器進行語音交流是人類一直以來的夢想。隨著計算機技術的飛速發展,語音識別技術也取得突破性的成就,人與機器用自然語言進行對話的夢想逐步接近實現。語音識別技術的應用范圍極為廣泛,不僅涉及到日常生活的方方面面,在軍事領域也發揮著極其重要的作用。它是信息社會朝著智能化和自動化發展的關鍵技術,使人們對信息的處理和獲取更加便捷,從而提高人們的工作效率。
1 語音識別技術的發展
語音識別技術起始于20世紀50年代。這一時期,語音識別的研究主要集中在對元音、輔音、數字以及孤立詞的識別。
20世紀60年代,語音識別研究取得實質性進展。線性預測分析和動態規劃的提出較好地解決了語音信號模型的產生和語音信號不等長兩個問題,并通過語音信號的線性預測編碼,有效地解決了語音信號的特征提取。
20世紀70年代,語音識別技術取得突破性進展。基于動態規劃的動態時間規整(Dynamic Time Warping, DTW)技術基本成熟,特別提出了矢量量化(Vector Quantization,VQ)和隱馬爾可夫模型(Hidden Markov Model,HMM)理論[1]。
20世紀80年代,語音識別任務開始從孤立詞、連接詞的識別轉向大詞匯量、非特定人、連續語音的識別,識別算法也從傳統的基于標準模板匹配的方法轉向基于統計模型的方法。在聲學模型方面,由于HMM能夠很好的描述語音時變性和平穩性,開始被廣泛應用于大詞匯量連續語音識別(Large Vocabulary Continous Speech Recognition, LVCSR)的聲學建模[2?3];在語言模型方面,以N元文法為代表的統計語言模型開始廣泛應用于語音識別系統[4]。在這一階段,基于HMM/VQ、HMM/高斯混合模型、HMM/人工神經網絡的語音建模方法開始廣泛應用于LVCSR系統,語音識別技術取得新突破。
20世紀90年代以后,伴隨著語音識別系統走向實用化,語音識別在細化模型的設計、參數提取和優化、系統的自適應方面取得較大進展[5]。同時,人們更多地關注話者自適應、聽覺模型、快速搜索識別算法以及進一步的語言模型的研究等課題[6]。此外,語音識別技術開始與其他領域相關技術進行結合,以提高識別的準確率,便于實現語音識別技術的產品化。
2 語音識別基礎
2.1 語音識別概念
語音識別是將人類的聲音信號轉化為文字或者指令的過程[7]。語音識別以語音為研究對象,它是語音信號處理的一個重要研究方向,是模式識別的一個分支。語音識別的研究涉及微機技術、人工智能、數字信號處理、模式識別、聲學、語言學和認知科學等許多學科領域,是一個多學科綜合性研究領域[8]。
根據在不同限制條件下的研究任務,產生了不同的研究領域。這些領域包括:根據對說話人說話方式的要求,可分為孤立字(詞)、連接詞和連續語音識別系統;根據對說話人的依賴程度,可分為特定人和非特定人語音識別系統;根據詞匯量的大小,可分為小詞匯量、中等詞匯量、大詞匯量以及無限詞匯量語音識別系統。
2.2 語音識別基本原理
從語音識別模型的角度講,主流的語音識別系統理論是建立在統計模式識別基礎之上的。語音識別的目標是利用語音學與語言學信息,把輸入的語音特征向量序列[X=x1,x2,…,xT]轉化成詞序列[W=w1,w2,…,wN]并輸出。基于最大后驗概率的語音識別模型如下式所示:
[W=argmaxW{P(W|X)}=argmaxWP(W|X)P(W)P(X)=argmaxW{P(X|W)P(W)}=argmaxW{logP(X|W)+λlogP(W)}]
上式表明,要尋找的最可能的詞序列[W],應該使[P(X|W)]與[P(W)]的乘積達到最大。其中,[P(X|W)]是特征矢量序列[X]在給定[W]條件下的條件概率,由聲學模型決定。[P(W)]是[W]獨立于語音特征矢量的先驗概率,由語言模型決定。由于將概率取對數不影響[W]的選取,第四個等式成立。[logP(X|W)]與[logP(W)]分別表示聲學得分與語言得分,且分別通過聲學模型與語言模型計算得到。[λ]是平衡聲學模型與語言模型的權重。從語音識別系統構成的角度講,一個完整的語音識別系統包括特征提取、聲學模型、語言模型、搜索算法等模塊。語音識別系統本質上是一種多維模式識別系統,對于不同的語音識別系統,人們所采用的具體識別方法及技術不同,但其基本原理都是相同的,即將采集到的語音信號送到特征提取模塊處理,將所得到的語音特征參數送入模型庫模塊,由聲音模式匹配模塊根據模型庫對該段語音進行識別,最后得出識別結果[9]。
語音識別系統基本原理框圖如圖1所示,其中:預處理模塊濾除原始語音信號中的次要信息及背景噪音等,包括抗混疊濾波、預加重、模/數轉換、自動增益控制等處理過程,將語音信號數字化;特征提取模塊對語音的聲學參數進行分析后提取出語音特征參數,形成特征矢量序列。語音識別系統常用的特征參數有短時平均幅度、短時平均能量、線性預測編碼系數、短時頻譜等。特征提取和選擇是構建系統的關鍵,對識別效果極為重要。
圖1 語音識別基本原理框圖
由于語音信號本質上屬于非平穩信號,目前對語音信號的分析是建立在短時平穩性假設之上的。在對語音信號作短時平穩假設后,通過對語音信號進行加窗,實現短時語音片段上的特征提取。這些短時片段被稱為幀,以幀為單位的特征序列構成語音識別系統的輸入。由于梅爾倒譜系數及感知線性預測系數能夠從人耳聽覺特性的角度準確刻畫語音信號,已經成為目前主流的語音特征。為補償幀間獨立性假設,人們在使用梅爾倒譜系數及感知線性預測系數時,通常加上它們的一階、二階差分,以引入信號特征的動態特征。
聲學模型是語音識別系統中最為重要的部分之一。聲學建模涉及建模單元選取、模型狀態聚類、模型參數估計等很多方面。在目前的LVCSR系統中,普遍采用上下文相關的模型作為基本建模單元,以刻畫連續語音的協同發音現象。在考慮了語境的影響后,聲學模型的數量急劇增加,LVCSR系統通常采用狀態聚類的方法壓縮聲學參數的數量,以簡化模型的訓練。在訓練過程中,系統對若干次訓練語音進行預處理,并通過特征提取得到特征矢量序列,然后由特征建模模塊建立訓練語音的參考模式庫。
搜索是在指定的空間當中,按照一定的優化準則,尋找最優詞序列的過程。搜索的本質是問題求解,廣泛應用于語音識別、機器翻譯等人工智能和模式識別的各個領域。它通過利用已掌握的知識(聲學知識、語音學知識、詞典知識、語言模型知識等),在狀態(從高層至底層依次為詞、聲學模型、HMM狀態)空間中找到最優的狀態序列。最終的詞序列是對輸入的語音信號在一定準則下的一個最優描述。在識別階段,將輸入語音的特征矢量參數同訓練得到的參考模板庫中的模式進行相似性度量比較,將相似度最高的模式所屬的類別作為識別中間候選結果輸出。為了提高識別的正確率,在后處理模塊中對上述得到的候選識別結果繼續處理,包括通過Lattice重打分融合更高元的語言模型、通過置信度度量得到識別結果的可靠程度等。最終通過增加約束,得到更可靠的識別結果。
2.3 聲學建模方法
常用的聲學建模方法包含以下三種:基于模式匹配的動態時間規整法(DTW);隱馬爾可夫模型法(HMM);基于人工神經網絡識別法(ANN)等。
DTW 是較早的一種模式匹配的方法。它基于動態規劃的思想,解決孤立詞語音識別中的語音信號特征參數序列比較時長度不一的模板匹配問題。在實際應用中,DTW通過計算已預處理和分幀的語音信號與參考模板之間的相似度,再按照某種距離測度計算出模板間的相似度并選擇最佳路徑。
HMM是對語音信號的時間序列結構所建立的統計模型,是在馬爾可夫鏈的基礎上發展起來的,它是一種基于參數模型的統計識別方法。HMM可模仿人的言語過程,可視作一個雙重隨機過程:一個是用具有有限狀態數的馬爾可夫鏈來模擬語音信號統計特性變化的隱含的隨機過程,另一個是與馬爾可夫鏈的每一個狀態相關聯的觀測序列的隨機過程[10]。
ANN以數學模型模擬神經元活動,將人工神經網絡中大量神經元并行分布運算的原理、高效的學習算法以及對人的認知系統的模仿能力充分運用到語音識別領域,并結合神經網絡和隱含馬爾可夫模型的識別算法,克服了ANN在描述語音信號時間動態特性方面的缺點,進一步提高了語音識別的魯棒性和準確率。其中成功的方法就是在混合模型中用ANN替代高斯混合模型估計音素或狀態的后驗概率。2011年,微軟以深度神經網絡替代多層感知機形成的混合模型系統大大提高了語音識別的準確率。
3 語音識別的應用
語音識別技術有著非常廣泛的應用領域和市場前景。在語音輸入控制系統中,它使得人們可以甩掉鍵盤,通過識別語音中的要求、請求、命令或詢問來作出正確的響應,這樣既可以克服人工鍵盤輸入速度慢,極易出差錯的缺點,又有利于縮短系統的反應時間,使人機交流變得簡便易行,比如用于聲控語音撥號系統、聲控智能玩具、智能家電等領域。在智能對話查詢系統中,人們通過語音命令,可以方便地從遠端的數據庫系統中查詢與提取有關信息,享受自然、友好的數據庫檢索服務,例如信息網絡查詢、醫療服務、銀行服務等。語音識別技術還可以應用于自動口語翻譯,即通過將口語識別技術、機器翻譯技術、語音合成技術等相結合,可將一種語言的語音輸入翻譯為另一種語言的語音輸出,實現跨語言交流[11]。
語音識別技術在軍事斗爭領域里也有著極為重要的應用價值和極其廣闊的應用空間。一些語音識別技術就是著眼于軍事活動而研發,并在軍事領域首先應用、首獲成效的,軍事應用對語音識別系統的識別精度、響應時間、惡劣環境下的頑健性都提出了更高的要求。目前,語音識別技術已在軍事指揮和控制自動化方面得以應用。比如,將語音識別技術應用于航空飛行控制,可快速提高作戰效率和減輕飛行員的工作負擔,飛行員利用語音輸入來代替傳統的手動操作和控制各種開關和設備,以及重新改編或排列顯示器上的顯示信息等,可使飛行員把時間和精力集中于對攻擊目標的判斷和完成其他操作上來,以便更快獲得信息來發揮戰術優勢。
4 結 語
語音識別的研究工作對于信息化社會的發展,人們生活水平的提高等方面有著深遠的意義。隨著計算機信息技術的不斷發展,語音識別技術將取得更多重大突破,語音識別系統的研究將會更加深入,有著更加廣闊的發展空間。
參考文獻
[1] 馬志欣,王宏,李鑫.語音識別技術綜述[J].昌吉學院學報,2006(3):93?97.
[2] RABINER L R, JUANG B H. An introduction to hidden Markov models [J]. IEEE ASSP Magazine, 1986, 3(1): 4?16.
[3] GALES M, YOUNG S. The application of hidden Markov models in speech recognition [J]. Foundations and Trends in Signal Processing, 2008, 1(3): 195?304.
[4] JELINEK F. Continuous speech recognition by statistical methods [J]. Proceedings of the IEEE, 1976, 64(4): 532?556.
[5] 倪崇嘉,劉文舉,徐波.漢語大詞匯量連續語音識別系統研究進展[J].中文信息學報,2009,23(1):112?123.
[6] 顧亞強.非特定人語音識別關鍵技術研究[D].長沙:國防科學技術大學,2009.
[7] 中華人民共和國國家質量監督檢驗檢疫總局.GB/T21023?2007 中文語音識別系統通用技術規范[S].北京:中國標準出版社,2007.
[8] 王文慧.基于ARM的嵌入式語音識別系統研究[D].天津:天津大學,2008.
[9] 何湘智.語音識別的研究與發展[J].計算機與現代化,2002(3):3?6.
[關鍵詞]專家系統;實踐能力評價;大學生
專家系統是一個具有大量的專門知識與經驗的程序系統,它應用人工智能和計算機技術,根據某領域一個或多個專家提供的知識和經驗,模擬人類專家解決一些復雜問題。
一、學生實踐能力
1.一般實踐能力:包括獨立生活能力、動手能力、環境適應能力、交往合作能力、語言表達能力、計算機應用能力和外語應用能力等。
2.專業實踐能力:主要指大學生在專業領域中運用專業知識解決實際問題的能力。
3.綜合實踐能力:指完成復雜任務和解決新問題所具備的實踐能力,常常涉及技術、經濟、社會、環境、心理等各種因素,不僅要綜合運用一般實踐能力和本專業實踐能力,還要學會運用跨學科跨專業的知識和技能。
二、評價系統的結構與功能
1.系統結構。基于專家系統的學生實踐能力評價系統(如圖1),是以個人基本信息模塊提供的信息作為基礎,結合實踐課程成績進行綜合分析,最后評價出學生的實踐能力。系統主要由知識庫、綜合數據庫、推理機、解釋器、知識獲取機構和人機接口組成。
(1)知識庫與知識的表示。知識庫是專家系統包含領域知識的部分,包括各種學生實踐能力培養方面的知識和學生實踐能力評價規則。知識庫可以隨時查詢、修改、刪除、更新和擴充。本系統的基本知識不僅包括學生的國家、民族、籍貫、學歷、英語水平、計算機水平、證件類型及號碼、獎罰情況等基本信息,還包括學生不同學習階段參與實踐活動的地點、時間、單位、部門及實踐成績等信息。
為便于計算機進行處理,必須通過知識表示方法將知識描述成計算機可以識別的形式。知識表示方法主要有一階謂詞邏輯表示法、產生式規則表示法、框架表示法、語義網絡表示法、面向對象表示法、過程表示法和基于神經網絡表示法等等。本評價系統選用產生式規則來表示知識。產生式規則表示法主要表示具有因果關系的知識,其基本形式為:PQ 或 IF P THEN Q。
其中P是產生式的前提條件,用于指出該產生式是否可用的條件;Q是產生式的后件,是一組結論或操作,用于指出當前件P被滿足時,可以得出的結論或應該執行的操作。例如:IF動手能力很好,獨立生活能力強,合作交往能力優良,表達能力非常好;THEN 一般實踐能力水平高
(2)推理機制。推理機制是專家系統的知識處理器,將工作內存中的事實與知識庫中的領域知識相匹配,以得出問題的結論。推理方法主要有四種:正向推理、反向推理、混合推理和雙向推理。正向推理屬于事實驅動推理,在一般基于產生式規則的專家系統中,多數采用此種推理方式。本文研究的基于專家系統的學生實踐能力評價系統即采用基于模糊理論的正向推理。
(3)解釋機制。專家系統能夠解釋本身的推理過程和回答用戶提出的問題,以便讓用戶能夠了解推理過程和專家知識。推理機制根據知識庫中的知識對學生實踐能力進行推理,得出測評結論。同時,系統啟動解釋機制向用戶顯示該結論的依據和推理過程。
2.系統功能。學生實踐能力評價系統通過用戶提供的一些基本信息,產生出不同類別的能力測試體系,被測試者只需要簡單的回答一定數量的問題,系統推理機根據用戶提交的答案結果進行計算與推理,再結合其實踐環節所取得的成績,最終得出被測試者實踐能力所處的水平,并給出相應解釋。通過評價系統,學校、用人單位、學生都可以了解學生的整體實踐能力,從而隨時對教學結構與模式做出調整與改進。
三、結語
專家系統已經歷了幾十年的發展與應用,其理論和實踐都已經相當成熟,在控制和推理方面的優勢也非常突出。利用專家系統的優勢和特點,將其合理地運用到學生實踐能力評價系統中,使得測評時間大大縮減,同時提高了學生實踐能力評價的客觀性與全面性,降低了人才評價的費用。若學生實踐能力評價系統能與學校學生資源管理系統集成,對提高學生的實踐能力培養具有很高的實際意義。
參考文獻:
關鍵詞:雙語教學;人工智能;體系結構
根據《朗曼應用語言學詞典》中的定義,雙語教學(Bilingual Teaching)指的是用兩種語言作為教學媒介語,通過學習學科知識來達到掌握第二語言的目的。雙語教學作為學科教學延伸,不是簡單的母語加第二語言,而是將第二種語言融進學科知識,通過學習學科專業知識提高學生第二語言的聽、說、讀、寫綜合能力,培養學生用第二語言思考、解決問題的能力,培養適應社會發展需求的高素質、復合型人才,以適應信息時代我國經濟和社會發展的需要。人工智能的主要目標是讓機器具有應用符號邏輯的方法模擬人的問題求解、推理、學習等方面的能力,能夠在各類環境中自主地或交互地執行各種任務,比如水下作業、輸油管道、森林救火等。人工智能的發展,不僅代表計算機等科學技術的發展水平,也是一個國家工業化水平的重要標志。這對高校的教育提出了新的挑戰。因此,選擇人工智能課程的雙語教學模式是非常必要的。
1人工智能課程分析
人工智能是一門多學科交叉的課程,特別涉及控制論、信息論、語言學、神經生理學、數學、哲學等多種學科[1-2]。學習該課程需要具有較好的數學基礎和較強的邏輯思維能力,大多教師、學生在教、學的過程中都顯得比較吃力。如何結合課程的特點,幫助學生找到好的學習方法,使他們能充分發揮自己的能力,提高學習興趣成為教學研究過程中的首要目標。在目前高校提倡雙語教學的環境下,我校已將人工智能立項為雙語教學示范課程。人工智能課程具有如下特點:
(1) 是一門非常前沿的學科。
計算機最初是用來做科學計算的,但隨著計算機科技的迅猛發展,人們開始考慮計算機還可以做些什么,能不能像人一樣學習、思考,然后解決問題?這就是基于人的知識和經驗,用符號推理的辦法讓計算機來做事情,是人工智能最早的研究成果。但是,知識并不都能用符號表示為規則,智能也不都是基于知識的。人們相信,自然智能的物質機構――神經網絡的智能是基于結構演化的。因此,20世紀80年代在人工智能理論發展出現停頓時,人工神經網絡理論出現新的突破,基于結構演化的人工智能迅速成為人工智能研究的新方向。事實上,智能問題無論從廣度還是深度,都遠比人們想象的要復雜得多。因此,我們一刻也不能放棄鉆研,并且要時刻關注該領域發展的最新動態。在高校開展人工智能課程的雙語教學,可以促使學生了解該領域以及相關領域,如模式識別、機器視覺、智能檢索、人工生命等發展的最新動態,掌握大量的專業詞匯,鍛煉理解問題、解決問題、了解領域文化等實際能力,對培養國際化、工程化、實用化的復合型人才等具有重要的現實意義。
(2) 涉及面寬、難度大。
人工智能是一門多學科交叉的、極富挑戰性的前沿學科,它幾乎涉及于社會科學和自然科學的每個領域。人工智能課程是一門理論性非常強、知識點比較分散、知識更新快的課程,它以編程語言、數據庫原理、概率統計、數據結構、離散數學以及編譯原理等前趨課程為基礎,還涉及到控制論、信息論、通信原理、圖像處理、模式識別等課程。因此,人工智能課程的知識點難度較大。通過該課程的雙語教學過程,學生不但學習了課程的專業知識,而且還學習了相關理論課程的第二語言表示方法及應用情況,對于培養具有個性化的多層次人才具有重要的價值。
人工智能課程的特點決定了它的雙語教學也具有很大的難度。根據普通高校的實際情況,我們組織了人工智能的雙語教學體系結構,教學實踐表明,該模式行之有效。
2人工智能雙語教學體系結構
要達到雙語教學的目的,就必須將傳統的“注入式”教學模式改變為新型的“以學生為中心”的教學模式。然而,這種“以學生為中心”的雙語教學模式是多樣化的,其教學過程是復雜的,在我國還處于探索階段[3-5]。在人工智能課程的教學過程中,根據學生的實際情況,我們采用課堂教學多樣化、基于CDIO理念的實踐教學,不斷地探索研究,形成高校人工智能雙語教學體系結構,如圖1所示。
計算機雙語教學的正常開展,必須依托優秀的計算機專業外語教科書和教學參考用書。根據學生的實際情況,我們采用了Nils J.Nilsson教授編著的《Artificial Intelligence A New Synthesis》,該教材是美國斯坦福大學計算機系本科教材,不僅內容豐富、取材新穎,更重要的是內容組織結構比較符合學生的認知規律,便于學生學習、理解。參考書主要選用了蔡自興、徐光v老師的《人工智能》。
3雙語教學方法
由于人工智能是一門非常前沿、涉及知識面寬、應用范圍廣的學科,因而在教學的具體過程中,我們多種教學手段并用,主要采取理論聯系實際的案例驅動講授、CDIO實踐模式、綜合考證等講授方法。
3.1理論教學
(1) 修改教學大綱和課程設計的實驗大綱。參考吸收國外先進教材中的內容,結合普通高校的實際情況,形成有針對性的、合理的教學體系。
(2) 采用多種教學方法和手段。設計和制作簡潔、易懂的英文電子教學課件,采用多媒體教學手段,豐富教學內容。建設課程網站,電子課件在網上公開,幫助學生預習專業詞匯、了解教師講解線索和重點內容,降低學習難度。
(3) 課堂提問。提問一些重要內容,鼓勵學生積極思考,既能加深學生對所學課程知識的理解,也有利于其英文表達能力的提高。
(4) 案例驅動法。將有意義的案例貫穿在教學過程中,培養學生的興趣,提高學生分析問題、解決問題的能力;
(5) 課后小組討論。每6~8位同學分為一組,實行小組長負責制,組織學生討論和解決學習中遇到的問題,交流學習心得,一方面起到溫故而知新的作用,同時培養團隊協作精神。
3.2實踐教學
由于學生的英語水平、專業基礎知識以及知識面都有差別,因此教師必須因材施教,培養學生的興趣。實踐課題來源于實際工程,將CDIO理念貫穿于實踐教學過程中,提高學生綜合創新能力與團體協作精神。
(1) 實驗題目多樣化。學生可以選擇,也可以根據老師的要求自己構思,以培養學生的興趣與查閱資料的能力。
(2) 分工與合作。來源于工程實踐的題目,學生通常很難在短時間內獨立完成,因而需要分工合作,培養學生的協作精神。
(3) 整體設計方案的靈活性。學生領會題目本意,自主設計解決方案,培養學生分析問題、解決問題的綜合創新能力。
(4) 編程實現。培養學生的編程能力,形成科學的編程風格。
3.3考核方式
(1) 多種形式的平時測試(30%)。主要包括平時測驗、討論、作業等。主要考察學生對基本知識的掌握,英文表達能力以及知識面的拓寬等。
(2) 實踐教學(30%)。主要考察學生對實踐題目的理解、整體方案的設計、團隊間的協作精神以及實現結果等。
(3) 期末考試(50%)。試題全部用英文形式出現,鼓勵學生用英文作答。
人工智能課程采用雙語教學,可以使學生最準確地理解專業知識,又可以使英語和專業課的學習相互促進。
4教學效果分析
課程結束后,我們對學生進行了教學效果討論與調查,結果如表1所示。
從本課程討論和調查的結果以及其他普通高等院校的雙語教學調查結果可以看出,雙語教學效果基本上達到了要求。但也存在一些值得思考的問題:不適應的人數比例偏高,專業知識的學習效果一般,甚至有學生因為跟不上進度放棄專業課的學習。為此,提出以下的建議:
(1) 加強學生認識。學生必須從思想上認識到人工智能雙語教學的重要性,克服教學過程中的種種困難、持之以恒,主動與同學、老師進行討論,密切關注學科發展動態。
(2) 提高實施條件。雙語教學過程中,學生是主體,教師是關鍵。因此,要求老師要有較高的專業知識和英語水平,學生要有較好英語基礎。
(3) 完善教學體系結構。雙語教學在我國還處在探索階段,因而必須在教學實踐過程中不斷地改進完善雙語教學的體系結構。
只有解決好這些問題,才能培養出更高素質的復合型人才,適應國內外科學與經濟發展的需要。
參考文獻:
[1] Nils J Nilsson. Artificial Intelligence A New Synthesis[M]. 北京:機械工業出版,2002.
[2] 蔡自興,徐光v. 人工智能[M]. 北京:清華大學出版社,2003.
[3] 賀志榮. 雙語教學的實踐與思考[J]. 黑龍江教育:高教研究與評估版,2008,62(10):45-46.
[4] 王樹根,姜昕. 我國雙語教學的歷史發展階段綜述[C]. 安徽黃山,2007年全國測繪學科教學改革研討會,2007.
[5] 湯東. 中外高校雙語教學模式的比較研究[J]. 黑龍江教育:高教研究與評估版,2008,62(11):69-70.
Exploration and Practice on Bilingual Teaching Architecture for Artificial Intelligence Course
LI Zhu-lin, HAO Ji-sheng, MA Le-rong
(Department of Computer Science, Yan’an University, Yan’an 716000,China)
關鍵詞:PLC技術;計算機控制技術;機電專業
作者簡介:李啟光(1970-),男,江蘇贛榆人,北京信息科技大學機電工程學院,副教授。(北京 100192)
中圖分類號:G642.0 文獻標識碼:A 文章編號:1007-0079(2013)07-0105-02
計算機控制系統是以計算機為核心實現生產過程自動控制的系統。隨著工業技術的發展和生產自動化程度的不斷提高,計算機控制技術得到了越來越廣泛的應用。“計算機控制技術”融合了計算機技術、自動控制理論和計算機通信技術,是新發展起來的理論性和實踐性很強的一門交叉學科。它實際上包含著兩部分內容:一是計算機控制理論基礎,主要涉及離散控制基礎理論;二是實現技術,主要包括通道接口技術、現場總線、人機界面等系統實現技術。課程涉及面很廣、知識集成度高,是高等學校自動化、電氣工程和機械電子工程等專業的一門重要的專業主干課程。[1-3]
一、“計算機控制技術”課程現狀
“計算機控制技術”是一門跨學科專業課程,涵蓋內容豐富,但由于各專業的要求不同,課程針對不同專業的側重內容應有區別,這樣才能達到各專業的培養目的。
目前多數高校選用課程教材內容主要是數字濾波、數字 PID、最少拍無差系統、Simth算法和達林算法、模糊控制、神經網絡等內容,這部分是建立在一整套完整控制理論基礎上的。[4]此外還包括接口技術、現場總線、人機界面等偏重于應用的內容。自動控制等專業培養目標側重于設計計算機實現控制算法、編制適用于工業控制系統的硬件及接口設計、控制軟件,選用此類編排內容的教材比較適用。而機械電子專業方向,機電專業以裝備及其控制系統為主要研究對象,課程以了解與掌握計算機控制系統在裝備控制中應用為其主要目的,選用此類教材不能體現專業側重點。同時機電專業有自己的專業設置要求以及本專業特有的先修基礎課程,與自控類專業有極大的不同,因此如何根據機電專業自身的專業特點確定理論教學內容及其深度,調整好計算機控制系統的理論及應用技術的關系,是目前機電專業“計算機控制技術”課程教學要解決的首要問題。
因此,在教學實踐過程中,應以控制系統應用技術為基礎,理論教學的內容和深度以應用內容的需求為標尺,使理論教學內容能夠支撐且覆蓋該課程涉及的主要技術,使理論教學的深度能與機電專業學生的實際水平及今后的就業需求相符合,同時還要與當前的技術發展水平和趨勢相適應,具有一定的前瞻性。
二、機電專業“計算機控制技術”教學內容改革
1.機電特色的控制類課程教學體系調整
面向機電專業的“計算機控制技術”課程應從裝備控制應用角度出發,密切結合裝備自動化需求組織教學內容。
根據以上原則,在教學中提出將運動控制卡和工業PLC作為計算機控制技術理論與運用結合的載體。一方面在課程開始之前,需要保障學生已掌握先修部分專業應用技術知識,尤其考慮到工業PLC、運動控制器是機電專業常用、最典型控制應用系統,課程內容可與此結合,將工業PLC、運動控制器的應用作為教學案例使用。先修課程包括“電工電子學”、“機械控制工程”、“單片機原理”、“數控技術”、“PLC 原理與應用”等專業課程,其中鑒于“數控技術”課程目前涉及均為封閉式數控系統,因此在課堂上需要補充介紹機電控制中使用面廣、開放式的運動控制器(卡)。
另一方面,課程以先修課程中所涉及的、與計算機相關的數字處理與控制技術為主要授課內容,重點介紹數字化后信號處理、數字控制理論及其實現,并通過各個理論教學環節與先修機電控制運用技術緊密結合,實現硬件和軟件結合、控制原理和典型應用控制器結合,貫徹理論聯系實際的方針,并將先修課程有關方面的知識有機集成在一個完整的機電控制系統內,使學生從整體上系統地掌握數字控制器的機電應用技術。
“計算機控制技術”強調理論、技術與實際應用相結合,理論與實踐并重,綜合性較強、強調應用,因此在課堂教學與課程實驗的基礎上,應增加機電綜合實踐環節,并鼓勵學生參加其他開放實驗以及科研項目,綜合應用所學知識,鞏固教學效果。項目選題從工程應用角度出發密切結合裝備自動化實踐。
2.機電專業特色的課程內容設定
在原有教學內容體系基礎上,針對機電專業控制理論基礎薄弱、專業需求有別的狀況,對教學內容作一系列的重新規劃及調整。強調教學內容緊密聯系機電傳動控制實際需求,優化知識結構、充實機電控制的實例,做到理論和實踐運用的對應與相互關聯。
對于機械電子專業,擬定的主要教學內容大致如下:
(1)輸入/輸出通道接口技術。這部分內容在“電工電子學”和“單片機原理”課程軟硬件基礎知識上,以單片機、PLC、運動控制卡上典型常用的接口硬件,如A/D、D/A、通訊口、觸摸屏、開關量輸入輸出接口等為例子介紹工作原理、使用方法和技術細節問題。
通過與實際應用系統關聯認知,學生對輸入/輸出通道接口設計及技術參數選取建立感性了解,使用中就可以通過查閱樣本資料掌握其他類似通用硬件的使用。
關鍵詞: 教育神經科學 初中歷史課堂 啟示展望
隨著認知神經科學的發展及其與教育科學的結合程度不斷提高,構建以教育神經科學為背景的中學歷史課堂教學理論正成為教育研究領域一種新的必然趨向。有學者將這種實踐取向的“基于腦的教育”形容為“教室里的神經科學”,這并不指將教室作為開展神經科學實驗的場所,而是希望采用神經科學的技術與方法研究并解決某些真正來自教學實踐中的問題[1]。
一、教育神經科學的概念
教育神經科學是將生物科學、發展科學和教育科學等學科的知識技能進行深度整合,提出科學的教育理論、踐行科學的教育實踐的、具有獨特話語體系的一門新興學科[2]。“教育神經科學”這一術語最早由肖爾和莫茨基于1978年提出。姜永志認為,教育神經科學以2003年哈佛大學“國際心理、腦與教育學會”(International Mind Brain and Education Society)成立為標志,成為一門基于實證的新興學科[3]。教育神經科學凝聚著跨學科專業研究者的共同智慧,汲取多門相關學科中的知識精華與哲學理念,形成獨特的概念結構。教育神經科學的誕生改變了長期以來教育學缺乏實證依據的狀況,為教育奠定了堅實的科學基礎。
與教育神經科學類似的概念有神經教育科學、教育生物學等。“教育生物學”的含義與“教育神經科學”的含義部分重合,因為神經科學是生物科學的一個分支。一些研究者將神經教育學定義為“一門整合了心理學、腦科學和教育學研究而形成的新科學,匯集了包括認知神經科學、發展認知神經科學、教育心理學、教育技術學、學習理論和其他相關學科的研究者,致力于探索學習的生理機制”[4]。由此看來,“教育神經科學”和“神經教育科學”的內涵相近,但是周加仙認為,兩者分別代表了不同的研究取向,前者強調以教育為核心的跨學科整合,后者的核心是整合教育學的神經科學,更重視這一新興領域的知識創造[5]。
二、教育神經科學視角下的中學課堂教學研究
教育神經科學研究者認為,教育神經科學不僅注重學生在課堂上的心理與行為變化等宏觀層次的研究,而且強調在不同教育環境下,學生大腦內部神經聯結和突觸結構的改變等微觀層次的研究。研究者借助先進的腦成像技術手段(ERP、fMRI)與多種研究方法,從基因-分子-突觸-神經元-神經網絡-神經系統-課堂行為-社會等不同層面,全面揭示了學生在不同教育環境下學習心理和行為的變化過程,對學生的學習行為提供了因果解釋,從而發展出了學生學習改變的完整的、有用的和確定性知識。
三、教育神經科學研究成果對初中歷史課堂教學的啟示
梁啟超說:“史者何?記述人類社會賡續之體相,校其總成績,求得其因果關系,以為現代一般人活動之資鑒者也。”[6]歷史有兩層概念:一是指過去發生過的事情,二是指記錄過去發生過的事情的資料等。歷史學科具有其他學科無法代替的功能,它是所有人文學科的基礎學科;它能夠提升整個民族的科學文化水平,是經濟順利發展的必要條件;歷史學科還具有促進學生身心多方面協調發展的功能[7]。課堂教學是實施素質教育的主渠道,誰抓住了課堂,誰就抓住了教學工作的關鍵。隨著基礎教育課程改革的不斷深入,教師的教學方式和學生的學習方式發生了積極的變化。但是不容否認,在初中歷史課堂教學實踐中,出現了從一個極端到另一個極端的現象。由“滿堂灌”變成“滿堂問”;學生面對著浮光掠影般的多媒體信息不知所云;教師仍然難以跳出“教書匠”的窠臼。教育神經科學的研究成果能給初中歷史課堂教學帶來如下啟迪:
(一)腦發育的不同步對初中生歷史學習的影響
青少年的性格不穩定,行為易偏激,以往的觀點是荷爾蒙分泌過剩的結果。但是,近來研究者使用神經影像技術對腦發育進行的縱向研究表明,與情緒有關的腦區在10到15歲時得到充分的發展,但與理性思維和情緒控制有關的腦區的成熟則發生在22至24歲。有學者將這種沖動稱為“短暫的瘋狂”[8]。這一發現解釋了初中生的思維具有不成熟和片面性的特點,屆于初中生對形象的、生動的、具體的歷史知識感興趣,歷史教師應該根據學生認知特點選擇最佳的課堂教學策略。另外,初中生的額葉尚不具備全面控制過激情緒的能力,容易引發一些不可預測而且危險的行為,包括情緒爆發和身體攻擊等,教師在課堂上要努力做到公平對待學生,妥善處理課堂突發事件。
(二)情緒影響歷史課堂
相比小學教師比較習慣處理學生的情緒表現,初中教師所受到的訓練則是向學生傳授大量課程內容。尤其是初中歷史課程這樣的非重點科目,一周只有兩節課時,教師的課堂教學任務繁重,導致歷史教師幾乎沒有時間關注學生的情緒發展,并常常假設初中生應該“像成人一樣行動”。張元認為:“認為本世紀以來,由于腦神經科學的飛躍發展,讓我們在過去談及認知時,十分忽視的部分,重新受到關注。我們非但知道感性在認知上應有不讓于理性的重要地位,并且知道就是‘潛意識’也是我們在教課時應該注地方,不論老師的講述,抑或學生的聽課,潛意識很可能扮演著支配的角色。老師在課堂中,談及看似無關緊要的三言兩語,或是輕輕地一聲嘆息,甚至一舉一動,一顰一笑,都是個人感情的流露與品味的展現,都會在學生的腦中留下印痕,對學生產生潛移默化的作用。”[9]其實教師應該理解情緒的生物學特征,特別是壓力的生物學特征,只有當學生在生理上和情感上都感到安全時,他們才能將注意力集中在課程上。
(三)學校的文化氛圍影響學生的歷史學習
人類是社會性動物,學生、同伴和教師間會產生相互影響。學校通常注重學業和測驗,往往忽視了社會和文化力量對學生的巨大影響。神經影像研究已經發現了負責評價事件意義的腦區,這一領域的研究發現形成了一個新的研究領域,稱為社會認知神經科學。學校的文化特征體現在開放性、期望、對努力的認識與賞識程度、參與決策和關愛的程度,這些影響著學生個體的自尊。教育者需要更多地關注學校積極的社會和文化氛圍的營造。當學生感到自己受到學校排斥時,會產生情緒上的不滿。我們不能再將學習和情緒分開來考慮,或者認為情緒干擾了學習,我們不能僅僅從單個學生的角度分析課堂教學中教學策略的有效性。初中歷史課堂教學中,歷史教師應該發揮歷史學科易于激發學生情緒的特點,利用豐富的史實、濃郁的情感,讓學生理解歷史,在歷史的回憶中探究歷史發展的規律。
(四)飲食和睡眠對記憶的重要性
大腦的運轉需要能量支持,充足的水分和葡萄糖是大腦高效運行的生理保障。因此,教師要提醒學生按時攝取水分和營養。高效的睡眠可以讓一個人醒來后精神煥發地處理新一天的事務。研究發現,腦在睡眠時非常活躍,仍然進行加工,幫助腦進行學習、建立聯結、記憶和清除混亂,睡眠剝奪會使人腦難以獲得任何形式的記憶。研究表明,睡眠被剝奪的學生比睡眠時間長的學生成績差,也更有可能變得抑郁。很多中學生和教師睡眠不足,他們每天的睡眠時間只有5-6小時。教師了解睡眠研究的結果,就可以向學生強調保證充足睡眠的重要性。大多數青少年大約需要9個小時的睡眠。
四、展望
事實上,目前教育神經科學所積累的確定性的知識只是一部分,更重要的是,教育神經科學的目的不是發現學習規律,而是用已經發現的知識解決教育問題,它與所有的教育學一樣是一門應用科學[10]。現階段,教育神經科學研究進展成果在我國一線教師隊伍中的普及力度不夠,很多教師的理論水平還停留在皮亞杰、奧蘇貝爾等人的教育理論上。對教育神經科學的誤解或盲從容易造成“神經神化”的訛傳,對學生的學習和發展產生危害。教師學習教育神經科學的基本知識,能夠初步從神經功能分辨教學中教師和學生存在的問題,從而采取恰當的策略改進教學,這樣的優勢顯而易見。
參考文獻:
[1]陳巍,丁峻.教室里的神經科學:一種從理論到實踐的取向.外國教育研究,2010,37(9):2.
[2]周加仙.教育神經科學的領域建構.華東師范大學學報(教育科學版),2009,27(3):69.
[3]姜永志.教育神經科學的理論與實踐―――從“實驗室”到“教室”的學習科學.開放教育研究,2013,19(3):72.
[4]楊娟,等.基于神經教育學的個體化教育研究及實踐.現代教育技術,2016(5):50.
[5]周加仙.教育神經科學:創建心智、腦與教育的聯結.華東師范大學學報(教育科學版),2013,31(2):42.
[6]梁啟超,著.中國歷史研究法.商務印書館,1933:1.
[7]參見于友西,主編.中學歷史教學法.北京:高等教育出版社,2013:60.
[8][美]格力?格雷戈里,等著.趙麗琴,譯.差異化教學.上海:華東師范大學出版社,2015:177.
[9]張元.教出歷史課的美感與品位.清華歷史教學,2014,6
我國加入WTO后,越來越多的跨國公司看到我國市場巨大的發展潛力,加大對華投資,紛紛在我國設廠并建立分銷、配送網絡,使其產品、服務得以打開我國市場。隨之而來的是國際物流大公司進軍中國,并且在剛剛起步的我國物流業中搶占了有利地位。與其相比,我國物流企業雖然擁有先天的市場優勢并取得一些進展,但由于我國物流業起步晚并且運營模式不完善以及體制障礙造成了我國物流信息化的標準不規范、信息技術和設備不夠先進、信息平臺建設滯后、專業型人才緊缺等問題,這些問題將嚴重制約物流信息化的進一步發展。
(一)大中型企業信息化意識普遍提高。隨著社會信息化程度的不斷加深,物流企業信息化建設已經受到普遍關注,并且企業的信息化意識也在不斷提高,重視并加大了對物流信息化的建設。據調查顯示,在大中型企業中,建立了信息管理系統和企業網站的比例較高。大約74%的企業已經建立了信息管理系統,大約77%的企業已有自己專業的網站。已建管理信息系統的企業,系統是內部局域網的和廣域網的各占一半左右。
(二)信息化發展仍處在初級階段。進入21世紀以來,我國經濟和物流業發展較為迅速,物流信息化建設也取得了一些成績,但物流信息化仍處在初級發展階段。根據調查,公司網站的主要功能多是用于企業宣傳(40%),其次是信息服務(36%),用于內部通訊的占30%,作為電子商務平臺的比例相對較少,大約占21%;另一方面從物流成本占GDP(國內生產總值)的比例來看,歐美、日本等發達國家比例在10%左右,而我國已接近20%,物流成本的差距反映我國物流信息化落后于發展成熟的發達國家。
二、我國物流企業信息化存在的問題
(一)物流信息化標準混亂,一體化水平低。物流行業發展至今,國家相關部門雖然也出臺了一些相關的政策法規,但是缺乏一定的物流信息化管理標準和行業規范,從而導致物流行業在不同層面存在標準不一的現象。由于受到當前市場經濟體制的影響,很多政策法規未能真正實施,使得物流活動的信息時效性和專業性都達不到相應的統一標準。由于企業管理不規范,信息傳遞及工作效率比較低,導致客戶投訴日益增多。由于缺乏標準的規范體系,一體化水平低,沒有形成優勢互補共同發展的局面,而且管理方法不能滿足一體化的物流需求,以致大部分物流企業規模較小、管理水平差、效率低下和運營成本高,這些都將嚴重制約物流信息化的發展建設。
(二)信息化技術不夠先進。信息化知識在不斷的發展,一些先進的技術用在物流企業中,能夠很大程度的發揮其優勢,降低企業經營風險,提高企業效益。比如,車輛管理系統可以科學地調派車輛,管理車輛的各項變動;GPS車輛定位系統可以加強自有車輛的監督管理和貨物的安全到達等。根據中國倉儲協會調查,絕大多數中小物流企業中,其信息系統的業務功能和系統功能還有待完善,缺乏必要的訂單管理、貨物跟蹤、倉庫管理和運輸管理等物流服務系統,物流信息資源的整合能力尚未形成。企業物流系統應當體現出專業化以及科學化,特別是使用先進的信息化技術對企業的物流進行相應的管理,比如說衛星定位、條形碼以及自動分揀等技術。但是,當前我國很多企業在對物流進行管理的時候,還沒有真正將信息技術應用到物流的信息化過程中,依舊處于一種人工化或者半人工化的狀態。
(三)物流信息平臺建設滯后,信息資源缺乏有效整合。物流信息平臺是物流領域的神經網絡,是支撐物流發展的關鍵基礎平臺。雖然我國的物流信息平臺已取得一定程度發展,但在發展中也存在著一些問題。一方面物流信息平臺建設運營主體均發展不完善。物流信息平臺建設運營主體主要有兩種:一種是以政府為主的模式,一種是以企業為主的模式。以政府為主的運營模式雖公益性較強但存在很多弊端,如后期資金的投入不能得到有效的保證,且容易造成對市場需求把握不足;以企業為主的運營模式雖然企業可以自主經營,積極把握市場需求,但也有一定的局限性,例如整合資源的能力不強,缺乏長遠規劃,資金投入壓力大等;另一方面物流信息平臺的盈利能力不強。由于物流信息平臺缺乏良好的商業運營模式,缺乏完善的市場調查和雄厚的資金支持,導致盈利能力不足,這樣,平臺的發展就受到很大限制,難以高效地為物流信息化提供更為優質的服務。
(四)專業的物流信息人才緊缺。現代物流作業過程具有信息量大,環節復雜,物流信息不確定,需要專業的知識及技術經驗等特點。因此,企業在實施信息化的進程中應當有專業性的人才作為保障和支撐。他們不但要掌握大量的物流專業基礎知識,而且還需要熟練的操作本領和實踐技術。由于我國物流業起步晚,具有理論知識、技術操作以及創新能力等的綜合型物流人才十分匱乏,這已成為制約我國物流企業信息化發展的又一重要因素。另外,當前很多物流企業所聘用的人才受教育程度比較低,缺乏專業的理論知識,綜合素質不高,難以推動信息化的發展進程;而學校培養的人才雖有理論知識但缺乏信息技術的處理能力、運營能力和創新能力,不能滿足信息化的現實發展需求。這樣就在很大程度上影響企業的物流信息化發展。
(五)缺乏統一的宏觀調控和長遠發展規劃。目前與物流相關的部門有公路、鐵路、航空和郵政等多個部門。各部門出于各自不同的目的,必然會有各自的政策和物流工作計劃,但由于缺乏統一的宏觀調控,必然導致物流業管理分散、混亂,物流信息化標準難以落到實處。其次,信息系統與企業的業務流程和戰略目標不匹配,缺乏長遠的發展規劃。多數企業往往采用頭痛醫頭,腳痛醫腳的方法來處理企業的信息化需求,不是從整個物流系統的角度來尋找解決問題的方法,對信息系統在企業整體戰略上的定位比較模糊。
三、促進我國物流企業信息化對策建議
(一)進一步健全物流信息化標準規范。物流信息化發展需要有一定的標準和規范作為支撐。因此,可以從以下幾方面完善信息化標準:一是通過法律規定使整個物流業的運行和發展標準化,研究和制定標準化的物流業政策法規。改進對物流相關領域的管理方式,對不適應物流業發展的各類規定和政策進行清理、修改和完善,規范物流企業扶持標準;二是通過建立一體化的物流信息系統,做到持續、簡便并準確地移動數據,及時自動地更新數據,提高物流作業過程的透明性和時效性;三是企業應加大資金投入,建立具有廣泛兼容性的數據庫并選擇良好的數據交換工具,充分利用最新的互聯網技術平臺,使物流信息化再上一個新臺階。
(二)開發引入先進的物流信息技術和設備。信息技術的提高主要依賴于信息應用軟件和物流設備的開發和利用,國家應當重視并支持信息化應用軟件以及技術設備的研發和使用。首先,國家應鼓勵企業信息技術的推廣和應用,并在科研項目中增加對信息技術優化物流管理和運行方式的研究,增加研究經費,以便開發新型便捷高效的信息化物流作業技術和設備。其次,我們要借鑒國外先進的經驗與技術,不斷提高我國的研發能力,進一步完善物流信息化標準,開發具有自主知識產權且先進的物流信息技術。使我國物流運營的效率得到進一步的提升和完善,加快物流信息化的進程。
(三)重視物流公共信息平臺建設。物流信息公共平臺是物流業實現信息化的必經之路,因此各方要共同努力做好信息化服務平臺的建設。作為國家,要重視信息化平臺的建設,在信息公共平臺建成之后,要對其進行持久的關注,加大資金投入,充分了解市場動向,完善公共平臺的質量,提高其公益價值。作為企業,應認識到開發信息平臺對企業盈利的重要性,對公共平臺的系統進行合理優化,加大資源整合力度,通過不斷實踐,提高平臺的服務質量。公共物流信息平臺能較好地整合現有資源,發揮行業整體優勢,實現互利共贏,從根本上改善行業現狀,促進信息化的發展。
(四)培養高素質的專業性物流人才。隨著信息技術在物流業中的廣泛應用以及物流信息化的發展,物流企業對工作人員的知識水平和技能有了更高的要求。為了建設高素質的擁有物流專業知識和技能的隊伍,實現對專業人才的培養,一方面鼓勵和允許院校按照市場需求開辦和設置物流專業及課程,為現代物流培養高級管理人才和專業人才,以滿足對物流人才多樣化的需求;另一方面要加強現有在職人員的培訓,通過全方面、多層次的培訓盡快使他們掌握物流基本知識和運作技術,成為專業人才。同時,也要積極引進國內外優秀的物流管理人才,讓他們先進的物流理念和運作方式及管理規范融入到物流信息化的建設中,從而提升服務水平,實現我國物流信息化的高速發展。
關鍵詞:聚類 聚類分析
中圖分類號:TP391 文獻標識碼:A 文章編號:1007-9416(2012)05-0204-02
1、引言
在對世界的分析和描述中,類或在概念上有意義的具有公共特性的對象組,扮演著重要的角色。的確,人類擅長將對象劃分成組(聚類),并將特定的對象指派到這些組(分類)。利用聚類操作可以對數據進行分組和深入分析,獲得其他方法不可能獲得的信息。就理解數據而言,簇是潛在的類,而聚類分析是研究自動發現這些類的技術。
2、相關概念
聚類[1]:可以看作一種分類,是將物理或抽象對象的集合分成由類似的對象組成的多個類的過程。由聚類所生成的簇是一組數據對象的集合,這些對象與同一個簇中的對象彼此相似,與其他簇中的對象相異。顧名思義是將一組對象劃分為若干類,每個類中的對象相似度較高,類與類之間的對象相似度較差。
聚類分析[2]:根據在數據中發現的描述對象及其關系的信息,將數據對象分組。其目標是在相似的基礎上收集數據來分類。它以相似性為基礎,因此組內的相似性(同質性)越大,組間差別越大,聚類就越好,所分的類就越成功。
聚類分析的基本思想[3]:聚類分析是依據實驗數據本身所具有的定性或定量的特征來對大量數據進行分組歸類,以便了解數據集的內在結構,并且對每一個數據集進行描述的過程。其主要依據是用數學的方法研究和處理給定對象的分類,把一個沒有類別標記的樣本按照某種準則劃分子類,使相似的樣本盡可能歸為一類。
3、聚類應用的四個基本方向[3]
減少數據:許多時候數據量n很大,會使處理變得很復雜費力,因此可將數據分成幾組可判斷的聚類m(m
假說生成:聚類算法依賴于猜測和假設,在這種情況下,為了推導出數據性質的一些假說,我們可對數據集進行聚類分析。這里使用聚類作為建立假說的方法,可使用其他數據集驗證這些假說。
假說檢驗:在這種情況下,使用聚類分析來驗證指定假說的有效性。例如,考慮下面的假說:“國內大公司都投資房地產”,驗證這個假說是否正確的一種方法是對國內的大公司和有代表性的公司進行聚類分析。假定每個公司用它的規模、在房地產行業的活躍度以及應用研究上成功完成項目的能力來表示,在進行聚類分析后,如果相應于規模大并且能在房地產上投資的公司形成聚類,則聚類分析支持這個假說。
基于分組的預測:在這種情況下,我們對現有數據集進行聚類分析,形成模式的特征,并用特征表示聚類。如果給出一個未知模式,我們可以判定它最可能屬于哪類,并用相應聚類的特征表示。
4、為了完成一個聚類任務,必須遵循下列步驟[3]
特征選擇(feature selection):必須選擇合適的特征,盡可能多地包含任務關心的信息。在特征中,使信息冗長減少和最小化是主要目標。因為在有監督分類中,使用之前特征的預處理是必要的。
近鄰測度(proximity measure):用于定量測量兩個特征向量如何“相似”或“不相似”。保證所有選中的特征具有相同的近鄰行,并且沒有占支配地位的特征,這是預處理期間必須要注意的一點。
聚類準則(clustering criterion):聚類準則以蘊涵在數據集中的類型為基礎。例如,L維空間的致密類特征向量可以根據一個準則判斷,但是拉長類卻需要另一個準則判斷。聚類準則可以用代價函數或其他規則表示。
聚類算法(clustering algorithm):已經采用近鄰測度和聚類準則,這一步涉及到選擇特定的算法,用于揭示數據集的聚類結構。
驗證結果(validation of the results):一旦用聚類算法得到結果,就必須驗證其正確性。通常使用逼近檢驗。
結果判定(interpretation of the results):在許多情況下,應用領域的專家必須用其他實驗證據和分析判定聚類結果,最后做出正確的結論。
5、聚類分析計算方法主要有如下幾種
劃分法(partitioning methods):給定一個有N個對象的數據集,利用分裂法構造K個分組,每個分組就代表一個聚類(K
層次法(hierarchical methods):這種方法對給定的數據集進行層次似的分解,直到某種條件滿足為止。根據層次分解的形成方式,該方法可分為“分解”和“合并”兩種方案,并且經常與其他方法結合使用進行優化。代表算法有:BIRCH算法[7]、CURE算法等;
基于密度的方法(density-based methods):基于密度的方法是根據密度完成對象的聚類。它是根據鄰域對象的密度或者根據某種密度函數生成簇。與其它方法的一個根本區別是:它不是基于各種各樣的距離的,而是基于密度的。這個方法的指導思想是,只要一個區域中的點的密度大過某個閥值,就把它加到與之相近的聚類中去。代表算法有:DBSCAN算法[9]、OPTICS算法[10]、ST-DBSCAN算法[11]等。
基于網格的方法(grid-based methods):這種方法首先將數據空間量化為有限個單元的網格結構,然后利用網格結構完成聚類,所有的處理都是以單個的單元為對象的。它突出的優點就是處理速度很快,通常這與目標數據庫中記錄的個數無關,它只與把數據空間分為多少個單元有關。代表算法有:STING算法[12]、CLIQUE算法、WAVE-CLUSTER算法等。
基于模型的方法(model-based methods):基于模型的方法給每一個聚類假定一個模型,并找出一個能適應相應模型的數據集。該方法試圖優化給定的數據和某數學模型的擬合,這樣一個模型可能是數據點在空間中的密度分布函數或者其它。它的一個潛在的假定就是:目標數據集是由一系列的概率分布所決定的。通常有兩種嘗試方向:統計的方案和神經網絡的方案。
6、聚類算法的現況
數據挖掘是近年來信息產業界非常熱門的研究方向,聚類的用途很廣泛,而聚類分析是數據挖掘中的核心技術。在商業上,聚類分析是細分市場的有效工具。雖然傳統的聚類算法已經能比較成功的解決了低維數據的聚類問題,但是隨著技術的進步使得數據庫規模越來越大、復雜性越來越高,處理數據的工作越來越復雜,因此在處理許多問題時,現有的算法已無法處理和滿足要求,特別是對于高維數據和大型數據的情況。高維數據聚類分析是聚類分析中一個非常活躍的領域,同時它也是一個具有挑戰性的工作。目前,高維數據聚類分析在各個領域都有很廣泛的應用,很多應用需要對包含大量特征項或者維數的對象進行分析,例如市場調查分析、信息安全、金融、娛樂、反恐等。
7、結語
本文介紹了一些聚類的基本知識,作為工具的聚類對數據的分組,從理論上學習掌握這部分知識,為下一步利用聚類知識作學習研究打下了基礎。
參考文獻
[1]Michalski R,Stepp R. Learning from Observation:Conceptual Clustering. Machine Learing.Spring-Verlag,1984.
[2]張明衛,劉瑩,張斌,朱志良.一種基于概念的數據聚類模型.軟件學報,Vol.20, No.9,September 2009:2387—2396.
[3]李晶皎,王愛俠等譯.(希)西奧多里德斯 等著.電子工業出版社,2006.
[4]Han JW, Kamber M, Wrote; Fan M, Meng XF, Trans. Data Mining Concepts and Techniques. Beijing: China Machine Press, 2001.232-236 (in Chinese)
[5]N g, R. , Han, J. Efficient and effective cluster method fo r spatial data m ining. In: Bocca, J. , J arke, M. , Zanio lo, C. ,eds. P roceedings of the 20th International Conference of V ery L arge Data Bases. San F rancisco, CA: Mo rgan Kaufmann Publisher, 1994. 144~ 155.