前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經(jīng)網(wǎng)絡(luò)情感分析主題范文,僅供參考,歡迎閱讀并收藏。
【關(guān)鍵詞】微博數(shù)據(jù);神經(jīng)網(wǎng)絡(luò);電影票房;預(yù)測(cè)模型
1.引言
據(jù)2011年IDC的《Digital Universe Sduty》報(bào)告顯示,數(shù)據(jù)以每年超過(guò)50%的速度增長(zhǎng),全球信息總量每過(guò)兩年就會(huì)增長(zhǎng)一倍。在眾多產(chǎn)生大數(shù)據(jù)的平臺(tái)中,Twitter、新浪和騰訊微博等使用簡(jiǎn)單便捷、信息豐富、傳播速度快、更新迅速、影響范圍廣,新浪微博是中國(guó)微博產(chǎn)業(yè)的主導(dǎo)力量。
電影作為一種生存期短的商品,對(duì)其票房的預(yù)測(cè)難度較大,當(dāng)前關(guān)于電影票房的研究較少。Kyung Jae Lee和Woojin Chang(1999)用貝葉斯網(wǎng)絡(luò)研究票房的影響因素,給出了預(yù)測(cè)模型[1]。Sharda R和Delen D(2006)利用影響電影票房的多個(gè)屬性,以多層神經(jīng)網(wǎng)絡(luò)算法為基礎(chǔ),提出一種電影票房分類(lèi)模型[2]。Marshall P等(2013)提出使用電影歷史數(shù)據(jù)預(yù)測(cè)電影上映期間的累計(jì)觀眾數(shù)量,使用多元線性回歸算法預(yù)測(cè)第1周的觀眾人數(shù),再用其預(yù)測(cè)后幾周的觀眾總數(shù)[3]。王錚和許敏(2013)基于Logit 模型的研究電影票房的影響因素發(fā)現(xiàn)明星和導(dǎo)演存在顯著的票房效應(yīng)[4]。鄭堅(jiān)和周尚波(2014)利用神經(jīng)網(wǎng)絡(luò)算法,提出一種基于反饋神經(jīng)網(wǎng)絡(luò)的電影票房預(yù)測(cè)模[5]。
電影上映前,主創(chuàng)人員會(huì)對(duì)電影進(jìn)行微博宣傳,對(duì)電影有潛在消費(fèi)欲望的網(wǎng)友會(huì)關(guān)注這些并評(píng)論和轉(zhuǎn)發(fā)。對(duì)粉絲數(shù)多的用戶(hù),這是一種便宜、高效、傳播范圍廣且迅速的營(yíng)銷(xiāo)方式。本文在此研究基礎(chǔ)上,嘗試?yán)蒙窠?jīng)網(wǎng)絡(luò)方法,基于微博數(shù)據(jù)對(duì)電影票房進(jìn)行預(yù)測(cè)性研究。
2.相關(guān)數(shù)據(jù)收集和處理
2.1 確定數(shù)據(jù)指標(biāo)
本文采用新浪微博的相關(guān)數(shù)據(jù)來(lái)對(duì)電影票房預(yù)測(cè)研究,選取電影主創(chuàng)的粉絲數(shù),相關(guān)轉(zhuǎn)發(fā)量和評(píng)論量作為票房預(yù)測(cè)的指標(biāo)體系(見(jiàn)圖1)。
因此,在對(duì)票房進(jìn)行相關(guān)分析時(shí)提取以電影名稱(chēng)為關(guān)鍵詞的相關(guān)主創(chuàng)的微博,統(tǒng)一選取電影主演1、主演2、導(dǎo)演的粉絲數(shù)、相關(guān)微博評(píng)論量、轉(zhuǎn)發(fā)量作為研究指標(biāo)并收集數(shù)據(jù)。粉絲數(shù)、轉(zhuǎn)發(fā)量和評(píng)論量越大對(duì)票房的貢獻(xiàn)率越大。
圖1 電影票房預(yù)測(cè)的數(shù)據(jù)指標(biāo)
2.2 數(shù)據(jù)收集
電影的微博營(yíng)銷(xiāo)時(shí)間通常集中在上映之前和上映的幾周之內(nèi)。為了使本文的研究結(jié)果得到驗(yàn)證,本文選擇的2013年上映的45部電影研究,電影名稱(chēng)見(jiàn)表1。
本文的數(shù)據(jù)收集流程見(jiàn)圖2:
(1)搜索電影名稱(chēng)確定其導(dǎo)演和主要演員;
(2)查找主演和導(dǎo)演的個(gè)人認(rèn)證微博中以電影名為關(guān)鍵詞對(duì)其原創(chuàng)和轉(zhuǎn)發(fā)的所有微博,收集其粉絲數(shù)量;
(3)收集有關(guān)電影所發(fā)微博的轉(zhuǎn)發(fā)數(shù)和評(píng)論數(shù)。
2.3 數(shù)據(jù)處理
在收集數(shù)據(jù)時(shí)會(huì)遇到幾個(gè)問(wèn)題:
(1)有的電影主演沒(méi)有個(gè)人認(rèn)證微博,其粉絲數(shù)和轉(zhuǎn)發(fā)數(shù)、評(píng)論數(shù)無(wú)法收集;
(2)有的電影主演的微博評(píng)論對(duì)粉絲關(guān)閉,只有互粉者可以評(píng)論;
(3)由于個(gè)人情感等原因,每部電影的相關(guān)轉(zhuǎn)發(fā)數(shù)和評(píng)論數(shù)差距較大。
鑒于以上問(wèn)題,需要對(duì)采集到的數(shù)據(jù)進(jìn)行預(yù)處理。
(1)對(duì)于沒(méi)開(kāi)通微博的主演和導(dǎo)演,以和其影響力相同的微博賬戶(hù)來(lái)代替。
(2)對(duì)粉絲評(píng)論關(guān)閉的主演和導(dǎo)演,采用其的其他的微博轉(zhuǎn)發(fā)數(shù)和評(píng)論數(shù)來(lái)近似替代,并采取轉(zhuǎn)發(fā)數(shù)和評(píng)論數(shù)求均值來(lái)提高對(duì)比性。本文收集的電影的部分微博數(shù)據(jù)見(jiàn)表2、3。
表1 2013年上映的45部電影
序號(hào) 名稱(chēng) 序號(hào) 名稱(chēng) 序號(hào) 名稱(chēng) 序號(hào) 名稱(chēng)
1 西游降魔篇 13 不二神探 25 毒戰(zhàn) 37 神奇
2 致青春 14 廚子戲子痞子 26 非常幸運(yùn) 38 控制
3 私人定制 15 無(wú)人區(qū) 27 逃出生天 39 在一起
4 狄仁杰 16 掃毒 28 天臺(tái)愛(ài)情 40 白狐
5 中國(guó)合伙人 17 盲探 29 激戰(zhàn) 41 我愛(ài)的是你愛(ài)我
6 警察2013 18 101次求婚 30 我想和你好好的 42 越來(lái)越好之村晚
7 北京遇上西雅圖 19 分手合約 31 等風(fēng)來(lái) 43 意外的戀愛(ài)時(shí)光
8 小時(shí)代1 20 全民目擊 32 笑功震武林 44 一場(chǎng)風(fēng)花雪月的事
9 風(fēng)暴 21 四大名捕2 33 摩登年代 45 超級(jí)經(jīng)紀(jì)人
10 富春山居圖 22 一夜驚喜 34 忠烈楊家將
11 小時(shí)代2 23 特殊身份 35 百星酒店
12 一代宗師 24 被偷走的那五年 36 宮鎖沉香
圖2 電影微博數(shù)據(jù)收集流程
表2 部分電影的微博數(shù)據(jù)
序號(hào) 名稱(chēng) 主1粉絲(萬(wàn)) 主1轉(zhuǎn)發(fā)量 主1評(píng)論量 主2粉絲(萬(wàn)) 主2轉(zhuǎn)發(fā)量
1 西游降魔篇 5334 753 1392 2455 1673
2 致青春 515 4379 4539 4208 9436
3 私人定制 412 1226 2055 1809 287
4 狄仁杰 515 819 558 1484 1867
5 中國(guó)合伙人 2118 8276 2817 1476 2772
6 警察2013 2216 4461 4574 3759 3519
7 北京遇上西雅圖 516 2740 2833 556 5726
8 小時(shí)代1 2994 13201 12724 3335 7790
9 風(fēng)暴 901 232 246 6687 2772
10 富春山居圖 901 232 246 556 5726
表3 電影的微博數(shù)據(jù)
序號(hào) 名稱(chēng) 主2評(píng)論量 導(dǎo)演粉絲(萬(wàn)) 導(dǎo)演轉(zhuǎn)發(fā)量 導(dǎo)演評(píng)論 票房
1 西游降魔篇 1979 1739 7060 5875 124603
2 致青春 7796 5712 2401 2109 71888
3 私人定制 173 1739 7060 5875 71210
4 狄仁杰 908 1 386 254 60036
5 中伙 1812 4 65 49 53857
6 警察2013 14724 4 324 72 53266
7 北京遇上西雅圖 1979 6 38 22 51967
8 小時(shí)代1 5160 3168 22310 8069 48409
9 風(fēng)暴 1812 1 400 100 31452
10 富春山居圖 1979 1 400 100 30013
3.構(gòu)建模型
3.1 研究工具
采用Spss Clementine12.0軟件的神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)構(gòu)建模型。
3.2 構(gòu)建神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型
微博收集的相關(guān)數(shù)據(jù)采用神經(jīng)網(wǎng)絡(luò)來(lái)構(gòu)建電影票房的相關(guān)預(yù)測(cè)模型,需要確定其輸入層、隱藏層和輸出層的神經(jīng)元個(gè)數(shù)。神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)見(jiàn)圖3。神經(jīng)網(wǎng)絡(luò)模型的輸入輸出變量名和數(shù)據(jù)類(lèi)型見(jiàn)表4。
圖3 神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
表4 神經(jīng)網(wǎng)絡(luò)模型的輸入輸出變量名
圖4 完整的模型圖
4.實(shí)證分析
4.1 仿真實(shí)驗(yàn)
利用微博平臺(tái)收集的有關(guān)45部電影的微博數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn)時(shí),使用45個(gè)數(shù)據(jù)的66%作為訓(xùn)練數(shù)據(jù),34%作為測(cè)試數(shù)據(jù),測(cè)試集和訓(xùn)練集是采取隨機(jī)抽樣的方法得到的,這兩個(gè)部分的數(shù)據(jù)完全分離,沒(méi)有重復(fù)樣本。在實(shí)驗(yàn)中,將訓(xùn)練數(shù)據(jù)作為訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練,使用測(cè)試集對(duì)模型進(jìn)行測(cè)試。
將主1粉絲數(shù)、主1轉(zhuǎn)發(fā)數(shù)、主1評(píng)論量、主2粉絲數(shù)、主2評(píng)論量、主2轉(zhuǎn)發(fā)量、導(dǎo)演粉絲數(shù)、導(dǎo)演轉(zhuǎn)發(fā)量、導(dǎo)演評(píng)論量的方向設(shè)置為輸入,將票房設(shè)置為輸出。將神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)加入到模型中,設(shè)置神經(jīng)網(wǎng)絡(luò)的隱藏層數(shù)和每層的神經(jīng)元數(shù)。在神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)的專(zhuān)家選項(xiàng)中選擇兩個(gè)隱藏層,層1選擇6,層2選(下轉(zhuǎn)第16頁(yè))(上接第13頁(yè))擇2。基于神經(jīng)網(wǎng)絡(luò)的完整模型見(jiàn)圖4。
4.2 結(jié)果分析
利用微博數(shù)據(jù)進(jìn)行建模之后,得出變量重要性見(jiàn)表5。基于數(shù)據(jù)的分析,可知導(dǎo)演粉和主2粉對(duì)電影票房預(yù)測(cè)模型有著很高的貢獻(xiàn)率。如果某部電影導(dǎo)演的粉絲數(shù)、轉(zhuǎn)發(fā)量和評(píng)論量大大高于其他電影導(dǎo)演,那么導(dǎo)演的指標(biāo)的貢獻(xiàn)率比主演的指標(biāo)要高。在現(xiàn)實(shí)的電影票房中,小時(shí)代的導(dǎo)演郭敬明和致青春導(dǎo)演趙薇粉絲數(shù)、轉(zhuǎn)發(fā)量、評(píng)論量都遠(yuǎn)超其他導(dǎo)演,票房也遠(yuǎn)比其他電影高。
表5 變量的重要性
變量名 變量重要性 變量名 變量重要性 變量名 變量重要性
主2粉絲數(shù) 0.24 導(dǎo)演評(píng)論量 0.124 導(dǎo)演轉(zhuǎn)發(fā)量 0.041
導(dǎo)演粉絲數(shù) 0.183 主2轉(zhuǎn)發(fā)量 0.117 主1評(píng)論量 0.032
主2評(píng)論量 0.181 主1粉絲數(shù) 0.058 主1轉(zhuǎn)發(fā)量 0.025
經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)模型使用訓(xùn)練集數(shù)據(jù)建模得到的模型的估計(jì)準(zhǔn)確性為89.894%,即訓(xùn)練集數(shù)據(jù)的擬合優(yōu)度為90%,從模型預(yù)測(cè)的精準(zhǔn)性來(lái)看,數(shù)據(jù)量的增多會(huì)提高模型的預(yù)測(cè)結(jié)果。
4.3 模型評(píng)估
使用訓(xùn)練集數(shù)據(jù)建立基于神經(jīng)網(wǎng)絡(luò)的電影票房預(yù)測(cè)模型之后,要使用測(cè)試集數(shù)據(jù)對(duì)模型預(yù)測(cè)性能進(jìn)行評(píng)估。本文使用相同的測(cè)試集數(shù)據(jù)分別對(duì)電影票房的線性回歸模型和決策樹(shù)模型進(jìn)行測(cè)試,來(lái)比對(duì)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)準(zhǔn)確性。三種模型對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè)的平均相對(duì)誤差見(jiàn)表6,平均誤差見(jiàn)圖5。可知運(yùn)用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型具有良好的預(yù)測(cè)精確度。
表6 三種模型的平均相對(duì)誤差 %
方法 平均相對(duì)誤差
神經(jīng)網(wǎng)絡(luò) 82.42
C&RT 94.07
線性回歸 104.55
圖5 三種模型的誤差對(duì)比圖
5.結(jié)束語(yǔ)
本文利用Spss Clementine中的神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)構(gòu)建了電影票房的預(yù)測(cè)模型。通過(guò)結(jié)果分析得出電影票房與主演和導(dǎo)演粉、轉(zhuǎn)和評(píng)和電影票房的關(guān)系,并給出了具體的預(yù)測(cè)模型。其精確度為89.894%,平均誤差相對(duì)較小,具有一定的可信度。
但是,本文建模所用的電影數(shù)目為45個(gè),進(jìn)一步加大數(shù)據(jù)量可以提高模型的精確度,同時(shí)微博數(shù)據(jù)不局限于電影主創(chuàng)們的微博,還可以通過(guò)統(tǒng)計(jì)一定時(shí)間內(nèi)以某部電影為關(guān)鍵詞所發(fā)微博總量等數(shù)據(jù)來(lái)預(yù)測(cè)電影票房,增加輸入神經(jīng)元個(gè)數(shù)也能提高模型的準(zhǔn)確性。下一步的研究可以將微博作為平臺(tái),將微博中關(guān)于某部電影的情感分析加入到電影票房的預(yù)測(cè)中,也可進(jìn)一步考慮微博轉(zhuǎn)發(fā)深度、評(píng)論活躍程度,以及相關(guān)微博數(shù)量隨電影上映日期臨近的變化趨勢(shì)等數(shù)據(jù),這些都可以被有效的提煉為特征并加入到模型中。
參考文獻(xiàn)
[1]Ramya Neelamegham,Pradeep Chintagunta.A Bayesian Model to Forecast New Product Performance in Domestic and International Markets[J].Marketing Science,1999,18(2)115-136.
[2]Sharda R,Delen D.Predicting box-office success of motion pictures with neural networks[J].Expert Systems with Applications,2006,30(2):243-254.
[3]MarshallP,Dockendorff M,Ibanez S.A forecasting system for movie attendance[J].Journal of Business Research,2013,66(13):1800-1806.
【關(guān)鍵詞】微表情識(shí)別 卷積神經(jīng)網(wǎng)絡(luò) 長(zhǎng)短時(shí)記憶
1 引言
人們的內(nèi)心想法通常都會(huì)表現(xiàn)在面部表情上,然而在一些極端環(huán)境下,人們?yōu)榱藟阂肿约旱恼鎸?shí)內(nèi)心情感時(shí),他們的面部變化十分微小,我們通常稱(chēng)之為微表情。在刑偵、醫(yī)學(xué)、教育、心理和國(guó)防等領(lǐng)域上,微表情的應(yīng)用前景十分遠(yuǎn)大, 不過(guò)即便是經(jīng)過(guò)訓(xùn)練的人也很難用肉眼來(lái)準(zhǔn)確的檢測(cè)和識(shí)別微表情。其主要原因就是它的持續(xù)時(shí)間短,僅為1/5~1/25s,而且動(dòng)作幅度很小。
人臉表情識(shí)別技術(shù)早已發(fā)展到一定程度了,甚至不少研究團(tuán)隊(duì)提出的方法針對(duì)6種基本表情的識(shí)別率已經(jīng)達(dá)到90%。然而微表情識(shí)別技術(shù)的研究在近幾年來(lái)才剛剛開(kāi)始,如Pfister等提出了一種結(jié)合時(shí)域插值模型和多核學(xué)習(xí)的方法來(lái)識(shí)別微表情; Wu等設(shè)計(jì)了一種使用Gabor特征和支持向量機(jī)的微表情識(shí)別系統(tǒng);唐紅梅等在LTP做出改進(jìn)而提出的MG-LTP算法,然后采用極限學(xué)習(xí)機(jī)對(duì)微表情進(jìn)行訓(xùn)練和分類(lèi);Wang等提出了基于判別式張量子空間分析的特征提取方法,并利用極限學(xué)習(xí)機(jī)訓(xùn)練和分類(lèi)微表情。
上述的識(shí)別技術(shù)都是基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法,而近幾年來(lái),利用深度學(xué)習(xí)技術(shù)來(lái)解決圖像識(shí)別問(wèn)題是當(dāng)前的研究熱點(diǎn)。在ILSVRC-2012圖像識(shí)別競(jìng)賽中,Krizhevsky等利用深度卷積神經(jīng)網(wǎng)絡(luò)的自適應(yīng)特征提取方法,其性能遠(yuǎn)遠(yuǎn)超過(guò)使用人工提取特征的方法,并且在近幾年內(nèi)的ImageNet大規(guī)模視覺(jué)識(shí)別挑戰(zhàn)比賽中連續(xù)刷新了世界紀(jì)錄。
本文決定使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來(lái)提取人臉微表情特征,它能讓機(jī)器自主地從樣本數(shù)據(jù)中學(xué)習(xí)到表示這些微表情的本質(zhì)特征,而這些特征更具有一般性。由于微表情的特性,要充分利用微表情的上下文信息才能更為精確的識(shí)別微表情,這里我們采用長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM),它是遞歸神經(jīng)網(wǎng)絡(luò)(RNN)中的一種變換形式,它能夠充分的利用數(shù)據(jù)的上下文信息,在對(duì)序列的識(shí)別任務(wù)中表現(xiàn)優(yōu)異,近幾年來(lái)它被充分的利用到自然語(yǔ)言處理、語(yǔ)音識(shí)別機(jī)器翻譯等領(lǐng)域。綜上所述,本文提出一種CNN和LSTM結(jié)合的微表情識(shí)別方法。
2 相關(guān)工作
2.1 卷積神經(jīng)網(wǎng)絡(luò)模型
卷積神經(jīng)網(wǎng)絡(luò)模型(CNN)最早是由LeCun等在1990年首次提出,現(xiàn)已在圖像識(shí)別領(lǐng)域取得巨大成功,它能夠發(fā)現(xiàn)隱藏在圖片中的特征,相比人工提取的特征更具有區(qū)分度,而且不需要對(duì)原始數(shù)據(jù)做過(guò)多的預(yù)處理。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)通過(guò)三種方式來(lái)讓網(wǎng)絡(luò)所學(xué)習(xí)到的特征更具有魯棒性:局部感受野、權(quán)值共享和降采樣。局部感受野是指每一個(gè)卷積層的神經(jīng)元只能和上一層的一部分神經(jīng)元連接,而不是一般神經(jīng)網(wǎng)絡(luò)里所要求的全連接,這樣每一個(gè)神經(jīng)元能夠感受到局部的視覺(jué)特征,然后在更高層將局部信息進(jìn)行整合,進(jìn)而得到整個(gè)圖片的描述信息。權(quán)值共享是指每一個(gè)神經(jīng)元和上一層的部分神經(jīng)元所連接的每一條邊的權(quán)值,和當(dāng)前層其他神經(jīng)元和上一層連接的每一條邊的權(quán)值是一樣的,首先@樣減少了需要訓(xùn)練的參數(shù)個(gè)數(shù),其次我們可以把這種模式作為提取整個(gè)圖片特征的一種方式。降采樣是指通過(guò)將一定范圍內(nèi)的像素點(diǎn)壓縮為一個(gè)像素點(diǎn),使圖像縮放,減少特征的維度,通常在卷積層之后用來(lái)讓各層所得到的特征具有平移、縮放不變形,從而使特征具有更強(qiáng)的泛化性。
2.2 長(zhǎng)短時(shí)記憶型遞歸神經(jīng)網(wǎng)絡(luò)模型
長(zhǎng)短時(shí)記憶(LSTM)模型是由Hochreiter提出,它解決了傳統(tǒng)RNN在處理長(zhǎng)序列數(shù)據(jù)時(shí)存在的梯度消失問(wèn)題,這一切都要?dú)w結(jié)于LSTM結(jié)構(gòu)的精心設(shè)計(jì)。一個(gè)常規(guī)的LSTM結(jié)構(gòu)如圖1所示。
每一個(gè)LSTM結(jié)構(gòu)都有一個(gè)記憶單元Ct(t表示當(dāng)前時(shí)刻),它保存著這個(gè)時(shí)刻LSTM結(jié)構(gòu)的內(nèi)部狀態(tài),同時(shí)里面還有三個(gè)門(mén)來(lái)控制整個(gè)結(jié)構(gòu)的變化,它們分別是輸入門(mén)(xt),忘記門(mén)(ft)和輸出門(mén)(ht),它們的定義如下所示:
(1)
(2)
(3)
(4)
(5)
(6)
其中σ是一個(gè)sigmod函數(shù),而則表示輸入數(shù)據(jù)的非線性變化,W和b是模型需要訓(xùn)練得到的參數(shù)。等式5展示了當(dāng)前的記憶單元是由忘記門(mén)和上一時(shí)刻的內(nèi)部狀態(tài)所控制的,ft決定了上一時(shí)刻的內(nèi)部狀態(tài)對(duì)當(dāng)前時(shí)刻的內(nèi)部狀態(tài)的影響程度,而it則確定了輸入數(shù)據(jù)的非線性變換得到的狀態(tài)對(duì)當(dāng)前時(shí)刻記憶單元的影響程度。等式6展示了輸出門(mén)和當(dāng)前時(shí)刻的內(nèi)部狀態(tài)決定了該LSTM的輸出。正因?yàn)檫@個(gè)巧妙的設(shè)計(jì),LSTM就能處理長(zhǎng)序列的數(shù)據(jù),并且能夠從輸入序列中獲取時(shí)間上的關(guān)聯(lián)性,這一特性對(duì)于微表情的識(shí)別尤為重要。
3 網(wǎng)絡(luò)結(jié)構(gòu)調(diào)優(yōu)和改進(jìn)
3.1 卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)
本文針對(duì)輸入大小為96×96的灰度圖,構(gòu)建了4個(gè)卷積層(C1,C2,C3,C4),4個(gè)池化層(S1,S2,S3,S4),1個(gè)全連接層(FC1)和1個(gè)Softmax層組成的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),如圖2所示。卷積核(C1,C2,C3,C4)的大小分別為3×3,3×3,5×5,5×5,分別有32,32,32,64個(gè)。池化層的降采樣核大小均為2×2,并且全部采用的是最大采樣,每一個(gè)池化層都在對(duì)應(yīng)的卷積層之后,而在所有的卷積層之后,連接了一個(gè)包含256個(gè)神經(jīng)元的全連接層,為了盡可能的避免過(guò)擬合問(wèn)題,本文在全連接層后加入一個(gè)p=0.75的Dropout層,除了softmax層,其余層的激活函數(shù)全部是采用ReLU,CNN的參數(shù)訓(xùn)練都是采用隨機(jī)梯度下降算法,每一批次包含100張圖片,并設(shè)置沖量為0.9,學(xué)習(xí)速率為0.001。
3.2 長(zhǎng)短時(shí)記憶型遞歸神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)
盡管CNN已經(jīng)從人臉微表情圖片從學(xué)習(xí)到了特征,但是單一的CNN模型忽略了微表情在時(shí)域上的信息。于是我們提出通過(guò)LSTM來(lái)學(xué)習(xí)不同人臉表情在時(shí)域上的關(guān)聯(lián)特征。我們構(gòu)建了多個(gè)LSTM層,以及一個(gè)softmax層。
我們首先先訓(xùn)練好CNN的參數(shù),然后把訓(xùn)練好的CNN模型,作為一個(gè)提取人臉微表情的工具,對(duì)于每一幀圖片,我們把最后一個(gè)全連接層的256維的向量輸出作為提取的特征。那么給定一個(gè)時(shí)間點(diǎn)t,我們?nèi)≈暗腤幀圖片([t-W+1,t])。然后將這些圖片傳入到訓(xùn)練好的CNN模型中,然后提取出W幀圖片的特征,如果某一個(gè)序列的特征數(shù)目不足,那么用0向量補(bǔ)全,每一個(gè)特征的維度為256,接著將這些圖片的特征依次輸入到LSTM的節(jié)點(diǎn)中去,只有t時(shí)刻,LSTM才會(huì)輸出它的特征到softmax層。同樣LSTM網(wǎng)絡(luò)的參數(shù)訓(xùn)練還是采用隨機(jī)梯度下降算法,每一批次為50個(gè)序列,沖量為0.85,學(xué)習(xí)速率為0.01。
4 實(shí)驗(yàn)
4.1 微表情數(shù)據(jù)集
該實(shí)驗(yàn)的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)均來(lái)自于中國(guó)科學(xué)院心理研究所傅小蘭團(tuán)隊(duì)的第2代改進(jìn)數(shù)據(jù)庫(kù)CASMEII。該數(shù)據(jù)庫(kù)從26名受試者中捕捉到近3000個(gè)面部動(dòng)作中選取的247個(gè)帶有微表情的視頻,并且給出了微表情的起始和結(jié)束時(shí)間以及表情標(biāo)簽,由于其中悲傷和害怕表情的數(shù)據(jù)量并不多,因此本文選取了里面的5類(lèi)表情(高興,惡心,驚訝,其他,中性),由于數(shù)據(jù)庫(kù)中的圖片尺寸不一樣并且是彩色圖片,因此先將圖片進(jìn)行灰度處理,并歸一化到 大小作為網(wǎng)絡(luò)的輸入。本實(shí)驗(yàn)采用5折交叉驗(yàn)證的方法,選取245個(gè)微表情序列等分成5份,每個(gè)序列的圖片有10張到70張不等,每份均包含5類(lèi)表情。
4.2 CNN+LSTM和CNN的對(duì)比實(shí)驗(yàn)
從圖2中可以看出不同策略在五類(lèi)表情里的識(shí)別率。當(dāng)我們采用單一的CNN模型來(lái)對(duì)人臉微表情進(jìn)行分類(lèi)時(shí),我們采取了dropout策略和數(shù)據(jù)集擴(kuò)增策略來(lái)防止CNN過(guò)擬合。CNN+D表示采取了dropout策略的CNN模型,CNN+A表示采取了數(shù)據(jù)擴(kuò)增策略的CNN模型, 即對(duì)每一張圖片進(jìn)行了以下四種變換:旋轉(zhuǎn)、水平平移、垂直平移、水平翻轉(zhuǎn)。從而能將數(shù)據(jù)集擴(kuò)增至4倍。CNN+AD表示采取了兩種策略的CNN模型。CNN+LSTM表示結(jié)合了CNN和LSTM的網(wǎng)絡(luò)模型。
從表1中我們可以看出,添加了策略的CNN,在人微表情識(shí)別上的表現(xiàn)要好于沒(méi)有添加策略的CNN,這可能是因?yàn)橛?xùn)練圖片較少,而CNN網(wǎng)絡(luò)層次較深,導(dǎo)致沒(méi)有添加策略的CNN在訓(xùn)練參數(shù)的過(guò)程中很容易就過(guò)擬合了。而對(duì)于CNN+LSTM的表現(xiàn)要好于單一的CNN模型,這說(shuō)明LSTM的確能夠充分利用時(shí)域上的特征信息,從而能夠更好識(shí)別序列數(shù)據(jù),這證明了CNN+LSTM的模型可以用于識(shí)別人臉微表情的可行性。從表1中,我們還可以看出高興和驚訝的表情識(shí)別率較高,而其他的則相對(duì)較低,這可能是因?yàn)楦吲d和驚訝的區(qū)分度較大,并且樣本較多。
4.3 LSTM的參數(shù)調(diào)整
下面我們逐一的研究不同參數(shù)對(duì)CNN+LSTM模型的微表情識(shí)別率的影響程度。
圖4顯示輸入的序列個(gè)數(shù)為100左右能夠擁有相對(duì)較高的準(zhǔn)確率,這說(shuō)明只有充分利用每一個(gè)微表情序列的時(shí)域信息,這樣,訓(xùn)練出的模型才更加具有一般性。
圖5顯示出當(dāng)LSTM隱層的神經(jīng)元個(gè)數(shù)為128時(shí),此時(shí)的微表情平均識(shí)別率最高,這說(shuō)明隱層需要足夠多的神經(jīng)元才能保留更長(zhǎng)的時(shí)域信息,對(duì)于微表情識(shí)別來(lái)說(shuō),能夠擁有更高的精度。
圖6顯示了LSTM隱層的個(gè)數(shù)為5時(shí),該模型擁有最好的識(shí)別率,這說(shuō)明較深的LSTM網(wǎng)絡(luò)才能充分挖掘特征的時(shí)域信息。因此經(jīng)過(guò)以上實(shí)驗(yàn),我們得到了一個(gè)由5層LSTM,每一層包含128個(gè)神經(jīng)元,并能夠處理長(zhǎng)度為100的特征序列的模型。
4.4 和非深度學(xué)習(xí)算法的實(shí)驗(yàn)對(duì)比
為了比較傳統(tǒng)機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法孰優(yōu)孰劣,我們使用傳統(tǒng)機(jī)器學(xué)習(xí)算法在Casme2進(jìn)行了一樣的實(shí)驗(yàn),從表2中可以看出,本文所提出的CNN+LSTM模型相對(duì)于這些傳統(tǒng)機(jī)器學(xué)習(xí)模型,有著較為優(yōu)異的表現(xiàn)。
本文中的實(shí)驗(yàn)均是基于Google的開(kāi)源機(jī)器學(xué)習(xí)庫(kù)TensorFlow上進(jìn)行的,硬件平臺(tái)是dell工作站:Intel(R) Core(TM) i7-5820K CPU、主頻3.3GHZ,內(nèi)存64GB、Nvida GeForce GTX TITAN X GPU、顯存12GB。
5 結(jié)束語(yǔ)
本文針對(duì)傳統(tǒng)方法對(duì)微表情識(shí)別率低,圖片預(yù)處理復(fù)雜的情況,提出了采用卷積神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)(LSTM)結(jié)合的方式,通過(guò)前面的卷積網(wǎng)絡(luò)層來(lái)提取微表情的靜態(tài)特征,省去了傳統(tǒng)機(jī)器學(xué)習(xí)方法,需要人工提取特征的過(guò)程,簡(jiǎn)化了特征提取的工作。然后再通過(guò)后面的遞歸神經(jīng)網(wǎng)路,充分利用表情特征序列的上下文信息,從而在序列數(shù)據(jù)中發(fā)現(xiàn)隱藏在其中的時(shí)域信息,從實(shí)驗(yàn)結(jié)果中可以看出,利用了時(shí)域信息的CNN+LSTM比單純使用CNN的識(shí)別率更高,而且相對(duì)于傳統(tǒng)機(jī)器學(xué)習(xí)方法也更為優(yōu)秀。但是當(dāng)數(shù)據(jù)量越大時(shí),如果網(wǎng)絡(luò)的層次比較深的話,模型的訓(xùn)練時(shí)間就會(huì)很長(zhǎng),并且極度依賴(lài)硬件設(shè)備,這算是深度學(xué)習(xí)通有的弊病。為了進(jìn)一步投入到應(yīng)用中去,接下來(lái)還得提高微表情的識(shí)別率,以及在實(shí)時(shí)環(huán)境下,如何能夠動(dòng)態(tài)和準(zhǔn)確的識(shí)別微表情,這些都將會(huì)是以后研究的重點(diǎn)。
參考文獻(xiàn)
[1]PORTER S,TEN BRINKE L.Reading between the Lies Identifying Concealed and Falsified Emotions in Universal Facial Expressions[J].Psychological Science,2008,19(05):508-514.
[2]Pfister T,Li X,Zhao G,Pietikainen M (2011) Recognising spontaneous facial micro-expressions.2011 Proc IEEE Int Conf Comput Vis (ICCV): IEEE.pp.1449-1456.
[3]Wu Q,Shen X,F(xiàn)u X (2011) The Machine Knows What You Are Hiding: An Automatic Micro-expression Recognition System.In: D’Mello S,Graesser A,Schuller B,Martin J-C,editors.Affect Comput Intell Interact.Springer Berlin/ Heidelberg. pp.152-162.
[4]唐紅梅,石京力,郭迎春,韓力英,王霞. 基于MG-LTP與ELM的微表情識(shí)別[J].電視技術(shù),2015,39(03):123-126.
[5]WANG S J,CHEN H L,YAN W J,et al. Face Recognition and Micro-Expression Recognition Based on Discriminant Tensor Subspace Analysis Plus Extreme Learning Machine[J].Neural Processing Letters,2014,39(01):25-43.
[6]Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks. In:Advances in Neural Information Processing Systems 25.Lake Tahoe, Nevada,USA:Curran Associates,Inc., 2012.1097?1105
[7]DENG J,DONG W,SOCHER R,et al.Imagenet:A large-scale hierarchical image database [C]//IEEE Conference on Computer Vision and Pattern Recognition.Piscataway,NJ:IEEE,2009:248-255.
[8]BENGIO Y,DELALLEAU O.On the expressive power of deep archi-tectures[C]//Proc of the 14th International Conference on Discovery Science.Berlin:Springer-Verlag,2011:18-36.
[9]LeCun Y,Boser B,Denker J S,Howard R E,Hubbard W,Jackel L D,Henderson D.Handwritten digit recogni- tion with a back-propagation network. In: Proceedings of Advances in Neural Information Processing Systems 2. San Francisco,CA,USA:Morgan Kaufmann Publishers Inc.,1990.396-404.
[10]S可.卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別上的應(yīng)用研究[D].杭州:浙江大學(xué)[學(xué)位論文],2012.
[11]Hochreiter S,Sehmidhuber J.Long Short-Term Memory.Neural Computation,1997,9(08):1735-1780
[12]LUCEY P,COHN J F,KANADE T,et al.The Extended Cohn-Kanade Dataset ( CK + ): A complete dataset for ac- tion unit and emotion-specified expression [C] //IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).New York:IEEE,2010:94-101.
[13]Dayan P,Abott L F.Theoretical Neuroscience.Cambridge:MIT Press, 2001.
[14]YAN W J, LI X, WANG S J, et al. CASME II: An Improved Spontaneous Micro-Expression Database and the Baseline Evaluation [J].Plos One, 2014,9(01):1-8.
[15]Yandan Wang,John See,Raphael C-W Phan,Yee-Hui Oh. Efficient Spatio-Temporal Local Binary Patterns for Spontaneous Facial Micro-Expression Recognition[J].PLOS ONE,2013,10(05): 11-12
[16]張軒閣,田彥濤,郭艷君,王美茜.基于光流與LBP-TOP特征結(jié)合的微表情識(shí)別[J].吉林大學(xué)學(xué)報(bào):信息科學(xué)版, 2015,33(05):521-522.
[17]Martín Abadi, Paul BarhamJianmin, Chen el.TensorFlow:Large-Scale Machine Learning on Heterogeneous Distributed Systems[EB/OL].https:///abs/1605.08695.
關(guān)鍵詞:人機(jī)大戰(zhàn);人工智能;發(fā)展前景
中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A
0.引言
2016年3月15日,備受矚目的“人機(jī)大戰(zhàn)”終于落下帷幕,最終Google公司開(kāi)發(fā)的“AlphaGo”以4∶1戰(zhàn)勝了韓國(guó)九段棋手李世h。毫無(wú)疑問(wèn),這是人工智能歷史上一個(gè)具有里程碑式的大事件。大家一致認(rèn)為,人工智能已經(jīng)上升到了一個(gè)新的高度。
這次勝利與1997年IBM公司的“深藍(lán)”戰(zhàn)勝?lài)?guó)際象棋世界冠軍卡斯帕羅不同。主要表現(xiàn)在兩個(gè)方面:
(1)AlphaGo的勝利并非僅僅依賴(lài)強(qiáng)悍的計(jì)算能力和龐大的棋譜數(shù)據(jù)庫(kù)取勝,而是AlphaGo已經(jīng)擁有了深度學(xué)習(xí)的能力,能夠?qū)W習(xí)已經(jīng)對(duì)弈過(guò)的棋盤(pán),并在練習(xí)和實(shí)戰(zhàn)中不斷學(xué)習(xí)和積累經(jīng)驗(yàn)。
(2)圍棋比國(guó)際象棋更加復(fù)雜,圍棋棋盤(pán)有361個(gè)點(diǎn),其分支因子無(wú)窮無(wú)盡,19×19格圍棋的合法棋局?jǐn)?shù)的所有可能性是冪為171的指數(shù),這樣的計(jì)算量相當(dāng)巨大。英國(guó)圍棋聯(lián)盟裁判托比表示:“圍棋是世界上最為復(fù)雜的智力游戲,它簡(jiǎn)單的規(guī)則加深了棋局的復(fù)雜性”。因此,進(jìn)入圍棋領(lǐng)域一直被認(rèn)為是目前人工智能的最大挑戰(zhàn)。
簡(jiǎn)而言之,AlphaGo取得勝利的一個(gè)很重要的方面就是它擁有強(qiáng)大的“學(xué)習(xí)”能力。深度學(xué)習(xí)是源于人工神經(jīng)網(wǎng)絡(luò)的研究,得益于大數(shù)據(jù)和互聯(lián)網(wǎng)技術(shù)。本文就從人工智能的發(fā)展歷程與現(xiàn)狀入手,在此基礎(chǔ)上分析了人工智能的未來(lái)發(fā)展前景。
1.人工智能的發(fā)展歷程
AlphaGo的勝利表明,人工智能發(fā)展到今天,已經(jīng)取得了很多卓越的成果。但是,其發(fā)展不是一帆風(fēng)順的,人工智能是一個(gè)不斷進(jìn)步,并且至今仍在取得不斷突破的學(xué)科。回顧人工智能的發(fā)展歷程,可大致分為孕育、形成、暗淡、知識(shí)應(yīng)用和集成發(fā)展五大時(shí)期。
孕育期:1956年以前,數(shù)學(xué)、邏輯、計(jì)算機(jī)等理論和技術(shù)方面的研究為人工智能的出現(xiàn)奠定了基礎(chǔ)。德國(guó)數(shù)學(xué)家和哲學(xué)家萊布尼茨把形式邏輯符號(hào)化,奠定了數(shù)理邏輯的基礎(chǔ)。英國(guó)數(shù)學(xué)家圖靈在1936年創(chuàng)立了自動(dòng)機(jī)理論(亦稱(chēng)圖靈機(jī)),1950年在其著作《計(jì)算機(jī)與智能》中首次提出“機(jī)器也能思維”,被譽(yù)為“人工智能之父”。總之,這些人為人工智能的孕育和產(chǎn)生做出了巨大的貢獻(xiàn)。
形成期:1956年夏季,在美國(guó)達(dá)特茅斯大學(xué)舉辦了長(zhǎng)達(dá)2個(gè)多月的研討會(huì),熱烈地討論用機(jī)器模擬人類(lèi)智能的問(wèn)題。該次會(huì)議首次使用了“人工智能”這一術(shù)語(yǔ)。這是人類(lèi)歷史上第一次人工智能研討會(huì),標(biāo)志著人工智能學(xué)科的誕生。其后的十幾年是人工智能的黃金時(shí)期。在接下來(lái)的幾年中,在眾多科學(xué)家的努力下,人工智能取得了矚目的突破,也在當(dāng)時(shí)形成了廣泛的樂(lè)觀思潮。
暗淡期:20世紀(jì)70年代初,即使最杰出的AI程序也只能解決問(wèn)題中最簡(jiǎn)單的部分,發(fā)展遇到瓶頸也就是說(shuō)所有的AI程序都只是“玩具”,無(wú)法解決更為復(fù)雜的問(wèn)題。隨著AI遭遇批評(píng),對(duì)AI提供資助的機(jī)構(gòu)也逐漸停止了部分AI的資助。資金上的困難使得AI的研究方向縮窄,缺少了以往的自由探索。
知識(shí)應(yīng)用期:在80年代,“專(zhuān)家系統(tǒng)”(Expect System)成為了人工智能中一個(gè)非常主流的分支。“專(zhuān)家系統(tǒng)”是一種程序,為計(jì)算機(jī)提供特定領(lǐng)域的專(zhuān)門(mén)知識(shí)和經(jīng)驗(yàn),計(jì)算機(jī)就能夠依據(jù)一組從專(zhuān)門(mén)知識(shí)中推演出的邏輯規(guī)則在某一特定領(lǐng)域回答或解決問(wèn)題。不同領(lǐng)域的專(zhuān)家系統(tǒng)基本都是由知識(shí)庫(kù)、數(shù)據(jù)庫(kù)、推理機(jī)、解釋機(jī)制、知識(shí)獲取等部分組成。
集成發(fā)展期:得益于互聯(lián)網(wǎng)的蓬勃發(fā)展、計(jì)算機(jī)性能的突飛猛進(jìn)、分布式系統(tǒng)的廣泛應(yīng)用以及人工智能多分支的協(xié)同發(fā)展,人工智能在這一階段飛速發(fā)展。尤其是隨著深度學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)研究的不斷深入,人工智能在近幾十年中取得了長(zhǎng)足的進(jìn)步,取得了令人矚目的成就。
人工智能發(fā)展到今天,出現(xiàn)了很多令人矚目的研究成果。AlphaGo的勝利就是基于這些研究成果的一個(gè)里程碑。當(dāng)前人工智能的研究熱點(diǎn)主要集中在自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)等領(lǐng)域。
2.人工智能l展現(xiàn)狀與前景
人工智能當(dāng)前有很多重要的研究領(lǐng)域和分支。目前,越來(lái)越多的AI項(xiàng)目依賴(lài)于分布式系統(tǒng),而當(dāng)前研究的普遍熱點(diǎn)則集中于自然語(yǔ)言處理、機(jī)器學(xué)習(xí)和人工神經(jīng)網(wǎng)絡(luò)等領(lǐng)域。
自然語(yǔ)言處理:自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱(chēng)NLP),是語(yǔ)言學(xué)與人工智能的交叉學(xué)科,其主要功能就是實(shí)現(xiàn)讓機(jī)器明白人類(lèi)的語(yǔ)言,這需要將人類(lèi)的自然語(yǔ)言轉(zhuǎn)化為計(jì)算機(jī)能夠處理的機(jī)器語(yǔ)言。
自然語(yǔ)言處理主要包括詞法分析、句法分析和語(yǔ)義分析三大部分。詞法分析的核心就是分詞處理,即單詞的邊界處理。句法分析就是對(duì)自然語(yǔ)言中句子的結(jié)構(gòu)、語(yǔ)法進(jìn)行分析如辨別疑問(wèn)句和感嘆句等。而語(yǔ)義分析則注重情感分析和整個(gè)段落的上下文分析,辨別一些字詞在不同的上下文定的語(yǔ)義和情感態(tài)度。
當(dāng)前自然語(yǔ)言的處理主要有兩大方向。一種是基于句法-語(yǔ)義規(guī)則的理性主義理論,該理論認(rèn)為需要為計(jì)算機(jī)制定一系列的規(guī)則,計(jì)算機(jī)在規(guī)則下進(jìn)行推理與判斷。因此其技術(shù)路線是一系列的人為的語(yǔ)料建設(shè)與規(guī)則制定。第二種是基于統(tǒng)計(jì)學(xué)習(xí)的經(jīng)驗(yàn)主義理論,這種理論在最近受到普遍推崇。該理論讓計(jì)算機(jī)自己通過(guò)學(xué)習(xí)并進(jìn)行統(tǒng)計(jì)推斷的方式不停地從數(shù)據(jù)中“學(xué)習(xí)”語(yǔ)言,試圖刻畫(huà)真實(shí)世界的語(yǔ)言現(xiàn)象,從數(shù)據(jù)中統(tǒng)計(jì)語(yǔ)言的規(guī)律。
機(jī)器學(xué)習(xí):機(jī)器學(xué)習(xí)(Machine Learning)是近20年來(lái)興起的人工智能一大重要領(lǐng)域。其主要是指通過(guò)讓計(jì)算機(jī)在數(shù)據(jù)中自動(dòng)分析獲得規(guī)律,從而獲取“自我學(xué)習(xí)”的能力,并利用規(guī)律對(duì)未知數(shù)據(jù)進(jìn)行判斷和預(yù)測(cè)的方法。
機(jī)器學(xué)致可以分為有監(jiān)督的學(xué)習(xí)和無(wú)監(jiān)督的學(xué)習(xí)。有監(jiān)督的學(xué)習(xí)是從給定的訓(xùn)練數(shù)據(jù)集中練出一個(gè)函數(shù)和目標(biāo),當(dāng)有新的數(shù)據(jù)到來(lái)時(shí),可以由訓(xùn)練得到函數(shù)預(yù)測(cè)目標(biāo)。有監(jiān)督的學(xué)習(xí)要求訓(xùn)練集同時(shí)有輸入和輸出,也就是所謂的特征和目標(biāo)。而依據(jù)預(yù)測(cè)的結(jié)果是離散的還是連續(xù)的,將有監(jiān)督的學(xué)習(xí)分為兩大問(wèn)題,即統(tǒng)計(jì)分類(lèi)問(wèn)題和回歸分析問(wèn)題。統(tǒng)計(jì)分類(lèi)的預(yù)測(cè)結(jié)果是離散的,如腫瘤是良性還是惡性等;而回歸分析問(wèn)題目標(biāo)是連續(xù)的,如天氣、股價(jià)等的預(yù)測(cè)。
無(wú)監(jiān)督學(xué)習(xí)的訓(xùn)練集則沒(méi)有人為標(biāo)注的結(jié)果,這就需要計(jì)算機(jī)去發(fā)現(xiàn)數(shù)據(jù)間的聯(lián)系并用來(lái)分類(lèi)等。一種常見(jiàn)的無(wú)監(jiān)督學(xué)習(xí)是聚類(lèi)分析(Cluster Analysis),它是將相似的對(duì)象通過(guò)靜態(tài)分類(lèi)的方法分成不同的組別或者是特定的子集,讓同一個(gè)子集中的數(shù)據(jù)對(duì)象都有一些相似的屬性,比較常用的聚類(lèi)方法是簡(jiǎn)潔并快速的“K-均值”聚類(lèi)算法。它基于K個(gè)中心并對(duì)距離這些中心最近的數(shù)據(jù)對(duì)象進(jìn)行分類(lèi)。
機(jī)器學(xué)習(xí)還包括如半監(jiān)督學(xué)習(xí)和增強(qiáng)學(xué)習(xí)等類(lèi)別。總而言之,機(jī)器學(xué)習(xí)是研究如何使用機(jī)器來(lái)模擬人類(lèi)學(xué)習(xí)活動(dòng)的一門(mén)學(xué)科,而其應(yīng)用隨著人工智能研究領(lǐng)域的深入也變得越來(lái)越廣泛,如模式識(shí)別、計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別、推薦算法等領(lǐng)域越來(lái)越廣泛地應(yīng)用到了機(jī)器學(xué)習(xí)中。
人工神經(jīng)網(wǎng)絡(luò):在腦神經(jīng)科學(xué)領(lǐng)域,人們認(rèn)為人類(lèi)的意識(shí)及智能行為,都是通過(guò)巨大的神經(jīng)網(wǎng)絡(luò)傳遞的,每個(gè)神經(jīng)細(xì)胞通過(guò)突出與其他神經(jīng)細(xì)胞連接,當(dāng)通過(guò)突觸的信號(hào)強(qiáng)度超過(guò)某個(gè)閾值時(shí),神經(jīng)細(xì)胞便會(huì)進(jìn)入激活狀態(tài),向所連接的神經(jīng)細(xì)胞一層層傳遞信號(hào)。于1943年提出的基于生物神經(jīng)元的M-P模型的主要思想就是將神經(jīng)元抽象為一個(gè)多輸入單輸出的信息處理單元,并通過(guò)傳遞函數(shù)f對(duì)輸入x1,x2…,xn進(jìn)行處理并模擬神經(jīng)細(xì)胞的激活模式。主要的傳遞函數(shù)有階躍型、線性型和S型。
在此基礎(chǔ)上,對(duì)神經(jīng)網(wǎng)絡(luò)算法的研究又有諸多進(jìn)展。日本的福島教授于1983年基于視覺(jué)認(rèn)知模型提出了卷積神經(jīng)網(wǎng)絡(luò)計(jì)算模型。通過(guò)學(xué)習(xí)訓(xùn)練獲取到卷積運(yùn)算中所使用的卷積系數(shù),并通過(guò)不同層次與自由度的變化,可以得到較為優(yōu)化的計(jì)算結(jié)果。而AlphaGo也正是采用了這種深度卷積神經(jīng)網(wǎng)絡(luò)(DCNN)模型,提高了AlphaGo的視覺(jué)分類(lèi)能力,也就是所謂的“棋感”,增強(qiáng)了其對(duì)全盤(pán)決策和把握的能力。
3.人工智能的發(fā)展前景
總體來(lái)看,人工智能的應(yīng)用經(jīng)歷了博弈、感知、決策和反饋這幾個(gè)里程碑。在以上4個(gè)領(lǐng)域中,既是縱向發(fā)展的過(guò)程,也是橫向不斷改進(jìn)的過(guò)程。
人工智能在博弈階段,主要是實(shí)現(xiàn)邏輯推理等功能,隨著計(jì)算機(jī)處理能力的進(jìn)步以及深度學(xué)習(xí)等算法的改進(jìn),機(jī)器擁有了越來(lái)越強(qiáng)的邏輯與對(duì)弈能力。在感知領(lǐng)域,隨著自然語(yǔ)言處理的進(jìn)步,機(jī)器已經(jīng)基本能對(duì)人類(lèi)的語(yǔ)音與語(yǔ)言進(jìn)行感知,并且能夠已經(jīng)對(duì)現(xiàn)實(shí)世界進(jìn)行視覺(jué)上的感知。基于大數(shù)據(jù)的處理和機(jī)器學(xué)習(xí)的發(fā)展,機(jī)器已經(jīng)能夠?qū)χ車(chē)沫h(huán)境進(jìn)行認(rèn)知,例如微軟的Kinect就能夠準(zhǔn)確的對(duì)人的肢體動(dòng)作進(jìn)行判斷。該領(lǐng)域的主要實(shí)現(xiàn)還包括蘋(píng)果的Siri,谷歌大腦以及無(wú)人駕駛汽車(chē)中的各種傳感器等。在以上兩個(gè)階段的基礎(chǔ)上,機(jī)器擁有了一定的決策和反饋的能力。無(wú)人駕駛汽車(chē)的蓬勃發(fā)展就是這兩個(gè)里程碑很好的例證。Google的無(wú)人駕駛汽車(chē)通過(guò)各種傳感器對(duì)周?chē)沫h(huán)境進(jìn)行感知并處理人類(lèi)的語(yǔ)言等指令,利用所收集的信息進(jìn)行最后的決策,比如操作方向盤(pán)、剎車(chē)等。
人工智能已經(jīng)滲透到生活中的各個(gè)領(lǐng)域。機(jī)器已經(jīng)能識(shí)別語(yǔ)音、人臉以及視頻內(nèi)容等,從而實(shí)現(xiàn)各種人際交互的場(chǎng)景。在醫(yī)學(xué)領(lǐng)域,人工智能可以實(shí)現(xiàn)自動(dòng)讀片和輔助診斷以及個(gè)性化t療和基因排序等功能。在教育領(lǐng)域,機(jī)器也承擔(dān)了越來(lái)越多的輔助教育,智能交互的功能。在交通領(lǐng)域,一方面無(wú)人車(chē)的發(fā)展表明無(wú)人駕駛是一個(gè)可以期待的未來(lái),另一方面人工智能能夠帶來(lái)更加通暢和智能的交通。另外人工智能在安防、金融等領(lǐng)域也有非常廣闊的發(fā)展前景。總之,人工智能在一些具有重復(fù)性的和具備簡(jiǎn)單決策的領(lǐng)域已經(jīng)是一種非常重要的工具,用來(lái)幫助人們解決問(wèn)題,創(chuàng)造價(jià)值。
參考文獻(xiàn)
[1]阮曉東.從AlphaGo的勝利看人工智能的未來(lái)[J].新經(jīng)濟(jì)導(dǎo)刊,2016 (6):69-74.
關(guān)鍵詞:圖像;情感;視覺(jué)特征;對(duì)應(yīng)關(guān)系;分類(lèi)
中圖分類(lèi)號(hào):TP391文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2011)21-5231-02
圖像中蘊(yùn)含著情感信息,如何有效地模擬人觀察圖像后引起的情感感覺(jué),實(shí)現(xiàn)基于語(yǔ)義的圖像檢索,是一個(gè)熱點(diǎn)且有挑戰(zhàn)性的課題。過(guò)去的圖像語(yǔ)義分析中,大都是根據(jù)圖像的低層特征簡(jiǎn)單的語(yǔ)義分類(lèi),很少涉及情感語(yǔ)義范疇;目前的研究中多是提取圖像的低層視覺(jué)特征并建立特征與情感的對(duì)應(yīng)以實(shí)現(xiàn)圖像情感分類(lèi)。
圖像情感語(yǔ)義分類(lèi)的關(guān)鍵是如何提取有效表達(dá)圖像情感的視覺(jué)特征,并根據(jù)視覺(jué)特征與高階語(yǔ)義的對(duì)應(yīng)關(guān)系,選擇合適的分類(lèi)算法。當(dāng)前研究中一般選擇某一類(lèi)圖像,如服裝圖像、天氣圖像等,在提取圖像的視覺(jué)特征中大都采用某一個(gè)視覺(jué)特征或者組合兩個(gè)視覺(jué)特征,高層語(yǔ)義分類(lèi)一般是一對(duì)相反的形容詞,如服裝圖像為“優(yōu)雅”的和“俗麗”的,天氣圖像為“喜歡”的和“厭惡”的等,通常采用神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等方法進(jìn)行分類(lèi)。
1 圖像的主要視覺(jué)特征
1.1 顏色特征
顏色特征是一種全局特征,有多種提取方法,可以分為兩大類(lèi):一是提取全局顏色信息的顏色特征;二是提取局部顏色信息的顏色特征。
在提取顏色特征中顏色直方圖是常用的有效方法,它反映了不同色彩在圖像中的比例。數(shù)字圖像大部分是基于RGB顏色空間的,但RGB空間結(jié)構(gòu)在顏色相似性上與人們的主觀判斷不一致,所以多選擇基于HSV等空間的顏色直方圖[1]。
1.2 紋理特征
紋理特征也是一種全局特征,常用的特征提取與匹配方法:灰度共生矩陣、Tamura紋理特征、Gabor小波變換等。
灰度共生矩陣主要提取能量、慣量、熵和相關(guān)性4個(gè)參數(shù);Tamura 紋理特征主要用粗糙度、對(duì)比度、方向度、線像度、規(guī)整度和粗略度6種屬性表示;Gabor變換用Gabor核函數(shù)與樣本卷積,分別提取數(shù)據(jù)的均值和方差作為特征數(shù)據(jù),獲得原圖在不同頻率和相位下的小波系數(shù),使每個(gè)樣本得到一個(gè)多維特征向量用于分類(lèi)[2]。
1.3 形狀特征
形狀特征是圖像的一個(gè)重要特征,常用兩類(lèi)方法表示,一是輪廓特征,二是區(qū)域特征。輪廓特征針對(duì)的是物體的外邊界,區(qū)域特征則是整個(gè)形狀區(qū)域。常用來(lái)描述形狀特征的方法有:邊界特征法、傅里葉形狀描述符、幾何參數(shù)法、不變矩法等。
邊界特征法用邊界特征的描述得到圖像的形狀參數(shù),經(jīng)典方法有Hough變換檢測(cè)平行直線和邊界方向直方圖;傅里葉形狀描述符采用物體邊界的傅里葉變換描述形狀;幾何參數(shù)法是描述區(qū)域特征方法;不變矩法利用目標(biāo)所占區(qū)域的矩描述參數(shù)。
2 情感空間的建立
圖像情感語(yǔ)義的提取,是將圖像映射到一個(gè)情感空間,每個(gè)圖像對(duì)應(yīng)著情感空間的一個(gè)點(diǎn),每個(gè)點(diǎn)代表某種情感的描述,這樣點(diǎn)之間的距離對(duì)應(yīng)著圖像的情感距離,即把觀察圖像后感受到的情感信息用語(yǔ)義描述,并定量比較。
根據(jù)實(shí)際情況,常構(gòu)造一些簡(jiǎn)化的情感空間模型。Colombo等建立的是圖像到愉快、緊張、放松、動(dòng)感這幾個(gè)基本情感的映射[3];毛峽等根據(jù)1/f波動(dòng)理論,主要討論了圖像中和諧舒適、雜亂、單調(diào)三類(lèi)情感感覺(jué)[4]。
目前獲得人們對(duì)圖像主觀情感的方法,多采用調(diào)查法,即選擇盡可能多的不同年齡、背景、文化程度等的人對(duì)圖像進(jìn)行情感描述。
3 圖像情感分類(lèi)識(shí)別
目前常用的是基于人工神經(jīng)網(wǎng)絡(luò)分類(lèi)方法和基于支持向量機(jī)的分類(lèi)方法。
3.1 人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)用計(jì)算機(jī)模擬生物機(jī)制,它不用對(duì)事物內(nèi)部機(jī)制很了解,系統(tǒng)的輸出由輸入和輸出之間的連接權(quán)決定,連接權(quán)是通過(guò)對(duì)訓(xùn)練樣本的學(xué)習(xí)獲得的。比較有代表性的網(wǎng)絡(luò)模型有感知器、多層前饋BP網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)等。
3.2 支持向量機(jī)
支持向量機(jī)的基礎(chǔ)是統(tǒng)計(jì)學(xué)習(xí)理論,設(shè)計(jì)原則是結(jié)構(gòu)風(fēng)險(xiǎn)最小化,針對(duì)的是有限樣本的一種機(jī)器學(xué)習(xí)算法,它的優(yōu)勢(shì)是在解決模型選擇與過(guò)學(xué)習(xí)問(wèn)題、非線性與維數(shù)災(zāi)難問(wèn)題、局部極小值問(wèn)題等問(wèn)題上很有效,基本原理是通過(guò)非線性變換把輸入空間變換到高維空間,然后在新空間中獲得最優(yōu)或是廣義最優(yōu)線性分類(lèi)面。
4 總結(jié)與展望
圖像的情感語(yǔ)義研究是一個(gè)較新的研究方向,對(duì)這個(gè)領(lǐng)域的研究還不多,很多問(wèn)題研究的還不夠深入。目前的研究存在的局限主要有:一是圖像的選取比較單一,只能分類(lèi)描述同一事物的圖像,如天氣、衣服圖像;二是反映圖像情感的視覺(jué)特征比較少,多是用顏色特征描述情感,用紋理和形狀描述情感還不多,將多種視覺(jué)特征融合起來(lái)更少;三是對(duì)圖像的情感分類(lèi)比較少,多是二分類(lèi),少有多種分類(lèi)的研究,而一幅圖像蘊(yùn)含著多種情感,一對(duì)或較少的形容詞并不能有效反映圖像的情感。今后圖像情感的分類(lèi)要在以下幾方面多做研究:一是擴(kuò)大圖像的選擇范圍;二是有效選擇融合盡可能多的視覺(jué)特征;三是豐富對(duì)圖像的情感分類(lèi)。
由于圖像的情感研究涉及到眾多學(xué)科領(lǐng)域,研究起來(lái)有一定難度,對(duì)它的研究還在初步階段,要解決的問(wèn)題還比較多,所以發(fā)展?jié)摿艽蟆?/p>
參考文獻(xiàn):
[1] 賀靜.基于特征融合的服裝圖像情感語(yǔ)義分類(lèi)研究[D].太原理工大學(xué),2007.
[2] 趙志艷,楊志曉,李卓瑜,等.一種基于紋理特征的筆跡鑒別方法[J].微計(jì)算機(jī)信息,2010,26(1-2).
【關(guān)鍵詞】情商教育 中職 情商課程 綜合競(jìng)爭(zhēng)力
一、中職生在校狀態(tài)與情商
(一)缺乏自信心。中職生在小學(xué)、初中階段,可能因?yàn)檫@樣或那樣的原因,老師和家長(zhǎng)的否定性評(píng)價(jià)或許多了些,使他們的自信心受的了較大的傷害,他們大認(rèn)為自己不行,在嚴(yán)重缺乏自信的情況下,使他們?cè)絹?lái)越不愿意學(xué)習(xí),甚至害怕學(xué)習(xí)。
(二)缺乏學(xué)習(xí)主動(dòng)性。現(xiàn)在的中職生普遍意志力較差,缺乏獨(dú)立自主的生活能力,缺乏克服困難的決心和毅力,一遇到困難,就想退縮或放棄。小學(xué)、初中階段過(guò)多的補(bǔ)習(xí),使孩子失去了應(yīng)有的,鍛煉自主學(xué)習(xí)能力的良機(jī),讓他們只會(huì)適應(yīng)被動(dòng)學(xué)習(xí)的環(huán)境,一旦沒(méi)有了老師的督促,家長(zhǎng)的逼迫,他們就失去了學(xué)習(xí)的動(dòng)力。
(三)公德及規(guī)則意識(shí)淡薄。相當(dāng)一部分學(xué)生紀(jì)律觀念淡薄,曠課、逃學(xué)、早戀、打架斗毆、部分學(xué)生甚至在課堂上辱罵教師。明知不可以違反學(xué)校的規(guī)章制度,但由于自控能力較差,時(shí)常有違規(guī)行為,且屢教不改。
(四)應(yīng)對(duì)挫折的能力差。大多數(shù)中職學(xué)校的學(xué)生都是因?yàn)闆](méi)能考進(jìn)高中,退而求其次選擇的來(lái)中職學(xué)校讀書(shū)。很多學(xué)生文化基礎(chǔ)課如數(shù)學(xué)和英語(yǔ)等課程普遍較差,他們對(duì)全新的專(zhuān)業(yè)基礎(chǔ)課和專(zhuān)業(yè)技能課,學(xué)起來(lái)會(huì)比較費(fèi)力。但并不是說(shuō)所有的專(zhuān)業(yè)基礎(chǔ)課和專(zhuān)業(yè)課程都與初中階段的文化基礎(chǔ)課程有直接的關(guān)系,只要學(xué)生能認(rèn)真開(kāi)始學(xué)習(xí),學(xué)好專(zhuān)業(yè)課程還是有可能的,但多數(shù)“后進(jìn)生”內(nèi)心非常自卑,他們認(rèn)為自己笨、認(rèn)為自己不可能學(xué)得會(huì)、學(xué)得好,從而在自己心理上主動(dòng)放棄了進(jìn)步的機(jī)會(huì)。
中職學(xué)生的這些讓老師和家長(zhǎng)都異常頭痛的外在表現(xiàn),其根源就是學(xué)生在小學(xué)、初中階段情商培養(yǎng)嚴(yán)重缺失的綜合表現(xiàn)。
二、中職生情商教育的重要性
的話以點(diǎn)帶面地剖析和分析出了“情商”對(duì)于人才培養(yǎng)的重要性、對(duì)于社會(huì)實(shí)際工作的重要性。有一句流行語(yǔ)稱(chēng):“智商(IQ)決定錄用,情商(EQ)決定提升。”哈佛大學(xué)教授丹尼爾?戈?duì)柭f(shuō)過(guò):“成功=20%的智商+80%的情商。”從這個(gè)角度說(shuō),情商已經(jīng)不僅關(guān)系一個(gè)青年人的成長(zhǎng)道路,也關(guān)系一個(gè)人的事業(yè)成敗,乃至在一個(gè)社會(huì)工作領(lǐng)域的潛力和發(fā)展。眾所周知,情商能更多的體現(xiàn)一個(gè)人的人格魅力、吸引力和凝聚力,放諸于生產(chǎn)領(lǐng)域、教育領(lǐng)域如此,在政務(wù)工作領(lǐng)域同樣如此。
中職學(xué)校擔(dān)負(fù)著為社會(huì)培養(yǎng)一線實(shí)際操作人才的重任,學(xué)生的情商水平?jīng)Q定了他們?cè)诠ぷ髦惺欠窬邆渑c人建立良好合作關(guān)系的團(tuán)隊(duì)精神,是否能夠在團(tuán)對(duì)中發(fā)揮更大作用的問(wèn)題,更關(guān)系到學(xué)生個(gè)人的未來(lái)發(fā)展前途。所以,中職學(xué)校必須重視這一問(wèn)題,把情商培養(yǎng)納入學(xué)生的教學(xué)計(jì)劃,讓學(xué)生在學(xué)習(xí)專(zhuān)業(yè)技能的同時(shí),情商水平能有一定程度的提高。
三、情商培養(yǎng)的時(shí)機(jī)選擇
現(xiàn)代醫(yī)學(xué)的研究成果告訴我們,大腦中有一個(gè)區(qū)域叫做前額皮質(zhì),是大腦的執(zhí)行中心,它的形成主要受童年時(shí)代的體驗(yàn)的影響。這個(gè)區(qū)域所控制的神經(jīng)網(wǎng)絡(luò)可以抑制破壞性的情感沖動(dòng),幫助集中精力、平靜和專(zhuān)注。如果孩子沒(méi)辦法減少焦慮,那么就沒(méi)有太多的精力去學(xué)習(xí)、解決問(wèn)題以及掌握新知識(shí)。比如,如果一個(gè)孩子因?yàn)橐淮瓮蝗灰u擊的考試恐慌不已,那么在腦子里留下的印象是當(dāng)時(shí)的反應(yīng)而不是考試的具體細(xì)節(jié)。精神緊張能毀滅學(xué)習(xí)。科學(xué)家相信,提高注意力和記憶力,擺脫思想的沖動(dòng)和痛苦,可以讓孩子的思維處在學(xué)習(xí)的最佳狀態(tài),社交和情緒學(xué)習(xí)也是一樣。因此,幫助孩子們管理情緒和改善人際關(guān)系可以改善他們的學(xué)習(xí)狀態(tài)。
青少年時(shí)期是人的大腦發(fā)育最快的階段,大約到25歲左右,大腦才會(huì)逐漸地停止發(fā)育。有一個(gè)被科學(xué)家稱(chēng)作“神經(jīng)可塑性”的名詞,意思是大腦神經(jīng)網(wǎng)絡(luò)的不斷形成,很大程度上依賴(lài)于每天的成長(zhǎng)體驗(yàn)的積累。由此看出,外界環(huán)境對(duì)大腦發(fā)育的影響在“社交和情緒”神經(jīng)網(wǎng)絡(luò)方面尤為明顯。如果孩子被父母及學(xué)校養(yǎng)育呵護(hù)得很好,并且在沮喪的時(shí)候父母和老師能教給他們調(diào)節(jié)自己情緒的方法,那么這些孩子的大腦神經(jīng)網(wǎng)絡(luò)在管理壓力方面就會(huì)發(fā)育得比較好。而那些被父母忽視的孩子則更有可能會(huì)出現(xiàn)叛逆和反抗的情緒,當(dāng)他們沮喪時(shí)也很難平靜下來(lái)。
由此可見(jiàn),中職教育階段是僅存的,能夠?qū)@部分情商有缺陷的孩子進(jìn)行情商改善性培養(yǎng)的教育機(jī)會(huì)了,中職學(xué)校應(yīng)該勇敢的擔(dān)負(fù)起這個(gè)責(zé)任,做出自己應(yīng)有的努力,為社會(huì)培養(yǎng)更多的技藝高超、情商優(yōu)雅的人才。
四、愛(ài)與靜思――情商培養(yǎng)的重要途徑
一、深度學(xué)習(xí)概念的提出
深度學(xué)習(xí)的概念,源于30多年來(lái)計(jì)算機(jī)科學(xué)、人工神經(jīng)網(wǎng)絡(luò)和人工智能的研究。上世紀(jì)八九十年代,人們提出了一系列機(jī)器學(xué)習(xí)模型,應(yīng)用最為廣泛的包括支持向量機(jī)(Support Vector Machine,SVM)和邏輯回歸(Logistic Regression,LR),這兩種模型分別可以看作包含1個(gè)隱藏層和沒(méi)有隱藏層的淺層模型。計(jì)算機(jī)面對(duì)較為復(fù)雜的問(wèn)題解決訓(xùn)練時(shí),可以利用反向傳播算法計(jì)算梯度,再用梯度下降方法在參數(shù)空間中尋找最優(yōu)解。淺層模型往往具有凸代價(jià)函數(shù),理論分析相對(duì)簡(jiǎn)單,訓(xùn)練方法也容易掌握,應(yīng)用取得了很多成功。①隨著人工智能的發(fā)展,計(jì)算機(jī)和智能網(wǎng)絡(luò)如何基于算法革新,模擬人腦抽象認(rèn)知和思維,準(zhǔn)確且高清晰度地進(jìn)行聲音處理、圖像傳播甚至更為復(fù)雜的數(shù)據(jù)處理和問(wèn)題解決等,在21世紀(jì)來(lái)臨的時(shí)候成為擺在人工智能領(lǐng)域的關(guān)鍵問(wèn)題。
30多年來(lái),加拿大多倫多大學(xué)計(jì)算機(jī)系辛頓教授(Hinton,G.)一直從事機(jī)器學(xué)習(xí)模型、神經(jīng)網(wǎng)絡(luò)與人工智能等問(wèn)題的相關(guān)研究,并在機(jī)器學(xué)習(xí)模型特別是突破淺層學(xué)習(xí)模型,實(shí)現(xiàn)計(jì)算機(jī)抽象認(rèn)知方面取得了突破性的進(jìn)展。2006年,他在《Science》上發(fā)表了《利用神經(jīng)網(wǎng)絡(luò)刻畫(huà)數(shù)據(jù)維度》(Reducing the Dimensionality of Data with Neural Networks)一文,探討了應(yīng)用人工神經(jīng)網(wǎng)絡(luò)刻畫(huà)數(shù)據(jù)的學(xué)習(xí)模型,首先提出了深度學(xué)習(xí)(Deep Learning)的概念和計(jì)算機(jī)深度學(xué)習(xí)模型,掀起了深度學(xué)習(xí)在人工智能領(lǐng)域的新。這篇文章的兩個(gè)主要觀點(diǎn)是:第一,多隱藏層的人工神經(jīng)網(wǎng)絡(luò)具有優(yōu)異的特征學(xué)習(xí)能力,學(xué)習(xí)到的特征對(duì)數(shù)據(jù)有更本質(zhì)的刻畫(huà),從而有利于可視化或分類(lèi);第二,深度神經(jīng)網(wǎng)絡(luò)可以通過(guò)“逐層初始化”(Layer-wise Pre-training)來(lái)有效克服訓(xùn)練和優(yōu)解的難度,無(wú)監(jiān)督的逐層初始化方法有助于突破淺層學(xué)習(xí)模型。②基于深度置信網(wǎng)絡(luò)(DBN)提出非監(jiān)督逐層訓(xùn)練算法,為解決深層結(jié)構(gòu)相關(guān)的優(yōu)化難題帶來(lái)希望,隨后提出多層自動(dòng)編碼器深層結(jié)構(gòu)。③2012年,辛頓又帶領(lǐng)學(xué)生在目前最大的圖像數(shù)據(jù)庫(kù)ImageNet上,對(duì)分類(lèi)問(wèn)題取得了驚人的結(jié)果,將計(jì)算機(jī)處理圖像數(shù)據(jù)問(wèn)題時(shí)排名前五的錯(cuò)誤率(即Top5錯(cuò)誤率),由最高26%大幅降低至15%,大大提高了人工智能圖像數(shù)據(jù)處理的準(zhǔn)確性和清晰度,這是早先計(jì)算機(jī)僅僅依賴(lài)數(shù)學(xué)模型的表層學(xué)習(xí)和單層學(xué)習(xí)根本無(wú)法實(shí)現(xiàn)的水平。
在人工智能領(lǐng)域,深度學(xué)習(xí)其實(shí)是一種算法思維,其核心是對(duì)人腦思維深層次學(xué)習(xí)的模擬,通過(guò)模擬人腦的深喲緯橄筧現(xiàn)過(guò)程,實(shí)現(xiàn)計(jì)算機(jī)對(duì)數(shù)據(jù)的復(fù)雜運(yùn)算和優(yōu)化。深度學(xué)習(xí)采用的模型是深層神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)模型,即包含多個(gè)隱藏層(Hidden Layer,也稱(chēng)隱含層)的神經(jīng)網(wǎng)絡(luò)(Neural Networks,NN)。深度學(xué)習(xí)利用模型中的隱藏層,通過(guò)特征組合的方式,逐層將原始輸入轉(zhuǎn)化為淺層特征、中層特征、高層特征直至最終的任務(wù)目標(biāo)。深度學(xué)習(xí)可以完成需要高度抽象特征的人工智能任務(wù),如語(yǔ)音識(shí)別、圖像識(shí)別和檢索、自然語(yǔ)言理解等。深層模型是包含多個(gè)隱藏層的人工神經(jīng)網(wǎng)絡(luò),多層非線性結(jié)構(gòu)使其具備強(qiáng)大的特征表達(dá)能力和對(duì)復(fù)雜任務(wù)的建模能力。訓(xùn)練深層模型是長(zhǎng)期以來(lái)的難題,近年來(lái)以層次化、逐層初始化為代表的一系列方法的提出,為訓(xùn)練深層模型帶來(lái)了希望,并在多個(gè)應(yīng)用領(lǐng)域獲得了成功。
人工智能學(xué)者們認(rèn)為計(jì)算機(jī)和智能網(wǎng)絡(luò)的這一深層的自動(dòng)編碼與解碼過(guò)程,是一個(gè)從數(shù)據(jù)刻畫(huà)、抽象認(rèn)知到優(yōu)選方案的深度學(xué)習(xí)的過(guò)程。由于人腦具有深度結(jié)構(gòu),認(rèn)知過(guò)程是一個(gè)復(fù)雜的腦活動(dòng)過(guò)程,因而計(jì)算機(jī)和人工智能網(wǎng)絡(luò)模擬從符號(hào)接受、符號(hào)解碼、意義建立再到優(yōu)化方案的學(xué)習(xí)過(guò)程也是有結(jié)構(gòu)的;同時(shí),認(rèn)知過(guò)程是逐層進(jìn)行、逐步抽象的,人工智能不是純粹依賴(lài)于數(shù)學(xué)模型的產(chǎn)物,而是對(duì)人腦、人腦神經(jīng)網(wǎng)絡(luò)及抽象認(rèn)知和思維過(guò)程進(jìn)行模擬的產(chǎn)物。應(yīng)該說(shuō),到目前為止,深度學(xué)習(xí)是計(jì)算機(jī)和智能網(wǎng)絡(luò)最接近人腦的智能學(xué)習(xí)方法。近幾年來(lái),深度學(xué)習(xí)進(jìn)一步嘗試直接解決抽象認(rèn)知的難題,并取得了突破性的進(jìn)展,AlphaGo的問(wèn)世,便是明證。2013年4月,《麻省理工學(xué)院技術(shù)評(píng)論》(MIT Technology Review )雜志將深度學(xué)習(xí)列為2013年十大突破性技術(shù)之首。④深度學(xué)習(xí)引爆的這場(chǎng)革命,將人工智能帶上了一個(gè)新的臺(tái)階,不僅學(xué)術(shù)意義巨大,而且實(shí)用性很強(qiáng),工業(yè)界也開(kāi)始了大規(guī)模的投入,一大批產(chǎn)品將從中獲益。二十世紀(jì)八九十年代以來(lái),隨著學(xué)習(xí)科學(xué)的不斷發(fā)展,深度學(xué)習(xí)的概念和思想不斷在教育中得到應(yīng)用。
二、深度學(xué)習(xí)在教育中的興起與發(fā)展
來(lái)自腦科學(xué)、人工智能和學(xué)習(xí)科學(xué)領(lǐng)域的新成就,必然引起教育領(lǐng)域研究者的深刻反省。計(jì)算機(jī)、人工智能尚且能夠模擬人腦的深層結(jié)構(gòu)和抽象認(rèn)知,通過(guò)神經(jīng)網(wǎng)絡(luò)的建立開(kāi)展深度學(xué)習(xí),那人對(duì)知識(shí)的學(xué)習(xí)過(guò)程究竟應(yīng)該是怎樣的一個(gè)腦活動(dòng)過(guò)程和學(xué)習(xí)過(guò)程?學(xué)生的學(xué)習(xí)有表層和深層等層次之分嗎?從作為符號(hào)的公共知識(shí)到作為個(gè)人意義的個(gè)人知識(shí)究竟是怎樣建立起來(lái)的?知識(shí)學(xué)習(xí)過(guò)程究竟是一個(gè)怎樣的抽象認(rèn)知過(guò)程?信息技術(shù)環(huán)境支持下深層次的學(xué)習(xí)如何實(shí)現(xiàn)?近十多年來(lái),這些問(wèn)題引起了許多教育研究者特別是教育技術(shù)學(xué)研究者的濃厚興趣,深度學(xué)習(xí)、深度教學(xué)的研究日益引起人們的重視。也正是在辛頓的“深度學(xué)習(xí)”概念明確提出后,教育學(xué)領(lǐng)域特別是教育技術(shù)學(xué)領(lǐng)域的深度學(xué)習(xí)研究日益活躍起來(lái)。
其實(shí),早在1956年布魯姆在《教育目標(biāo)分類(lèi)學(xué)》里關(guān)于“認(rèn)知領(lǐng)域目標(biāo)”的探討中,對(duì)認(rèn)識(shí)目標(biāo)的維度劃分就蘊(yùn)含了深度學(xué)習(xí)的思想,即“學(xué)習(xí)有深淺層次之分”,將教學(xué)目標(biāo)分為了解、理解、應(yīng)用、分析、綜合、評(píng)價(jià)六個(gè)由淺入深的層次。⑤學(xué)習(xí)者的認(rèn)知水平停留在知道或領(lǐng)會(huì)的層次則為淺層學(xué)習(xí),涉及的是簡(jiǎn)單提取、機(jī)械記憶符號(hào)表征或淺層了解邏輯背景等低階思維活動(dòng);而認(rèn)知水平較高的深層理解、應(yīng)用、分析、綜合和評(píng)價(jià)則涉及的是理性思辨、創(chuàng)造性思維、問(wèn)題解決等相對(duì)復(fù)雜的高階思維活動(dòng),屬于深層學(xué)習(xí)。1976年,美國(guó)學(xué)者馬頓(Marton,F(xiàn).)和薩爾約(Saljo,R.)在《論學(xué)習(xí)的本質(zhì)區(qū)別:結(jié)果和過(guò)程》(On Qualitative Difference in Learning: Outcome and Process)一文中,明確提出了表層學(xué)習(xí)和深層學(xué)習(xí)的概念。⑥這被普遍認(rèn)為是教育學(xué)領(lǐng)域首次明確提出深度學(xué)習(xí)的概念。他們?cè)谝豁?xiàng)關(guān)于閱讀能力的實(shí)驗(yàn)研究中,明確探討了閱讀學(xué)習(xí)的層次問(wèn)題。通過(guò)讓學(xué)生閱讀文章并進(jìn)行測(cè)驗(yàn),發(fā)現(xiàn)學(xué)生在閱讀的過(guò)程中運(yùn)用了兩種截然不同的學(xué)習(xí)策略:一種是試圖記住文章的事實(shí)表達(dá),揣測(cè)接下來(lái)的測(cè)試并記憶,即表層學(xué)習(xí)(Surface Learning);另一種是試圖理解文章的中心思想和學(xué)術(shù)內(nèi)涵,即深層學(xué)習(xí)(Deep Learning),也被譯為深度學(xué)習(xí)。深度學(xué)習(xí)的學(xué)習(xí)者追求知識(shí)的理解并且使已有的知識(shí)與特定教材的內(nèi)容進(jìn)行批判性互動(dòng),探尋知識(shí)的邏輯意義,使現(xiàn)有事實(shí)和所得出的結(jié)論建立聯(lián)系。淺層學(xué)習(xí)和深層學(xué)習(xí)在學(xué)習(xí)動(dòng)機(jī)、投入程度、記憶方式、思維層次和遷移能力上有明顯的差異。深度學(xué)習(xí)是一種主動(dòng)的、高投入的、理解記憶的、涉及高階思維并且學(xué)習(xí)結(jié)果遷移性強(qiáng)的學(xué)習(xí)狀態(tài)和學(xué)習(xí)過(guò)程。之后 ,拉姆斯登(Ramsden,1988)、英推施黛(Entwistle,1997)以及比格斯(Biggs,1999)等人發(fā)展了淺層學(xué)習(xí)和深度學(xué)習(xí)的相關(guān)理論。⑦隨著信息技術(shù)的發(fā)展,近十年來(lái),國(guó)外學(xué)者對(duì)信息技術(shù)支持下的深度學(xué)習(xí)及其在各學(xué)科領(lǐng)域、各類(lèi)教育中的應(yīng)用研究日漸廣泛。
2002年以來(lái),從技術(shù)支持高等教育的深度學(xué)習(xí)、虛擬環(huán)境中的深度學(xué)習(xí)、形成性評(píng)估對(duì)深度學(xué)習(xí)的影響、學(xué)習(xí)環(huán)境對(duì)學(xué)生進(jìn)行深度學(xué)習(xí)的影響、技術(shù)支持下的深度學(xué)習(xí)設(shè)計(jì)等方面研究成果日益豐富,但絕大部分是基于教育技術(shù)學(xué)視野的研究成果。2006年,辛頓教授關(guān)于深度學(xué)習(xí)的成果發(fā)表,進(jìn)一步推動(dòng)了深度學(xué)習(xí)在教育中的研究與應(yīng)用。近十年來(lái),在中小學(xué)深度學(xué)習(xí)研究方面最有影響的當(dāng)屬加拿大西盟菲莎大學(xué)(Simon Fraser University)艾根(Egan, K.)教授領(lǐng)銜的“深度學(xué)習(xí)”(Learning in Depth,簡(jiǎn)稱(chēng)LID)項(xiàng)目組所進(jìn)行的研究,其成果集中體現(xiàn)在《深度學(xué)習(xí):轉(zhuǎn)變學(xué)校教育的一個(gè)革新案例》(Learning in Depth: A Simple Innovation That Can Transform Schooling)等著述之中。⑧該研究探討了深度學(xué)習(xí)的基本原則與方法,分析了深度學(xué)習(xí)對(duì)學(xué)生成長(zhǎng)、教師發(fā)展和學(xué)校革新的價(jià)值與路徑,并在加拿大部分中小學(xué)進(jìn)行實(shí)驗(yàn)研究。其核心成果聚焦課堂學(xué)習(xí)和教學(xué)問(wèn)題,即使是關(guān)于教師教育中深度學(xué)習(xí)的研究,也聚焦于教師的學(xué)習(xí)過(guò)程和學(xué)習(xí)方式。⑨艾根所開(kāi)展的深度學(xué)習(xí)研究項(xiàng)目超越了單一教育技術(shù)學(xué)視野的研究,不僅僅是關(guān)于教學(xué)設(shè)計(jì)、學(xué)習(xí)技術(shù)和學(xué)習(xí)環(huán)境開(kāi)發(fā)的研究,而是基于建立新的學(xué)習(xí)觀和知識(shí)觀,對(duì)教學(xué)活動(dòng)與學(xué)習(xí)過(guò)程作出了新的闡釋。
總體上看,國(guó)內(nèi)關(guān)于深度學(xué)習(xí)的研究最近十年才剛剛起步。2005年,我國(guó)學(xué)者黎加厚教授在《促進(jìn)學(xué)生深度學(xué)習(xí)》一文中,率先介紹了國(guó)外關(guān)于深度學(xué)習(xí)的研究成果,同時(shí)探討了深度學(xué)習(xí)的本質(zhì)。他認(rèn)為深度學(xué)習(xí)是指在理解學(xué)習(xí)的基礎(chǔ)上,學(xué)習(xí)者能夠批判性地學(xué)習(xí)新的思想和事實(shí),并將它們?nèi)谌朐械恼J(rèn)知結(jié)構(gòu)中,能夠在眾多思想間進(jìn)行聯(lián)系,能夠?qū)⒁延械闹R(shí)遷移到新的情境中,作出決策和解決問(wèn)題的學(xué)習(xí)。⑩此文被認(rèn)為是國(guó)內(nèi)較早介紹并論及深度學(xué)習(xí)的研究成果,此后,關(guān)于深度學(xué)習(xí)的探討,特別是基于信息技術(shù)環(huán)境下的深度學(xué)習(xí)的相關(guān)研究論文逐漸增加。2006年10月,筆者在前期研究的基礎(chǔ)上,與臺(tái)灣成功大學(xué)教育研究所所長(zhǎng)李坤崇教授聯(lián)合發(fā)起“海峽兩岸能力生根計(jì)劃”,推進(jìn)能力導(dǎo)向的深度教學(xué)的理論研究與實(shí)驗(yàn)研究,主張以?xún)r(jià)值觀、知識(shí)觀、學(xué)習(xí)觀、過(guò)程觀的重建為基礎(chǔ),以發(fā)展學(xué)生的學(xué)科能力為宗旨,實(shí)施深度教學(xué),克服課堂教學(xué)改革過(guò)于注重教學(xué)程序、教學(xué)技術(shù)、教學(xué)時(shí)間的淺層次改革和表層學(xué)習(xí)的局限性,深化課堂教學(xué)改革。2014年后,中國(guó)教育科學(xué)院院長(zhǎng)兼教育部課程教材研究與發(fā)展中心主任田慧生研究員基于深化課程改革的需要,帶領(lǐng)一個(gè)團(tuán)隊(duì)開(kāi)始啟動(dòng)深度學(xué)習(xí)的項(xiàng)目研究。直至今日,基于核心素養(yǎng)追求背景下的深度學(xué)習(xí)研究項(xiàng)目,如雨后春筍般涌現(xiàn),“深度學(xué)習(xí)”成為教育研究中的一個(gè)熱詞。
盡管計(jì)算機(jī)、人工智能領(lǐng)域與教育學(xué)領(lǐng)域都提出了“深度學(xué)習(xí)”概念,但不難看出二者顯然具有本質(zhì)差異。計(jì)算機(jī)與人工智能領(lǐng)域的深度學(xué)習(xí)是建立在機(jī)器模擬人腦深層結(jié)構(gòu)的基礎(chǔ)之上的,是基于人腦結(jié)構(gòu)的一種計(jì)算機(jī)算法思維和問(wèn)題解決模型,是對(duì)人腦和認(rèn)知結(jié)構(gòu)的模擬。而教育學(xué)領(lǐng)域的“深度學(xué)習(xí)”概念,無(wú)論是布魯姆還是馬頓和薩爾約,都指向了“知識(shí)”和“學(xué)習(xí)”兩個(gè)核心,是關(guān)于知識(shí)學(xué)習(xí)的目標(biāo)和過(guò)程的問(wèn)題。布魯姆在教育目標(biāo)分類(lèi)學(xué)認(rèn)知領(lǐng)域的目標(biāo)構(gòu)設(shè)中,認(rèn)為認(rèn)知目標(biāo)是由了解、理解、應(yīng)用、分析、綜合、評(píng)價(jià)六個(gè)不斷加深的層次構(gòu)成的。這一目標(biāo)明顯是關(guān)于知識(shí)學(xué)習(xí)和認(rèn)知過(guò)程的目標(biāo),在2001年修訂版中,這一目標(biāo)被精確表述為知識(shí)學(xué)習(xí)和認(rèn)知過(guò)程兩個(gè)維度。馬頓和薩爾約在關(guān)于閱讀的研究中,基于學(xué)生對(duì)文本理解的層次和理解的深度提出了“深度學(xué)習(xí)”的概念,并認(rèn)為學(xué)習(xí)的本質(zhì)區(qū)別在于過(guò)程而不是學(xué)習(xí)的結(jié)果,是學(xué)生對(duì)文本知識(shí)學(xué)習(xí)的深刻程度決定了其學(xué)習(xí)結(jié)果的差異性。
艾根的研究實(shí)現(xiàn)了從深度學(xué)習(xí)向深度教學(xué)的轉(zhuǎn)向。艾根的深度學(xué)習(xí)(Learning in Depth)研究更明確地指向了學(xué)生對(duì)知識(shí)的學(xué)習(xí)所到達(dá)的深度,以及教師通過(guò)對(duì)知識(shí)的處理引導(dǎo)學(xué)生逐步到達(dá)一定的學(xué)習(xí)深度。這一深度學(xué)習(xí)的過(guò)程是一個(gè)逐步深化的學(xué)習(xí)過(guò)程,要求教師在教學(xué)過(guò)程中引導(dǎo)學(xué)生著眼于知識(shí)的深層次理解和深度處理。該項(xiàng)研究表明,深度學(xué)習(xí)的研究開(kāi)始從單一的學(xué)習(xí)技術(shù)研究轉(zhuǎn)向了對(duì)教學(xué)過(guò)程的關(guān)注,注重深度學(xué)習(xí)與深度教學(xué)的關(guān)聯(lián)性和一致性,深度學(xué)習(xí)的研究呈現(xiàn)出向深度學(xué)習(xí)與深度教學(xué)相結(jié)合的轉(zhuǎn)向。
三、深度學(xué)習(xí)的核心理念
從深度學(xué)習(xí)走向深度教學(xué),一方面是教與學(xué)的一致性決定的,另一方面是當(dāng)前中小學(xué)課堂教學(xué)普遍存在的局限性Q定的。教與學(xué)的關(guān)系既不是對(duì)立關(guān)系,也不是對(duì)應(yīng)關(guān)系,而是一種具有相融性的一體化關(guān)系,離開(kāi)了教無(wú)所謂學(xué),離開(kāi)了學(xué)也無(wú)所謂教。學(xué)生真正意義上的深度學(xué)習(xí)需要建立在教師深度教導(dǎo)、引導(dǎo)的基礎(chǔ)之上。從本質(zhì)上看,教育學(xué)視野下的深度學(xué)習(xí)不同于人工智能視野下的深度學(xué)習(xí),不是學(xué)生像機(jī)器一樣對(duì)人腦進(jìn)行孤獨(dú)的模擬活動(dòng),而是學(xué)生在教師引導(dǎo)下,對(duì)知識(shí)進(jìn)行的“層進(jìn)式學(xué)習(xí)”和“沉浸式學(xué)習(xí)”。“層進(jìn)”是指對(duì)知識(shí)內(nèi)在結(jié)構(gòu)的逐層深化的學(xué)習(xí),“沉浸”是指對(duì)學(xué)習(xí)過(guò)程的深刻參與和學(xué)習(xí)投入。離開(kāi)了教師的教學(xué)和引導(dǎo),學(xué)生何以“沉浸”?因此,深度學(xué)習(xí)只有走向深度教學(xué)才更具有發(fā)展性的意義和價(jià)值。同時(shí),我國(guó)新一輪基礎(chǔ)教育課程改革以來(lái),課堂教學(xué)改革依然存在著諸多表層學(xué)習(xí)、表面學(xué)習(xí)和表演學(xué)習(xí)的局限性,“學(xué)習(xí)方式的轉(zhuǎn)變”往往演變成了教學(xué)形式的改變,諸如教與學(xué)在程序上的簡(jiǎn)單翻轉(zhuǎn)和在時(shí)間上的粗暴分配。其所體現(xiàn)出來(lái)的知識(shí)觀、價(jià)值觀、教學(xué)觀、過(guò)程觀依然陳舊落后,以學(xué)科知識(shí)、學(xué)科能力、學(xué)科思想和學(xué)科經(jīng)驗(yàn)的融合為核心的學(xué)科素養(yǎng)依然未能得到實(shí)質(zhì)性的滲透。
深度教學(xué)的“深度”是建立在完整而深刻地處理和理解知識(shí)的基礎(chǔ)之上的。艾根在深度學(xué)習(xí)的研究中,首次從知識(shí)論的角度,論述了深度學(xué)習(xí)的“深度”(Depth)的涵義。他認(rèn)為“學(xué)習(xí)深度”具有三個(gè)基本標(biāo)準(zhǔn),即知識(shí)學(xué)習(xí)的充分廣度(Sufficient Breadth)、知識(shí)學(xué)習(xí)的充分深度(Sufficient Depth)和知識(shí)學(xué)習(xí)的充分關(guān)聯(lián)度(Multi-Dimensional Richness and Ties)。這三個(gè)標(biāo)準(zhǔn),也是深度學(xué)習(xí)的核心理念。
第一,知識(shí)學(xué)習(xí)的充分廣度。充分的廣度與知識(shí)產(chǎn)生的背景相關(guān),與知識(shí)對(duì)人生成的意義相關(guān),與個(gè)體經(jīng)驗(yàn)相關(guān),也與學(xué)習(xí)者的學(xué)習(xí)情境相關(guān)。如果教學(xué)把知識(shí)從其賴(lài)以存在的背景、意義和經(jīng)驗(yàn)中剝離出來(lái),成為純粹的符號(hào),便成為無(wú)意義的符號(hào)、無(wú)根基的概念知識(shí)。知識(shí)具有強(qiáng)烈的依存性,無(wú)論是自然科學(xué)的知識(shí)還是社會(huì)科學(xué)或人文學(xué)科的知識(shí),都是特定的社會(huì)背景、文化背景、歷史背景及其特定的思維方式的產(chǎn)物。離開(kāi)了知識(shí)的自然背景、社會(huì)背景、邏輯背景,前人創(chuàng)造的知識(shí)對(duì)后人而言幾乎不具有可理解性。隨著深度學(xué)習(xí)的興起,旨在以廣度促進(jìn)理解的“無(wú)邊界學(xué)習(xí)”日益引起人們的重視。可見(jiàn),知識(shí)的充分廣度,其實(shí)是為理解提供多樣性的支架,為知識(shí)的意義達(dá)成創(chuàng)造了可能性和廣闊性基礎(chǔ)。
第二,知識(shí)學(xué)習(xí)的充分深度。知識(shí)的充分深度與知識(shí)所表達(dá)的內(nèi)在思想、認(rèn)知方式和具體的思維邏輯相關(guān),深度學(xué)習(xí)把通過(guò)知識(shí)理解來(lái)建立認(rèn)識(shí)方式,提升思維品質(zhì),特別是發(fā)展批判性思維作為核心目標(biāo)。所以說(shuō),深度學(xué)習(xí)是一種反思性學(xué)習(xí),是注重批判性思維品質(zhì)培養(yǎng)的學(xué)習(xí),同時(shí)也是一種沉浸式、層進(jìn)式的學(xué)習(xí)。深度學(xué)習(xí)強(qiáng)調(diào)學(xué)習(xí)過(guò)程是從符號(hào)理解、符號(hào)解碼到意義建構(gòu)的認(rèn)知過(guò)程,這一過(guò)程是逐層深化的。
第三,知R學(xué)習(xí)的充分關(guān)聯(lián)度。知識(shí)的充分關(guān)聯(lián)度,是指知識(shí)學(xué)習(xí)指向與多維度地理解知識(shí)的豐富內(nèi)涵及其與文化、想象、經(jīng)驗(yàn)的內(nèi)在聯(lián)系。知識(shí)學(xué)習(xí)不是單一的符號(hào)學(xué)習(xí),而是對(duì)知識(shí)所承載的文化精神的學(xué)習(xí)。同時(shí),通過(guò)與學(xué)生的想象、情感的緊密聯(lián)系,達(dá)到對(duì)知識(shí)的意義建構(gòu)。從廣度,到深度,再到關(guān)聯(lián)度,學(xué)生認(rèn)知的過(guò)程是逐層深化的。所謂意義建構(gòu),即從公共知識(shí)到個(gè)人知識(shí)的建立過(guò)程,都需要建立在知識(shí)學(xué)習(xí)的深度和關(guān)聯(lián)度之上。
①Y.LeCun and Y.Bengio.Convolutional networks for images,speech,and time-series.In M.A.Arbib,editor,The Handbook of Brain Theory and Neural Networks.MIT Press,1995.
②Geoffery E.Hinton and Salakhutdinov R.R.,Reducing the dimensionality of data with neural networks. Science.2006 Jul 28;313(5786):504-7.
③Geoffrey E.Hinton,Simon Osindero,Yee-Whye Teh. A Fast Learning Algorithm for Deep Belief Nets. Neural Computation.2006(7).
④余凱等.深度學(xué)習(xí)的昨天、今天和明天[J].計(jì)算機(jī)研究與發(fā)展,2013,9.
⑤安德森.布盧姆教育目標(biāo)分類(lèi)學(xué)(修訂版)[M]. 北京:外語(yǔ)教學(xué)與研究出版社,2009:78-80.
⑥Marton,F(xiàn). and Saljo,R.,On Qualitative Difference in Learning:Outcome and Process. British Journal of Educational Psychology,1976,46:4-11.
⑦安富海.促進(jìn)深度學(xué)習(xí)的課堂教學(xué)策略研究[J].課程?教材?教法,2014,11.
⑧Kieran Egan. Learning in Depth: A Simple Innovation That Can Transform Schooling. London, Ontario: The Althouse Press, 2010.
【關(guān)鍵詞】共情;疼痛;親社會(huì)行為;共情關(guān)注;利他行為
一、社會(huì)神經(jīng)科學(xué)下的共情研究:共享神經(jīng)網(wǎng)絡(luò)假說(shuō)
共情學(xué)者提出我們之所以能夠理解他人的行為,感覺(jué),情感,是因?yàn)檫@些情感激活了個(gè)體本身對(duì)這些情緒的表征,激活了共同的神經(jīng)網(wǎng)絡(luò)。在早期行為解釋模型知覺(jué)―動(dòng)作的啟發(fā)下,Preston 和 de Waal (2002)提出了一個(gè)神經(jīng)科學(xué)模型來(lái)解釋共情,這個(gè)模型認(rèn)為通過(guò)觀察或者想象處于某種情緒狀態(tài)下的人會(huì)自動(dòng)的激活個(gè)體本身對(duì)該情緒的表征,并且伴隨著自動(dòng)的軀體反應(yīng)。其他學(xué)者也認(rèn)為共同的神經(jīng)表征對(duì)理解他人的精神狀態(tài)起到關(guān)鍵作用。他們認(rèn)為同行的表征可以使他們模仿產(chǎn)生類(lèi)似的感覺(jué),情感體驗(yàn)和精神狀態(tài)。這種觀點(diǎn)認(rèn)為我們能夠通過(guò)想象將自己投射到他人的角度源于我們成熟的心理理解(mind-reading)能力,即激活自己的神經(jīng)結(jié)構(gòu)來(lái)模仿表征他人的情緒情感狀態(tài)從而產(chǎn)生同形的表征。甚至這種思維方式已經(jīng)蔓延到了行為和情感領(lǐng)域:為了明白他人特定行為的含義我們也模仿類(lèi)似的行為;為了理解他人的感覺(jué),我們激活自己的情感機(jī)制產(chǎn)生類(lèi)似的情感體驗(yàn)。事實(shí)上,這種社會(huì)交往和相互主觀性的所謂同形表征已成為近來(lái)共情FMRI研究中解釋血液動(dòng)力激活模式的主要理論。
目前對(duì)共情的社會(huì)神經(jīng)科學(xué)研究主要是采用觀察他人疼痛來(lái)激活個(gè)體自身疼痛共情的實(shí)驗(yàn)范式。采用這種實(shí)驗(yàn)范式的一個(gè)共同發(fā)現(xiàn)是對(duì)他人的疼痛共情會(huì)部分激活我們自身經(jīng)歷疼痛的神經(jīng)網(wǎng)絡(luò)。例如Singer(2004)和他的同事招募夫妻來(lái)做被試,實(shí)驗(yàn)有兩種條件,一種是對(duì)妻子的右手施加電極來(lái)產(chǎn)生疼痛反應(yīng),激活痛覺(jué)感覺(jué)網(wǎng)絡(luò)區(qū)域并用FMRI測(cè)量她的血氧水平,這屬于自我疼痛。第二種情況是對(duì)坐在MRI檢測(cè)器旁的丈夫施加疼痛刺激,但是躺在MRI里面的妻子可以通過(guò)一個(gè)反光系統(tǒng)觀察到這種疼痛,再次測(cè)量其血氧水平,這屬于他人疼痛。不同顏色的光束會(huì)指向妻子或者丈夫,暗示誰(shuí)會(huì)接受疼痛刺激。這個(gè)實(shí)驗(yàn)程序可以測(cè)量不同條件下大腦的神經(jīng)激活,疼痛刺激施加到被掃描的被試(疼痛的切身體驗(yàn))或者她的伴侶身上(對(duì)疼痛的共情)。研究發(fā)現(xiàn),不管是個(gè)體自己體驗(yàn)疼痛還是觀察伴侶接受疼痛刺激都會(huì)共同激活大腦的疼痛加工網(wǎng)絡(luò)即所謂的pain matrix的一部分(Derbyshire2000)。其中雙側(cè)前腦島(AI),背側(cè)前扣帶回皮層(ACC),腦干和小腦主要涉及對(duì)疼痛的情感加工,也就是說(shuō),這些區(qū)域主要負(fù)責(zé)編碼被試親身體驗(yàn)到得或者感覺(jué)到的情緒體驗(yàn)如不愉快,厭惡等。因此,個(gè)體親身感受到疼痛和觀察自己所愛(ài)的人接受疼痛刺激會(huì)激活同樣的情感神經(jīng)回路―這暗示了我們的神經(jīng)反應(yīng)也反映了伴侶的消極情緒反應(yīng)。
二、自下而上和自上而下的加工
大部分根據(jù)腦神經(jīng)神經(jīng)科學(xué)研究建立起來(lái)的共情模型都有一個(gè)共同的特點(diǎn):觀察者共同表征(自身和他人)的激活是沒(méi)有意識(shí)加工到且自發(fā)啟動(dòng)產(chǎn)生地。舉個(gè)例子來(lái)說(shuō),目前我們采用疼痛,觸覺(jué)和厭惡刺激對(duì)共情的研究中,通常我們會(huì)要求被試觀看一些場(chǎng)景或者電影,這些場(chǎng)景和電動(dòng)描繪了一個(gè)處于某種情緒或者被觸摸的他人,而不會(huì)告訴被試本研究的研究目的是觀察共情誘發(fā)的神經(jīng)反應(yīng)。然而事實(shí)上,僅僅呈現(xiàn)這些情景都足以引起被試對(duì)這些情感和觸摸的切身體驗(yàn)的表征。因此,一些研究者提出我們會(huì)自發(fā)地分享他人的情感,這個(gè)假設(shè)與早期的知覺(jué)―動(dòng)作模型是一致的,該模型認(rèn)為,當(dāng)個(gè)體知覺(jué)到他人的行為時(shí)會(huì)自動(dòng)激活其與該行為有關(guān)的個(gè)人經(jīng)驗(yàn)的表征從而產(chǎn)生共情反應(yīng)。此外,在這些研究中如果要讓被試產(chǎn)生預(yù)想的一系列反應(yīng),從情緒感染到最終產(chǎn)生飽滿(mǎn)的共情體驗(yàn),一個(gè)重要的條件是需要被試將注意指向他人的情感狀態(tài)。雖然注意,抑制和其他的一些執(zhí)行控制加工在產(chǎn)生共情體驗(yàn)中有著關(guān)鍵的作用,但這并不意味著共情只是一種純粹的感覺(jué)驅(qū)動(dòng)加工過(guò)程,也就是說(shuō)誘發(fā)共情反應(yīng)只能通過(guò)自下而上的加工方式。相反,一些研究提出情景評(píng)估,認(rèn)知加工和自上而下的控制也是人類(lèi)產(chǎn)生共情的主要組成部分。譬如,在十八世紀(jì),當(dāng)時(shí)的哲學(xué)家和經(jīng)濟(jì)學(xué)家亞當(dāng)斯密就提出這樣一種說(shuō)法,想象可以將我們投射到他人的情景中,從而產(chǎn)生類(lèi)似他人但一般弱于他人的感知覺(jué)。現(xiàn)在有關(guān)共情的大部分腦神經(jīng)科學(xué)模型認(rèn)可這一說(shuō)法,它們強(qiáng)調(diào)自上而下的加工和情景評(píng)估在產(chǎn)生共情反應(yīng)和調(diào)節(jié)之前提到的由自下而上的加工誘發(fā)的共情反應(yīng)中的重要作用。
最近的研究結(jié)果同樣支持這樣一種假設(shè),這個(gè)假設(shè)認(rèn)為是對(duì)情景的評(píng)估而不僅僅是感覺(jué)輸入就可以決定共情者的神經(jīng)和行為反應(yīng)。在一項(xiàng)FMRI研究中,讓被試觀看一系列疼痛圖片,譬如針扎在手上或者將活檢針(biopsy needle)扎在一個(gè)麻醉的手上。因此,需要考慮這兩種基本上一樣的圖片刺激所造成的疼痛感受,這樣就可以產(chǎn)生比較匹配的替代性體驗(yàn)。支持這一情景評(píng)估加工過(guò)程的神經(jīng)結(jié)構(gòu)有背內(nèi)側(cè)和眶額皮層(OFC)以及右顳頂交界(Rtpj)。眶額皮層的涉及主要是重新評(píng)估一些刺激的效價(jià),因?yàn)閳D片看起來(lái)是厭惡刺激,實(shí)際上是中性的活組織檢查刺激。然而,顳頂葉和背內(nèi)側(cè)前額葉的激活與自我和他人的區(qū)分以及自我意識(shí)有密切的關(guān)系。這些區(qū)域的功能使得被試可以將兩種反應(yīng)區(qū)分開(kāi)來(lái),這兩種反應(yīng)是厭惡刺激可能誘發(fā)的自發(fā)的和自我中心的反應(yīng),和理論上根據(jù)情境信息我們知道對(duì)活組織檢測(cè)的這種不合適的情感反應(yīng)。
三、研究展望
關(guān)鍵詞:E-learning;單模式情感識(shí)別;多模式情感識(shí)別
中圖分類(lèi)號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)15-3599-04
E-learning(數(shù)字化學(xué)習(xí)或電子學(xué)習(xí))是利用現(xiàn)代通信技術(shù),將信息技術(shù)與課本知識(shí)整合,為學(xué)習(xí)者提供理想的學(xué)習(xí)環(huán)境和學(xué)習(xí)方式,以達(dá)到深化教學(xué)改革和創(chuàng)新人才培養(yǎng)的目的。
基于情感計(jì)算的E-learning系統(tǒng),就是在傳統(tǒng)E-learning系統(tǒng)的基礎(chǔ)上增加了情感識(shí)別模塊,包括:情感識(shí)別模塊、情感分析模塊、情感反饋模塊、情感評(píng)價(jià)模塊等,實(shí)現(xiàn)情感化個(gè)性化的教學(xué)。主要目的是彌補(bǔ)傳統(tǒng)E-learning系統(tǒng)情感缺失的問(wèn)題。在這些情感模塊中,情感識(shí)別模塊是基礎(chǔ),這一模塊產(chǎn)生的結(jié)果直接影響后面所有模塊的效果,因此對(duì)情感識(shí)別模塊的研究放在重要的位置上,且進(jìn)行深入的研究。
由于識(shí)別的環(huán)境為遠(yuǎn)程E-learning教學(xué)的學(xué)生端,因此可以將多模式識(shí)別方法分為三部分[1],分別為:基于視覺(jué)的面部表情識(shí)別和身體動(dòng)作識(shí)別,還有基于聽(tīng)覺(jué)的會(huì)話信息(語(yǔ)音)識(shí)別。
1 基于單視覺(jué)的情感識(shí)別方法
1.1 面部表情識(shí)別
對(duì)面部圖像的捕捉是通過(guò)網(wǎng)絡(luò)攝像頭來(lái)實(shí)現(xiàn)的,采樣的方法是按一定的時(shí)間間隔來(lái)停幀并存取圖像(與20秒為一個(gè)時(shí)間間隔),接下來(lái)會(huì)對(duì)存取的圖像進(jìn)行情感的識(shí)別,確定這一時(shí)刻的情感狀態(tài),為以后的情感分析和反饋提供依據(jù)。
1.1.1 對(duì)圖像進(jìn)行情感的識(shí)別
對(duì)面部圖像進(jìn)行情感識(shí)別其實(shí)是一種人臉識(shí)別過(guò)程,其中主要包括三個(gè)方面的內(nèi)容:人臉檢測(cè)、人臉表征、人臉鑒別。
1)人臉檢測(cè):采用基于膚色的人臉檢測(cè)算法;
根據(jù)計(jì)算機(jī)色彩理論,通過(guò)對(duì)RGB格式、HIS格式、YCbCr格式[3]等主要色彩空間的比較,選用基于YCbCr空間的膚色模型來(lái)進(jìn)行膚色區(qū)域分割。YCbCr[4]色彩空間從YUV色彩空間衍生而來(lái)。其中Y代表亮度, Cb和Cr分量分別表示藍(lán)色和紅色的色度,在不同的光照下這兩種色度是穩(wěn)定的。該空間的優(yōu)點(diǎn)是將亮度分量與色度分量分離開(kāi)來(lái), 這樣受亮度變化的影響就比較小, 降低了兩者的相關(guān)性。
2)人臉表征:主要對(duì)眼睛、鼻子和嘴巴等的特征檢測(cè)與定位。
在對(duì)人臉進(jìn)行表征之前首先要進(jìn)行人臉區(qū)域的分割,把人臉區(qū)域用矩形框起來(lái)。所采用的分割算法流程圖如圖1:
具體的算法是基于相似度的方法,得到的結(jié)果圖如圖2所示(紅線矩形框?yàn)榻Y(jié)果),把眼睛和嘴巴表示為分段多項(xiàng)式曲線,用變形模版得到準(zhǔn)確的輪廓[3],標(biāo)記的結(jié)果圖如下圖2 :
3)人臉鑒別:采用主成分分析(PCA)
主成分分析方法(Principal Component Analysis ,PCA) 也稱(chēng)為主元法,主分量分析法,是一種常用、簡(jiǎn)單有效的方法。PCA方法就是將包含人臉的圖像區(qū)域看作是一種隨機(jī)向量,用K-L變換獲取其正交K-L基底,對(duì)應(yīng)其中較大特征值的基底具有與人臉相似的形狀,因此又稱(chēng)之為特征臉(Eigenfaces)[7]。
采用PCA算法進(jìn)行人臉識(shí)別時(shí),其中的測(cè)試數(shù)據(jù)庫(kù)選用Yale人臉數(shù)據(jù)庫(kù)(耶魯大學(xué)網(wǎng)站上下載),此人臉數(shù)據(jù)庫(kù)由耶魯大學(xué)計(jì)算視覺(jué)與控制中心創(chuàng)建,包含15位志愿者的165張圖片,包含光照,表情和姿態(tài)的變化,效果圖如圖3:
1.2 人體動(dòng)作識(shí)別
人體動(dòng)作過(guò)程是一個(gè)動(dòng)態(tài)系統(tǒng),其識(shí)別方法也都是基于動(dòng)態(tài)系統(tǒng)的識(shí)別方法。人體運(yùn)動(dòng)分析中一個(gè)重要的內(nèi)容是運(yùn)動(dòng)識(shí)別和動(dòng)作檢索。一般認(rèn)為,運(yùn)動(dòng)識(shí)別的任務(wù)就是把物體的輪廓從背景中分離出來(lái),根據(jù)特征值與目標(biāo)樣本庫(kù)中的運(yùn)動(dòng)進(jìn)行匹配運(yùn)算,以達(dá)到識(shí)別目標(biāo)的目的。而動(dòng)作檢索則是在已知的運(yùn)動(dòng)類(lèi)型范圍內(nèi),對(duì)于每個(gè)時(shí)刻的動(dòng)作,根據(jù)特征值和時(shí)間關(guān)系,與運(yùn)動(dòng)庫(kù)中的動(dòng)作匹配[16]。
2 基于單聽(tīng)覺(jué)(語(yǔ)音)的情感識(shí)別方法
基于單聽(tīng)覺(jué)的語(yǔ)音情感識(shí)別的實(shí)現(xiàn)大致可分成三個(gè)模塊:語(yǔ)音數(shù)據(jù)的讀取、語(yǔ)音數(shù)據(jù)的特征提取與分析以及語(yǔ)音情感識(shí)別。
2.1 語(yǔ)音數(shù)據(jù)的獲取
語(yǔ)音數(shù)據(jù)的獲取以話筒為依托,并將輸入的語(yǔ)音信息存儲(chǔ)為數(shù)字音頻文件,這里采用了波形音頻文件,即WAVE文件格式,擴(kuò)展名為“.wav”。它是WINDOWS中缺省的也是最常用的文件格式,這種格式在IBM PC及其兼容的平臺(tái)上被廣泛的應(yīng)用于加工處理數(shù)字聲音的程序中,波形音頻文件符合RIFF(Resource Interchange File Format)文件規(guī)范[10]。
本系統(tǒng)對(duì)語(yǔ)音信息的處理,主要是對(duì)WAVE文件中data結(jié)構(gòu)所包含的信息進(jìn)行分析和提取,以及使用優(yōu)化的FFT快速傅立葉變換,可以將輸出直接轉(zhuǎn)化成頻率(Hz)的形式,從而得到輸入信號(hào)中包含的頻率(Hz)及其幅度值。對(duì)音頻數(shù)據(jù)的優(yōu)化FFT變換在Matlab平臺(tái)實(shí)現(xiàn)。
2.2 語(yǔ)音情感識(shí)別
語(yǔ)音情感識(shí)別有兩種較為流行的方法: a)基于概率生成模型的方法如高斯混合模型(GMM)和隱馬爾可夫模型(HMM);b)基于判別模型的方法,主要有支持向量機(jī)(SVM)和人工神經(jīng)網(wǎng)絡(luò)(ANN)。近來(lái),一種新的解決思路是把上述若干模型融合起來(lái),各自取長(zhǎng)補(bǔ)短,形成混合模型[12]。這里采用基于判別模型的PNN (probabilistic neural network)和基于概率生成模型的HMM(hidden markov model)的混合模型[13],算法如下:
3 基于多模式的識(shí)別方法
3.1 多模式識(shí)別系統(tǒng)的設(shè)計(jì)
以上基于單模式的各情感識(shí)別方法都有自己的缺點(diǎn),例如,基于單視覺(jué)的人臉識(shí)別方法,只能對(duì)人的正面臉進(jìn)行情感識(shí)別,而捕捉到的人臉圖像大部分卻是非正面的,因?yàn)樽匀粻顟B(tài)下人的頭部是很隨意的;基于單視覺(jué)的人體動(dòng)作識(shí)別方法,其中的多數(shù)方法只能識(shí)別一些簡(jiǎn)單的運(yùn)動(dòng),無(wú)法應(yīng)用到復(fù)雜動(dòng)作的識(shí)別,且識(shí)別出的情感種類(lèi)比較少,不能識(shí)別出教學(xué)中應(yīng)有的一些情感狀態(tài);基于單聽(tīng)覺(jué)(語(yǔ)音)的識(shí)別方法,受語(yǔ)音庫(kù)的影響比較大,而語(yǔ)音庫(kù)的建立很不完善,正確率打折,同時(shí)對(duì)活動(dòng)性相近的情感[13]的區(qū)分性較差。
針對(duì)各單模式情感識(shí)別的缺點(diǎn),采用多模式的情感識(shí)別方法,目的是共同來(lái)識(shí)別人在無(wú)意識(shí)情況下的情感狀態(tài),為下一步進(jìn)行情感分析、反饋與評(píng)價(jià)提供準(zhǔn)確的信息,最終利用各種情感信息調(diào)用不同的學(xué)習(xí)策略以達(dá)到學(xué)習(xí)的最佳狀態(tài)。
由于識(shí)別的環(huán)境為遠(yuǎn)程E-learning教學(xué)的學(xué)生端,因此多模式識(shí)別系統(tǒng)包括了文章所論述的各單模式情感識(shí)別方法,即:基于視覺(jué)的面部表情識(shí)別和身體動(dòng)作識(shí)別、基于聽(tīng)覺(jué)的會(huì)話信息(語(yǔ)音)識(shí)別,共同配合來(lái)進(jìn)行情感的識(shí)別,系統(tǒng)的構(gòu)架圖如圖4:
3.2 多模式識(shí)別方法
基于多模式的識(shí)別方法,目前有三種可以對(duì)視聽(tīng)信息進(jìn)行融合的策略[1](特征層面、決策層面和模型層面)。其中,特征層面上的融合策略[16]的主要方法為:首先關(guān)聯(lián)韻律特征和面部特征,以構(gòu)造共同特征向量,然后用來(lái)建立一個(gè)情感識(shí)別器;決策層面上的融合策略[3]的主要方法為:先獨(dú)立的識(shí)別視覺(jué)、聽(tīng)覺(jué)的情感,最后把單一模式的識(shí)別結(jié)果進(jìn)行融合;模型層面上的融合策略[18]的主要方法為:可以利用音頻流和視頻流之間的關(guān)聯(lián)性,并能同步流。
目前常用的是特征層面與決策層面的融合策略,模型層面上的融合策略要同步音頻視頻流,比較復(fù)雜則不常采用。特征層面上的融合策略采用單一的分類(lèi)器來(lái)處理視聽(tīng)的特征;決策層面上的融合策略視聽(tīng)的特征有各自的分類(lèi)器處理,最后把輸出的結(jié)果按一定的標(biāo)準(zhǔn)(包括最大、平均、乘積、權(quán)值)進(jìn)行組合[6]。兩種方法的流程圖如圖5:
特征層面上的融合策略對(duì)發(fā)怒(anger)與平靜(neutral)這兩種情感狀態(tài)的識(shí)別率最高;而決策層面上的融合策略對(duì)快樂(lè)(happiness)與悲傷(sadness)這兩種情感狀態(tài)的識(shí)別率最高;兩種方法對(duì)其它情感狀態(tài)的識(shí)別情況基本相同[8]。因此,在本文的多模式識(shí)別系統(tǒng)中,結(jié)合以上分析得出的教學(xué)系統(tǒng)中常見(jiàn)的情緒:平靜、困惑、無(wú)聊、高興、挫敗感、厭惡、驚訝,把這兩種融合策略進(jìn)行結(jié)合。
兩種融合策略結(jié)合的方法:以決策層面上的融合策略為主,當(dāng)所有采樣的數(shù)據(jù)進(jìn)入情感識(shí)別模塊進(jìn)行處理時(shí),使用決策層面上的融合策略來(lái)輸出結(jié)果;最后經(jīng)過(guò)評(píng)價(jià)模塊反饋回來(lái)的信息不理想時(shí),先進(jìn)入情感分析模塊重新分析,再進(jìn)入評(píng)價(jià);評(píng)價(jià)還是不理想時(shí),則把原來(lái)采樣的數(shù)據(jù)在情感識(shí)別模塊中,換為特征層面上的融合策略進(jìn)行處理。
4 實(shí)驗(yàn)結(jié)果
系統(tǒng)的實(shí)現(xiàn)采用VC++開(kāi)發(fā)平臺(tái),利用VC中的網(wǎng)絡(luò)應(yīng)用函數(shù)開(kāi)發(fā)出客戶(hù)端/服務(wù)器的通訊系統(tǒng)[6],多模式情感識(shí)別模型的仿真引用MATLAB中的神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行。
本系統(tǒng)利用MATLAB來(lái)進(jìn)行訓(xùn)練使其能很好的為系統(tǒng)服務(wù),然后把訓(xùn)練好的模型嵌入到學(xué)生端,該文中所設(shè)計(jì)的模型與E-learning系統(tǒng)沒(méi)有整合在一塊兒,而是單獨(dú)在每個(gè)學(xué)生端安裝,并且相應(yīng)的數(shù)據(jù)庫(kù)也是獨(dú)立安裝。動(dòng)畫(huà)人物的實(shí)現(xiàn),利用了Microsoft Agent技術(shù)來(lái)實(shí)現(xiàn),選用的動(dòng)畫(huà)人物為Merlin,并作為ActiveX控件嵌入到學(xué)生端程序,運(yùn)行界面如圖6:
5 結(jié)束語(yǔ)
基于多模式的情感識(shí)別方法,把基于單模式的識(shí)別方法集成到一塊兒來(lái)共同識(shí)別情感,識(shí)別的過(guò)程較單模式要復(fù)雜,且識(shí)別時(shí)間相對(duì)要長(zhǎng)。處理的又是人在無(wú)意識(shí)情況下的情感狀態(tài),對(duì)多模式情感識(shí)別提出了更大的挑戰(zhàn)。基于多模式的識(shí)別方法已經(jīng)是目前情感識(shí)別方法的主流。
參考文獻(xiàn):
[1] Zeng Z H, Pantic M, Glenn L. Roisman and Thomas S. Huang. A Survey of Affect Recognition Methods:Audio,Visual and Spontaneous Expressions, Japan:ICMI’07,2007:126-133.
[2] Hsu R L,Abdel-Mottaleb M,Jain A K.Face detection in color images.IEEE Trans.Pattern Analysis and Machine intelligence,2002,24(5):696-706.
[3] Reuderink B,Poel P,Truong P,Ronald Poppe,and Maja Pantic. Decision-Level Fusion for Audio-Visual Laughter Detection,LNCS 5237,2008:137-148.
[4] Alejandro J,Daniel G P,Nicu S,et al.Human-centered computing:toward a human revolution[J].Computer,2007,40(5)30-34.
[5] Jin N,Mokhtarian F.Image-based shape model for view-invariant human motion recognition[A].Proceedings of Conference on Advanced Video and Signal Based Surveillance[C].London:IEEE,2007:336-341.
[6] Ogale A S,Karapurkar A,Aloimonos Y.View-invariant modeling and recognition of human actions using grammars[A].International Conference on Computer Vision,Workshop on Dynamical Vision[C].Beijing,China:Springer Verlag,2005.
[7] Parameswaran V,Chellappa R.Using 2D projective invariance for human action recognition[J].International Journal of Computer Vision,2006,66(1):83-101.
[8] 王金庭,楊敏.基于YCbCr空間的亮度自適應(yīng)膚色檢測(cè)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2007(6):99-101.
[9] 劉振,吳鵬,陳月輝.基于PCA和神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別[J].山東科學(xué),2006,19(4):63-67.
[10] 王茜.一個(gè)語(yǔ)音情感識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].大眾科技,2006,94(8):103-104.
[11] 趙臘生,張強(qiáng),魏小鵬.語(yǔ)音情感識(shí)別研究進(jìn)展[J].計(jì)算機(jī)應(yīng)用研究,2009,26(2):428-432.
[12 蔣丹寧.蔡蓮紅.基于語(yǔ)音聲學(xué)特征的情感信息識(shí)別[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2006,46(1):86-89.
[13] 董靜,王萬(wàn)森.E-learning系統(tǒng)中情感識(shí)別的研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,29(17):4525-4534.
[14] 程祥.人體動(dòng)作識(shí)別的研究[J].電腦知識(shí)與技術(shù),2006:120-133.
關(guān)鍵詞: 人工智能 發(fā)展過(guò)程 研究熱點(diǎn) 應(yīng)用領(lǐng)域 未來(lái)發(fā)展
一、人工智能概述
人工智能(Artificial Intelligence,簡(jiǎn)稱(chēng)AI),也稱(chēng)機(jī)器智能,它是計(jì)算機(jī)科學(xué)、控制論、信息論、神經(jīng)生理學(xué)、心理學(xué)、語(yǔ)言學(xué)等多種學(xué)科互相滲透而發(fā)展起來(lái)的一門(mén)綜合性學(xué)科。從計(jì)算機(jī)應(yīng)用系統(tǒng)角度來(lái)看,人工智能是研究如何制造出智能機(jī)器或智能系統(tǒng),實(shí)現(xiàn)模擬人類(lèi)智能活動(dòng)的能力,以延伸人們智能的科學(xué)。人工智能是一門(mén)交叉學(xué)科,是一門(mén)涉及心理學(xué)、認(rèn)知科學(xué)、思維科學(xué)、信息科學(xué)、系統(tǒng)科學(xué)和生物科學(xué)等多學(xué)科的綜合性技術(shù)學(xué)科,目前已在知識(shí)處理、模式識(shí)別、自然語(yǔ)言處理、博弈、自動(dòng)定理證明、自動(dòng)程序設(shè)計(jì)、專(zhuān)家系統(tǒng)、知識(shí)庫(kù)、智能機(jī)器人等多個(gè)領(lǐng)域取得舉世矚目的成果,并形成了多元化的發(fā)展方向。
二、人工智能的發(fā)展過(guò)程
人工智能經(jīng)歷了三次飛躍階段:第一次是實(shí)現(xiàn)問(wèn)題求解,代替人完成部分邏輯推理工作,如機(jī)器定理證明和專(zhuān)家系統(tǒng);第二次是智能系統(tǒng)能夠和環(huán)境交互,從運(yùn)行的環(huán)境中獲取信息,代替人完成包括不確定性在內(nèi)的部分思維工作,通過(guò)自身的動(dòng)作,對(duì)環(huán)境施加影響,并適應(yīng)環(huán)境的變化,如智能機(jī)器人;第三次是智能系統(tǒng),具有類(lèi)人的認(rèn)知和思維能力,能夠發(fā)現(xiàn)新的知識(shí),去完成面臨的任務(wù),如基于數(shù)據(jù)挖掘的系統(tǒng)。
三、人工智能的研究熱點(diǎn)
AI研究出現(xiàn)了新的,這一方面是因?yàn)樵谌斯ぶ悄芾碚摲矫嬗辛诵碌倪M(jìn)展,另一方面是因?yàn)橛?jì)算機(jī)硬件突飛猛進(jìn)地發(fā)展。隨著計(jì)算機(jī)速度的不斷提高、存儲(chǔ)容量的不斷擴(kuò)大、價(jià)格的不斷降低,以及網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,許多原來(lái)無(wú)法完成的工作現(xiàn)在已經(jīng)能夠?qū)崿F(xiàn)。目前人工智能研究的三個(gè)熱點(diǎn)是:智能接口、數(shù)據(jù)挖掘、主體及多主體系統(tǒng)。
1.智能接口技術(shù)是研究如何使人們能夠方便自然地與計(jì)算機(jī)交流。為了實(shí)現(xiàn)這一目標(biāo),要求計(jì)算機(jī)能夠看懂文字、聽(tīng)懂語(yǔ)言、說(shuō)話表達(dá),甚至能夠進(jìn)行不同語(yǔ)言之間的翻譯,而這些功能的實(shí)現(xiàn)又依賴(lài)于知識(shí)表示方法的研究。因此,智能接口技術(shù)的研究既有巨大的應(yīng)用價(jià)值,又有基礎(chǔ)的理論意義。目前,智能接口技術(shù)已經(jīng)取得了顯著成果,文字識(shí)別、語(yǔ)音識(shí)別、語(yǔ)音合成、圖像識(shí)別、機(jī)器翻譯及自然語(yǔ)言理解等技術(shù)已經(jīng)開(kāi)始實(shí)用化。
2.數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但是又潛在有用的信息和知識(shí)的過(guò)程。數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的研究目前已經(jīng)形成了三根強(qiáng)大的技術(shù)支柱:數(shù)據(jù)庫(kù)、人工智能和數(shù)理統(tǒng)計(jì)。主要研究?jī)?nèi)容包括基礎(chǔ)理論、發(fā)現(xiàn)算法、數(shù)據(jù)倉(cāng)庫(kù)、可視化技術(shù)、定性定量互換模型、知識(shí)表示方法、發(fā)現(xiàn)知識(shí)的維護(hù)和再利用、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中的知識(shí)發(fā)現(xiàn)及網(wǎng)上數(shù)據(jù)挖掘等。
3.主體系統(tǒng)是具有信念、愿望、意圖、能力、選擇、承諾等心智狀態(tài)的實(shí)體,比對(duì)象的粒度更大,智能性更高,而且具有一定的自主性。主體試圖自治、獨(dú)立地完成任務(wù),而且可以和環(huán)境交互,與其他主體通信,通過(guò)規(guī)劃達(dá)到目標(biāo)。多主體系統(tǒng)主要研究在邏輯上或物理上分離的多個(gè)主體之間進(jìn)行協(xié)調(diào)智能行為,最終實(shí)現(xiàn)問(wèn)題求解。多主體系統(tǒng)試圖用主體來(lái)模擬人的理,主要應(yīng)用在對(duì)現(xiàn)實(shí)世界和社會(huì)的模擬、機(jī)器人及智能機(jī)械等領(lǐng)域。目前對(duì)主體和多主體系統(tǒng)的研究主要集中在主體和多主體理論、主體的體系結(jié)構(gòu)和組織、主體語(yǔ)言、主體之間的協(xié)作和協(xié)調(diào)、通信和交互技術(shù)、多主體學(xué)習(xí)及多主體系統(tǒng)應(yīng)用等方面。
四、人工智能的應(yīng)用領(lǐng)域
1.專(zhuān)家系統(tǒng)
專(zhuān)家系統(tǒng)是一個(gè)具有大量專(zhuān)門(mén)知識(shí)與經(jīng)驗(yàn)的程序系統(tǒng),專(zhuān)家系統(tǒng)存儲(chǔ)著某個(gè)專(zhuān)門(mén)領(lǐng)域中經(jīng)過(guò)事先總結(jié)、分析并按某種模式表示的專(zhuān)家知識(shí),以及擁有類(lèi)似于領(lǐng)域?qū)<医鉀Q實(shí)際問(wèn)題的推理機(jī)制。專(zhuān)家系統(tǒng)的開(kāi)發(fā)和研究是人工智能中最活躍的一個(gè)應(yīng)用研究領(lǐng)域,涉及社會(huì)各個(gè)方面。
2.知識(shí)庫(kù)系統(tǒng)
知識(shí)庫(kù)系統(tǒng)也叫數(shù)據(jù)庫(kù)系統(tǒng),是儲(chǔ)存某學(xué)科大量事實(shí)的計(jì)算機(jī)軟件系統(tǒng),它可以回答用戶(hù)提出的有關(guān)該學(xué)科的各種問(wèn)題。知識(shí)庫(kù)系統(tǒng)的設(shè)計(jì)是計(jì)算機(jī)科學(xué)的一個(gè)活躍的分支。為了有效地表示、儲(chǔ)存和檢索大量事實(shí),已經(jīng)發(fā)展出了許多技術(shù)。但是在設(shè)計(jì)智能信息檢索系統(tǒng)時(shí)還是遇到很多問(wèn)題,包括對(duì)自然語(yǔ)言的理解,根據(jù)儲(chǔ)存的事實(shí)演繹答案的問(wèn)題、理解詢(xún)問(wèn)和演繹答案所需要的知識(shí)都可能超出該學(xué)科領(lǐng)域數(shù)據(jù)庫(kù)所表示的知識(shí)。
3.物景分析
計(jì)算機(jī)視覺(jué)已從模式識(shí)別的一個(gè)研究領(lǐng)域發(fā)展為一門(mén)獨(dú)立的學(xué)科。視覺(jué)是感知問(wèn)題之一。整個(gè)感知問(wèn)題的要點(diǎn)是形成一個(gè)精練的表示,以表示難以處理的、極其龐大的未經(jīng)加工的輸入數(shù)據(jù)。最終表示的性質(zhì)和質(zhì)量取決于感知系統(tǒng)的目標(biāo)。機(jī)器視覺(jué)的前沿研究領(lǐng)域包括實(shí)時(shí)并行處理、主動(dòng)式定性視覺(jué)、動(dòng)態(tài)和時(shí)變視覺(jué)、三維景物的建模與識(shí)別、實(shí)時(shí)圖像壓縮傳送和復(fù)原、多光譜和彩色圖像的處理與解釋等。機(jī)器視覺(jué)已在機(jī)器人裝配、衛(wèi)星圖像處理、工業(yè)過(guò)程監(jiān)控、飛行器跟蹤和制導(dǎo)及電視實(shí)況轉(zhuǎn)播等領(lǐng)域獲得極為廣泛的應(yīng)用。
4.模式識(shí)別
模式識(shí)別就是識(shí)別出給定物體所模仿的標(biāo)本或標(biāo)識(shí)。計(jì)算機(jī)模式識(shí)別系統(tǒng)能夠彌補(bǔ)計(jì)算機(jī)對(duì)外部世界感知能力低下的缺陷,使計(jì)算機(jī)能夠通過(guò)感官接受外界信息,識(shí)別和理解周?chē)h(huán)境。模式識(shí)別在二維的文字、圖形和圖像的識(shí)別方面已取得許多成果,在三維景物、活動(dòng)目標(biāo)的識(shí)別和分析方面是目前研究的熱點(diǎn),同時(shí)它還是智能計(jì)算機(jī)和智能機(jī)器人研究的十分重要的基礎(chǔ)。此外,人工智能還在機(jī)器視覺(jué)、組合調(diào)度問(wèn)題、自然語(yǔ)言理解、機(jī)器學(xué)習(xí)、博弈、定理證明等研究應(yīng)用領(lǐng)域發(fā)揮著重要作用。可以說(shuō)人工智能已深入各行各業(yè),對(duì)人類(lèi)社會(huì)作出了巨大的貢獻(xiàn)。
5.機(jī)器人
機(jī)器人學(xué)所研究的問(wèn)題,從機(jī)器人手臂的最佳移動(dòng)到實(shí)現(xiàn)機(jī)器人目標(biāo)的動(dòng)作序列的規(guī)劃方法,無(wú)所不包。盡管已經(jīng)建立了一些比較復(fù)雜的機(jī)器人系統(tǒng),但是現(xiàn)在工業(yè)上運(yùn)行的機(jī)器人都是一些按預(yù)先編好的程序執(zhí)行某些重復(fù)作業(yè)的簡(jiǎn)單裝置,大多數(shù)工業(yè)機(jī)器人是“盲人”。機(jī)器人和機(jī)器人學(xué)的研究促進(jìn)了許多人工智能思想的發(fā)展。智能機(jī)器人的研究和應(yīng)用體現(xiàn)出廣泛的學(xué)科交叉,涉及眾多課題。機(jī)器人已在工業(yè)、農(nóng)業(yè)、商業(yè)、旅游業(yè)、空中和海洋及國(guó)防等多個(gè)領(lǐng)域獲得越來(lái)越普遍的應(yīng)用。
五、人工智能的未來(lái)發(fā)展
目前絕大多數(shù)人工智能系統(tǒng)都是建立在物理符號(hào)系統(tǒng)假設(shè)之上的。在尚未出現(xiàn)能與物理符號(hào)系統(tǒng)假設(shè)相抗衡的新的人工智能理論之前,無(wú)論從設(shè)計(jì)原理還是從已取得的實(shí)驗(yàn)結(jié)果來(lái)看,Soar在探討智能行為的一般特征和人類(lèi)認(rèn)知的具體特征的艱難征途上都取得了有特色的進(jìn)展或成就,處在人工智能研究的前沿。上世紀(jì)80年代,以NewellA為代表的研究學(xué)者總結(jié)了專(zhuān)家系統(tǒng)的成功經(jīng)驗(yàn),吸收了認(rèn)知科學(xué)研究的最新成果,提出了作為通用智能基礎(chǔ)的體系結(jié)構(gòu)Soar。目前的Soar已經(jīng)顯示出強(qiáng)大的問(wèn)題求解能力。在Soar中已實(shí)現(xiàn)了30多種搜索方法,實(shí)現(xiàn)了若干知識(shí)密集型任務(wù)(專(zhuān)家系統(tǒng)),如RI等。對(duì)于人工智能未來(lái)的發(fā)展方向,專(zhuān)家們通過(guò)一些前瞻性研究可以看出未來(lái)人工智能可能會(huì)向以下幾個(gè)方面發(fā)展:模糊處理、并行化、神經(jīng)網(wǎng)絡(luò)及其情感。
目前,人工智能的推理功能已獲突破,學(xué)習(xí)及聯(lián)想功能正在研究之中,下一步就是模仿人類(lèi)右腦的模糊處理功能和整個(gè)大腦的并行化處理功能。人工神經(jīng)網(wǎng)絡(luò)是未來(lái)人工智能應(yīng)用的新領(lǐng)域。未來(lái)智能計(jì)算機(jī)的構(gòu)成,可能就是作為主機(jī)的馮?諾依曼型機(jī)與作為智能的人工神經(jīng)網(wǎng)絡(luò)的結(jié)合。研究表明:情感是智能的一部分,而不是與智能相分離的,因此人工智能領(lǐng)域的下一個(gè)突破可能在于賦予計(jì)算機(jī)情感能力。情感能力對(duì)于計(jì)算機(jī)與人的自然交往至關(guān)重要。
根據(jù)這些前瞻性研究我們也可以通過(guò)想象模擬勾畫(huà)出人工智能未來(lái)發(fā)展的三個(gè)階段。
1.融合時(shí)期(2010―2020年)
(1)用語(yǔ)言操縱和控制的智能化設(shè)備十分普及,像遠(yuǎn)程醫(yī)療這樣的服務(wù)也更為完善。
(2)以計(jì)算機(jī)和互聯(lián)網(wǎng)為基礎(chǔ)的遠(yuǎn)程教育十分普及,在家就可以上大學(xué)。
(3)在身體里植入許多不同功能的芯片已不新奇。
(4)量子計(jì)算機(jī)和DNA計(jì)算機(jī)會(huì)有更大發(fā)展,新材料不斷問(wèn)世。
(5)抗病毒程序可以防止各種非自然因素引發(fā)災(zāi)難。
2.自信時(shí)期(2020―2030年)
(1)智能化計(jì)算機(jī)和互聯(lián)網(wǎng)既能自我修復(fù),也能自行進(jìn)行研究、生產(chǎn)產(chǎn)品。
(2)一些新型材料的出現(xiàn),促使智能化向更高層次發(fā)展。
(3)有了高水準(zhǔn)智能化技術(shù)的協(xié)助,人們“定居火星夢(mèng)”可能性大增。
3.非神秘時(shí)期(2030―2040年)
(1)新的全息模式世界將取代原有幾何模式的世界。
(2)人們對(duì)一些目前無(wú)法解釋的自然現(xiàn)象會(huì)有更完善的解釋。
(3)人工智能可以模仿人類(lèi)的智能,因此會(huì)出現(xiàn)有關(guān)法律來(lái)規(guī)范這些行為。
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:北大期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:北大期刊
榮譽(yù):百種重點(diǎn)期刊
級(jí)別:北大期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊