前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的統(tǒng)計與信息論文主題范文,僅供參考,歡迎閱讀并收藏。
信息通信技術(ICT)是信息技術(IT)和通信技術(CT)相互融合后產(chǎn)生的一個新概念。信息技術側(cè)重于管理和處理信息的相關技術,而通信技術則主要指用于溝通交換信息的相關技術。21世紀初,八國集團在沖繩發(fā)表的《全球信息社會沖繩》中認為:“信息通信技術是21世紀社會發(fā)展的最強有力動力之一,并將迅速成為世界經(jīng)濟增長的重要動力”。目前為止,信息通信技術的具體內(nèi)涵仍具有爭議,它不僅涉及信息的管理與處理,還包括信息的交換與共享,還將繼續(xù)向智能化發(fā)展。目前ICT已經(jīng)廣泛應用于我們的日常生活當中,例如,IPTV、手機電視等,也應用于各專業(yè)領域,例如,遠程工程監(jiān)控、地理信息系統(tǒng)等。在本文將討論的教育領域,ICT的應用也加速了進程,在學生都已掌握一定信息通信技術的前提下,大量的在線課程、在線輔導都已普遍使用??陀^地講,信息通信技術是現(xiàn)代社會的一種通用技術。
二、ICT在EFL教學中的應用優(yōu)勢
英國的教育電子期刊《課程領導》曾在2008年的頭版回顧了17項有關ICT課堂應用效果的實證研究,絕大多數(shù)研究證實了ICT的課堂應用與學生的成績表現(xiàn)為正相關。有些研究更進一步表明ICT的課堂應用對學生學習的能動性、獨立性以及批判性均有促進作用。本文將重點從EFL學習者的學習環(huán)境、學習方式和學習能力三個方面討論ECT在EFL教學中的應用優(yōu)勢。
(一)ICT的應用對EFL學習環(huán)境的影響
眾所周知,語言環(huán)境對于語言學習者來說至關重要。EFL的教學特性決定了無法給學習者提供等同于母語的學習環(huán)境,讓學習者在日常生活中隨時隨地地輸入和輸出語言。但ICT在EFL教學中的應用可以在一定程度上給學習者提供一個廣泛而靈活的、虛擬而又真實的學習環(huán)境。正如前面提到的,由于我國的國土面積較大導致了教育資源分布不均的問題。劉俊教授的研究發(fā)現(xiàn),EFL學習者的成績表現(xiàn)與地緣分布有較強的相關性。處于東部發(fā)達地區(qū)的學習者成績表現(xiàn)與偏遠地區(qū)的學習者表現(xiàn)存在顯著性差異。而ICT的應用給教師提供了遠程教學的可能性,正如Holmes和Gardner所說ICT可以“消除地理限制”。此外,ICT的課堂應用也使教師和學生在學習地點、學習節(jié)奏和學習時間上享有更多的自由,真正讓學習可以在任何地方和任何時間實現(xiàn)。而我國的人口規(guī)模也造成了班級容量普遍較大的問題,在教育資源匱乏的地區(qū),甚至有八十至九十個學生為一個班級的情況。大容量班級造成教師很難滿足學生的差異化學習需求。將ICT應用于課堂后,教師可以為學生提供在線單獨輔導,學生也可以通過ICT的輔助來進行獨立自主的學習,實現(xiàn)學習環(huán)境廣泛化和靈活化。ICT在EFL教學中的應用,可以為語言學習者營造一個虛擬的學習環(huán)境,雖然目前還沒有實驗證明虛擬學習環(huán)境(virtuallearningenvironment,VLE)對學習者的成績表現(xiàn)會產(chǎn)生積極的影響,但其輔助作用也不容忽視。通過ICT創(chuàng)建的虛擬學習環(huán)境給學生提供了一個獲取信息和增加交流的平臺。學生可以瀏覽自己感興趣的英語網(wǎng)頁,觀看自己喜歡的視頻,從而接觸到英語為母語國家的真實語言使用情況。而且,學習者還能進一步了解英語為母語國家的價值觀、思維方式,甚至肢體語言表達習慣,這些都是確??缥幕浑H有效的重要因素。這種虛擬而又真實的語言學習環(huán)境,是對學生課堂學習和課本學習的必要補充。
(二)ICT的應用對EFL學習模式的影響
學習模式是一種持續(xù)的作用過程,反映出學習者的行為動因。學生的學習模式雖然因人而異,但仍擺脫不了教師為主導的單項模式,聽、說、讀、寫單項練習的傳統(tǒng)模式。ICT的應用可以激發(fā)出一系列新的學習方式,例如自主學習、混合學習、綜合學習和無意識的學習。ICT的應用能顯著改變教師與學生的角色。一方面,學生從學習的接受者變?yōu)閰⑴c者;另一方面,教師從課堂的主導者變?yōu)橹笇д?、輔助者和組織者。增加學生學習的自主能動性并控制語言學習過程是交際型語言教學、任務型教學以及學習策略培養(yǎng)的中心目標。我國從事EFL教學的教師絕大部分都是英語為非母語的,因此,他們同時扮演學習者和教授者的角色。從這個角度來說,學生學習的自主能動性就更為重要。將ICT應用于EFL課堂能激發(fā)學生開展自主學習,同時學生可以根據(jù)自己實際情況調(diào)整學習地點、時間和節(jié)奏;而且ICT可以應用于整個語言學習過程,從提供信息到練習再到反饋,讓學生全程掌控自己的學習。Holmes和Gardner提出了“混合學習”這一概念,指將數(shù)字化學習與傳統(tǒng)學習相結合。Neumeier更進一步解釋了在語言學習情境中混合學習是指在同一個學習環(huán)境中面對面講授型學習和電腦輔助學習同時存在。ICT的應用不可避免地會產(chǎn)生混合學習這一模式。ICT的應用給教學方式帶來了巨大變革,但并不意味著會貶低傳統(tǒng)教學的作用,相反地,兩者必須共同存在、相互作用才能實現(xiàn)有效教學這一最終目的。Clarke將學習分為三類:視覺學習、聽覺學習和體驗學習,簡單地來說就是通過看、聽和實踐的三種學習方法。而EFL的學習強調(diào)的恰恰是聽、說、讀、寫四種能力的培養(yǎng),所以通過比較不難發(fā)現(xiàn)EFL的學習需要的視覺學習、聽覺學習和體驗學習的綜合使用,而ICT的應用能很好地實現(xiàn)綜合學習。英國東北部的蒙克西頓中學曾在1996年做過一項實驗。學校鼓勵學生與法國和德國的兩所合作學校的同年級學生進行視頻會面(videoconference)。經(jīng)過五個月的試驗,九年級的五個學生在班里十三個學生中表現(xiàn)突出,他們的口語交際能力包括口音、語調(diào)、流利度都有明顯改進。參與到這項實驗中的學生不僅通過視頻會面增加了詞匯量,同時聽說能力也得到了極大的提升。ICT的應用可以讓EFL學習者方便地進行聽、說、讀、寫能力的綜合學習。無意識的學習也是將ICT引入課程后的一個不可忽視的副產(chǎn)品。有數(shù)據(jù)顯示,全球網(wǎng)頁有84%的應用語言為英語,這意味著如果EFL學習者在使用英語網(wǎng)站檢索信息,無論初始目的是否是進行語言學習,在無意中都會提高語言能力。Vogel在2001年進行了一項研究,他隨機挑選了55名大學生作為樣本,這些學生正在進行國際商務或跨文化的專業(yè)學習,因此外語對于他們來說也是專業(yè)學習的一個核心要素。研究結果顯示所有的研究樣本都使用網(wǎng)站在進行學習,當被問及他們使用網(wǎng)站是否是為了進行語言學習時,回答竟然驚人得一致,學習外語并不是他們使用網(wǎng)站的最初目的;而且,這些樣本中沒有人會說出一個專門提供外語學習的網(wǎng)站名稱。隨著ICT的發(fā)展,EFL學習者在瀏覽英語網(wǎng)頁,觀看英文電影等休閑娛樂過程中,也能進行無意識的學習,增加了學習時間也豐富了學習內(nèi)容。
(三)ICT的應用對EFL學習能力的影響
相對于傳授知識而言,教授學法更加重要,正如我國有句諺語常說“授人以魚,不如授人以漁”。因為課堂為依托的教學只是很短的一個學習階段,更長久的學習、知識更新都需要學習者自主學習來完成。眾所周知,語言的學習需要長時間的積累,所以對于EFL學習者的學習能力培養(yǎng)也顯得更為重要。ICT的應用將有助于培養(yǎng)學習者的專業(yè)技能、批判思維、交際能力以及自主解決問題的能力。如今ICT技能已經(jīng)是學生學習和未來職業(yè)的必備能力之一。在本文之前的論證分析中著重強調(diào)了ICT應用對于語言學習的促進作用;而客觀地講,在語言學習的過程中引入ICT也促進了ICT技能的傳播和發(fā)展。如果EFL學習者要通過ICT學習語言需要掌握的基本專業(yè)技能有文字處理、交際軟件的使用、數(shù)據(jù)分析管理、演示文稿制作等。在荷蘭曾實施過一個項目旨在促進語言學習者的ICT技能。這個項目包含若干模塊,例如,使用文字處理軟件用目標語寫一封信然后通過電子郵件發(fā)給一位朋友;用目標語寫一個有關自己對荷蘭教育體系認識的報告,使用PowerPoint軟件制作演示文稿,然后在班級里進行口頭報告,最后通過交際軟件與目標語國家的朋友分享報告。這個項目具有建設性和綜合性,讓語言學習者在學習語言的同時發(fā)展了ICT技能。批判性思維和自主解決問題的能力是學習者應具備的基本素質(zhì),甚至也是日常生活中的必備能力。ICT的應用讓學生可以進行自主的學習,學生可以通過網(wǎng)絡獲取到大量的信息,但隨之而來的是如何篩選分辨信息質(zhì)量和可信度的問題。與紙質(zhì)媒介相比較,數(shù)字信息需要學習者具備較強的批判性思維能力。此外,如前面所討論的,ICT的應用讓學習者可以方便地根據(jù)個人的喜好來安排學習時間、地點、內(nèi)容和節(jié)奏,這也就進一步需要學習者有足夠的能力來自主解決學習中遇到的問題。這里所說的問題不僅僅指學習語言本身遇到的學術性問題,也指在使用ICT過程中遇到的技術性問題。交際能力對EFL學習者至關重要,而電腦輔助實現(xiàn)的語言交際大致可以分為兩類:異步和同步,ICT的發(fā)展讓這兩種交際都變得十分可行,正如Snyder所說ICT讓語言交際變得“available,accessible,andusable”,從而達到提升交際能力的目的。人對人的傳統(tǒng)交際方式,會讓學習者在使用目的語交際的過程中缺乏自信,容易產(chǎn)生緊張尷尬等負面情緒,而通過ICT實現(xiàn)的無論是異步交際還是同步交際都會相應地減緩目的語使用者的負面情緒。例如,通過電子郵件的交際屬于異步交際,教師應鼓勵學生在這種交際過程中注重意思的表達而不是形式的準確性,何況目前的拼寫和語法檢查軟件可以輔助學生進行形式上的檢查,所以學生可以無負擔地進行有效交際能力訓練。視頻會面作為同步交際的一種,無論從硬件、軟件需求還是交際基本原則都會比異步交際更為復雜一些。在交際前,教師需要制定一些基本交際原則,比如機會均等、相互尊重等。通過ICT實現(xiàn)交際能力的提升還有網(wǎng)絡論壇、在線聊天等多種形式,無論采用哪種具體形式,毫無疑問都會使EFL學習者的交際能力得到提升。
三、在我國EFL課堂應用ICT存在的阻礙
雖然ICT在EFL課堂上有眾多的應用優(yōu)勢,但根據(jù)我國目前的國情和教育現(xiàn)狀,要在EFL課堂上普及使用ICT仍然存在著一系列的阻礙,例如,教育政策、教育投資、ICT技術培訓和通過ICT進行教學反饋等。
(一)國家教育政策和教育投資
國家教育政策就是教育實踐者的指南針,要將ICT引入課堂不僅需要國家政策的支持,而且也需要大量的教育投資。從英國前二十年的經(jīng)驗不難發(fā)現(xiàn),在推廣ICT課堂應用的過程中,國家教育政策的支持尤為重要。Williams在1999年就將英國當時的教育政策總結為以促進ICT課堂應用為特點,通過加大對基礎設施、硬件、在職培訓、新入職培訓的投入來實現(xiàn)。在基本政策的指導下,一些細節(jié)也相繼制定,例如,英國的教師資格(QualifiedTeacherStatus,QTS)標準中就有規(guī)定直接與ICT相關。標準2.5指出獲得教師資格的教師必須知道如何有效使用ICT,不僅在教學方面,也包括個人的發(fā)展方面。這種強制性的政策規(guī)定確保了教師在任教前都具備了ICT技能。有了指南針,還必須有動力才能前行,而教育投資就是實現(xiàn)ICT應用的直接動力。英國2005年花費與ICT課堂應用建設的投資為7億英鎊。正是因為擁有這樣的教育政策和教育投入,英國的ICT課堂應用才得以發(fā)展迅速。我國的ICT課堂應用需要政府提供進一步的政策支持和投入,但由于我國的幅員遼闊和人口眾多這一現(xiàn)狀,鼓勵社會力量參與教學投資或許也是一種解決辦法。
(二)ICT技能培訓
將ICT引入課堂的前提是教師和學生都必須具備一定的ICT技能。教師在使用ICT時是否有自信心直接影響到他接受ICT的程度和使用ICT的頻度。ICT的應用是學生的學習更有自主能動性也就意味著學生會需要相應的ICT技能來實現(xiàn)自主學習。而我國目前的實際情況是教師和學生普遍缺乏ICT使用技能,這就需要教育政策制定者或教育領導者為教師和學生安排定期的、持久的ICT培訓。
(三)通過ICT進行學習檢測
ICT廣泛應用于課堂后,學習檢測的方式也會發(fā)生極大的改變。傳統(tǒng)的檢測方式是由老師通過課堂表現(xiàn)或考試來檢測學生的學習情況,而ICT引人課堂后,電腦輔助檢測就應運而生。這種檢測的優(yōu)點是可以提供即時反饋和詳細指導,但缺點是題型僅局限于選擇題或者填空題,而開放性問題并不適用。使用ICT進行學習檢測的信度和效度也都存有爭議。一方面,教師無法掌控學生的受檢測過程,例如,學生花費多少時間完成檢測。另一方面,學生ICT技能的差異性也會影響到他們的學習檢測結果。我國的教育一直是應試型教育,如果采用ICT對學生進行學習檢測,學生便會相應地調(diào)整學習習慣,在學習中更多地使用ICT。但是如果ICT僅僅停留在課堂應用的層面,與學習成績評價沒有相應銜接,學生長久以來形成的應試學習習慣就很難改變。雖然我國通過考試來選拔人才的模式備受爭議,但目前為止仍然沒有一個更好的替代模式產(chǎn)生,開始嘗試使用ICT進行學習檢測不妨為一種辦法。
四、結語
隨著時代的發(fā)展,在較大程度上完善了通訊方式,用戶要想獲得各類信息,可以隨時隨地的獲得,借助于信息網(wǎng)絡的生產(chǎn)方式和工作方式,可以促使信息化社會體系得到構建。如今電網(wǎng)系統(tǒng)擁有更強的競爭力,將語音、視頻和數(shù)據(jù)的應用給大部分融合了過來,促使電力企業(yè)員工統(tǒng)一服務的需求得到滿足,并且可以有效應用到先行網(wǎng)絡環(huán)境中。
(1)可以促使員工的工作效率得到有效提升
電力企業(yè)的規(guī)模在不斷擴大,電力企業(yè)要將為人民服務的原則給貫徹下去,通過電力通訊,來對員工更好的服務,并且促使員工的工作需求得到隨時隨地的滿足,以便更加快捷的開展工作,并且通過融合電力信息和電力通訊,將多樣化的服務提供給員工,促使員工的工作效率得到提升。
(2)多樣化的工作方式
通過融合網(wǎng)絡,我國現(xiàn)代化電子商務的需求和移動辦公需要能夠得到滿足,融合網(wǎng)絡數(shù)據(jù),可以應用企業(yè)信息通訊,員工可以更加靈活的工作,操作可以隨時隨地進行,并且將電腦以及手機等通訊工具應用過來,促使現(xiàn)代信息化操作功能得到實現(xiàn)。
2電力信息和通訊技術融合的技術環(huán)境分析
電力企業(yè)在網(wǎng)絡技術日趨成熟和廣泛應用的大環(huán)境下,將會越來越廣泛的用于因特網(wǎng)的信息化業(yè)務管理內(nèi)容。通過不斷引入新型技術,統(tǒng)一應用多種業(yè)務和技術,電網(wǎng)將會朝著這個方向發(fā)展。通過有效融合電力信息和電力通訊,同時將一些先進技術應用過來;具體來講,包括這些方面的內(nèi)容:
(1)融合核心網(wǎng)技術
借助于IP/MPLS技術,來對核心網(wǎng)絡進行構建,促使網(wǎng)絡的可靠性、拓展性以及低延時性得到提高,帶寬的利用率得到提升,同時,借助于先進的信息技術,以便更好地服務于員工。
(2)融合接入網(wǎng)技術
如今,接入網(wǎng)技術獲得了較快的發(fā)展,有著更加廣泛的應用范圍,但是還沒有完善全網(wǎng)寬帶化。通過有效融合電力信息和電力通訊,借助于一系列的通訊條件,如因特網(wǎng)和WLAN等,介入多元化的寬帶。就目前的情況來講,要想促使發(fā)展需求得到滿足,就需要充分重視光纖接入網(wǎng)和無源光網(wǎng)。
3電力信息和電力通信技術的融合策略
(1)對企業(yè)工作流程進行優(yōu)化,統(tǒng)一整合
在企業(yè)發(fā)展的過程中,需要對信息通信調(diào)度室進行統(tǒng)一構建,這樣調(diào)度人員就可以統(tǒng)一監(jiān)控調(diào)度信息通信,分開調(diào)度室和機房,以便連通通信和信息,對統(tǒng)一的通信信息調(diào)度運行平臺進行構建。借助于通信調(diào)度,信息工作許可就可以得到實現(xiàn),向通信調(diào)度反饋信息的監(jiān)控結果,這樣就可以對信息傳輸狀態(tài)及時了解。要想促使通信系統(tǒng)運行的統(tǒng)一調(diào)度、統(tǒng)一運行目的得到實現(xiàn),就需要對通信信息的運行、維護管理工作等進行強化,對信息監(jiān)控系統(tǒng)進行全方位的構建,對各個通信站的通信運作進行實時監(jiān)測,并且監(jiān)督反饋工作需要及時進行。
(2)將基礎技術作為技術融合的立足點
學生的學籍管理,是一項非常重要的工作,傳統(tǒng)的管理主要依靠人工,大量的紙質(zhì)檔案,管理起來,是一項非常繁瑣的工作。多媒體互聯(lián)網(wǎng)技術的快速發(fā)展,為高校實施信息化管理提供了技術支持。大多數(shù)高校都已經(jīng)建立了資金的信息化管理系統(tǒng),例如,教務管理系統(tǒng)、學生管理系統(tǒng)、科研管理系統(tǒng)、人事勞資管理系統(tǒng)等。這些管理系統(tǒng)的廣泛應用,極大地提高了辦公效率,方便了師生獲取相關信息。但是,校園內(nèi)絕大多數(shù)老師和學生白天基本都在教室、操場等教學場地,不能及時通過臺式計算機和有線網(wǎng)絡獲取網(wǎng)站上的相關學籍管理的信息,網(wǎng)站在傳遞此類消息的時候有滯后性。而且重要的、緊急的通知還不能夠及時有效地傳遞。
2微信公眾平臺的申請認證
2.1微信及微信公眾平臺簡介
騰訊公司,在2011年推出了一款可以進行及時通訊的微信軟件,通過微信,用戶可以在智能終端設備上實現(xiàn)及時通訊,傳輸內(nèi)容包括語音、視頻、文字和圖片等。該軟件的使用,僅需要耗費一定的網(wǎng)絡流量,由于微信相較與其他及時通訊工具的一些優(yōu)點,使得其使用數(shù)量增長很快,到2013年11月,騰訊公司的數(shù)據(jù)顯示,其有效注冊用戶量超過了6億,成為亞洲地區(qū)使用最廣泛的及時通訊工具。在此基礎之上,微信公眾平臺開始出現(xiàn),用戶可以通過使用微信公眾平臺,商品推介信息,創(chuàng)新營銷模式。在這個微信平臺上,可使用自媒體的方式進行營銷。如商家通過申請公眾微信服務號通過二次開發(fā)如對接微信會員云營銷系統(tǒng)展示商家微官網(wǎng)、微會員、微推送、微支付、微活動,微報名、微分享、微名片等,已經(jīng)形成了一種主流的線上線下微信互動營銷方式。
2.2微信公眾平臺注冊與推廣
帳號申請:可以登錄微信公眾平臺,進行注冊公眾微信賬號,在經(jīng)過后臺確認通過后,即成為公共帳號用戶。微信公眾平臺在申請使用時,其中文名稱沒有規(guī)則限制,可以重復進行申請使用,所以注冊的中文名稱可以是一樣的,如果覺得別人的更好,可以將自己的公眾賬號改成一樣的名字,或模仿其形式,完全是可以的。但是,具體的公眾微信號則是唯一的,在使用過程中,是不可以修改的。
2.3平臺類型介紹
到2013年8月5日為止,在經(jīng)過幾次升級之后,基本上形成了比較成熟的兩種類型。服務號:公眾平臺的一種帳號類型,旨在為用戶提供服務。服務號一個月內(nèi)僅可以發(fā)送四條群發(fā)消息。服務號發(fā)給用戶的消息,會顯示在用戶的聊天列表中。并且,在發(fā)送消息給用戶時,用戶將收到即時的消息提醒。訂閱號:是公眾平臺的一種帳號類型,為用戶提供信息和資訊。訂閱號每天可以發(fā)送一條群發(fā)消息。訂閱號發(fā)給用戶的消息,將會顯示在用戶的訂閱號文件夾中。在發(fā)送消息給用戶時,用戶不會收到即時消息提醒。在用戶的通訊錄中,訂閱號將被放入訂閱號文件夾中。但是兩種類型可以進行開發(fā),可以將訂閱號開發(fā)菜單,服務號直接使用菜單。服務號可以申請自定義菜單。使用QQ登錄的公眾號,可以升級為郵箱登錄,一個月可更換。使用郵箱登錄的公眾號,可以修改登錄郵箱。編輯圖文消息可選填作者。群發(fā)消息可以同步到騰訊微博。運營主體為組織,可在新注冊的時候選擇成為服務號或者訂閱號。之前注冊的公眾號,默認為訂閱號,可升級為服務號。
2.4方式
微信公眾平臺,主要是通過訂閱和的方式進行消息推送,用戶在使用過程中,可以通過添加公眾平臺或訂閱號進行。對于感興趣的內(nèi)容可以按照關鍵詞進行搜索。
2.5消息推送
一般的普通公眾帳號,基本上都可以群發(fā)文字、圖片、語音、視頻等類別的內(nèi)容,這個和個人普通微信賬號幾乎差不多,而通過認證的帳號,在使用過程中,其權限更高,所的內(nèi)容模式更加多樣,除了上述信息之外,還可以發(fā)送專題。在推送的打擾方面,用戶訂閱增加可能也會增加這方面的困擾。但是據(jù)筆者所知,下一版本的推送將全部取消聲音提醒,以便把私人信息和內(nèi)容消息區(qū)分。而最重要的,恐怕還是內(nèi)容和品牌的選擇問題———人們會喜歡少量而精致的資訊,而且隨時可以離開。
2.6添加關注
微信公眾平臺無法主動去添加好友,只能被他人添加為好友,通過認證的用戶可以在微信公眾平臺被搜索。在微信中點擊朋友們添加朋友掃描二維碼把需要關注用戶的二維碼圖案置于取景框內(nèi)添加關注的人。添加關注成為粉絲后,關注的用戶即可通過微信公眾平臺發(fā)送消息與您互動。個人也可以通過搜索微信號的方法,來添加關注公眾平臺。但是公眾賬號平臺不能搜索和添加任何人。此外,微信公眾平臺還進行了如下調(diào)整:增加高級功能選項,用戶可以在編輯模式和開發(fā)模式中選擇一個使用;設置選項里只保留賬號信息、公眾號手機助手2項,被添加消息自動回復、自定義規(guī)則回復2個重要功能選項被刪除。
3測試與應用
經(jīng)過在校園網(wǎng)和QQ群的廣泛宣傳,我們選擇在部分系進行了應用測試,告知學生具體使用流程和方法。經(jīng)過一個月的系統(tǒng)測試運行良好,得到了西安職業(yè)技術學院近半數(shù)在校生的關注,通過公眾平臺的學籍管理類通知消息的瀏覽量遠超傳統(tǒng)網(wǎng)站,在新生學籍注冊和在校生學年注冊,還有補考成績登錄期間,發(fā)揮了較大作用,有效地解決了校內(nèi)查詢終端不足的問題,達到了預期效果。
4結束語
Abstract:Constructingfinancialcrisispre-warningsystemisthenecessitytothedevelopmentofcapitalmarketinChina.Thispaperanalyzesthepossibilityofconstructingfinancialcrisispre-warningsystemofthelistedcompaniesfromthreeaspects,theory,economicsandtechnology,andworksoutthenewthoughtandbasicframeworkofconstructingfinancialcrisispre-warningsystemsoastopreventandresolvethefinancialcrisisofthelistedcompanies.
關鍵詞:上市公司財務危機預警系統(tǒng)
KeyWord:ListedcompanyFinancialcrisisPre-warningsystem
隨著經(jīng)濟一體化,經(jīng)營全球化的發(fā)展,企業(yè)的生存發(fā)展環(huán)境發(fā)生了很大變化,面臨著很大的風險性和復雜性。作為企業(yè)改革先鋒的上市公司,同樣存在著潛在的危機。一旦財務危機無法化解,就會被戴上“ST”的帽子,以失敗告終。為了有效化解財務危機,亟待建立適合我國上市公司的財務危機預警系統(tǒng)。
1財務危機預警系統(tǒng)
財務危機是企業(yè)喪失償還到期債務的能力。財務危機預警系統(tǒng)正是為化解上市公司財務危機而建立起來的一種機制,財務危機預警系統(tǒng)還沒有公認的定義,筆者在分析預警系統(tǒng)構成要素的基礎上,將其定義為:財務危機預警系統(tǒng)是企業(yè)專門組織根據(jù)財務管理學、風險管理和統(tǒng)計學的相關理論,以企業(yè)的財務報表、經(jīng)營計劃、相關經(jīng)營資料以及所收集的外部資料為依據(jù),采用定性和定量的分析方法,建立預警分析機制,將企業(yè)所面臨的經(jīng)營波動情況和危險情況預先告知企業(yè)經(jīng)營者和其他利益相關方,并分析企業(yè)發(fā)生經(jīng)營非正常波動或財務危機的原因,挖掘企業(yè)財務運營體系中所隱藏的問題,以督促企業(yè)管理部門提前采取防范或預防措施,為管理部門提供決策和風險控制依據(jù)的組織手段和分析系統(tǒng)。簡單的說,它是企業(yè)專門組織預警-報警-排警的有機管理過程體系。
2構建財務危機預警系統(tǒng)的重要性
從理論上看,上市公司財務危機預警系統(tǒng)的構建是我國企業(yè)管理與控制理論的豐富和發(fā)展。本文所構建的財務危機預警系統(tǒng)是基于我國上市公司相關理論和經(jīng)濟技術特點上的,為上市公司財務危機警兆的理論研究提供新思路,從而建立一套發(fā)現(xiàn)警兆-確認警情-排警對策(預警-報警-排警)的邏輯機理,為我國上市公司提供一種危機預警管理新模式,在預防和化解危機,提高企業(yè)危機預警管理水平方面發(fā)揮作用。
從實踐上看,對于上市公司來說,借助財務危機預警系統(tǒng),公司管理層能夠及時發(fā)現(xiàn)公司財務狀況的惡化,以及造成公司財務狀況惡化的原因,從而能夠及時地、有針對性的調(diào)整公司的經(jīng)營策略,扭轉(zhuǎn)公司經(jīng)營狀況惡化的勢頭,以避免淪為“ST”“PT”的行列。另外公司越早獲得危機信號,越可以減少其在會計、審計、律師等方面所支付的費用。同時,有利于證監(jiān)部門加強財務監(jiān)督管理,以提高上市公司的經(jīng)濟效益。
3構建財務危機預警系統(tǒng)的可行性
3.1理論依據(jù)
我國20世紀80年代初有了經(jīng)濟預警的概念,承認經(jīng)濟的波動性和周期性。企業(yè)預警理論主要包括危機管理理論、策略震撼理論、企業(yè)逆境管理理論以及企業(yè)診斷理論。這就為財務預警理論的發(fā)展和成熟提供了理論基礎。財務危機預警系統(tǒng)是基于上市公司財務運作的全過程,不斷成熟的財務管理學理論則成為其基礎;財務危機預警系統(tǒng)的預警分析是對大量原始信息和數(shù)據(jù)的處理,日益發(fā)展完善的信息傳遞理論和統(tǒng)計學為其提供了理論基礎;財務危機預警系統(tǒng)中的危機管理不僅是對危機全過程的監(jiān)測和控制,而且是對風險的處理,那么現(xiàn)代經(jīng)濟周期理論和風險管理理論則為其提供了依據(jù)。另外,證監(jiān)部門于2001年11月《虧損上市公司暫停上市和終止上市實施辦法(修訂)》,表明我國證券市場退市機制不斷健全和完善。證券市場的退市機制是實現(xiàn)上市公司優(yōu)勝劣汰的重要途徑,增強上市公司的風險防范意識,提高上市公司的質(zhì)量,引導證券市場朝良性方向發(fā)展。
3.2經(jīng)濟基礎
財務危機預警系統(tǒng)是在危機前建立的,這個時候上市公司的財務狀況良好,財力雄厚,完全可以滿足構建財務危機預警系統(tǒng)的所有資金需求。同時,財務危機預警系統(tǒng)建立起來以后,為公司解決財務危機提供了有效分析手段和控制對策,使上市公司不至于破產(chǎn),更甚是能及時發(fā)現(xiàn)風險,保證了公司經(jīng)濟效益的實現(xiàn),可以彌補構建財務危機預警系統(tǒng)的全部支出,實現(xiàn)風險收益,即危機管理支出小于危機管理所帶來的收益。
3.3技術支撐
上市公司的財務資料相對容易搜集,財務數(shù)據(jù)趨于規(guī)范財務預警系統(tǒng)以財務報表及其他相關的財務信息與非財務信息為依據(jù),在建立財務預警模型和進行預警分析時,要運用大量的財務資料。大部分上市公司已經(jīng)能夠按照市場經(jīng)濟的基本規(guī)則進入市場,完成了現(xiàn)代企業(yè)制度的建設,產(chǎn)權明晰,管理規(guī)范、科學,財務披露制度較為健全。同時,又處于公開的市場監(jiān)管之下,各種操作行為較為規(guī)范。同時,監(jiān)管部門監(jiān)管力度的加大,將進一步抑制會計造假者的造假動機,提高財務數(shù)據(jù)質(zhì)量,從而更加有利于財務預警系統(tǒng)的順利運行。
4構建財務危機預警系統(tǒng)的新思路
財務危機有潛伏、發(fā)作、惡化三個階段,在各個階段應該有相應的管理對策,這一系列的對策就構成了本文財務危機預警系統(tǒng)的基本框架。
財務危機的潛伏時期,上市公司處在一個多變的環(huán)境之中,公司的市場狀況、產(chǎn)品的升級換代速度、關聯(lián)企業(yè)的供貨和資金償付能力、競爭對手的價格政策變動、金融市場的波動、利率和外匯市場的變化、銀行信用和利率政策的改變等等,都會對企業(yè)的財務狀況、籌資能力、資金調(diào)度能力和償債能力等產(chǎn)生巨大的影響。為了及時準確的識別財務危機,就需要有一個專門組織對企業(yè)內(nèi)外的財務信息和數(shù)據(jù)進行全面收集和有效傳遞,為預警分析機制提供信息數(shù)據(jù)基礎,這就構成了財務危機預警系統(tǒng)的信息處理機制。
財務危機的發(fā)作時期,在證監(jiān)部門的財務監(jiān)督下,上市公司為保證經(jīng)濟效益的實現(xiàn),就必須對收集的內(nèi)外財務信息和數(shù)據(jù)進行分析,選擇能夠明顯反映公司財務狀況特征的指標體系,不僅要有財務指標,而且要引入非財務指標,如行業(yè)、企業(yè)規(guī)模、管理水平等,以全面反映公司財務狀況,然后用收集的數(shù)據(jù)和選定的指標,通過現(xiàn)代建模方法(如主成分法,人工神經(jīng)網(wǎng)絡方法)構建預警分析模型,以準確判斷財務危機是否已經(jīng)產(chǎn)生,將此分析結果及時反饋給企業(yè)管理者,便于其迅速采取對策。指標分析和模型分析構成了財務危機預警系統(tǒng)的預警分析機制。
財務危機的惡化時期,財務危機已經(jīng)存在,如果不能及時控制或有效化解,上市公司將面臨生死存亡的境地。為了化解危機,公司管理層就要立即啟動財務危機處理小組,迅速分析財務危機產(chǎn)生的原因,及時采取有效的管理措施,以恢復公司正常經(jīng)營。由于財務危機有突發(fā)性,要求公司管理層要有強烈的危機意識。
任何一項管理活動都離不開管理者,上市公司財務危機預警管理也不例外,要有一個專門組織為預警管理服務。構建了以財務危機發(fā)展階段為基礎的預警-報警-排警的財務危機預警過程機理,還需要有實施財務危機預警系統(tǒng)的組織機制,它包含了組織體系和組織過程。組織體系就是構建一個專門為危機預警管理服務的組織;組織過程則是在危機預警系統(tǒng)實施中的預警-報警-排警邏輯過程。
此財務危機預警系統(tǒng)是以專門組織為保證,依次執(zhí)行預警-報警-排警三項活動,與前面的研究相比,克服了將組織機制、信息處理機制、預警分析機制、危機管理機制并列的不足,使預警系統(tǒng)結構更為合理,為財務危機預警系統(tǒng)的實施提供了新思路。
參考文獻:
[1]EIAltman.CorporateFinancialDistressandBankruptcy[M].NewYork:Wiley,2000.
[2]StephenARoss.公司理財[M].北京:機械工業(yè)出版社,2000.
[3]張鳴,張艷,程濤.企業(yè)財務預警研究前沿[M].北京:中國財政經(jīng)濟出版社,2004.
[4]張友棠.財務預警系統(tǒng)管理研究[M].北京:中國人民大學出版社,2004.
[5]汪平.財務理論[M].北京:經(jīng)濟管理出版社,2003.
【關鍵詞】投稿平臺 在線投稿 PHP Mysql 編輯管理
1 引言
傳統(tǒng)的投稿方式有郵寄和電子郵件兩種。郵寄投稿方式時間長,反饋慢,并有可能郵寄失敗。E-mail投稿方式基于網(wǎng)絡環(huán)境下,利用現(xiàn)在網(wǎng)絡社會中提供的各種電子郵件服務投寄郵件。與傳統(tǒng)的郵寄方式相比,這種方式在時效性和安全性上都邁進了一大步,但同時也存在著許多不足之處,如作者本人郵箱容量的限制、編輯郵箱郵件承載量限制等。
論文投稿平臺的設計開發(fā),主要是為了能夠合理、高效率和更完善的處理論文投稿過程投遞錯誤、半路遺失和處理不及時等引發(fā)的問題。該平臺適用于各種類型編輯部門,其主要目標是實現(xiàn)作者的在線投稿、專家審核、論文、論文下載、論文管理和稿件狀態(tài)查詢等。
論文投稿平臺功能包含為作者提供在線投稿功能;為審稿專家提供在線審稿功能;為論文投稿平臺管理人員提供各類信息的添加、刪除、修改、統(tǒng)計和查詢等功能;和自動更新論文投稿平臺的一些常規(guī)信息,如有關論文投稿平臺的情況介紹以及近期稿件錄用情況。
2 總體設計
本平臺是針對論文在線投稿、在線審核、在線等相關內(nèi)容進行設計的,主要是展示網(wǎng)站最新的論文動態(tài),介紹論文在線投稿相關的步驟,專家對論文進行審核的主要流程以及讀者在線閱讀和下載的基本程序。另一方面,平臺具有讀者、作者、專家編輯登錄注冊功能。論文在線投稿平臺分為前臺和后臺兩部分。網(wǎng)站前臺展示了整個論文投稿簡介、最新、編委會以及編讀園地等一系列的相關信息,全面向網(wǎng)站用戶展示了平臺的特色。提供在線投稿功能,滿足了作者通過網(wǎng)絡在線投稿論文的需求。通過網(wǎng)絡對論文編輯流程的管理,大大提高了論文投稿的效率。網(wǎng)站后臺實現(xiàn)了各類型用戶信息的管理、對投稿論文進行管理以及用戶的留言信息等,有效的實現(xiàn)了平臺的主要功能。
文投稿平臺是一個利用PHP+Mysql數(shù)據(jù)庫相結合開發(fā)的應用程序,由前臺基本模塊和后臺管理組成,平臺功能模塊如下。
2.1 前臺展示區(qū)
主要內(nèi)容包括首頁、期刊簡介、編委會、投稿指南、編讀園地、刊文選讀、期刊訂閱、聯(lián)系我們、幫助、留言、在線投稿、稿件查詢等。2.2 后臺功能管理
主要功能是更新平臺的基本信息、管理前臺論文信息、最新通知和公告信息、注冊信息管理、在線投稿論文的管理、留言信息管理和系統(tǒng)信息管理等。
3 數(shù)據(jù)庫設計
分析網(wǎng)站功能模塊,論文投稿平臺需要使用數(shù)據(jù)庫來存儲投稿論文管理、用戶留言、讀者信息管理、作者信息管理、審核者信息管理、編輯者信息管理和管理員表。采用的數(shù)據(jù)庫是Mysql,該數(shù)據(jù)庫中定義如下數(shù)據(jù)表。
3.1 投稿論文表(表名:tg)
投稿論文表主要用于保存投稿論文基本信息,結構如表1所示。
3.2 作者信息表(表名:zz)
作者信息管理表主要用于保存作者基本信息內(nèi)容,該表結構如表2所示。
編輯者信息管理表主要用于保存編輯者基本信息內(nèi)容,該表結構如表3所示。
4 投稿平臺設計實現(xiàn)
論文投稿平臺的前臺主要是期刊的簡介、編委會功能職責、投稿指南、編輯園地、刊文選讀、期刊訂閱的介紹,并且具有在線投稿、在線審核和稿件查詢模塊等模塊。實時更新以及論文檢索頁突顯在網(wǎng)頁的前臺。前臺要求網(wǎng)站界面簡潔、盡量展示在線投稿的方便、實用和快捷,并且要求操作方面,便于用戶注冊登錄和瀏覽下載論文,故整個平臺的文件架構比較重要。
前臺頁面主要包括以下功能模塊:
網(wǎng)站導航:為瀏覽者提供清晰明了的瀏覽路線,也為各類用戶介紹了網(wǎng)站的基本功能。
(1)期刊簡介模塊:介紹論文期刊的基本格式、字數(shù)要求、論文類型等相關信息。
(2)編委會模塊:介紹編委會的主要成員以及各自的職責。
(3)投稿指南模塊:介紹在線投稿基本流程以及投稿須知。
(4)刊文選讀模塊:介紹各類型刊文、選讀技巧、提供選題方案。
(5)聯(lián)系我們模塊:為讀者、作者、審核者提供在線實時對話幫助。
(6)幫助模塊:為各類型用戶提供幫助。
(7)用戶登錄區(qū)模塊:讀者、作者、審稿專家、編輯者可以在此模塊進行注冊登錄。
(8)在線投稿模塊:作者可以通過此模塊進行在線投稿。
(9)稿件查詢模塊:讀者和作者可以通過此模塊對所要查詢的論文進行檢索。
(10)動態(tài)模塊:展示平臺最新更新論文、通知、公告以及最新錄用信息。
網(wǎng)站后臺主要使用PHP+Mysql數(shù)據(jù)庫實現(xiàn)前臺信息的添加、修改、刪除和查詢等功能,在論文中不做展開。
5 小結
文章在對在線投稿的研究和探索的基礎上,結合在線投稿具體流程的要求,設計開發(fā)出一個具有在線投稿和稿件的編輯處理功能的投稿平臺,該平臺目前已經(jīng)在少數(shù)幾個雜志社投入使用,平臺運行穩(wěn)定,取得了較好的經(jīng)濟效益和社會效益。但在平臺大規(guī)模推廣使用之前,應該再對平臺再進行改進,以使平臺能夠更加滿足在線投稿的需求。
參考文獻
[1]隋興芳,薛愛華.全面實行電子稿件管理系統(tǒng)處理稿件的體會[J].中國科技期刊研究,2012(16):25-30.
[2]陳翔.基于B/S的期刊稿件管理系統(tǒng)的設計和實現(xiàn)[J].杭州師范學院學報,2014(10):33-38.
[3]蘇波.基于web應用的性能測試研究[J].中國石油大學學報,2013(09):41-45.
[4]鄭阿奇,湯玫.PHP程序設計教程[M].北京:機械工業(yè)出版社,2014(07).
[5]汪曉軍,鐘平.PHP網(wǎng)絡開發(fā)技術(第二版)[M].北京:人民郵電出版社,2013(06).
本系統(tǒng)高壓發(fā)泡機以高性價比的臺達DVP系列PLC和臺達的DOP的人機界面為核心控制單元,有多組工作模式多組配方工藝參數(shù)選擇,且可自主編輯工藝參數(shù),流量注入精確穩(wěn)定,壓力流速可控可調(diào),故障報警實時監(jiān)控。實踐證明,相比老式發(fā)泡機,PLC控制系統(tǒng)的設備性能穩(wěn)定可靠,易于操作,工作效率大幅提高。發(fā)泡機控制系統(tǒng)充分利用了現(xiàn)代先進技術,提高了勞動生產(chǎn)率,改善了勞動條件,減輕了工人的勞動強度,保持穩(wěn)定的發(fā)泡倍數(shù),克服了人為的不穩(wěn)定因數(shù),具有良好的應用前景。
發(fā)泡機是利用塑料顆粒作為發(fā)泡包裝的原料,可以對精密儀器、電子類產(chǎn)品、工藝品、插花等多類怕震、怕壓的產(chǎn)品進行現(xiàn)場的發(fā)泡包裝。發(fā)泡機作為一種機電一體化產(chǎn)品,在現(xiàn)代工業(yè)生產(chǎn)的自動化控制中占有重要的地位。高壓發(fā)泡機廣泛用在各種行業(yè),可用于汽車裝飾、保溫墻噴涂、保溫管道制造、自行車和摩托車車座海綿的加工等等。
發(fā)泡機最早出現(xiàn)于國外,其原始機型是采用葉輪高速旋轉(zhuǎn)制泡,故又名“打泡機”。后來隨著技術的不斷進步,發(fā)泡機的技術含量不斷提高,新的機型不斷出現(xiàn),形成了不同的技術體系。我國早在20世紀50年代就開始使用發(fā)泡機,但不是專用的發(fā)泡機型,而是采用砂漿攪拌機。即將發(fā)泡劑直接加入砂漿攪拌機或混凝土攪拌機,讓發(fā)泡劑和砂漿或混凝土一起攪拌生成泡沫。20世紀70年代前后,開始出現(xiàn)專用的發(fā)泡劑,即高速葉輪發(fā)泡機。以后又不斷技術升級和換代,如今已發(fā)展為以高壓充氣為主體的第三代機型,基本可滿足泡沫混凝土的需要擠出技術的發(fā)展越來越具有如下特色:一方面要求擠出系統(tǒng)高效率,另方面又要求擠出系統(tǒng)具有靈活性、廣泛適應性。應用廣泛的高效擠出系統(tǒng)應兼頤這兩個方面。其中發(fā)泡機控制系統(tǒng)將直接影響該產(chǎn)品的發(fā)泡倍數(shù)的穩(wěn)定。發(fā)泡機控制系統(tǒng)的發(fā)泡倍數(shù)受原料添加重量和發(fā)泡好后粒子的總量決定,蒸汽壓力和氣壓不直接影響發(fā)泡倍數(shù)。因此,為這類發(fā)泡機開發(fā)出一種可以保持穩(wěn)定的發(fā)泡倍數(shù)的控制系統(tǒng)是一個有著較大實際意義的課題。
[關鍵詞]學術論文 復制檢測 抄襲剽竊檢測 統(tǒng)計語言模型 文本相似度算法
[分類號]TP391.1
自從方舟子的“新語絲”使原本長期存在于學術界的學術不端暴露出來之后,學術論文抄襲剽竊引起社會的廣泛關注。抄襲剽竊的表現(xiàn)形式多種多樣:有些只是在語言文字的表達形式上做手腳,換成同義詞或顛倒語句的表達順序,在文章框架、主要觀點和主要論據(jù)上卻沒有大的變化;有些直接大段地“引用”別人的內(nèi)容;有些綜合運用多種手段,將多篇別人的文章拼湊而成自己的;有些“學術高手”直接拿國外的論文翻譯成中文發(fā)表,等等。抄襲和剽竊“手段”的越來越“高明”,給抄襲剽竊檢測帶來很大困難。抄襲檢測又叫復制檢測、剽竊檢測或副本檢測,根據(jù)檢測對象性質(zhì)不同可分為圖像、聲音和文本復制檢測。學術論文抄襲檢測是文本復制檢測的一種,歸根到底是判斷兩篇學術論文的相似程度?!罢倩芈省焙汀熬珳事省笔桥袛鄼z測算法好壞的兩個重要指標。為了進一步提高學術論文復制檢測判斷的準確率,針對學術論文的文檔相似度算法的改進和創(chuàng)新研究變得尤為重要。
1 國內(nèi)外研究現(xiàn)狀及存在的問題
1.1 國外研究現(xiàn)狀
國外具有代表性的文檔相似度算法主要有以下幾種:①Manber提出一個sif工具,其“近似指紋”是用基于字符串匹配的方法來度量文件之間的相似性;②Brin等在“數(shù)字圖書館”工程中首次提出文本復制檢測機制COPS(copy protection system)系統(tǒng)與相應算法,奠定了論文抄襲檢測系統(tǒng)的基礎;③Garcia-Molin提出SCAM(Stanford copy analysis method)原型,改進了COPS系統(tǒng),用于發(fā)現(xiàn)知識產(chǎn)權沖突。他使用基于詞頻統(tǒng)計的方法來度量文本相似性,后來把檢測范圍從單個注冊數(shù)據(jù)庫擴展到分布式數(shù)據(jù)庫上以及在Web上探測文本復制的方法;④貝爾實驗室的Heintze開發(fā)了KOALA系統(tǒng)用于剽竊檢測,采用與sif基本相同的算法;⑤si和Leong等人建立的CHEC系統(tǒng)首次把文檔結構信息引入到文本相似性度量中;⑥Stein提出一種方法,這種方法能產(chǎn)生一種“指紋”,在某種程度上能有效防止修改;⑦MeyerzuEissen等提出通過根據(jù)寫作風格上的變化來分析單篇文檔,從而決定是否有潛在抄襲;⑧美國學校首先引入Tumitin偵探剽竊數(shù)據(jù)庫,用于防止論文抄襲,此外還有其他類似軟件系統(tǒng)用于進行文檔相似度分析。當然不同的檢測系統(tǒng)其相似度算法的精度也不盡相同。
1.2 國內(nèi)研究現(xiàn)狀
國內(nèi)關于論文抄襲剽竊檢測方面已有一些研究:①張斯通過對中文文本進行自動分詞,然后計算它們的相似度,從而判別文本是否抄襲,其對應裝置包括:樣本輸入裝置、樣本數(shù)據(jù)庫、自動分句分詞裝置、分詞數(shù)據(jù)庫、預處理裝置、特征詞數(shù)據(jù)庫、相似判別裝置、判別結果輸出裝置和控制處理裝置等。②鮑軍鵬通過文本的結構信息和語義信息提取文本特征,是通過運用文本剽竊判定模塊中設定的探針法,估計待檢測文本特征和特征庫中的文本特征的最大共同語義,并給出文本雷同度量,從而判別文本是否抄襲。③沈陽是通過先找到存儲空間內(nèi)的格式遺留,再將這些遺留格式附近文檔的關鍵詞或/和句子或/和段落與文獻庫中的文獻內(nèi)容進行比較,從而減少被檢測文檔的數(shù)據(jù)量,加快了反剽竊或轉(zhuǎn)載文檔檢測速度。④張履平通過對已植入水印的文章進行特征擷取,根據(jù)所取得的詞匯輸入搜尋引擎以搜尋相關可疑文章;根據(jù)與原文比對結果取得的句子進行水印解析;將所取得的水印信息與原來的水印比對,從而判斷是否為剽竊。⑤金博等則對基于篇章結構相似度的復制檢測算法有一些研究。
1.3 存在的問題
事實上,由于剽竊形式的多樣性和隱蔽性、語法和句法的復雜性等,目前主要采用的“數(shù)字指紋”和詞頻統(tǒng)計兩大類抄襲識別技術已經(jīng)不能滿足實際的剽竊檢測需求,會造成很多漏檢和誤檢,其“召回率”和“精準率”都有待提高。歸根到底是因為其檢索模型有待突破,算法亟待改進或需創(chuàng)造全新的算法來針對學術論文抄襲剽竊檢測的實際。如何把握并充分利用學術論文的結構和語言特征,提供具有針對性的檢索模型和相似度算法及其實現(xiàn)系統(tǒng),對能否在異構的分布式學術論文資源系統(tǒng)中,對抄襲剽竊檢測進行更精確的判斷至關重要。
2 學術論文復制檢測研究的新思路
針對以上問題,筆者提出以下學術論文復制檢測研究的新思路:①建立有針對性的學術論文語料庫;②通過對語料庫的深層加工、統(tǒng)計和學習,建立統(tǒng)計語言模型;③充分利用學術論文著錄項目自身的特點,通過將文檔結構化,賦予元數(shù)據(jù)項加權系數(shù),運用卷積計算學術論文的相似度;④利用支持網(wǎng)絡語言的JAVA編程實現(xiàn)相似度算法;⑤通過將待檢測論文與數(shù)據(jù)庫中已有文獻對比,計算其相似度,當相似度超過某一閾值時,則判斷該論文有抄襲的可能,如圖1所示:
3 具體方法及步驟
3.1 建立某一學科專業(yè)的學術論文語料庫
新一代的兆億級的大規(guī)模語料庫可以作為語言模型的訓練和測試手段,用以評價一個語言模型的質(zhì)量。本文建立的語料庫中存放的是在學術論文語言的實際使用中真實出現(xiàn)過的學術論文語言材料;是以電子計算機為載體,承載學術資源語言知識的基礎資源;通過對真實語料進行分析和處理等加工,使之成為本文的學術論文抄襲檢測模型和算法的訓練與測試手段。
利用豐富的學術資源數(shù)據(jù)庫,如Dialog、SCI、EI、INSPE、IEEE、Science Direct、EBSCO、PQDD、SPRINGERLINK、KLUWER、Science online、Medline、CNKI、中文科技期刊全文數(shù)據(jù)庫、萬方數(shù)據(jù)科技信息子系統(tǒng)、萬方數(shù)據(jù)商業(yè)信息子系統(tǒng)、七國兩組織的專利數(shù)據(jù)庫、國內(nèi)外專利數(shù)據(jù)庫等異構的分布資源,通過信息檢索,從某一學科專業(yè)著手,構建某一學科專業(yè)領域的學術論文語料庫。
3.2 以信息論為工具,創(chuàng)建統(tǒng)計語言模型用于學術論文檢索
數(shù)學是解決信息檢索和自然語言處理的最好工具。其實早在幾十年前,數(shù)學家兼信息論專家香農(nóng)(Claude Shannon)就提出了用數(shù)學方法處理自然語言的想法。語音和語言處理大師賈里尼克(Fred Je-
linek)首先成功利用數(shù)學方法解決了自然語言處理問題。統(tǒng)計語言模型(即基于統(tǒng)計的語言模型)通常是概率模型,計算機借助于統(tǒng)計語言模型的概率參數(shù),可以估計出自然語言中每個句子出現(xiàn)的可能性,而不是簡單地判斷該句子是否符合文法。統(tǒng)計語言模型以概率頒布的形式描述了任意語句(字符串)s屬于某種語言集合的可能性,需要對任意的語句s都給出一個概率值,例如:P(他/認真/學習)=0.02。本文充分利用學術論文不同于報紙新聞論文或其他類型文檔的語言特點,以建立的學術論文語料為訓練和測試基礎,提出新的基于學術論文的統(tǒng)計語言模型作為針對學術論文抄襲剽竊檢測算法的檢索語言模型。具體做法為:以信息論為工具,把握學術論文的語言特點,通過對以上所建立的學科專業(yè)語料庫進行深層加工、統(tǒng)計和學習,獲取大規(guī)模真實學術論文語料中的語言知識,建立基于學術論文語料庫的統(tǒng)計語言模型;通過實驗,與其他文本信息檢索模型進行比較,論證其有效性。
3.3 利用學術論文中描述資源對象語義信息的元數(shù)據(jù)結構,計算文檔相似度
充分利用正式出版的學術論文的結構特點,根據(jù)學術論文中標引出的K個描述資源對象語義信息的元數(shù)據(jù)(Di,i=1,2…k),將學術論文結構化;然后利用已有的基于學術論文語料庫的統(tǒng)計語言模型,將待比較的論文的各相同元數(shù)據(jù)Di(i=1,2…k)部分進行比對得相似度si,再根據(jù)元數(shù)據(jù)對論文的重要程度給定第i個元數(shù)據(jù)項相似度權函數(shù)wi;則整篇學術論文總體的相似度為Sd=∑Wi*Si。
具體算法舉例如下:
將待檢測的學術論文的元數(shù)據(jù)如題名Til、關鍵詞Kyl、摘要Abl、正文.Tel、參考文獻Rel等元數(shù)據(jù)字段抽取出來,與語料庫中已有論文的相應元數(shù)據(jù)字段內(nèi)容題名Ti2、關鍵詞Ky2、摘要Ab2、正文Tx2、參考文獻Re2進行相似度計算。計算時,在篇名字段前給以0.25,0.4,0.15,0.1和0.1的加權系數(shù)。建立的統(tǒng)計語言模型計算待測論文和語料庫中已出版的論文j同一元數(shù)據(jù)字段的內(nèi)容相似程度,記為:Sim_Tij,sim―Kyj,Sim_Abj,Sire Tej,Sim_Rej,卷積后得整篇論文與語料庫中某篇論文j的相似程度值計算公式為:Sinai―larity_paper_j=0.25×Sim_Tij+0.4×Sim_Kyj+0.15×Sim_Abj+0.1×Sim_Txj+0.1×Sim_Rej;再計算與待檢測論文最相似的那個最大相似度Max_Similarity=Max{Simflarity_paper_j};如果Max_Similarity大于設定的閥值1(如40%),則判斷為疑似抄襲,這樣的論文需要審稿專家仔細認真審理,如果Max_Similarity大于設定的閥值2(比設定的閥值1大,如80%),這樣的論文極有可能存在抄襲,需要審稿專家特別注意。在計算相似度值后,計算機系統(tǒng)記錄下相似度高于設定閥值的抄襲和被抄襲的學術論文來源、相似度值、及其各元數(shù)據(jù)項信息(包括作者信息)。以上各元數(shù)據(jù)項相似度計算過程中,加權系數(shù)可以根據(jù)需要做適當調(diào)整為其他數(shù)值,但系數(shù)總和為1。
3.4 推廣使用
通過對某一學科專業(yè)的研究,進一步拓展到其他學科領域,從而最終實現(xiàn)在異構的分布式學術論文資源系統(tǒng)中,對各個學科領域的學術論文抄襲剽竊進行跨平臺檢測。
4 研究展望及難點、解決辦法
《統(tǒng)計自然語言處理》是宗成慶研究員在為中國科學院研究生院講授“自然語言理解”課程時使用的講義的基礎上編寫完成的,歷時三年多。該書全面系統(tǒng)地介紹了自然語言處理的基本概念、理論方法和最新進展,尤其是近年來國際流行的基于統(tǒng)計機器學習的自然語言處理方法,對近年來國內(nèi)外一些經(jīng)典的論文,包括國際計算語言學年會(ACL)的最佳論文,給予了詳細介紹。作者在該書中充分利用已取得的實驗結果闡釋統(tǒng)計方法的基本理念,并給出了自己的理解和評述,提倡多種方法兼收并蓄。對很多專著中已有詳細闡述的經(jīng)典算法,該書沒有多述,只是簡單地提及或給出參考文獻,避免了與其他專著在內(nèi)容上過多地重復。
全書內(nèi)容包括15章:第1章為緒論,介紹自然語言處理的基本概念、研究內(nèi)容、面臨的困難和研究現(xiàn)狀;第2章簡要介紹自然語言處理中常用的基礎知識,包括概率論、信息論、支持向量機等基本內(nèi)容;第3章介紹形式語言與自動機理論及其在自然語言處理中的應用;第4章介紹語料庫技術、詞匯知識庫概念和語言知識庫建設中的本體論;第5章介紹語言模型的基本概念、性能評價方法、數(shù)據(jù)平滑方法和模型自適應方法;第6章介紹隱馬爾可夫模型的基本概念、構成和相關算法;第7章介紹漢語自動分詞中的基本問題、基本方法、命名實體識別與詞性標注方法等;第8章介紹句法分析的基本概念、算法及評測方法等;第9章介紹詞義消歧的基本概念、策略和評測方法;第10章全面詳細地介紹機器翻譯的基本概念、統(tǒng)計機器翻譯模型和系統(tǒng)實現(xiàn)方法;第11章概述語音翻譯的基本概念、技術現(xiàn)狀和相關的國際學術組織;第12章至15章分別簡要介紹文本自動分類、信息檢索與問答系統(tǒng)、自動文摘和信息抽取、口語分析與人機對話系統(tǒng)等相關技術的基本方法和研究現(xiàn)狀。
在該書編寫過程中,從事自然語言處理研究的31位國內(nèi)外專家和10多位在讀博士生或碩士生校對了全書的內(nèi)容。全書引用參考文獻816篇。
Abstract: By an overall analysis and research on data mining technique, according to the different function and task and the influence of perspective on sorting method, emphasizing particularly on the form of results which is made by data mining technique, and overcoming the limitation and illegibility of canonical sorting method, then finally a kind of sorting method and approach is present. The effective distinction of this method makes it more feasible and convenient, and it offers guidance for applying proper data mining method to discover knowledge in a right way.
關鍵詞:數(shù)據(jù)挖掘;方法;分類
Key words: data mining; method; sort
中圖分類號:TP392文獻標識碼:A文章編號:1006-4311(2010)26-0146-02
0引言
數(shù)據(jù)挖掘是一門多學科交叉的綜合性學科[1],其方法也融合了各學科方法的思想,主要是由人工智能、機器學習的方法發(fā)展而來,并與傳統(tǒng)的統(tǒng)計分析方法、模糊數(shù)學方法結合而形成的,如圖1所示。正因為如此,對它進行合理的分類十分重要,但同時卻也不太容易。這里將它分為:信息論方法、集合論方法、神經(jīng)網(wǎng)絡方法、遺傳算法、公式發(fā)現(xiàn)。
1信息論方法
信息論方法是利用信息論的原理建立決策樹。由于該方法最后獲得的知識表示形式是決策樹,又稱它為決策樹方法。典型的信息論方法有兩類。
1.1 ID3等方法ID3(Iterative Dichotomiser 3)[2]方法由J.R.Quinlan首創(chuàng),其前身是CLS(Concept Learning System)。ID3方法檢驗所有的特征,選擇信息增益(互信息)最大的特征點產(chǎn)生決策樹結點,由該特征的不同取值建立分支,對各分支的實例子集遞歸,用該方法建立決策樹節(jié)點和分支,直到某一子集中的例子屬同一類。這種方法對愈大的數(shù)據(jù)庫效果愈好。ID3方法在國際上影響很大,ID3方法以后又陸續(xù)開發(fā)了ID4、ID5、C4.5等。
1.2 IBLE方法IBLE(Information-based Learning from Examples)[3]方法是利用信息論中信道容量的概念作為對實體中選擇重要特征的度量。尋找數(shù)據(jù)庫中信息量從大到小的多個字段的取僅建立決策樹的一個結點,根據(jù)該結點中指定字段取值的權值之和與兩閾值的比較,建立左、中、有三個分枝,在各分枝子集中重復建樹結點和分枝的過程。IBLE方法比ID3方法在識別率上提高了10%。
2集合論方法
集合論方法是開展較早的方法。近年來,由于粗糙集理論的發(fā)展使集合論方法得到了迅速的發(fā)展。這類方法中包括:覆蓋正例排斥反例方法、概念樹方法和粗糙集(rough set)方法。關聯(lián)規(guī)則挖掘也屬于集合論方法。
2.1 覆蓋正例排斥反例方法覆蓋正例排斥反例方法是從已知的正例和反例中歸納出能夠描述正例而排斥反例的一般規(guī)則,它在機器學習中稱為示例學習(也稱為通過例子學習)。在學習的過程中,它既需要正例集又需要反例集,數(shù)據(jù)庫中的元組集合可以被視為示例集合。當要發(fā)現(xiàn)某一類而排斥其余類的一般規(guī)則時,可以將某一類元組作為正例集,其余類所有的元組作為反例集,這樣依次指定正例集和反例集便可以發(fā)現(xiàn)描述知識基表中某一類元組而排斥其余類的一般規(guī)則,即分類規(guī)則。比較典型的有AQ[4]算法及其改進算法,洪家榮的AE5方法[5]。
2.2 概念樹方法在數(shù)據(jù)庫中,許多屬性都是可以進行數(shù)據(jù)歸類的,以形成概念匯聚點,各屬性值和概念依據(jù)抽象程度不向可以構成一個層次結構,概念的這種層次結構通常稱為概念樹。概念樹一般由領域?qū)<姨峁?概念樹與數(shù)據(jù)庫定的屬性有關,它將各個層次的概念按一般到特殊的順序排列。基于概念樹的知識發(fā)現(xiàn)方法其實是一個幾組合并的處理過程,用這種方法從數(shù)據(jù)庫中發(fā)現(xiàn)規(guī)則知識的核心是執(zhí)行基本的和面向各屬性的歸納。其基本思想是:①一個同性的較具體的值被該屬性的概念樹中的父概念所替代。②對知識基表中出現(xiàn)的相同元組進行合并,構成更宏觀的元組,并計算宏元組所覆蓋的元組數(shù)目,如果數(shù)據(jù)庫記錄生成的宏元組數(shù)目仍然很大,那將用這個屬性的概念樹中更一般的父概念去替代或者根據(jù)另一個屬性進行概念樹的提升操作。③生成覆蓋面更廣、數(shù)量更少的宏元組,并歸納所得的最后結果轉(zhuǎn)換成邏輯規(guī)則。
2.3 粗糙集方法粗糙集理論中的一些概念和方法可以用來從數(shù)據(jù)庫中發(fā)現(xiàn)分類規(guī)則,其基本思想是將數(shù)據(jù)庫中行元素視為元組,列元素視為屬性(條件屬性和決策屬性)。等價關系R定義為不同元組在某個(或幾個)屬性上取值相同,這些滿足等價關系的元組組成的集合稱為該等價關系R的等價類。條件屬性上的等價類E與決策屬性上的等價類Y之間有3種情況[6]:①下近似:Y包含E。②上近似:Y和E的交為非空。③無關:Y和E的交為空。對下近似建立確定性規(guī)則,對上近似建立不確定性規(guī)則,無關情況不存在規(guī)則。
2.4 關聯(lián)規(guī)則挖掘關聯(lián)規(guī)則挖掘是在事務數(shù)據(jù)庫中,挖掘出不同項集的關聯(lián)關系。關聯(lián)規(guī)則挖掘在事務數(shù)據(jù)庫D中尋找那些不同項集(如A和B兩個商品)同時出現(xiàn)的概率(即P(A∪B))大于最小支持度(min_sup),且在包含一個項集(如A)的所在事務中,同時也包含月一個項集(如B)的條件概率(即P(B|A))大于最小置信度(min_conf)時。則存在關聯(lián)規(guī)則(即A=>B)。
3神經(jīng)網(wǎng)絡方法
神經(jīng)網(wǎng)絡是由大量的處理單元(神經(jīng)元)互相連接而成的網(wǎng)絡[7]。它是仿生學的一大成果,最早由生物學家McCulloch和數(shù)理學家Pitts提出[8]。神經(jīng)網(wǎng)絡的主要部分是神經(jīng)元(如圖2),它具有以下生物特征:是一個多輸入、單輸出的元件;是具有非線性的元件;具有可塑性,傳遞強度可變的特征;其輸出是每個輸入綜合的結果。
在神經(jīng)網(wǎng)絡中,知識與信息的存儲表現(xiàn)為神經(jīng)元之間分布式的物理聯(lián)系。它分散地表示和存儲于整個網(wǎng)絡內(nèi)的各神經(jīng)元及其連線上。每個神經(jīng)元及其連線只表示一部分信息,而不是一個完整具體概念。只有通過各神經(jīng)元的分布式綜合效果才能表達出特定的概念和知識。由于人工神經(jīng)網(wǎng)絡中神經(jīng)元個數(shù)眾多以及整個網(wǎng)絡存儲信息容量的巨大,使得它具有很強的不確定性信息處理能力。即使輸入的信息不完全、不準確或模糊不清,神經(jīng)網(wǎng)絡仍然能夠通過聯(lián)想思維,展示存在于記憶中事物的完整圖像。只要輸入的模式接近于訓練樣本,系統(tǒng)就能給出正確的推理結論。同時神經(jīng)元的處理輸出不是隨意的,只有當神經(jīng)元對所有的輸入信息的綜合處理結果超過某一閾值后才輸出一個新的信息。
神經(jīng)網(wǎng)絡方法,以MP模型和Hebb學習規(guī)則為基礎,建立了三大類多種神經(jīng)網(wǎng)絡模型,即:前饋式網(wǎng)絡,以感知機、BP反向傳播模型和函數(shù)型網(wǎng)絡為代表,此類網(wǎng)絡可用于預測、模式識別等方面;反饋式網(wǎng)絡,Hopfield的離散模型和連續(xù)模型為代表,分別用于聯(lián)想記憶和優(yōu)化計算;自組織網(wǎng)絡,ART模型、Kohonen模型為代表,用于聚類。
4遺傳算法
遺傳算法將問題的求解的過程看成一個在候選解空間尋找滿足問題要求的解或最優(yōu)近似解的搜索過程,其重點在適應規(guī)劃和適應度量方面。遺傳算法的適應規(guī)劃用于指導算法怎么樣在空間進行搜索,一般采用遺傳算子(或稱遺傳操作)諸如交叉和變異等,以及模擬自然過程的選擇機制,而適應度量采用計算適應值的方法來評估一個候選解的優(yōu)劣。
典型遺傳算法求解問題的過程如圖3所示。
①首先生成一組初始的候選解群體(假設為M個候選解個體),稱為第0代;②計算群體中各個候選解的適應值;③如果有候選解滿足算法終止條件,算法終止,否則繼續(xù);④根據(jù)概率,將候選解群體中的個體隨機兩兩配對,進行操作以生成新的候選解;⑤根據(jù)變異概率,對步驟④中生成的候選解群中的每個個體進行變異操作;⑥使用選擇機制形成新一代候選解,轉(zhuǎn)②。
從上面的算法可以看出,遺傳算法的3個重要步驟為選擇、交叉和變異。①選擇(繁殖):從一個舊種群(父代)選擇出生命力強的個體產(chǎn)生新種群(后代)的過程。②交叉(重組):選擇兩個不同個體(染色體)的部分(基因)進行交換,形成新個體。③變異(突變):對某些個體的某些基因進行變異(1變0,0變1)。
這種遺傳算法起到產(chǎn)生優(yōu)良后代的作用。這些后代需要滿足適應值,經(jīng)過若干代的遺傳.將得到滿足要求的歷代(問題的解)。遺傳算法已在優(yōu)化計算和分類機器學習方面發(fā)揮了顯著的效果。
5統(tǒng)計分析方法
數(shù)據(jù)挖掘思想和統(tǒng)計學緊密相連,有著一個類似的目標,即發(fā)現(xiàn)數(shù)據(jù)中的結構。目前采用的很多數(shù)據(jù)挖掘方法是根據(jù)統(tǒng)計學的分析方法發(fā)展出來的,需要用到例如隨機變量、樣本、假設檢驗、回歸等一系列統(tǒng)計學概念和原理。把這類數(shù)據(jù)挖掘方法歸稱為統(tǒng)計分析方法,統(tǒng)計分析方法主要有以下幾種。
5.1 常用統(tǒng)計用樣本數(shù)據(jù)集中的頻次、頻率描述樣本數(shù)據(jù)結構的基本特征;用莖葉圖與直方圖對刻度級樣本數(shù)據(jù)作描述;用樣本眾數(shù)、中位數(shù)、均值對數(shù)據(jù)中心作描述;用極值、四分點與百分位點對樣本數(shù)據(jù)離散特征作點狀描述;用極差、四分位距與離差對樣本數(shù)據(jù)離散特征作區(qū)間描述;用樣本方差對離散狀的統(tǒng)計值描述以及用箱形圖對樣本數(shù)據(jù)特征作綜合表述等。
5.2 各種回歸技術回歸又包括線性回歸和非線性回歸。
5.2.1 線性回歸線性回歸是最簡單的回歸形式。雙變量回歸是將一個隨機變量y(稱作響應變量)看作另一個隨機變量x(稱為預測變量)的線性函數(shù)。
5.2.2 非線性回歸即變量間的關系是曲線性式(即非線性的)的關系。非線性回歸主要存在以下七種模型:雙曲線模型,二次曲線模型,對數(shù)模型,三角函數(shù)模型,指數(shù)模型,冪函數(shù)模型,修正指數(shù)增長曲線。
6結語
數(shù)據(jù)挖掘技術因在海量數(shù)據(jù)的知識發(fā)掘方面發(fā)揮著巨大的作用而被越來越多的應用到實際當中。選擇合適的數(shù)據(jù)挖掘方法,則是能否成功得以應用并取得高效結果的關鍵步驟。因此,數(shù)據(jù)挖掘技術的方法分類是先決條件,分類的好壞決定了應用的成敗。
參考文獻:
[1]Jiawei Han, Micheline Kamber著.范明.孟小峰譯.數(shù)據(jù)挖掘概念與技術[M].機械工業(yè)出版社,2007.
[2]Quinlan. J. R. Induction of Decision Tree[J].Machine Learining,1986(1):81-106.
[3]陳文偉,黃金才,趙新昱等.數(shù)據(jù)挖掘技術[M].北京工業(yè)大學出版社,2002.
[4]R. S. Michalski, I. Mozetic, J. Hong. The multi purpose incremental learning system AQ15 and its testing application to three medical domains. In. Proc AAAI,USA,1986,1041~1045.
[5]洪家榮.示例學習及多功能學習系統(tǒng)AE5[J].計算機學報,1989,12(2):98~105.
[6]晏偉峰.基于Rough Set的屬性約減算法研究[D].華中科技大學碩士學位論文,2006.