前言:想要寫出一篇引人入勝的文章?我們特意為您整理了中文科技期刊語義出版態勢淺析范文,希望能給你帶來靈感和參考,敬請閱讀。
[摘要]為促進中文科技期刊語義出版的發展,探討其可行性發展路徑,以文獻分析、綜合調查、態勢分析等方法研究語義技術應用于中國科技期刊的發展機遇、優勢、外部威脅和劣勢。在國家政策層面、技術層面、社會需求層面,語義出版應用于中文科技期刊均具有良好的發展機遇。語義技術的應用可實現中文科技期刊信息平臺的智能化,提升其受眾黏性,保障中文科技期刊質量控制,但也存在語義出版意識欠缺,語義出版技術人才匱乏等內部劣勢,并且政府引導與資助有限,專業化期刊集群平臺建設緩慢,存在一定的市場推廣阻力。可以通過拓展投融資渠道,建立刊企合作研發與發展模式,支持科技期刊專業化集群,建立優勝劣汰的退出機制,加快相關技術人才培養,制訂戰略性人才管理機制等措施來應對語義技術應用于科技期刊的劣勢與風險。
[關鍵詞]語義出版;中文科技期刊;態勢
1語義技術應用于中文科技期刊的發展機遇
1.1國家政策層面
近年來,國家先后出臺了一些政策,積極支持數字出版產業的發展,推進出版融合。語義出版作為數字出版的高級形態,也越來越受到關注。2011年,《新聞出版業“十二五”時期發展規劃》,在推動“十二五”時期新聞出版業發展的主要措施中將語義分析技術作為重點支持研發的內容之一。2012年,新聞出版總署了《關于加快我國數字出版產業發展的若干意見》,積極鼓勵研發數字出版核心技術,鼓勵出版方式的多樣化,推動出版傳播技術升級換代。2018年11月,中央審議通過《關于深化改革培育世界一流科技期刊的意見》,并于2019年8月印發,其中將抓住數字化、智能化促進期刊變革的機遇,“建設科技期刊論文大數據中心”作為一項重要任務。國家也設立了專項資金資助新聞出版業的數字化轉型升級,如在《關于開展2014年度文化產業發展專項資金新聞出版業數字化轉型升級項目申報工作的說明》中指出“支持部分專業出版企業按服務領域劃分、聯合開展專業數字內容資源知識服務模式探索。包括:開展知識挖掘、語義分析等知識服務領域關鍵技術的應用。”2017年9月,國家新聞出版廣電總局的《新聞出版廣播影視“十三五”發展規劃》中提出,“推動設立國家出版融合發展投資引導資金,帶動社會資本積極參加傳統出版與新興出版融合發展?!辈⒃O立出版融合發展課題研究專項資金和出版融合發展項目引導資金。這些政策為我國科技期刊的語義出版提供了強有力的支持,為語義出版指明了發展方向和實施路徑?!笆濉逼陂g,各地推動文化產業轉型升級,建立了很多數字出版基地或園區,其中國家級數字出版基地14個,極大地提高了數字出版產業的發展速度[6]。2016年,國家新聞出版廣電總局出臺《關于加快新聞出版業實驗室建設的指導意見》,確定了20家出版融合發展重點實驗室[7]。數字出版基地與出版融合發展實驗室的建立為科技與出版的深度融合中瓶頸問題的解決提供了有力支撐,為語義出版提供了良好的發展空間。
1.2技術層面
隨著相關技術的迅速發展,語義出版的內容越來越豐富,為“無縫交流”創造了可能。一些基于語義出版數據集的應用系統被逐步開發出來,如SemanticLancet(2014年愛思唯爾出版集團)、SciGraph(2017年由Springer-Nature集團)、SciKG(2017年清華大學)等。數據加工處理方法和工具的普及使得出版物的語義越來越簡單化,技術門檻的降低為中文科技期刊的語義出版普及帶來了可能[8]。在數據的結構化標準方面,中華醫學會雜志社參考國外期刊的經驗,制定出適合中文科技期刊的中華醫學會期刊論文標簽集(CMAJATS)[4]。目前,國際上有的期刊已經做到了多種類型的數據融合,如提供文章唯一標志符DOI和超鏈接;文本術語的語義標記,與相關第三方信息資源的鏈接;交互式數字;可重新排序的參考列表;包含研究摘要、標簽云和引文分析的文件摘要;包含了表和圖中數據的可下載的電子表格[1]。從Aries系統公司的集成元文獻智能的可支持論文出版決策的系統,到Elsevier在期刊信息采集與搜索領域的全部期刊及圖書資源支持文本與數據挖掘,再到Taylor&Francis與UNSILO合作致力于期刊內容的語義,語義技術在整個出版流程中的融入,對于我國中文科技期刊的語義出版均極具參考價值[9]。國內的一些科技公司也在語義技術的應用方面進行積極探索,如科大訊飛、百度等。目前,訊飛的核心語音業務正在向語音識別、語義識別、自然語言處理方向演進。2014年起,科大訊飛基于深度學習算法,啟動了針對人工智能的重大攻關項目“訊飛超腦計劃”[10]。語義技術在其他領域的成功應用對于中文科技期刊的語義出版具有一定的借鑒意義。
1.3社會需求層面
1.3.1響應凈化學術環境的吁求
近年來,隨著網絡數據庫資源的日益豐富,科技信息的獲取越來越便利,而科技期刊版權保護力度普遍較弱[9],科技論文學術不端現象日益嚴重。數字出版的迅速發展使得科技期刊的影響面越來越廣,學術不端事件的曝光率增大,導致近來國際上頻現學術不端事件,學術道德也受到了前所未有的重視。中文科技期刊作為我國科技信息交流的重要平臺,在學術環境的維護中有著舉足輕重的地位。語義技術則為科技期刊對于學術不端的防范提供了一道新屏障。利用語義技術強大的信息挖掘功能,開發出一套高精度的論文分析系統,對論文進行全文檢索和整體分析,防止抄襲及低水平重復,對于科技期刊的發展和學術環境的凈化顯得尤為重要。
1.3.2擺脫海量數字信息的困擾
隨著科技的發展,我國科技期刊每年發文量不斷攀升,其中所蘊含的信息量也呈幾何量級地增長,完全靠人力來完成這些信息的分析處理越來越不現實,與此同時科技期刊的審稿工作量也大幅增加??蒲腥藛T需要在浩渺的文獻中尋找對自己有用的信息,面臨查詢不全面不準確、成本高、耗時等問題。在傳統的學術信息服務平臺上,其搜索引擎無論是基于網站分類技術還是基于全文檢索技術,用戶在查找在庫文獻的相關信息時,由于所提供的表達模糊、信息孤立、機械化的關鍵字匹配、無法進行知識整合等原因,均需對獲得的一級信息進行二次過濾,難以避免誤查漏查情況的出現。而科技期刊編輯人員所面臨的問題是:在出版前對低水平重復的論文進行有效剔除,降低審稿工作壓力,并確保不遺漏具有創新性的科研成果;在出版后對科技論文所含信息進行有效管理,實現信息的高效利用?;谡Z義技術的科技期刊學術信息平臺可提供一個智能化的檢索方式,實現面向編審人員和科研人員的從稿件編審到到應用的輕松分析處理和充分利用,實現戰略性閱讀,并精準獲取“宏知識”??萍计诳D型為信息解決方案的提供方,旨在為用戶提供更好的信息和決策方案[9]。
1.3.3解除經濟效益低下的困境
中文科技期刊作為一種特殊的商品,在任何情況下都必須把社會效益放在首位。以社會效益為主的傳統經營方式隨著辦刊環境的變化以及辦刊經費的增加,使得一些期刊入不敷出,甚至停刊。實現社會效益和經濟效益的雙贏,是維持中文科技期刊的生命力、促進其可持續發展的最優路徑。語義出版是具有彈性擴展、動態分配和資源共享等特點的數字內容出版,它催生大量新型出版業信息服務,帶動出版格局的整體變革。語義技術在科技期刊出版流程中的介入與升級,使得科技信息傳播的專項服務、深度服務、私人訂制成為可能。語義化的中文科技期刊信息服務平臺可以為用戶提供智能化、個性化的科技信息服務,拓寬了其在信息消費市場的服務方式,通過增值服務創造新的商業機會,增加了盈利空間。如,全球最大的科學與醫藥信息出版商愛思唯爾,通過整合科技期刊資源和對內容產品價值的重新挖掘,其數字內容資源的收入可達每年30億美元[11]。
2語義技術應用于中文科技期刊的內部優勢
就多數中文科技期刊來說,目前已基本實現了XML等結構化處理,這有利于進行文本的語義標注和互動訪問,便于機器理解和獲取其中的數據單元,這是應用語義技術的根本和前提,為語義技術的應用創造了條件。同時,語義出版也為中文科技期刊帶來更為優良的發展格局。
2.1實現中文科技期刊信息平臺的智能化
在中文科技期刊信息平臺建設中,運用語義技術將出版內容進行智能化加工整合,能夠讓信息的動態整合和動態選擇成為可能,科技信息平臺為用戶輸出的產品更加智能化和個性化。利用語義技術,可以將出版對象從論文延伸到原始數據,將知識組織單位由“文獻”細化到“知識單元”。由于出版內容更加結構化,信息粒度更小,從而更易被計算機理解和自動集成,有利于信息的再利用和按需重組,利于出版內容的二次深度開發,實現大規模個性化信息服務。語義技術的應用可以創新科技期刊的出版形式,實現一次投入多次產出,一種產品多樣化服務,使得科技信息平臺更具友好性,實現信息的結構化、關聯化、混合化、可操作化、可視化,先于用戶完成內容的理解、分析、綜述、聚合等活動,使得用戶能夠以盡可能少的搜索與整理工作,獲得盡可能多的可用信息。更重要的是,通過信息的智能化加工整合,不僅豐富了傳統中文科技期刊的表現形式,提高了其內容的可操作性和交互性,深入挖掘了其內容的價值,還增強了不同期刊間、不同文獻間的關聯度,實現出版內容與行業數據跨平臺的互通共享。2.2提升中文科技期刊的受眾黏性將語義技術融入中文科技期刊的數字出版中,將為用戶帶來全新的知識服務體驗。可以利用語義技術識別和跟蹤用戶的興趣,分析用戶的行為,自動建立用戶偏好庫。通過自動跟蹤偏好庫,用戶即可在浩淼的文獻中方便快捷地得到自己所需的數據和信息。通過鏈接至語義相關的文獻,并提供獲取文章內數據的可行性途徑,實現動態地獲取和組織內容,并主動推送精準的個性化服務。另外,語義技術為中文科技期刊的富媒體出版提供了新路徑,用戶面對的不再僅僅是文字和圖片,還有更豐富和多感官的互動性內容展現。這種專業化、定制化、交互性、高增值性知識服務在為用戶提供較大便利的同時,增加了期刊的受眾黏性,提升了其在信息消費市場的競爭力。
2.3保障中文科技期刊質量控制
運用語義技術構建知識版權保護壁壘,確保中文科技期刊的綠色發展。目前,在論文的審稿階段,中文科技期刊多通過論文重合率的檢測,實現對高重復性文章的初步篩選,防范學術不端行為的出現,保證期刊的質量。但是一些作者通過各種途徑進行后,對文章的語言敘述稍加調整,即可通過審核,如:變換同義詞,長短句互換,改變描述方式,打亂句子順序等。隨著語義技術在軟件中應用及逐步成熟,檢測的精確度被提高,真正實現從技術手段方面防范學術不端、減少低水平重復,建立中文科技期刊知識版權的保護壁壘。其原理是基于詞頻統計的方法,此方法引自向量空間的檢索模型,和信息檢索技術相關,是根據指定規則,將單詞頻度轉化為空間特征向量,最后采取度量向量之間的距離來計算相似度達到的目的[12]。2008年10月的“CNKI期刊學術不端文獻檢測系統”目前已實現了多庫及互聯網資源的聯合比對,其檢測原理包含了“語義技術”。
3語義技術應用于中文科技期刊的內部劣勢
3.1中文科技期刊語義出版意識欠缺
網絡化和市場化的浪潮為中文科技期刊的發展帶來了機遇與挑戰,大多中文科技期刊都在積極地進行新媒體融合的探索和應用,數字化出版開始滲透期刊出版的方方面面。但是,由于受發展思路、體制機制、技術手段、人才資源、經營管理模式等因素制約,很多期刊在數字化進程中處于相對被動的地位,對于語義出版的研究與應用方面更是表現為動力不足。首先是發展思路方面。目前,中文科技期刊在新媒體融合方面的應用多囿于在線投審稿、開放獲取、DOI標注、搭建集群數字出版平臺、開通微信公眾號等[13],也有部分中文科技期刊嘗試采用視頻動畫等探索論文可視化發表[14],語義出版還是一個相對較新的領域,未能進入大多數中文科技期刊的發展視野。其次,由于盈利模式尚不成熟,多數中文科技期刊并未從數字出版中獲得更多的經濟利益,而語義技術的應用尚在逐步發展中,由于出版理念的落后,未遠瞻到語義出版的優勢,鮮有進行語義出版的嘗試。
3.2中文科技期刊語義出版技術人才匱乏
由于中文科技期刊出版與發行相關機構人員的復雜性及相應的研究發展起步較晚,編輯隊伍建議滯后,編輯部管理水平落后等原因,該行業缺乏一支穩定的、高質量的、專業的計算機軟件方面研究的隊伍,特別是熟悉編輯業務、了解語義技術、富有相關系統運作經驗的專業人才十分匱乏。但要進行后期軟件使用的不斷調適,實現相關軟件系統與出版流程的真正契合,少不了科技期刊管理與編校人員的智力支持。如,在中文科技期刊的語義過程中,需要有專業的人員進行內容碎片化處理,語義標注,語義關聯等,這些工作需要人員不僅懂專業,還要熟悉語義技術處理方法,對碎片化的資源進行再處理。
4語義技術應用于中文科技期刊的外部威脅
4.1政府引導與資助有限
一方面,現有政策多為針對數字出版的宏觀指導,針對語義出版的,能夠解決具體的問題的政策相對較少[6];另一方面,語義技術與科技期刊出版的嵌合需要投入較高的成本,然而相關研究資助來源較少。目前,我國科技期刊的發展多依賴政府的投入,支持資金渠道單一,雖然有專項扶持等政策,也是僧多粥少。在國家和地方的基金項目申報中,新聞學和傳播學基本不在優先資助行列,給研究項目申請資助增加了一定難度。
4.2專業化期刊集群平臺建設緩慢
本體及知識結構關聯是以學科為基礎,因此一定規模的中文科技期刊專業化集群平臺是語義出版實施的基礎條件。另外,研發軟件系統的先期投入、后期維護和嵌合會增加辦刊的成本。而專業化期刊集群既能滿足本體庫構建及語義檢索的要求,又可降低單刊語義出版的成本。由于較多中文科技期刊的主管部門分屬各個高校、科研院所、政府部門或學會,由于體制原因,改革動力不足,思維鈍化,慣于單兵作戰,較難建立起集群。目前,中文科技期刊專業化集群仍處于初始階段,僅出現少量期刊集群,這些集群中期刊數量分布不一,而期刊數量最少的腫瘤科學網僅3種期刊,普遍無法涵蓋學科領域內的所有優勢刊物。
4.3存在市場推廣阻力
語義技術與出版的融合,可以促進中文科技期刊的發展,所能帶來的社會效益和經濟效益是毋庸置疑的,同時也是一把雙刃劍。鑒于語義技術對于論文相似性檢測的嚴苛性,其對于中文科技期刊稿源的沖擊是必然的,甚至會對一些刊物帶來毀滅性的影響;另外由于資金等方面的限制,其應用很可能僅限于各大中文科技期刊數據庫或少數中文科技期刊出版機構,因此其市場推廣具有一定的難度。
5語義技術應用于中文科技期刊的發展路徑
5.1拓展投融資渠道,建立刊企合作研發與發展模式
語義技術相關軟件系統的開發和應用,離不開政府的支持和引導??紤]采取“政府參與、刊企合作、產業推動”的發展模式,邊研發邊試點,由易到難逐步有序推進中文科技期刊語義出版的發展。為了促進中文科技期刊語義出版的發展,要以政府為主導,做好可持續的頂層設計和系統規劃。通過設立專項資金及政策和社會資源適當傾斜,加大對技術研發平臺的建設,為該項技術的研發提供信息和技術支持,鼓勵和支持其推廣應用。根據我國中文科技期刊的網絡發行現狀,考慮建立以中文科技期刊出版與發行相關機構為主體的技術研發體系,充分發揮政府和產學研機構的協同作用,通過利益關聯,鼓勵各大網絡科技文獻信息服務商等科技企業積極參與,切實從社會需要出發,共同進行技術分析和項目研究。積極爭取國家及地方各級財政支持有條件的刊社先行發展,對已開展語義出版嘗試的刊社進行目標評估與前期扶持,推動設立扶持科技期刊語義出版的專項資金,制定稅收等各項優惠政策,吸引社會資金參與中文科技期刊語義出版的發展。
5.2支持中文科技期刊專業化集群,建立優勝劣汰的退出機制
一方面,充分發揮已建期刊集群的示范引領作用,從政府層面采取強有力的措施有效整合社會資源,打破傳統出版單位的界限,加強出版單位間的溝通與合作,依托行業協會、高校和科研機構建立專業化期刊集群,實現信息與技術共享,互利共贏,這是實現語義出版的有效路徑。另一方面,應建立一套中文科技期刊的準入退出機制,實行科技期刊動態監管,通過優勝劣汰,實現資源的優化配置,為普及語義出版創造條件。優勝劣汰是市場競爭的必然結果,中文科技期刊應當順應出版業的發展趨勢,適時轉變思路,掌握并應用新技術,調整出版服務模式,積極應對科技的發展。不進則“退”的競爭壓力會帶動中文科技期刊的主動變革,加快中文科技期刊的規范化和數字化發展。
5.3加快相關技術人才培養,制訂戰略性人才管理機制
要實現語義技術融入科技期刊出版流程的方方面面,不僅要具備友好的軟件系統,還需要借助多方的人才優勢。傳統出版單位要重視涉及語義出版的內容生產、研發、資本運作和經營管理等方面各類新型人才的培養,在開展專業技術人才繼續教育培訓時,考慮適當加入語義出版方面內容的介紹,加快專業技術人才知識更新。隨著相關技術的逐步成熟和完善,有條件的單位可考慮引進相關專業技術人才,已形成集群的科技期刊則可采取遠程的專業智力資源共享。另外,應建立有效的評價和激勵機制,鼓勵專業技術人員樹立專業自信,積極開展語義出版方面的研究。
6結語
中文科技期刊作為我國科技信息傳播和交流的重要平臺,承載著促進科技發展等功能,固步自封既不利于科技信息的快速傳播,也不利于期刊自身的健康發展。語義出版為中文科技期刊走向可持續發展提供了契機。抓住機遇,積極探索,創新中國特色發展模式,是提升中文科技期刊的國際影響力的可行之路。
作者:聞麗 張揚 謝榮秀 吳彬 單位:中南林業科技大學期刊社 國家新聞出版署出版融合發展(武漢)重點實驗室