前言:想要寫出一篇引人入勝的文章?我們特意為您整理了科技信息服務(wù)人工智能技術(shù)應(yīng)用研究范文,希望能給你帶來靈感和參考,敬請閱讀。
互聯(lián)網(wǎng)為我們提供了取之不盡,用之不竭的公開信息資源寶庫,現(xiàn)代科技已廣泛應(yīng)用于科技信息服務(wù)領(lǐng)域,其中人工智能技術(shù)使科技信息工作流程的計算化、智能化特征更為顯著,因此,利用人工智能技術(shù)助推科技信息事業(yè)的發(fā)展成為必然選擇。本文對大數(shù)據(jù)下科技信息領(lǐng)域需要解決的主要問題,人工智能技術(shù)應(yīng)用于科技信息領(lǐng)域的研究的意義和主要研究內(nèi)容進行了剖析和闡述,提出了相應(yīng)的研究觀點和技術(shù)路線圖,提出基于人工智能技術(shù)的科技政策動態(tài)分析體系設(shè)計方案。并以科技信息的共享和利用為導(dǎo)向,開發(fā)和應(yīng)用科技信息資源,實現(xiàn)數(shù)據(jù)信息價值的最大化,通過人工智能技術(shù)進行科技信息的深度領(lǐng)域數(shù)據(jù)分析服務(wù),實現(xiàn)科技信息資源的前沿性研究是大數(shù)據(jù)下科技信息的人工智能技術(shù)應(yīng)用的主要方向之一。大數(shù)據(jù)時代催生了海量數(shù)據(jù)的誕生,數(shù)據(jù)量的劇增一方面提供了更多信息來源,另一方面也給從更大量數(shù)據(jù)集中獲取有用信息制造了困擾。若要基于更全面客觀的數(shù)據(jù)獲得其準(zhǔn)確的信息,大量的非結(jié)構(gòu)化數(shù)據(jù)需要結(jié)構(gòu)化處理,才更便于分析,需要更長的時間和更高的人力成本。此外,互聯(lián)網(wǎng)環(huán)境下的信息傳遞瞬間即達,對信息的即時性、保密性也提出了更高的要求。大數(shù)據(jù)時代的信息分析需求對傳統(tǒng)的信息分析方法提出了巨大的挑戰(zhàn)。伴隨公開和非公開的科技信息資源的日益增加,其數(shù)據(jù)已呈現(xiàn)和具備大數(shù)據(jù)的特點,傳統(tǒng)的科技信息搜集和處理方法不足以應(yīng)付當(dāng)前的數(shù)據(jù)現(xiàn)狀。面對大數(shù)據(jù)時代日益增長和積累的龐大數(shù)據(jù)集,以及科技信息本身具有的學(xué)術(shù)價值和技術(shù)先進性特質(zhì),使得面向科技信息領(lǐng)域的應(yīng)用研究工作必須做出變革,即以科技信息的處理和分析為導(dǎo)向,旨在實現(xiàn)科技信息資源的有效組織、處理和分析,實現(xiàn)需求驅(qū)動的科技信息組織和分析方法的創(chuàng)新,為挖掘科技信息的前沿性研究服務(wù)。
大數(shù)據(jù)下科技信息領(lǐng)域需要解決的主要問題
(1)大數(shù)據(jù)下科技信息處理的標(biāo)準(zhǔn)化體系研究相比傳統(tǒng)的科技信息,大數(shù)據(jù)環(huán)境下的科技信息的來源、類型、內(nèi)容和數(shù)據(jù)格式更為復(fù)雜,制定和完善科技信息的標(biāo)準(zhǔn)化體系和內(nèi)容是及其必要的。信息資源的標(biāo)準(zhǔn)化體系是保證信息有效存儲、處理、分析和利用的基礎(chǔ)和前提。本文認(rèn)為將依據(jù)當(dāng)前科技信息現(xiàn)狀,針對具體領(lǐng)域研究和制定大數(shù)據(jù)下的科技信息處理規(guī)范和建議是必要的。(2)大數(shù)據(jù)下的科技信息資源的建設(shè)方法研究借助大數(shù)據(jù)技術(shù)可實現(xiàn)科技信息的大數(shù)據(jù)處理與大數(shù)據(jù)存儲,實現(xiàn)多源異構(gòu)的科技信息完成數(shù)據(jù)的存儲、處理、交換等功能。大數(shù)據(jù)下的科技信息資源的建設(shè)方法研究需要從數(shù)據(jù)本身和數(shù)據(jù)的組織兩個研究視角出發(fā),分析梳理大數(shù)據(jù)環(huán)境下科技信息資源在建設(shè)中面臨的難點和關(guān)鍵性技術(shù)問題,研究和提出科技信息資源的知識組織系統(tǒng)框架和基本構(gòu)建方法。(3)大數(shù)據(jù)下的科技信息資源的分析方法研究結(jié)合科技大數(shù)據(jù)特點,主要利用深度學(xué)習(xí)技術(shù)解決科技大數(shù)據(jù)的高維數(shù)據(jù)降維處理問題。研究和探索面向科技信息資源的分析方法,提出不同類型科技信息資源的關(guān)聯(lián)分析、重要性分析、主題演化路徑等深層次的信息分析方法和技術(shù),通過系列分析方法和技術(shù)研發(fā),解決科技信息資源管理工作中存在的問題,研究方法在實踐中進行創(chuàng)新和發(fā)展。世界的發(fā)展、科技的換代、媒介的延伸以及人文的變更,匯聚成一股巨大的洪流,加速了我們所處時代的變換,人工智能技術(shù)已經(jīng)滲透到各個技術(shù)領(lǐng)域,以上問題涉及科技信息的組織和分析,需要人工智能技術(shù)的融合,即與人工智能技術(shù)的深度融合必將推動科技信息進入全新時代。
人工智能應(yīng)用于科技信息領(lǐng)域的研究意義和主要研究內(nèi)容
人工智能為解決科技信息的獲取和分析提供解決途徑(1)人工智能可拓展獲取科技信息的來源。從事智能分析的美國Stabilitas公司的首席運營官ChrisHurst認(rèn)為:“人工智能可以擴大信息工作的范圍,不會遺漏那些有價值的細(xì)節(jié)。”科技信息同樣需要通過各種渠道獲取世界各國的同類信息,利用分布式網(wǎng)絡(luò)爬蟲等人工智能技術(shù)可獲取全世界的開源信息,包括文本和音視頻數(shù)據(jù)。(2)人工智能可加快處理科技信息數(shù)據(jù)的速度。美國中央信息局肯特學(xué)校教信息分析的校長JosephGartin認(rèn)為:“梳理社交媒體來獲得信息并不是什么新鮮事,讓人耳目一新的是如今我們收集社交媒體數(shù)據(jù)的數(shù)量之大和速度之快?!焙A康目萍夹畔⑼ㄟ^人工智能技術(shù)可以快速處理億萬比特的數(shù)據(jù),從而了解世界各國同類信息或事件,將每天接收到的大量數(shù)據(jù)轉(zhuǎn)變?yōu)槟軌蛴糜谡吆蛻?zhàn)場行動的信息。(3)人工智能使科技信息的分析自動化、智能化。據(jù)俄羅斯通訊社報道,俄羅斯總統(tǒng)普京表示:“無論誰在這一領(lǐng)域中處于領(lǐng)先地位,都將成為世界的統(tǒng)治者?!逼站┱J(rèn)為:人工智能是未來權(quán)力的關(guān)鍵。利用自然語言處理技術(shù)、語音識別、圖像檢索等人工智能技術(shù)可以極大的提高信息人員檢索有用信息的速度。此外,知識圖譜作為人工智能的知識庫基礎(chǔ),基于知識圖譜可實現(xiàn)分析對象的多維多步自動關(guān)聯(lián)分析,利用深度學(xué)習(xí)模型可大大提高多因素影響的系統(tǒng)分析,獲得更好的信息分析效果。主要研究內(nèi)容(1)基于人工智能技術(shù)的科技信息的知識存儲和管理大數(shù)據(jù)下的科技信息具有海量、異構(gòu)、跨媒體的特點,其知識存儲和管理需要對結(jié)構(gòu)化或非結(jié)構(gòu)化的跨模態(tài)數(shù)據(jù)進行語義智能化計算研究,以為統(tǒng)一語義范疇下的數(shù)據(jù)查詢提供便捷的元數(shù)據(jù)服務(wù);對跨媒體知識統(tǒng)一組織進行研究,為不同關(guān)系結(jié)構(gòu),不同模態(tài)數(shù)據(jù)的統(tǒng)一存儲與管理提供結(jié)構(gòu)基礎(chǔ);同時,需要對跨媒體知識的更新進行研究,為動態(tài)的數(shù)據(jù)存儲與多變的業(yè)務(wù)管理提供支撐。最后,對跨媒體知識檢索與查詢進行研究,從實際的檢索和查詢業(yè)務(wù)角度出發(fā),制定規(guī)則,優(yōu)化性能,提升知識數(shù)據(jù)被獲取時的準(zhǔn)確性與高效性。(2)基于人工智能技術(shù)的科技信息與知識的深度揭示與聚類加強科技信息資源的多源多模態(tài)數(shù)據(jù)整合關(guān)聯(lián)、信息抽取、不確定推理、機器學(xué)習(xí)、自然語言處理等人工智能技術(shù)研發(fā)與應(yīng)用;利用人工智能技術(shù)實現(xiàn)科技信息資源的外在層面的資源整合,資源內(nèi)在特征的深度聚合,實現(xiàn)科技信息與知識的深度揭示與聚類。通過可視化方式實現(xiàn)科技信息知識(研發(fā)技術(shù)、研發(fā)機構(gòu)、研發(fā)人員等)的聚合、揭示與展示。其中重點利用語義分析技術(shù)、詞表/本體構(gòu)建技術(shù)、知識圖譜技術(shù)、大數(shù)據(jù)分析等人工智能技術(shù),通過可視化方式實現(xiàn)科技信息知識的聚合、揭示與展示;實現(xiàn)對格式各異、內(nèi)容復(fù)雜的數(shù)字資源進行深層次的揭示,從資源外在層面的資源整合,深入到資源內(nèi)在特征進行深度聚合,實現(xiàn)信息與知識的深度揭示與聚類,同時將科技信息知識服務(wù)嵌入知識交流之中。技術(shù)路線圖如圖1所示。(2)基于人工智能技術(shù)的科技信息前沿技術(shù)發(fā)現(xiàn)與預(yù)警研究前沿技術(shù)發(fā)現(xiàn)與預(yù)警旨在有效指導(dǎo)和開展科技研究,國內(nèi)外已有研究在信息對象和研究方法上比較單一,信息價值和服務(wù)效果受限??萍夹畔⑶把丶夹g(shù)發(fā)現(xiàn)與預(yù)警研究應(yīng)更強調(diào)面向信息源的全面收集、處理、分析的一定程度智能化生產(chǎn)過程,更好的感知非完備信息,輔助信息用戶把不確定性預(yù)測變成更確定性預(yù)測。研究將不同類型的信息源進行整合、融合,多維度的分析科技前沿技術(shù)特征,從不同角度實現(xiàn)有價值信息的綜合疊加和映射,從中發(fā)現(xiàn)、分析和描述科技前沿技術(shù)問題,為科技領(lǐng)域?qū)<覍崿F(xiàn)科技前沿的準(zhǔn)確辨識提供服務(wù),實現(xiàn)有效的技術(shù)預(yù)警。技術(shù)路線圖見圖2所示。
基于人工智能技術(shù)的科技政策動態(tài)分析平臺設(shè)計
科技政策動態(tài)分析脫離原有人工分析為主的模式,而借助技術(shù)手段進行輔助分析是時展的必然趨勢,海量數(shù)據(jù)的現(xiàn)實對情報分析方法的沖擊不可避免。技術(shù)參與的目的是提高人工分析的效率和質(zhì)量,采用技術(shù)輔助手段是可以做到事半功倍的?;谌斯ぶ悄芗夹g(shù)的科技政策動態(tài)分析平臺的目的在于如何利用技術(shù)手段提供獲取情報數(shù)據(jù)、情報多維分析能力和自動生成可讀性的分析報告的能力,幫助提高人類思維的效率。1)科技政策動態(tài)信息監(jiān)測科技政策動態(tài)信息監(jiān)測主要采用網(wǎng)絡(luò)信息的監(jiān)測方式,只有在有效采集網(wǎng)絡(luò)信息的基礎(chǔ)上才能進而實現(xiàn)具體內(nèi)容分析與信息服務(wù)。信息監(jiān)測是對互聯(lián)網(wǎng)上共享的科技政策資源進行提取、解析、收集和存儲等的過程。科技政策動態(tài)信息監(jiān)測的一般框架可由圖3表示??萍颊邉討B(tài)信息監(jiān)測系統(tǒng)的層次模型:表示層,業(yè)務(wù)邏輯層和數(shù)據(jù)訪問層。數(shù)據(jù)訪問層:連接數(shù)據(jù)庫,執(zhí)行插入和查詢等操作。主要是用數(shù)據(jù)集訪問。業(yè)務(wù)邏輯層:調(diào)用數(shù)據(jù)訪問層的方法然后返回結(jié)果給表示層。表示層:獲取表單的數(shù)據(jù),然后調(diào)用業(yè)務(wù)邏輯層的方法處理數(shù)據(jù),然后根據(jù)結(jié)果顯示相應(yīng)的數(shù)據(jù)??萍颊邉討B(tài)信息監(jiān)測的系統(tǒng)框架:系統(tǒng)分為數(shù)據(jù)層與應(yīng)用層兩個層次。其中,數(shù)據(jù)層為整個平臺提供數(shù)據(jù)支撐,包括監(jiān)測站點、情報、文章、等基礎(chǔ)信息數(shù)據(jù),以及用戶信息、日志信息等數(shù)據(jù)。應(yīng)用層主要提供站點管理、信息服務(wù)、編輯撰文三大功能模塊,為用戶使用系統(tǒng)進行信息檢索、篩選、瀏覽、定制、撰文等提供服務(wù),同時也為管理員進行系統(tǒng)管理、任務(wù)分配、成果組織等提供相應(yīng)接口。具體系統(tǒng)框架如圖4所示。
結(jié)語
在大數(shù)據(jù)環(huán)境下,科技信息的處理和分析涉及的數(shù)據(jù)更加復(fù)雜化,人工智能給科技信息處理和分析帶來了機遇和挑戰(zhàn),有效利用最新的人工智能技術(shù)能更好的為科技信息建設(shè)服務(wù)。ChrisHurst認(rèn)為:“人類的行為是數(shù)據(jù),而人工智能是數(shù)據(jù)模型。所以我們認(rèn)為人工智能在處理這些數(shù)據(jù)方面能夠比人類做得更好?!北疚奶岢隽嘶谌斯ぶ悄芗夹g(shù)的科技政策動態(tài)分析平臺設(shè)計方案。并有以下幾方面未來工作的建議:(1)加強科技信息數(shù)據(jù)收集能力。充分利用爬蟲技術(shù)搜集開源情報,并研究存儲整合技術(shù),為信息分析打下堅實的數(shù)據(jù)基礎(chǔ);(2)加強多源多模態(tài)大數(shù)據(jù)整合關(guān)聯(lián)、信息抽取、不確定推理、機器學(xué)習(xí)、圖像識別、自然語言處理等人工智能技術(shù)研發(fā)與應(yīng)用;(3)構(gòu)建科技信息領(lǐng)域知識圖譜,加強信息分析、推理和挖掘的能力。
作者:于偉 王忠軍 單位:北方科技信息研究所