前言:想要寫出一篇引人入勝的文章?我們特意為您整理了圖書館信息管理可視化技術研究范文,希望能給你帶來靈感和參考,敬請閱讀。
隨著社會不斷發(fā)展,新的知識不斷涌現(xiàn),圖書館作為知識和信息集散的重要場所,為人們提供便利的同時,也面臨著資源積累逐漸龐大的壓力,給數(shù)據的存儲、分類和檢索帶來了巨大的挑戰(zhàn)。基于現(xiàn)代化信息技術的飛速發(fā)展,不僅實現(xiàn)了圖書館海量知識的電子格式存儲,而且提供了相應的檢索、添加、修改、刪除和保存功能,特別是信息檢索功能,為用戶進行數(shù)據信息的查找和使用帶來了很大的便利。
1信息檢索可視化技術的特點
信息檢索可視化技術是數(shù)據可視化技術在信息檢索領域的應用,信息使用者通過圖形界面和網絡信息檢索系統(tǒng)的相互作用,評價和優(yōu)化檢索結果,從而提高信息的查全率和查準率,達到滿足信息使用者需求的目的[1]。信息檢索可視化技術,不僅可以實現(xiàn)空間數(shù)據以圖形或者圖像的方式直觀地顯示出來,讓用戶明確數(shù)據之間的聯(lián)系與規(guī)律,有利于用于對數(shù)據進行分析和理解,而且還使用戶信息檢索操作更加簡便,有效地提高了檢索效率。信息檢索可視化技術實現(xiàn)了過程—結果的全程直觀展示,受到廣大用戶的一致好評。
2圖書館信息檢索可視化技術的發(fā)展及其存在的問題
2.1圖書館信息檢索技術的發(fā)展
圖書館傳統(tǒng)的檢索方式主要是檢索者利用館藏期刊、書目索引和各館自行編排的館藏目錄卡片實現(xiàn)相關信息的查找和翻閱。進入20世紀70年代,隨著計算機通信技術的飛速發(fā)展,圖書館信息檢索也開始利用通信設備和存儲信息的計算相連,實現(xiàn)聯(lián)機檢索。各大型圖書館依托因特網成功地開發(fā)和應用了多種服務項目,其中最具優(yōu)勢的服務項目之一當屬網絡信息檢索技術。迄今為止,在Internet上功能完善的信息檢索工具主要有分布式信息服務系統(tǒng)、廣域信息網和萬維網等。Internet技術將海量服務器連成一體,實現(xiàn)了分散信息系統(tǒng)向整體化集成的重要轉化,通過在館內建立Web網站OPAC,實現(xiàn)了信息使用者快速檢索各學科信息的目的。
2.2圖書館檢索技術存在的問題
現(xiàn)有數(shù)字圖書館的檢索系統(tǒng)主要是運用主題目錄分類和搜索關鍵字來進行信息資源的檢索,相較于傳統(tǒng)檢索方法,新的信息檢索方法為信息導航帶來了巨大的變革,同時也存在較多的問題。第一,信息歸類和維護過程需要投入大量的人力資源,信息更新也很不及時。第二,關鍵字檢索使得搜索結果涵蓋大量無用信息,用戶很難直接查找到與自己意圖相吻合的信息。第三,大部分圖書館Web站點缺乏明確的定位,不具備自己的特色,提供的服務主要是館藏書目查詢,很難直接檢索文獻,用戶難以快速、正確地找到所需信息[2]。第四,文獻數(shù)據庫著錄未能統(tǒng)一,規(guī)范性差,資源共享不完全,缺乏統(tǒng)一的組織與協(xié)調。第五,檢索工具缺乏檢索詞控制,大多數(shù)采用自然語言標引,無法實現(xiàn)人工標引的甄選。第六,站點管理水平有限,系統(tǒng)運行穩(wěn)定性不高,加上信息工作人員普遍水平不高,英語水平較差,難以達到網上瀏覽器查新的水平,使信息服務質量大打折扣。
3可視化技術在信息檢索方面的具體運用
3.1本體概念和應用
3.1.1本體的定義和作用本體涵蓋了概念模型、形式化、共享等含義,通過抽出客觀世界中的一些現(xiàn)象的相關概念而得出的模型,所體現(xiàn)的是相關領域共同認可的知識,應用計算機進行處理。本體的建立就是為了捕獲相關領域的知識,提供對該領域相關知識的共同理解。具體來說,就是本體為人們提供了相互交流的通用語言,使領域在不同的系統(tǒng)和模型之間實現(xiàn)相互集成和轉化。
3.1.2基于信息檢索的本體應用多信息的檢索和集成是本體的重要運用領域,信息多就容易出現(xiàn)不同信息源在表達上存在差異,所以就必須建立一套共用的信息語言,不僅可以減少信息轉換的難度,還能建立統(tǒng)一的信息集成模式,幫助信息使用者搜索到期望的知識點,并將所搜索的知識點進行相應的概念補充,從而在數(shù)據集成里面查詢到最終需要的資源。由于本體具有通過概念之間的關系來表達語言的能力,所以能夠大幅度地提高檢索的準確性和全面性。
3.2內容檢索
互聯(lián)網不斷發(fā)展,信息載體和形式也在不斷變化,互聯(lián)網信息多樣化不斷深入,圖形、圖片、視頻和動畫等多媒體技術不斷涌現(xiàn),致使以文本方式進行檢索的技術弊端日漸凸顯。為此,內容檢索技術隨著網絡技術的發(fā)展在文本檢索技術的基礎上應運而生。該檢索主要是利用融合了圖像處理技術、模式識別技術,從而極大地提高了檢索的效率,為信息使用者提供了更加直觀有效的檢索手段。
3.3可視化信息檢索
3.3.1可視化信息檢索的內容和優(yōu)勢可視化信息檢索包含兩方面內容:檢索過程可視化和檢索結果可視化。相對于其他信息檢索技術,可視化信息檢索技術具有顯著的優(yōu)勢,具體表現(xiàn)如下:第一,增強用戶的認知能力??梢暬瘷z索通過人類對圖片處理的較強能力,將文本內容轉化為空間的、圖形的形式后,以直觀的方式供用戶瀏覽與分析,不再需要進行語言處理,從而減少人的認知負擔。與此同時,檢索結果的可視化,可以揭示文檔中看不見的語義關系,通過一些空間屬性如距離、長短、大小等來表示文檔的相似性,可以便于用戶快速地找到相關的文檔,也方便用戶理解檢索到的信息之間的關聯(lián)性,從而提高用戶的認知能力。第二,信息檢索過程透明化。傳統(tǒng)的信息檢索系統(tǒng)對用戶而言是一個不透明的黑箱,用戶提交了提問式后,系統(tǒng)怎樣分解用戶提問式、怎么匹配提問詞和標引詞、怎樣得出結果等過程對用戶而言都是不透明的,因此用戶也無法對系統(tǒng)內部處理過程進行控制。一個可視化的信息檢索環(huán)境使檢索過程變得透明了,包括文獻與提問的語義關聯(lián)關系、文獻與文獻語義關聯(lián)關系、信息發(fā)現(xiàn)過程、檢索的顯示等。這使得用戶的檢索更加容易、有趣,也大大增加了用戶對信息檢索過程的控制能力。第三,方便用戶進行信息瀏覽。在可視化的檢索環(huán)境中,用戶檢索信息如魚得水,各種各樣的可視化檢索技術充分利用了人們對圖像處理的能力,既可以顯示檢索的核心信息,又以各種方式忽略或隱藏周圍的細節(jié)信息[4]。當用戶點擊檢索結果時,可以很快發(fā)現(xiàn)感興趣的領域,并且根據檢索結果的語義關聯(lián)性研究相關興趣領域,從一個興趣領域里自然地過渡到另一個興趣領域,同時還可以來回自由地在相關的興趣領域尋找相關信息,這是傳統(tǒng)的信息檢索所不能實現(xiàn)的。第四,提供良好的人機對話和交流環(huán)境。信息檢索過程應該是一個多回合的人機對話和交流過程??梢暬男畔z索將人的因素引進系統(tǒng)內,在檢索中可以發(fā)現(xiàn)檢索結果之間的關聯(lián)性,用戶可以根據自己感興趣的內容進行檢索,不斷獲取所需的信息,也可以獲取到相關領域的信息,這將會鼓勵人的參與,促進人機對話,改善人機交流。第五,提高檢查率和查準率。信息檢索可視化是數(shù)據可視化技術在信息檢索領域的應用,可視化提高了信息相關性判別的效率,擴展了信息相關性判別的手段。信息用戶可以通過圖形界面與網絡信息檢索系統(tǒng)進行交互,評價檢索過程中每次檢索的結果,優(yōu)化提問或查詢,從而提高查全率和查準率。
3.3.2信息檢索可視化的相關技術信息檢索的可視化涉及信息檢索技術和可視化技術。其中可視化技術的實現(xiàn)以映射技術和顯示技術最為關鍵。
(1)映射技術主要就是把數(shù)據從多維空間映射到2維和3維空間,以便成為計算機可以處理的數(shù)據。在此主要介紹自組織映射和潛在語義標引兩種映射技術:自組織映射是通過模擬人腦對信號的處理特點而發(fā)展起來的人工神經網絡,目的就是把錄入數(shù)據或信號的各種特點加以抽象和歸類,使其保持拓撲結構的有序性,當類似信號輸入時就會通過映射反映到相應維度空間;潛在語義標引就是通過統(tǒng)計方法尋找詞與詞之間的語義結構,通過奇異值分解,將文檔向量投影到較低的維度空間,實現(xiàn)數(shù)據的有效轉化。
(2)顯示技術是指將經過處理的文字和信號以圖形的形式顯示出來的技術。目前常用的顯示技術主要有Focus+Contex(t聚焦+上下文技術)、Cone-Tree(錐形樹技術)、Tree-map(樹圖技術)、HyperbolicTree(雙曲線樹技術)等技術。不同的顯示技術各有優(yōu)缺點,在信息檢索可視化應用過程中,需要依據實際情況加以選擇或整合。
想要不斷完善圖書館信息管理可視化技術,就必須從以下幾方面做好工作:第一,根據本館的館藏資料格局、人力和經費等條件,結合區(qū)域內社會發(fā)展對信息的需求,對館藏信息進行重組,建立各種與教學、科研及人們日常生活息息相關的特色數(shù)據庫,使讀者可以快速檢索到所需信息。第二,建立信息數(shù)據指引庫,通過對指引庫的訪問檢索到相關信息的具體館藏路徑,方便檢索信息。第三,實施標準化、規(guī)范化的數(shù)據庫信息,采用統(tǒng)一高效的網絡檢索工具,做到人機檢索有效互換,提高檢索的準確性,為后期各圖書館的聯(lián)網打好基礎。第四,對各館的館藏資料實施資源整合,形成新的資源體系,讓用戶能夠通過統(tǒng)一的檢索平臺查找各個圖書館的館藏信息,從而實現(xiàn)信息資源的高效利用。第五,對新一代的電子用戶進行相關基礎教育,比如優(yōu)化本館網上資源的配置及檢索途徑,Internet相關服務項目、使用方法和技巧,從而吸引更多的讀者進行檢索閱讀。第六,提高館藏工作人員的整體業(yè)務水平,要求館藏人員具備相應的計算機應用等級水平和英語等級水平,能夠熟練運用互聯(lián)網搜索相關資料,熟練運用英語進行人機互動,招聘適應新時代需求的數(shù)字圖書管理人員。第七,建立健全網絡技術人員考核制度,加強服務意識和事故應變處理能力,保證網絡系統(tǒng)穩(wěn)定有效運行。第八,完善數(shù)字化圖書館信息系統(tǒng)的語義表達。所謂語義就是數(shù)據和符號所代表的含義及含義之間的關系,是對數(shù)據的抽象和組織的更高層次的邏輯表達。信息檢索的難點就是簡短、模糊的用戶查詢與存在的海量文檔之間不匹配的問題,解決該問題就要增加文檔和用戶查詢的語義表達,隨著互聯(lián)網向語義網絡不斷深化發(fā)展,網絡平臺不僅僅只提供簡單的通信服務,而是要達到人機之間智能的交互理解,從而為人們共享知識、交流思想提供更好的服務。
5結語
現(xiàn)代信息可視化技術不斷發(fā)展,使抽象的信息以圖像、聲音等形式直觀地展示出來,可視化檢索技術作為信息可視化發(fā)展的重要內容,縮短了用戶理解信息的時間,實現(xiàn)了用戶感覺與思考之間的有效反饋,隨著新型檢索技術的不斷開發(fā),還能有效將人的認知能力融入信息檢索過程中,為信息檢索開拓新的領域,提升信息檢索的層次和水平。信息檢索的可視化發(fā)展作為圖書館信息管理可視化的重要組成部分,充分發(fā)掘了人類對圖像的處理能力,提高了人們的認知能力,符合當今社會“讀圖”的趨勢需求;同時,使檢索過程更具透明化,提高了用戶的檢索興趣,實現(xiàn)了良好的人機對話環(huán)境和高效的信息檢索過程。雖然我國信息檢索可視化尚處于初級階段,面臨著許多待解決的問題,但是我們堅信,信息檢索可視化的普及應用即將到來。
作者:顏培亮 單位:廣西民族師范學院圖書館