前言:想要寫出一篇引人入勝的文章?我們特意為您整理了高校檔案管理的策略研究范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:人工智能技術的發展給高校檔案管理的創新和變革提供了契機,高校檔案館要轉變思想,注重對檔案全流程、多維度、非結構化數據的收集,構建檔案大數據平臺,并依靠人工智能算法對大數據進行分析挖掘,以解決檔案管理中的各種創新難題,如智能推薦和咨詢服務、自動回答和編研匯總、主動服務和個性化服務等,提高檔案管理水平。但另一方面,人工智能技術對用戶隱私和檔案安全等可能造成一定的侵害,需要引起高校檔案工作者的重視。
關鍵詞:人工智能;高校檔案管理;大數據;RFID;隱私;檔案安全
一、人工智能技術的基本概念
人工智能是指用一種新的能以人類智能相似的方式做出反應的智能機器,它能夠自我學習和思考、判斷并作出決策[2]。不過計算機獲得智能的方式和人類不同,它不是依靠邏輯推理,而是靠著大數據和智能算法。因此人工智能的實質是在大數據基礎上,通過深度學習,將數據挖掘問題轉化為可計算問題來處理的過程。比如AlphaGo把下圍棋這個難題轉化為棋盤問題空間的表達和搜索問題,在學習數以萬計棋譜的基礎上,利用啟發式搜索算法,求得當前的最優解,并不斷迭代推演,最終戰勝人類圍棋世界冠軍[3]。可見,人工智能并不神秘,并非遙不可攀,關鍵就在于數據的收集和算法的使用。而高校檔案館就是一個“數據密集型”部門,有大量的學籍、文書、科研、基建、人物等檔案數據,可以充分利用人工智能技術對檔案資源和用戶數據進行挖掘,發現關系以及分析趨勢,提供更加主動及優質的檔案服務[4]。
二、人工智能技術在高校檔案管理中的應用
人工智能技術在高校檔案管理中的應用可以從思維、數據、技術等幾個方面來進行研究。
1.思維方面
人工智能不僅僅是一種技術,更是一種思維方式的轉變。工業革命以來,人們已經習慣了機械思維,相信所有問題都有一個通用的解決辦法,并在努力尋求事物間的因果關系。進入人工智能時代,人們開始接受世界的不確定性,學會利用信息或者數據來消除這種不確定性,又逐漸利用相關關系取代因果關系,以更快地獲得問題的近似解,如預測投票選舉結果和預測股市波動。受此思維影響,高校檔案工作者在指導各部門檔案收整時可以不預先設定目標,而是先把所有能夠收集到的本部門相關的檔案數據收集起來,運用“全部留”的方法破解檔案價值的不確定,檔案價值認定難的問題。因為在人工智能時代,數據或信息不再是包袱,而是財富[5],然后對這些檔案數據分析挖掘,能夠得到什么結論就是什么結論,用“數據說話”,盡量減少人工主觀的干預活動。另外針對檔案收整和利用的不確定性和易變性,可以引入外部信息,如歷年數據、收整和利用的關系,利用者需求的變化等數據,以便對檔案管理作出合理預測和規劃。
2.數據方面
人工智能的基礎是大數據。近幾年大數據一詞經常出現在媒體上,它的3V特性(體量大、多樣性、及時性)也逐漸被更多人所熟知和接受,但大數據更重要的含義其實是多維度和完備性。具體到高校檔案領域,檔案數據多維度是指在常規檔案顯性數據以外,包含其它隱性維度的數據。比如在教學檔案中,除學生姓名、成績、學號、專業等基本信息以外,還應該收集整合學生的籍貫、出生年月、高考分數、高中學校、報考專業、獎懲明細、畢業學位信息、工作派遣單位等數據,如果有可能還可以跟蹤補錄學生就業后的一些個人數據信息,以便從多角度分析數據間的相關關系,挖掘隱含信息。檔案數據的完備性是指包含檔案管理全流程的數據。比如在文書檔案中,除文件題名、責任者、歸檔時間等基本信息以外,還應該收集文件生成時間、地點,文件流轉過程批注、修改、查閱人,檔案整理人姓名、職務,檔案移交時間,檔案利用時間、人員姓名和單位,檔案利用方式等數據,這些數據有助于打通從檔案生成到檔案利用之間的關系,使檔案生成單位能更好的把握歸檔內容,及時獲得檔案利用者的反饋,調整歸檔策略,以提供更多利用者感興趣或需要的檔案。隨著移動互聯網和物聯網技術的發展,檔案大數據的收集越來越方便實時,把控每一個用戶,每一卷檔案和每一次檔案利用細節也將成為現實。檔案數據越來越豐富全面,檔案案卷實體正在成為流通渠道、數據收集途徑,這也為人工智能時代的檔案數據收集提供了一個新的來源。
3.技術方面
人工智能技術主要包括軟件和硬件兩方面內容。軟件主要指各種數據挖掘算法,常用的有啟發式搜索算法、蒙特卡羅樹搜索算法、神經網絡算法等,這些算法可以解決在實際檔案利用中如何有針對性地給用戶推薦檔案的問題。人工智能時代,人們追求檔案利用的時效性和個性化,各種檔案利用數據能夠被即時而完整地記錄下來。如檔案查詢關鍵詞、查詢時間、查詢結果點擊數、查詢者賬號信息、查詢者滿意度等,這些數據隨時可用,以便系統及時做出分析。而隨著算法的改進和提高,以往同類檔案用戶歸類的推薦方式,可以進一步變為由檔案直接推薦檔案,由兩類檔案到兩件具體檔案的直接關聯,一件檔案被利用時,自動推薦和其相關的檔案文件。隨著檔案利用數據的積累,尤其是和每一個用戶相關的各種維度數據的積累,推薦將越來越靠譜,越來越準確,最終做到因人而異,完全個性化。硬件方面則主要采用在檔案中插入RFID芯片和在檔案閱覽室安裝各種監控攝像頭。RFID是一種不需要電源的芯片,里面存儲的信息可以被專門的閱讀器發出的無線電波探測出來[6]。這種芯片價格便宜,將它裝到各種物品上,就可以自動識別各種物品,進而跟蹤物品。在檔案管理中,RFID不僅可以記錄檔案生成期間的各種數據信息,還可以記錄檔案利用過程中的各種數據信息,檔案的每一次查詢、提取、翻閱、借出等全流程數據都能夠被完整收集保存,RFID中的數據記錄了檔案文件全生命周期的與檔案實體相關的數據,堪稱檔案的“全息影像”。這些數據有助于檔案館對館藏檔案的布局、檔案的質量有清晰的認識,有針對性地提供利用服務。而各種監控攝像頭可以實時記錄檔案閱覽室的人員情況,查檔等待時間,服務利用時間,查檔次數等數據,這些數據有助于檔案利用部門合理安排人員,簡化辦事流程,提高工作效率。
4.其他應用方面
除了以上一些應用,有了通過多種途徑收集的檔案多維度全流程大數據,再利用各種數據挖掘算法,還可進一步實現人工智能時代檔案的智能化管理利用。在此另外舉幾個例子,拋磚引玉,希望未來高校檔案工作者能發掘出更多的檔案創新工作模式。(1)根據檔案利用者的反饋,系統自動向各歸檔單位推送其歸檔檔案的利用情況,并建議其加大某類檔案的歸檔力度,或者提醒其可適當增加某類用戶可能更感興趣更需要的檔案等。(2)根據學生成績,通過橫向同學間比較和縱向歷史成績數據對比,并結合個人實際情況,智能推薦其更合適的畢業選擇,是讀研、出國還是工作。如果數據全面準確,甚至可以具體到讀研、出國的學校信息或者工作地點、工作單位等信息,推薦更精準。(3)對電子化的檔案圖像進行全文識別讀寫,自動分析其中的關鍵字,使計算機獲得“檔案知識”,并結合已有目錄數據庫,將整理后的信息推送給用戶,如可自動回答用戶提出的“學校最年輕正教授”、“學校某專業成績績點分布”、“學校各省市招生人數變化”等問題,提高查檔利用的全面性和滿意度。另外還可以利用計算機閱讀和分析檔案匯編成果,并從已有的大量文本語料中學習寫作,最終實現計算機自動編研檔案和撰寫檔案文章。(4)對各種檔案利用異常行為進行預警,及時提醒檔案利用單位重點關注某些利用行為或者利用者。先從檔案數據找到普遍規律,然后再應用于每一個具體的用戶,并且影響到每一個具體的操作,以發現每一個異常情況。做到從個體到全體再從全體到個體的雙向流動。
三、人工智能對高校檔案管理的挑戰
人工智能對檔案創新變革提供技術支持的同時,也對用戶隱私和數據安全方面提出了新的挑戰。
1.用戶隱私安全
由于大數據具有多維度和全面性的特點,它可以從很多看似支離破碎的信息中完全復原一個人或者一個組織的全貌,并且了解到這個人工作生活的細節或者組織內部的各種信息。這樣就會引發大家對個人隱私權的擔憂。比如要想推薦精準,對學生數據的收集就要更加全面多維度,在這個過程中必然會涉及對學生隱私的干預。要想對這些檔案大數據進行隱私保護,一種辦法是從收集信息的一開始就對數據進行一些預處理,將數據“脫敏”,比如去掉姓名、學號、身份證號等這些具有明顯個人屬性的數據。預處理后的數據保留了原來的特性,能夠進行分析利用,但卻“讀不懂”數據的內容。第二種辦法是利用一定規則在檔案數據中添加“擾動”,通過數學的方法讓大數據依然有很強的可靠性,但是卻完全找不到每條數據對應的來源,如蘋果公司的“差別隱私”技術。第三種辦法是雙向監視,使數據從采集到使用都在雙方知情的情況下進行,使數據使用者受到監督,提高檔案館對數據利用的自律意識,相比前兩者,這種方式可能更有效果。
2.數據存儲和數據安全
人工智能的核心是海量全面的數據,因此數據存儲和數據安全是未來所面臨的最大挑戰。數據存儲。由于摩爾定律導致各種存儲器的容量成倍增加,同時價格迅速下降,使得更多的檔案數據有條件存起來以供使用。但是隨著數據量的劇增,查找和使用檔案數據的時間也會變得很長,影響分析數據的效率。而且即使采用并行計算,受制于算法和計算機,數據分析處理的效率也存在瓶頸,這些問題還需依靠技術的進步來解決。數據安全。檔案數據安全有兩層含義,首先是保證檔案數據不損壞、不丟失;第二層含義是要保證檔案數據不會被偷走或者盜用。為避免安全問題,要盡量將學生個人情況等敏感信息放到不同的地方,以免多種敏感數據同時丟失。另一種保護數據安全的方法則可以利用大數據本身的特點,即發現異常操作,比如某次某個賬號使用檔案系統的流程和正常不符,即可斷定這是一起檔案系統密碼泄露、系統入侵事件。另外,當數據量足夠大時,每個系統用戶的操作習慣也可以學習,不符合某人習慣的操作就可能是來自于非法的闖入者,這些操作就會被禁止。
四、總結
“檔案+人工智能”指日可待,而其特點,則是檔案的智能化和精細化,在這些變革中,具有智能的計算機將可以幫助我們完成相當多的工作,甚至是絕大部分工作。人工智能時代,檔案管理將全部數據化,從檔案生成到檔案利用,全流程所有數據都將被記錄;檔案服務利用將全部無人化,用戶自助遠程查詢,而查詢結果不僅限于原始檔案文件,更有可能來自于計算機的智能整合推薦;檔案系統會根據不同用戶,自動定期推送精準的個性化內容,深度挖掘檔案的人文內涵;而檔案全文的數字化將對學校沿革和未來決策提供更多輔助信息。未來的人工智能時代是一個大數據的時代,而高校檔案館的定位則應該作為一個數據集中平臺,以數據驅動解決各種問題,以相關性取代因果關系來快速迭代結果。另外各個檔案館要注重數據的共享共建,盡量采用標準化數據,以提高數據整合效率。
作者:劉洋 單位:天津大學檔案館