前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的圖書借閱方法主題范文,僅供參考,歡迎閱讀并收藏。
《幸福的種子――親子共讀圖畫書》是被譽為“日本圖畫書之父”的松居直先生的一部代表作。在這本書中,作者從圖畫書與兒童的世界講起,系統(tǒng)介紹了圖畫書在兒童成長中的重要作用,列舉了許多生動的實例教家長和教師如何為孩子挑選優(yōu)秀的圖畫書、如何對孩子進行閱讀指導。全書充滿著親切、溫暖的氛圍,通俗易懂,讀后可以消除我們的很多困惑,讓人有受益匪淺之感。
精彩書摘:
圖畫書的作用
要增加幼兒的詞匯量,培養(yǎng)幼兒的語言能力,最重要的就是讓他們在成長的過程中聽到豐富的詞匯。事實上,建立幼兒閱讀能力的基礎(chǔ),是從耳朵不斷積累詞匯開始的,而不是讓幼兒提早識字、看書。
圖畫書對幼兒沒有任何“用途”,不是拿來學習東西的,而是用來感受快樂的。而且一本圖畫書愈有趣,它的內(nèi)容愈能深刻地留在孩子的記憶里,在成長的過程中,或是長大成人之后,他自然能理解其中的含義。
在心靈互通的情形下所交流的語言,才是真正的人類語言。而圖畫書就是在為孩子制造機會,使他們在成長之路上常常體驗這種語言。
要專心地聽故事,就必須具備獨特的能力,將看不到的故事在腦海中想象成畫面,這就是一般所稱的想象力。豐富的想象力并非天賦,而是經(jīng)由直接或間接的體驗得來,體驗愈多,想象力愈豐富。圖畫書正好能提供給孩子更多的機會去體驗。能從一本書中發(fā)掘豐富絢爛的世界,或是只能掏出有限的知識,這完全有賴于讀者的想象力,而圖畫書是培養(yǎng)孩子想象力的啟蒙工具。
語言相通,心靈才能相通,才能產(chǎn)生共鳴。共鳴愈多,心靈就愈能結(jié)合在一起,從而產(chǎn)生認同感。有了這種共同生活的基礎(chǔ),才能夠展開團體育兒的工作。共同的體驗發(fā)展出共同的創(chuàng)造性活動(游戲),會產(chǎn)生更強烈的共鳴和認同感,最后,每個孩子真正了解到同心協(xié)力的樂趣。這種共識和深刻的理解,是圖畫書在幼兒園教育中的重要功能。
家庭與幼兒園擁有共通的文化、語言和影像,對幼兒來說,是不可取代的成長助力。我們只要確實為圖畫書定位,好好活用,這一點應該不難實現(xiàn)。
怎樣教孩子看圖畫書
在思考圖畫書與幼兒的關(guān)系時,最重要的是認清圖畫書不是讓孩子自己看的書,而是大人讀給孩子聽的書。
講圖畫書只管一個勁兒地講就好了,不要問東問西,因為這些問題只是為了滿足大人的需求。如果是自然地互相討論,當然最理想,但一定要做到不落痕跡。
圖畫書是讓人先看圖,而不是先看文字。孩子一邊看圖,大人一邊將文字念給他聽,孩子的腦海中就會清楚地浮現(xiàn)出對故事的整體印象。這是使用圖畫書最理想的方式。
孩子會從有圖畫的地方開始看故事,大人卻會跳過這幾頁,從有文字的地方才開始看,結(jié)果遺漏了非常重要的部分??慈魏我槐緢D畫書時都可能出現(xiàn)這種情形,因此教孩子看圖畫書時,應該從封面、封二、扉頁、正文到封底,仔細閱讀每一幅插畫。
如何判斷圖畫書的優(yōu)劣
“畫得可愛”“顏色鮮艷美麗”不是圖畫書插畫的必備要素。真正重要的是“插畫能否充分表達故事”。
要判斷故事的好壞,可以讀一讀圖畫書的文字,然后在心中描繪故事的情節(jié),看看會不會出現(xiàn)清楚的影像。
對于圖畫書,要確認故事好壞的最好方法,不是用眼睛看文章,而是用耳朵去聽。我們可以請別人來讀,自己用耳朵聽,如果故事中的畫面一幕幕自動浮現(xiàn)在眼前,那就是容易理解的文章。由于孩子們是用耳朵聽圖畫書的,因此大人有必要站在孩子的立場,以相同的方式來接觸圖畫書。
圖畫書的插畫應該比文字的描述更豐富、更正確。
好的圖畫書作者會以歷歷在目的方式來敘述,將要說的主題傳達給孩子,同時將插畫的細部與整體結(jié)合,以圖文一致的形態(tài)表現(xiàn)整個故事。這種圖畫書能使孩子確實把握主題,相信作者的描述并產(chǎn)生共鳴。
圖畫書的插畫應該天真可愛的說法,沒有任何依據(jù)……我們應該慎選內(nèi)容及表現(xiàn)手法恰當?shù)膱D畫書。
自稱是世界名著的圖畫書,都是簡明版,是模仿原著的贗品。希望父母為孩子選圖畫書時,能夠先剔除這類由世界名著改編而成的圖畫書。
小貼士:
本書的附錄中,按照“歡迎來到圖畫書的世界”“培養(yǎng)語言能力的圖畫書”“感受親子溫情的圖畫書”“給孩子生存力的圖畫書”等類別,向我們推薦了松居直先生喜歡的50本圖畫書。按照這個書單去購買圖畫書,相信您一定不會失望。
著者簡介:
松居直,1926年生于京都,于1956年創(chuàng)辦日本第一本圖畫書月刊《兒童之友》,發(fā)掘了赤羽末吉、長新太、神澤利子等世界級的圖畫書作家,對日本圖畫書的發(fā)展起到了重要作用,被稱為“日本圖畫書之父”。現(xiàn)為福音館書店顧問、日本出版學會會員、日本國際兒童讀物聯(lián)盟(JBBY)理事、聯(lián)合國教科文組織亞洲文化中心評議員、中日兒童文學美術(shù)交流中心副會長。著有《桃太郎》(獲日本產(chǎn)經(jīng)兒童出版文化獎)、《木匠和鬼六》等多種圖畫書,出版了《我的圖畫書論》《看圖畫書的眼睛》《繪本之力》等理論著作。
譯者簡介:
關(guān)鍵詞:圖書館 統(tǒng)計分析 借閱量
中圖分類號:G255 文獻標識碼:A 文章編號:1672-3791(2017)01(c)-0195-04
Abstract: The statistics of library is an important part of library work, it could improve the scientific management level by finding problems and taking measures to the problems from the statistical analysis. Through the statistical analysis of books daily borrowing and readers into the library in 2015 of China University of Political Science and Law Library, this paper analyzes in depth the objective phenomenon of utilization of university libraries of different type readers. The data shows that the library resources construction needs to pay attention to the readers’ actual demand, and provides some valuable suggestions for the construction of library resources, it is also one of the main basis for library work’s decision and evaluation.
Key Words: Library;Statistical analysis;Borrowing amount
1 圖書館利用統(tǒng)計的意義
圖書館是人才培養(yǎng)和知識傳播的重要場所。讀者根據(jù)需要走進圖書館進行學習,以便在生活、學習、工作中表現(xiàn)出更高的知識素養(yǎng)、學習和工作能力[1]。圖書館利用統(tǒng)計是了解圖書館利用與讀者需求之間關(guān)系的一種方法,通過統(tǒng)計圖書的日常借閱和讀者入館情況,掌握讀者對圖書的需求,從客觀的角度反映圖書館的服務水平[2]。
2 統(tǒng)計的目的、內(nèi)容與方法
2.1 統(tǒng)計的目的
圖書館利用是衡量圖書館館藏和服務質(zhì)量的重要指標,通過借閱統(tǒng)計與讀者入館次數(shù)統(tǒng)計了解讀者閱讀傾向與習慣,掌握讀者對圖書的需求。通過統(tǒng)計還能加強圖書館硬件與藏書建設(shè),制定科學合理的藏書規(guī)劃,從而對完善圖書館整體建設(shè)提供依據(jù)??傊?,圖書館統(tǒng)計對館藏質(zhì)量和讀者服務水平的提高具有重要的意義[3]。
2.2 統(tǒng)計的方法與內(nèi)容
統(tǒng)計的具體內(nèi)容是對館藏的圖書借閱數(shù)據(jù)與讀者的入館次數(shù)進行統(tǒng)計,一般統(tǒng)計時間為1年,以讀者借閱與入館情況為統(tǒng)計樣本[3]。借閱情況統(tǒng)計可以借鑒《中國圖書館圖書分類法》。統(tǒng)計的方法是對讀者每日的借閱數(shù)據(jù)與入館次數(shù)情況進行統(tǒng)計、匯總與分析,進而掌握圖書館的年度利用情況。
3 實例分析
通過進行實例分析,能夠了解并掌握閱讀者對館藏圖書的需求,根據(jù)讀者的需求,合理調(diào)整館內(nèi)資源建設(shè),使圖書館的建設(shè)更加合理化,同時提高讀者的綜合素質(zhì),進一步做好服務育人[4]。以中國政法大學圖書館為例進行分析。
3.1 圖書借閱量與讀者傾向分析
從表1得知,該館各學科圖書的借閱情況相差懸殊,借閱量最大的是政治法律類書籍占51.88%,其次是文學類、經(jīng)濟類、哲學類、歷史地理類,這五類圖書占85.97%。流通量最小的有綜合性圖書、天文學科類、生物科學類、農(nóng)業(yè)科學類、交通運輸類及航空航天類圖書,其流通量占0.20%。在館藏圖書全年流通量中,社會科學圖書的流通量占88.13%,自然科學類占1.64%,綜合性圖書類占0.08%。社會科學類圖書的流通量最高,這說明了我館讀者借閱需求偏重于社科類圖書,這也與我校專業(yè)設(shè)置與資源分配相吻合。
3.2 各類讀者借閱情況分析
該館讀者主要由學生、教職工和其他讀者(包括館際互借讀者、擔保生等)構(gòu)成。學生讀者又分為本科生、碩士生和博士生。從圖1中可以看出借閱量最大的是本科生,但圖2表明其人均借書量排在第三位,并未因其借閱量大而提高人均借閱量,這是因為本科生的借閱量雖大,但其人數(shù)也最多,所以本科生的人均借閱量并未達到最高,恰恰是比重最少的博士生取得了最高的人均借閱量,碩士生次之。這恰恰反映高校的現(xiàn)狀,就是要求培養(yǎng)高素質(zhì)高水平人才,對研究生的畢業(yè)要求在逐年增長,尤其是博士生的更為明顯,所以研究生的人均借閱量較高。其他類型讀者的借閱量比例雖小,但這也彰顯了一個好的發(fā)展趨勢,說明讀者正在向多元化發(fā)展。
關(guān)鍵詞:大一新生 圖書借閱 問題 對策
圖書館是一所大學最重要的書籍資料集藏地,是大學生四年學習生涯中除了教室之外最重要的學習場所。大學生學會科學、合理地借閱圖書,對其學習、成長無疑具有十分重要的意義。但在實際當中,許多大學生尤其是大一新生在圖書借閱過程中存在不同程度的問題,值得師生們思考。
一、大一新生圖書借閱存在問題
由于剛剛脫離高中繁重的學業(yè),步入大學校園,大一的同學往往缺乏圖書借閱方面的知識。
1.閱讀書目較盲目
閱讀書目是針對各專業(yè)特點而為學生設(shè)計和推薦閱讀的書目清單,包括專業(yè)類、人文類和綜合類書籍。大學的文、理、工、農(nóng)、經(jīng)、管、藝等各專業(yè)課程設(shè)置存在很大差異,其參閱書目亦各有側(cè)重。
大一新生由于剛從高三繁重的學習中解脫出來,普遍存在一種上大學后放松的心態(tài),因此在閱讀書目的選擇上存在偏差,往往喜愛借閱小說、休閑雜志、通俗讀物等,而不愿意借閱本專業(yè)的入門類書籍及拓寬學習視野的綜合類書籍。
2.索書、找書有困難
高校圖書館的藏書一般都有幾十萬至上百萬冊,按照《中國圖書館分類法》進行分類上架;每一個書架上的藏書又是按照從小號到大號,以“Z”型順序排放。
大一新生在高中時并未接觸過相關(guān)知識,進入大學后在索引和尋取圖書時容易出現(xiàn)不知道圖書分類法的含義、不知道如何尋找圖書等情況,給他們的圖書借閱帶來一定的困擾。
3.借閱規(guī)則不熟悉
圖書館一般都對圖書流通有詳細地規(guī)定,如讀者借閱等級、借閱權(quán)限,圖書借閱期限、圖書續(xù)借、超期罰款,圖書證辦理、注銷及延期等情況。
大一新生由于不熟悉借閱規(guī)則,往往會產(chǎn)生一些超期欠費、證件遺失未及時掛失,甚至圖書被冒名借閱等麻煩。
4.借閱習慣未養(yǎng)成
一些大一新生沒有養(yǎng)成良好的借閱習慣,例如:閱讀了圖書之后就將其遺留在自習室座位上,而不愿順手將其放到圖書流轉(zhuǎn)架,從而增加了圖書館工作人員的工作量;部分讀者不愛惜圖書,將圖書隨意折疊、污損;書籍借閱之后不能按期歸還導致超期;不懂得在網(wǎng)上或者手機上進行續(xù)借操作;借還書時不懂得將書籍碼放整齊以方便圖書館老師掃描圖書條形碼。
二、原因分析
產(chǎn)生上述情況的原因,主要有以下幾點:
1.系部無暇顧及
新生報到之后就是緊張的軍訓,接著便是正式上課,大一年級各種各樣的事務非常多,因此各教學系部的精力都集中在這些工作上,對于新生入館知識培訓、入館教育等方面根本就無暇顧及。
2.入館教育工作不到位
按照相關(guān)規(guī)定,大一新生入學后應當接受圖書館利用方法的教育。但是由于多方面原因,新生的入館教育往往由圖書館老師在會堂里做一個講座,學生也是愛聽不聽,導致講座起不到什么實際效果。入館教育工作不到位,流于形式,走走過場。
3. 學生自己不重視
大一新生往往認為,入館教育就是簡單的借還圖書,一看就會,并沒有什么知識可學的,參加入館教育講座時很多同學壓根就沒聽,光顧低頭玩手機。甚至從來不登陸圖書館網(wǎng)站,不閱讀圖書館相關(guān)規(guī)章制度。
三、對策探討
針對上述問題,我們可以從多個方面加以改進及提高。
1.加強大一新生的入館教育
入館教育是大一新生入學教育的重要部分,是其了解、認識并學會利用圖書館的開始。做好了入館教育,能幫助大一新生有效地掌握圖書館的資源利用方法,如同交給了他們一把開啟知識寶庫的金鑰匙。
高校分管領(lǐng)導、各院系領(lǐng)導、圖書館領(lǐng)導要高度重視入館教育工作,把入館教育納入新生必修課。通過組織新生實地參觀,開設(shè)講座,利用校園網(wǎng)、宣傳欄、《讀者手冊》等途徑,切實做好做扎實新生入館教育。
2.借助新興媒體提高工作效率
現(xiàn)在的大學生都是95后,他們成長在信息時代,對新興媒體的接觸和掌握能力較強。因此,我們完全可以充分利用微信、微博、人人網(wǎng)、百度貼吧等新興媒體手段,將圖書館的借閱規(guī)則、借閱流程、索書細則、新書推介等內(nèi)容在其上,以95后喜聞樂見的形式開展工作,并與讀者進行交流互動,從而提高工作效率。
3.培養(yǎng)新生良好的借閱習慣
【關(guān)鍵詞】圖書室 管理 現(xiàn)狀
【中圖分類號】G 【文獻標識碼】A
【文章編號】0450-9889(2017)01A-0011-02
一、學校圖書館(室)的作用
中小學圖書館(室)建設(shè)是學?;窘ㄔO(shè)之一,是學校教育教學的重要組成部分,是學校領(lǐng)導不斷提高管理水平,教師不斷更新知識、提高育人藝術(shù)和教學教研能力,以及培養(yǎng)學生收集與處理信息的能力、促進學生全面發(fā)展的有力助手。圖書館(室)是學校的文獻信息中心,是為學校教育、教學和科研服務的機構(gòu),圖書館(室)的建設(shè)水平在一定程度上體現(xiàn)了學校的辦學水平。根據(jù)《廣西中小學圖書館(室)建設(shè)工作實施意見(試行)》中的說明,也可以看出圖書館(室)建設(shè)與管理是學校的重要工作之一,更是學生獲取知識不可缺少的地方。對于農(nóng)村小學來說,學校的圖書室更是活躍學生第二課堂的主要場所。
語文課程標準提出,要讓學生“認識中華文化的豐厚博大,吸收民族文化智慧”,其中明確要求學生在九年義務教育階段課外閱讀量達到400萬字以上,一到六年級學生背誦古今優(yōu)秀詩文160篇(段),由此看出新課標對學生課外閱讀的重視程度。作為一名語文老師,同時也是一名圖書室管理人員,筆者深感課外閱讀對于學生的重要性。一般來說,凡是課外閱讀量大的學生,知識積累比較豐厚,做閱讀題、完成習作對他們而言不算太難,而受經(jīng)濟條件所限,農(nóng)村地區(qū)小學生的課外閱讀主要在學校的圖書室完成。
二、目前農(nóng)村小學圖書室的發(fā)展現(xiàn)狀
近幾年來,隨著國家對各地中小學基礎(chǔ)建設(shè)的重視和支持,許多中小學圖書室建設(shè)取得了較大的進步,圖書室由無到有,藏書有少到多。但由于各地的辦學條件限制,目前許多農(nóng)村中小學校的圖書室均由一間兩至三開間的教室改建而成,存在館舍面積不達標的問題,使圖書室仍為一個圖書儲存間,沒辦法開架借閱;同時,圖書室內(nèi)大多是經(jīng)年累積的舊圖書,或由上級下拔,或由校外贈送,或由校內(nèi)老師、學生自主捐贈,藏書量根本沒辦法達到基礎(chǔ)建設(shè)的要求,有些學校就算達到了生均本數(shù)的要求,但從學生的閱讀需求來說,可讀圖書仍大為不足;另外,大部分學校圖書室采用一些舊制木架或各種不規(guī)范的改制鐵架存放圖書,配套設(shè)施較為簡陋,沒有達到通風防霉條件,圖書易損壞,添置的新書沒過一陣子就會出現(xiàn)掉頁的現(xiàn)象。許多學校沒有正規(guī)的圖書管理老師,而是由一些即將退休的老教師或是任課老師充當,出現(xiàn)管理人員圖書管理能力偏低和管理工作不規(guī)范等問題,大大制約了學校圖書室的發(fā)展,也讓學生對閱讀課外書興趣不大,使圖書室的功能沒能最大程度地發(fā)揮出來。
三、建立規(guī)范化的圖書室管理辦法
為了最大限度地發(fā)揮圖書室的功能和作用,學校需建立一套規(guī)范化的圖書室管理辦法。根據(jù)農(nóng)村小學的辦學實際,可以從以下方面著手。
(一)創(chuàng)造條件設(shè)置圖書室
首先,學校應創(chuàng)設(shè)條件,按照要求在校內(nèi)開設(shè)圖書室或閱覽室,盡量選擇通風采光好的場所,書架以對向通透的架子為宜。除此之外,為便于管理,圖書室管理也應逐步向管理電子化發(fā)展,如配備電腦和條形碼掃描器、使用圖書管理系統(tǒng)軟件等,有條件的也可以考慮進行自助化借閱,如自動借閱。
(二)規(guī)范圖書管理
圖書室中,林林總總的書籍很多,要想提高圖書的利用率,發(fā)揮圖書室在學校教學中的作用,首先就要建立規(guī)范化的圖書室管理方法,如建立圖書室管理制度、圖書借閱制度、圖書室管理員守則等,進一步規(guī)范圖書室的基礎(chǔ)管理工作。只有實施規(guī)范化的管理方法,才能保證圖書室業(yè)務工作和管理的科學化。
1.建立規(guī)范的圖書分類及科學的目錄檢索
為規(guī)范管理,學校圖書室的圖書應當按《中國圖書館圖書分類法》進行分類,可以將圖書分為22個大類。當然,讓所有兼職的圖書室管理老師去系統(tǒng)學習圖書的分類方法是不現(xiàn)實的,目前最省事的辦法就是參照圖書在版編目(CIP)數(shù)據(jù)中的Ⅳ.項進行分類,這個是圖書在出版前出版社就已經(jīng)根據(jù)分類方法進行的分類。假如圖書上沒有在版編目數(shù)據(jù)項,可以簡單地將其分至大類。經(jīng)過分類處理的圖書,已經(jīng)基本能滿足圖書索引的需要。另外,應該將圖書室內(nèi)所有圖書的基本信息錄入電腦,一方面能提升工作效率,也便于打印或下發(fā)到班級中作為檢索目錄;另一方面也為開展電子借閱提供了基礎(chǔ)信息支持。
2.多樣化借閱方式提高圖書的借閱率
圖書只有到了讀者手上,才能最大限度地發(fā)揮作用。目前我校的圖書借閱工作仍使用簡單的手工借閱(即借出或歸還圖書使用手工記錄的方式),主要有憑證借閱、教師代辦借閱兩種形式。
憑證借閱,就是圖書室給每位學生辦理借書證,學生根據(jù)自己所辦的借書證,在自己班級規(guī)定的借閱時段到圖書室自主借書;借書后,由學生將所借圖書信息填寫到借書證上,交由圖書管理員核對后即可。借書完成后,學生的借書證統(tǒng)一由圖書室按班級保管,待到下次還書后歸還給學生,再進行下一次的借閱。根據(jù)學生的自主閱讀能力,目前我校圖書室實行的是三至六年級學生憑證借閱。教師代辦借閱,就是教師根據(jù)自己的教學需求,要求學生集體閱讀一些專題資料時,可由任課老師憑自己的借閱證到圖書館代辦借閱,借閱的圖書由代辦老師發(fā)放給學生并回收歸還圖書室,借閱過程中的相關(guān)事宜均由代辦老師統(tǒng)一管理和負責。教師代辦借閱主要面向低年級的學生。
總的來說,憑證借閱是由學生自主進行圖書選擇與借閱,每個班級中學生的興趣愛好不盡相同,這樣的方式可以讓他們喜歡讀哪一類圖書就借哪一類書籍,最大限度地滿足學生的借閱需求,保證了學生的閱讀興趣。只是這樣的借閱方式要對學生進行圖書分類的指導,另外還要由熟悉藏書的老師或?qū)W生進行有針對性的推薦,不然學生就會找不到想看的圖書,或是浪費太多時間去尋找書籍。相比前一種方式,教師代辦借閱就更省事、更省時間,只需要任課老師到圖書室統(tǒng)一借閱、統(tǒng)一登記即可。這種方式之所以面向低年級的學生,主要因為小學低年級的學生識字量較少,不知道挑哪一本書去閱讀,有的個子小的學生甚至還夠不到上層的書架,所以由任課老師代辦借閱。同時,根據(jù)學生的心理特點和學習特點,這一年齡段的學生仍需要管理員給他們推薦一些插畫式的注音讀物。
3.圖書的常規(guī)管理
(1)圖書入庫和登記制度。無論是學校統(tǒng)一采購還是上部門下?lián)艿膱D書,在新書入庫前,都要進行拆包點數(shù),一方面要核對到庫圖書的數(shù)量與價格,方便進行學校資產(chǎn)登記;另一方面也可以為圖書基礎(chǔ)信息錄入工作做準備。當拆包點數(shù)工作完成后,就要進行圖書分類整理,接著進行信息錄入。圖書在上架前還要加蓋館藏章及圖書室流水章,這樣既明確了圖書的歸屬,又便于核對館藏圖書的數(shù)量。圖書也是學校資產(chǎn)的一個大項,藏書量多少也體現(xiàn)了學校文化資產(chǎn)的多少,而且在學校基礎(chǔ)信息年報里通常也需要填報該項目。此外,掌握各類在館圖書的數(shù)量,更方便有針對性地選購新書。從方便管理員對圖書進行上架或索引的角度出發(fā),接著要做的工作就是給圖書貼標簽,標簽上通常手寫或打印圖書的分類號及四角編碼或大類順序號。目前我校圖書標簽上貼的是分類號及大類順序號,采用貼側(cè)簽與背簽兩種貼標方式。以上圖書上架前的準備工作完成后,新書就可以正式上架進行借閱了。
(2)舊書維護與賠償制度。由于部分學生對書籍的保護意識不強,平時所借閱的圖書會經(jīng)常出現(xiàn)破損或者脫頁的情況,在日常借閱工作中,可以由管理員對讀者所借圖書進行初步的檢查,如有損壞的,可以安排人員進行修補;如果出現(xiàn)一些損壞特別嚴重的圖書,已經(jīng)影響到后期的借閱,則應該上報登記并作為缺失處理。同時,對于損壞、丟失圖書的教師或?qū)W生,要根據(jù)《圖書維護與賠償制度》的相關(guān)規(guī)定進行賠償處理,以此提高師生的愛書意識。
(三)建立圖書管理員責任制度
1.專職負責人。圖書管理是專業(yè)性、技術(shù)性和創(chuàng)造性都很強的工作,復雜而繁瑣,管理者一定要有良好的職業(yè)道德,具有高度認真負責的工作作風,熱愛圖書管理,不斷提高管理水平。
2.其他管理員。多數(shù)農(nóng)村小學沒有專職的圖書管理員,管理老師還要兼任教學工作,除了不能保證時刻都在圖書室,還肩負著非常大的工作量。我校根據(jù)實際情況,從三至六年級每班選出一至兩名學生作為學校圖書管理員,承擔每天課余時間開放圖書室的管理工作,負責借書班級的借還書以及圖書室的日常管理工作。此外,還在各班另外安排班級圖書管理員,由班級管理員到圖書室借出圖書,發(fā)給班上所需的學生閱讀,并做好相關(guān)記錄。班級圖書管理員還可以組織大家在班上進行交換閱讀,待全班學生閱讀完后,再將書收還圖書室,這樣不僅很大程度分擔了老師的工作,也培養(yǎng)了學生的管理能力,提高了學生對圖書的保護意識。工作出色的圖書管理員,還會在期末受到獎勵及表彰。無論是管理老師,還是學生圖書管理員,都要熟悉圖書的藏書分類歸檔情況、借閱的工作流程及方法。
3.衛(wèi)生工作。圖書室的衛(wèi)生一定要按時打掃,一天兩次以上,門窗、書架、桌椅等要經(jīng)常用毛巾擦洗,桌椅擺放要整齊、規(guī)范,使人一見就覺得十分舒服,也就是說圖書室一定要經(jīng)常保持干凈、清潔,良好的衛(wèi)生環(huán)境才能讓師生們在圖書室安心借書、讀書。
【關(guān)鍵詞】開架借閱管理措施
開架借閱是圖書館發(fā)展的必然趨勢,是“以人為本”的理念在圖書館服務工作中的具體實踐,是現(xiàn)代化的管理手段、面對面的服務方式,為廣大讀者提供了最大的方便和最有效的借閱方式,同時提高了文獻的流通率和利用率。但也存在一些如亂架、丟失、污損等問題,不利于館藏文獻的保護,本文就這些問題進行探討
一、圖書開架借閱的優(yōu)勢
1.1提高館內(nèi)藏書利用率,降低讀者拒借率。
開架借閱能使讀者博覽群書,開擴視野,激發(fā)了讀者的閱讀興趣和求知欲望,,一些不易被讀者發(fā)現(xiàn)的呆滯書也得到充分利用,使館藏文獻的利用率大大提高。擴大了讀者檢索、選擇的范圍,讀者找不到急需的書時,還可用相關(guān)的書代替減少了拒借率,提高了圖書的流通。
1.2可以節(jié)省讀者時間。
圖書開架借閱省去了讀者檢索目錄、填寫索書單、排長隊等待工作人員到書庫取書的時間,縮短了獲取圖書的過程,極大方便了時間緊迫的讀者,受到讀者歡迎。
1.3減少館員勞動強度和無效勞動,提高工作效率。
開架借閱圖書,工作人員從繁忙的人工借閱工作中解脫出來。而把更多的精力投入到服務讀者、介紹館藏、解答咨詢、維護借閱秩序、修補圖書等有效勞動中。讓讀者高興而來,滿意而歸。
二、開架借閱的弊端
開架借閱給讀者帶來了很多方便,但并非盡善盡美,由于不同的讀者有不同的道德修養(yǎng),圖書館內(nèi)部的管理制度客觀因素,給開架管理帶來一定的妨害與困擾。
2.1圖書錯架、亂架現(xiàn)象嚴重。
讀者在選書過程中存在盲目性和隨意性。有些讀者,不了解圖書開架的方法和制度,不懂得圖書的分類方法和架位上圖書的嚴密有序性和科學性。選書中出于好奇心,無目標地東翻翻西看看,盲目地亂取亂放。在找書過程中從書架上抽出來便翻閱,發(fā)現(xiàn)不適合自己閱讀隨意放到空架上。
另外還有些讀者由于受借閱量的限制,將自己喜愛而本次無法借出的圖書私自放置到不引人注意的地方,以防別人借出,影響圖書的正常借閱。大多數(shù)讀者忽視代書板的作用,到借閱處后雖然憑借閱證換取了代書板,但不去使用它。
2.2圖書破損、開“天窗”時有發(fā)生。
一是自然因素。開架借閱流通量較大,圖書頻繁地下架、歸架,對圖書的丟皮、掉頁、索書號和條形碼的自然磨損就相應增加,圖書在流通過程中由新到舊,由完整到破損,這是屬于正常的不可避免的現(xiàn)象。二是人為因素。開架借閱眾多讀者可以直接入庫自由挑選,抽取頻率大,破損率增高。個別讀者缺乏愛護圖書的意識,選書時毫無章法地亂翻、亂插、亂扔,甚至將一些自己喜歡的圖片或文字撕下來,造成“開天窗”的現(xiàn)象。
2.3故意損壞及偷盜圖書。
有的讀者入庫后趁工作人員不注意時,將圖書的防盜磁條偷偷摳下來,把書藏在衣內(nèi)通過監(jiān)測儀伺機偷出。由于丟失的圖書往往是價格高、較時尚、借閱率較高的圖書,也是很少再版和復本較少的圖書,有的甚至是珍貴的孤本書。這樣對館藏圖書資源造成很大損失。
三、解決問題的措施、方法
由于開架借閱中存在著許多問題,所以在圖書開架借閱管理中必須采用以下有效的強化措施,以確保開架借閱工作的順利開展。
3.1加強對讀者入館宣傳教育工作。
圖書館每年應對新生進行入館培訓及專題講座,向他們介紹本館的規(guī)章制度、借閱規(guī)則、藏書結(jié)構(gòu)、布局、特點等,以杜絕或最大限度減少開架借閱所出現(xiàn)的不文明、不道德現(xiàn)象的發(fā)生;同時要把愛書、護書、愛館的教育融入其中,使讀者理解愛護書刊不僅是館員的責任,也是讀者應盡的義務和起碼的道德修養(yǎng)。從而減少了亂架、污損、丟失等現(xiàn)象的發(fā)生。
3.2培養(yǎng)讀者規(guī)范使用代書板。
亂架是開架借閱中最大難題,而規(guī)范“代書板”制度,能有效地克服開架管理中這一最普遍、最棘手的難題。對亂放、亂扔圖書者耐心教育,使讀者逐漸養(yǎng)成規(guī)范使用代書板的習慣,培養(yǎng)他們正確使用代書板的自覺性。同時在架位上留出一定的空間,供讀者存放從書架中取出而又不借的圖書,從而使圖書錯架、亂架現(xiàn)象得到有效的控制。
3.3優(yōu)化館藏布局,建立平面圖,配備先進的管理設(shè)備。
高校圖書館可根據(jù)讀者需求設(shè)立專門書架(如新書架、熱門書架等)特色書架(如就業(yè)指導、考試輔導類等)同時在書庫入口處設(shè)置詳細的標識平面圖,標明各類圖書的分布情況,在書架上標明詳細架標,使讀者一目了然,減少盲目性。這樣既方便了讀者,也減少了亂架損書等現(xiàn)象的發(fā)生。在書庫進出口處安裝防盜檢測儀,對竊書者起到威懾作用。建立完善的查詢系統(tǒng),使讀者隨時在校園網(wǎng)查詢所需資料。配備先進的復印設(shè)備,將讀者喜愛某些書刊中的內(nèi)容或圖片及時復印,減少撕毀和丟失現(xiàn)象。
3.4提高館員政治素質(zhì)、業(yè)務水平,強化責任心,實行崗位責任制。
高校圖書館工作人員必須具有較高的業(yè)務水平、淵博的知識和愛崗敬業(yè)、無私奉獻的精神。能主動對讀者進行指導,解決他們的疑難問題,隨時糾正讀者的違章行為,減少書庫的亂架現(xiàn)象。要求做到三勤,即“眼勤、口勤、手勤”。要利用一切時間,尤其是讀者較少的時間進行整架、順架、歸架。嚴格實行崗位責任制,做到責任到人、分工明確、定期檢查、獎罰分明,充分調(diào)動館員積極性。
開架借閱是圖書館傳統(tǒng)管理的一項重大突破,給圖書館帶來了新的活力和生機,是圖書館以人為本的服務方向,然而科學地管理開架書庫,不斷掌握開架借閱的規(guī)律,研究開架服務中讀者的心理和活動規(guī)律,正確協(xié)調(diào)讀者與圖書、書庫關(guān)系任重而道遠。今后,圖書館還要從多方面努力,繼續(xù)提供更優(yōu)質(zhì)的服務,以適應現(xiàn)代不斷提高的讀者需求。
參考文獻:
1熊燕,談高校圖書館開架借閱中存在的問題及管理措施大慶師范學院,2005,04
2李小平,高校,圖書館,圖書的開架借閱利弊談,四川畜牧獸醫(yī)學院學報,20015
3鐘良健如何做好高校圖書館開架借閱的管理,科學教育家2008,8
關(guān)鍵詞: 決策樹; 分類; 圖書館; Clementine; 借閱權(quán)限
中圖分類號:TP391 文獻標志碼:A 文章編號:1006-8228(2014)04-30-04
Abstract: The factors influencing readers' borrowing amount are analyzed and different readers' borrowing demand are determined. The differential borrowing authority and service are customized. A decision tree classification model of reader borrowing frequency is built with C5.0 in mining tool of SPSS Clementine. The decision tree classifies readers into three groups: activing readers, common readers and silent readers. The mined data come from reader borrowing records of the library of university of international relations. The results show readers' identity, major, grade and gender have an important effect on borrowing amount. The borrowing demand of junior students is great, while that of senior students is small. The library readers may be classified by refering to decision tree classification to provide theoretical evident for adjusting borrowing authority.
Key words: decision tree; classification; library; Clementine; borrowing authority
0 引言
數(shù)據(jù)挖掘能從大量數(shù)據(jù)中發(fā)現(xiàn)有用的知識,目前己成功應用于各個領(lǐng)域。圖書館系統(tǒng)積累了大量讀者數(shù)據(jù),研究如何將數(shù)據(jù)挖掘有效地用于圖書館[1-4],變數(shù)據(jù)為知識,從而更好地為讀者服務,是數(shù)據(jù)挖掘和圖書館工作者的共同責任。
決策樹分類是數(shù)據(jù)挖掘中的一種重要方法,該方法通過對已有數(shù)據(jù)的學習,識別影響對象分類的若干因素,構(gòu)建一個決策樹分類模型,對對象進行分類。文獻[5-6]為決策樹在圖書館讀者借閱數(shù)據(jù)中的應用實例,其中文獻[5]利用C4.5算法,對306條讀者借閱記錄進行了分類建模,利用學歷、專業(yè)和年級三個屬性,構(gòu)建借閱次數(shù)(高/中/低)分級模型,得出的結(jié)論為:學歷是第一決定因素,其次是專業(yè)和年級,研究生和大四學生借閱量低等。筆者認為文獻[5]挖掘的數(shù)據(jù)量過小,不具有足夠的說服力,且借閱次數(shù)分級采取主觀劃分的方法,缺乏依據(jù)。文獻[6]利用ID3算法,對1969條研究生的借閱記錄進行了分類建模,利用讀者是否為新生、是否為工程類學生、性別和距離圖書館的遠近等屬性,構(gòu)建決策樹模型,得出的結(jié)論為:讀者是否為新生為第一決定因素,其次為是否工程類、距離遠近和性別,一年級新生離圖書館近的、高年級工科學生為活躍讀者等。筆者認為文獻[6]的數(shù)據(jù)只覆蓋研究生讀者,樣本不全,且模型僅從訓練數(shù)據(jù)構(gòu)建,沒有測試數(shù)據(jù)測試,使模型的普適性受到懷疑。另外,文獻[5-6]沒有對具體所用挖掘工具的介紹。
針對上述研究背景,本文使用SPSS Clementine軟件,采用基于C5.0的決策樹分類算法,對國關(guān)圖書館的4366條讀者借閱記錄進行建模。建模過程綜合考慮讀者身份、專業(yè)、年級、性別、民族和索書號等因素,構(gòu)建讀者借閱頻度決策樹分類模型,分析影響讀者借閱量的主要因素,給出針對不同讀者群的借閱權(quán)限分配和服務建議。作為數(shù)據(jù)挖掘在圖書館的進一步應用探索,本文一方面可為國際關(guān)系學院圖書館開展實際業(yè)務工作提供幫助;另一方面可為其他高校圖書館開展挖掘?qū)嵺`,提供方法和過程指導。
1 需求分析及技術(shù)思路
1.1 需求分析
國際關(guān)系學院圖書館藏書37萬余冊,服務對象為全校師生員工、家屬、成人教育學員、國際大學預科項目PCP學員(Pre-College Program)等。服務的部門涵蓋法律系、公共管理系(簡稱公管)、國際經(jīng)濟系(簡稱國經(jīng))、國際政治系(簡稱國政)、日語法語系(簡稱日法)、文化與傳播系(簡稱文傳)、信息科技系(簡稱信科)、英語系共八個系。
長期以來,國關(guān)圖書館對于讀者權(quán)限的設(shè)定按本科生、研究生和教工劃分,見表1。這種劃分一是沒有結(jié)合讀者的實際借閱需求,可能造成借閱需求量大的讀者權(quán)限不足,借閱需求量小的讀者權(quán)限過剩;二是劃分不夠細化,沒有考慮到讀者年級、專業(yè)、性別、成績等因素對借閱量的影響。依據(jù)讀者的現(xiàn)實個性化需求來確定借閱權(quán)限,已成為目前高校圖書館借閱權(quán)限改革的方向[7],問題在于:影響用戶借閱量的因素有哪些,哪些是主要因素,如何確定這些因素,如何根據(jù)這些因素定制差異化權(quán)限和服務。本文針對這些問題展開討論。
1.2 技術(shù)思路
本文收集國關(guān)圖書館的借閱數(shù)據(jù),通過對歷史數(shù)據(jù)的挖掘和分析找出影響讀者借閱需求的若干因素,依靠這些因素進行借閱權(quán)限細分。具體地,本文借助于SPSS Clementine工具中的決策樹挖掘方法對數(shù)據(jù)進行分析,借助于挖掘得到的決策樹識別影響讀者借閱量的主要因素,對借閱量按借閱頻度進行分級,并構(gòu)建一個判定用戶借閱頻度的決策樹分類模型,然后基于決策樹分類模型,給出針對國關(guān)圖書館讀者的借閱權(quán)限建議。具體技術(shù)思路如圖1所示。
2 具體的實現(xiàn)方案
2.1 數(shù)據(jù)源
數(shù)據(jù)源于國關(guān)圖書館金盤系統(tǒng)Oracle數(shù)據(jù)庫,主要涉及原始數(shù)據(jù)庫三個表:、、。其中流通日志表記錄讀者每次到館的一項事務。筆者利用這三張表進行連接,從流通日志表抽取2009-2010完整一學年的數(shù)據(jù),抽取后的數(shù)據(jù)存儲在Excel表中,命名為 (格式見表2),該表共包含記錄109609條,字段8個。其中操作類型為事務類型,如J:借書/H:還書/S:賠書等;讀者級別為讀者身份,如本科生、研究生、信科教職工等;源單位具體到班級,如:信科0601/國經(jīng)0702/國政研二等。
2.2 數(shù)據(jù)預處理
⑴ 數(shù)據(jù)篩選
取出流通事務記錄表中操作類型為“J”(借書)的全部記錄。
⑵ 分組計數(shù)
取出的記錄集按讀者條碼分組,統(tǒng)計每個讀者出現(xiàn)的次數(shù),將此數(shù)值記為讀者在一學年中的“借書數(shù)”。將此屬性添加到中具有相同讀者條碼的記錄中。未在流通事務記錄表中出現(xiàn)的讀者條碼的借書數(shù)記為0。
⑶ 空缺值的處理
一些記錄在“單位”字段上取值為空,用“資料不全”填充空缺值。
⑷ “借書數(shù)”區(qū)間化
對“借書數(shù)”這一數(shù)值屬性,在建模前對其區(qū)間化,把它劃分為幾個等級來描述讀者的借閱頻度,并讓其作為輸出屬性,為讀者建立分類決策樹。該字段原先的數(shù)值分布如圖2所示。在4366個讀者中,一年中讀者借書數(shù)最多的為174本,平均約12本,最少的為0本(約占50%,即一般讀者該年沒有借過書)。借過書的讀者按照其累計借書量的增加,人數(shù)基本呈遞減模式。
對“借書數(shù)”區(qū)間化時,先將沒借過書的讀者單分一個區(qū)間,即借書數(shù)等于0,記為“Null”。其余讀者盡量按照等頻,即相等人數(shù)的原則,分為高(high)、低(Low)兩個區(qū)間,經(jīng)過統(tǒng)計分析,發(fā)現(xiàn)“17”為較好的分界點,區(qū)間劃分規(guī)則為:0
為記錄區(qū)間化后的借閱頻度,為讀者庫表添加列“借閱頻度”,來儲存每位讀者的年借閱量,處理后的借閱頻度屬性不同區(qū)間的樣本數(shù)量分布為:
Null:2187;Low:1103;High:1076;總計:4366。
⑸ 其他字段的概化
“讀者級別”字段中,教職人員具體到各系和各行政部門,將該字段統(tǒng)一歸為“教職工”?!霸磫挝弧弊侄沃校瑢W生的單位具體到班級,將其概化到年級。將“索書號”字段概化為索書號頭一位。
將預處理后的數(shù)據(jù)導入到Microsoft Access數(shù)據(jù)庫中,表名命名為,它共包含國關(guān)4366名讀者09-10學年的借書統(tǒng)計數(shù)據(jù),見表3。
2.3 模型構(gòu)建
利用數(shù)據(jù)挖掘工具SPSS Clementine(版本11.1)中的C5.0建模節(jié)點構(gòu)建決策樹模型。將預處理后的Access數(shù)據(jù)庫表文件作為數(shù)據(jù)源節(jié)點,先后連接工具中的“選擇節(jié)點”、“抽樣節(jié)點”和“C5.0節(jié)點”,形成如圖3所示的讀者借閱頻度挖掘訓練流程圖。
將得到的分類模型加入到流程取代“借閱頻度類別”建模節(jié)點,鏈接相關(guān)輸出節(jié)點,檢驗訓練樣本的自檢正確率。之后再用原樣本剩下的30%做測試,具體流程如圖7所示。其中測試路徑抽樣節(jié)點的配置跟圖6基本相同,除了將單選按鈕“包含”改為“丟棄。
執(zhí)行圖7流程,得到模型測試結(jié)果,其中訓練樣本上的測試正確率為69.1%,測試樣本上的正確率為67.2%。
模型分類結(jié)果與測試樣本的對比矩陣見表4。該矩陣記錄了得到的決策樹模型對不同屬性取值的分類結(jié)果和所占總樣本的比例等信息。例如表4,對于測試樣本中原來標注為“High”的記錄,決策樹準確地將其中的203條記錄歸類為“High”,占所有標為“High”的樣本數(shù)的60.237%,占總樣本數(shù)的16.009%。在所有被決策樹歸類為“High”的記錄中,正確歸類的這432條占其中的59.882%。
2.4 模型優(yōu)化
在創(chuàng)建決策樹過程中,訓練樣本可能存在噪聲和離群點,形成異常分支,異常分枝在訓練模型中表現(xiàn)好,但會對預測帶來不良影響。因此通常需對決策樹剪枝,使樹的復雜度降低,更易理解,預測分類時更快更好。
在SPSS Clementine中,C5.0模型通過“修剪嚴重性”指標控制對決策樹的修剪程度,取值為0到100,該指標值越小剪枝越少;值越大剪枝越多。為保證模型精度,并使構(gòu)建的決策樹簡單。筆者對“修剪嚴重性”指標進行了不同設(shè)置和反復測試,測試結(jié)果見表5。
從表5看出,當“修剪嚴重性”在50-85間變化時,測試樣本準確率和訓練樣本自檢率并沒有出現(xiàn)較大變化,而樹的復雜度降低了,深度從3變?yōu)?。為了在不增加決策樹深度的情況下保留較完整的決策樹信息,我們將“修剪嚴重性”值設(shè)為50,此時樹的深度為2。
最終生成的國關(guān)讀者借閱頻度決策樹分類模型如圖8所示。
集合A={法律(大三,研一/研二),公管大三,國經(jīng)(研一/研二),國政(大二/大三,研一/研二),日法(研一/研二),文傳(大一/大二/大三,研一/研二),信科(大一/大二/大三,研一/研二),英語(大一/大三/大四,研一/研二),應用化學研一}
集合B={法律(大一/大二/大四),公管(大一/大四),國經(jīng)(大一/大三/大四),國政(大一/大四),日法(大二/大三/大四),信科大四,英語大二,應用化學研二,家屬,成人教育}
集合C={公管大二,信科研三,應用化學研三,教職工,外教,PCP}
需說明的是,公管系在2009年至2010學年還沒有研究生,故相應信息未出現(xiàn)在決策樹分支集合中。除信科系外,其他系的研究生學制均為兩年,沒有研三。
2.5 模型分析和建議
模型的準確度還不夠高,這可能是由于源數(shù)據(jù)缺乏更多與“借閱頻度”相關(guān)的屬性,可繼續(xù)收集一些有關(guān)讀者學習成績(如GPA、年級排名)、距離圖書館遠近等信息來為建模服務。
從圖8中看出,所在單位(包括身份、專業(yè)和年級)對其借閱量影響較大,其次是“性別”。具體如下。
⑴ 借閱量高的讀者(活躍讀者群):文傳大四女生,集合A(特別是大三的學生)。約占總?cè)藬?shù)的25%。
⑵ 借閱量低的讀者(一般讀者群):國經(jīng)大二女生,日法大一女生,集合B;約占總?cè)藬?shù)的25%。
⑶ 無借閱的讀者(沉默讀者群):國經(jīng)大二、日法大一、文傳大四的男生,集合C。約占總?cè)藬?shù)的50%。
按身份分析,大致地,本科生大二、大三的借閱需求較大,大一新生和大四畢業(yè)班學生借閱需求較??;研究生文科的借閱需求較大,理科非畢業(yè)班的借閱需求大,理科畢業(yè)班研三的借閱需求小;教職工借閱需求小。尤其是理科研三學生和教職工在09-10學年的借閱量為0,這可能是由于理科研三寫論文所需要的文獻大多從電子數(shù)據(jù)庫中獲取,而國關(guān)教職工每人每年都有充足的購書經(jīng)費,使得他們更愿意自己購買圖書的方式獲取資料。
從上述分析結(jié)果看出,權(quán)限最低的本科生中很多群體借閱量高,而權(quán)限最高的教工的借閱量卻為0,這跟表1的權(quán)限分配相悖,說明了表1權(quán)限分配的不合理性。針對國關(guān)圖書館讀者的借閱權(quán)限分配,本文提出以下建議。
建議⑴:按決策樹分類模型劃分權(quán)限。模型中活躍讀者群,借閱冊數(shù)權(quán)限設(shè)為20;一般讀者群,借閱冊數(shù)權(quán)限設(shè)為10;沉默讀者群,借閱冊數(shù)權(quán)限設(shè)為5。權(quán)限劃分的關(guān)鍵在于模型的構(gòu)建和基于模型的讀者分類,具體數(shù)值可根據(jù)藏書量、讀者人數(shù)加以調(diào)整。
建議⑵:平均劃分權(quán)限。按教育部規(guī)定,高校圖書館的生均藏書量應達到80-100冊,按一個圖書館可經(jīng)常利用文獻量約為館藏總量的20%計[8],理論上的每生借閱權(quán)限應在16-20之間。國關(guān)人均藏書量約為85冊(37萬冊/4366人),因此理論上每人借閱權(quán)限應為20%×85冊=17冊,考慮到國關(guān)有約50%的人基本不到圖書館借書,理論上的借閱權(quán)限還有較大上調(diào)空間。保守計算,可將借閱冊數(shù)權(quán)限統(tǒng)一設(shè)為17,以最大程度體現(xiàn)“平等服務”和最大限度滿足讀者借閱量。
建議⑴重視讀者需求差異,有助于提高文獻利用率和讀者需求滿足率,但未考慮讀者對“平等借閱權(quán)”的訴求,然而相對于表1的權(quán)限設(shè)置更為合理和科學;建議⑵重視讀者借閱權(quán)的平等。
除借閱權(quán)限,圖書館還可針對不同讀者群提供針對,比如針對活躍讀者群,圖書館可讓其參與到圖書購買、圖書資源評價中,進行新書推薦,提供額外的培訓,以提高文獻資源利用率和最大限度滿足讀者需求。
3 結(jié)束語
圖書館的數(shù)據(jù)挖掘?qū)μ嵘龍D書館服務質(zhì)量,開發(fā)增值服務具有重要意義。本文從校圖書館的實際需求分析和數(shù)據(jù)出發(fā),采用SPSS Clementine中的C5.O決策樹算法,建立借閱頻度決策樹分類模型。建模結(jié)果顯示,決策樹模型可按借閱量對讀者有效分類,讀者身份、專業(yè)、年級和性別對借閱量有重要影響,本科大三學生借閱需求較大,大四學生借閱需求小。決策樹模型能夠幫助圖書館進行讀者細分、調(diào)整借閱權(quán)限和提供差異化服務。
進一步的研究可從兩個方面開展,一是收集更多年份、更多屬性的數(shù)據(jù),提高模型的準確率;二是以分析讀者的借閱時長為目標,建立讀者借閱時長分類模型,為圖書館針對不同讀者群制定不同借閱期限提供幫助。
參考文獻:
[1] 顧倩.數(shù)據(jù)挖掘應用于高校圖書館個性化服務的探討[J].圖書館雜志,2013.32(8):63-65
[2] 鄭斐,郭彥宏,郝俊勤,劉娜.數(shù)據(jù)挖掘技術(shù)如何在圖書館建設(shè)中體現(xiàn)價值[J].圖書情報工作,2013.S1:263-264,212
[3] 王偉.基于數(shù)據(jù)挖掘的圖書館用戶行為分析與偏好研究[J].情報科學,2012.30(3):391-394,418
[4] 馮研,王馨.國內(nèi)圖書館數(shù)據(jù)挖掘技術(shù)實踐應用進展分析[J].圖書館學研究,2011.20:2-4
[5] 吳修琴.決策樹分類技術(shù)在圖書館管理中的應用[J].農(nóng)業(yè)圖書情報學刊,2007.19(5):24-26,35
[6] 張金鐲.基于數(shù)據(jù)挖掘的圖書館活躍讀者研究[J].現(xiàn)代圖書情報技術(shù),2008.7:96-99
關(guān)鍵字:高校圖書館 紙質(zhì)圖書 利用 調(diào)查分析
圖書館作為高等院校的文獻信息、情報服務中心,也是為教學和科學研究服務的學術(shù)性機構(gòu),其發(fā)展狀況也直接影響到高校培養(yǎng)人才的質(zhì)量。目前高校圖書館的發(fā)展狀況不容樂觀。高校圖書館的紙質(zhì)利用率持續(xù)走低,紙質(zhì)文獻資源的發(fā)展面臨嚴峻挑戰(zhàn)。
在這種情況下,為了充分了解高校圖書館的紙質(zhì)圖書資源利用情況,并使紙質(zhì)圖書資源在高校充分發(fā)揮最大作用,提高紙質(zhì)圖書資源的利用率,加強資源優(yōu)化與服務,全面提升圖書館的服務質(zhì)量,以更好地服務于讀者,本文就以近年5年平頂山市教育學院凌云校區(qū)圖書館的紙質(zhì)圖書資源的借閱情況為基礎(chǔ)進行了調(diào)查與分析。
一、圖書館紙質(zhì)圖書發(fā)展現(xiàn)狀
隨著近年來高校的合并及招生規(guī)模的擴大,高校圖書館文獻資源館藏量呈現(xiàn)逐年遞增的態(tài)勢,紙質(zhì)圖書資源的購置投資也在不斷穩(wěn)步增加。自2008年以來,我校圖書館在紙質(zhì)圖書資源方面的投資基本是直線上升。相關(guān)的紙質(zhì)圖書資源包括一般圖書、期刊報紙和特色文獻這三方面都處于逐年增加狀態(tài),不過在特色文獻方面的增加相對較弱。筆者比較了這三者近五年的一個大概比例情況?;緦儆谝话銏D書占紙質(zhì)圖書資源購置費用的78%左右,期刊報紙占18%左右,特色文獻占4%左右。由此可以看出我校圖書館的一個大概購置狀況。據(jù)統(tǒng)計,2012年我校圖書館借閱對象分類中,學生借書占到了98.7%,教師借書占了1%,校外人員借書僅占了0.3%。另外,紙質(zhì)圖書資源的利用率反映紙質(zhì)圖書資源被利用的程度,是衡量紙質(zhì)圖書資源質(zhì)量和圖書館服務的重要指標之一。據(jù)統(tǒng)計,全國高校圖書館的紙質(zhì)文獻利用率一般在50%左右,當然其中也包括期刊和報紙,但我校最好的在2008年是25.42%,到了去年只有15.43%。從中可以看出我校的紙質(zhì)圖書資源利用情況不容樂觀。
二、紙質(zhì)圖書利用狀況及分析
通過調(diào)查統(tǒng)計2008年至2012年我校圖書館各類圖書的大致借閱情況,縱觀各年各類型圖書的利用率都普遍偏低,最低的v類(航空、航天)圖書連續(xù)四年的圖書利用率都只有0.01%,最高的圖書利用率也只有25.72%,總體來看所有的圖書利用率普遍都在百分之零點幾到百分之幾,如此低的利用率的確讓人驚訝。另外,幾乎所有類別的圖書借閱量從2008年到2012年在數(shù)量上基本上都是減少了1-3倍左右,最為夸張的是n類,(自然科學總論)這類圖書的下降倍數(shù)達到了9倍多,似乎這類自然原理性的圖書正在逐漸被人們遺忘。值得一提的是在近年的各類圖書借閱量逐年減少的情況下x類(環(huán)境、安全科學)圖書的借閱量卻在近兩三年有所提升,特別是在2011年圖書借閱量達到2008年的兩倍多。也充分證實了在當今社會逐步重視環(huán)境與安全的同時潛移默化地使學生在環(huán)境安全方面的重視有所提高。最后的統(tǒng)計數(shù)據(jù)也可以明顯看出逐年的借閱量是在快速下降的。
筆者將近五年的圖書借閱量進行了逐年排名,可以看出基本上前五名是被文學,語言、文字,工業(yè)技術(shù),藝術(shù),經(jīng)濟類所占據(jù)。其中文學,語言、文字包攬了全部的第一二名,語言、文字更是在最近四年連續(xù)占據(jù)了第一名。對大多數(shù)本校學生來說,通過相關(guān)的英語書籍練習更有利于通過考試,因此這也是直接影響語言文字類圖書借閱情況一直占據(jù)第一的主要原因。而最為穩(wěn)定的則是排在第三的工業(yè)技術(shù)類圖書,一直備受學生喜愛。排名靠后的圖書例如2008年和2009年排在倒數(shù)第二的環(huán)境科學、安全科學類在近年社會廣泛關(guān)注環(huán)境和安全問題后也順利退出倒數(shù)行列。航空、航天類圖書的借閱量在前幾年排在最后一名,但隨著近年中國航空事業(yè)的飛速發(fā)展也逐漸引起人們的重視,在2010年后也退出了倒數(shù)行列。而自然科學總論類圖書在2010年跌入倒數(shù)行列后更是在近兩年一直處于了最后一名,可見這類書正逐步被人們遺忘,也直接淡化了其在圖書館中應有的價值。
三、提高高校圖書館紙質(zhì)圖書利用的建議和思考
(一)做好新書通報和各類藏書的宣傳工作
在數(shù)字資源被廣泛利用而紙質(zhì)圖書資源備受冷落的現(xiàn)狀下,對藏書的宣傳就顯得格外重要。圖書館可利用多種形式對圖書進
行宣傳,比如通過培訓講座,幫助讀者了解館藏圖書的分類方法和圖書的排架方法;通過實地參觀的形式使讀者盡快熟悉館藏資源的分布、圖書的借還流程、閱覽規(guī)則和書目數(shù)據(jù)庫的使用方法等。對于新生而言,進行館前教育,是了解圖書館,熟悉館藏資源的最好形式。
(二)完善管理體制和館員業(yè)務培訓制度,激勵員工工作積極性
在圖書館中長時間的工作就會使館員覺得繁瑣枯燥并產(chǎn)生消極情緒,輪崗和轉(zhuǎn)變服務方式是把工作做活的途徑,由此將館員的被動工作變?yōu)橹鲃臃?。所以,合理安排員工工作,不斷完善管理體制是一種促進圖書利用的方法之一。定期對館員進行培訓或者多途徑提供繼續(xù)教育機會,使圖書館員對于圖書館計算機集成系統(tǒng)的利用逐步精通,同時館員在工作崗位上也應該大膽探索和實踐,拓寬服務領(lǐng)域,更新服務手段,積極開拓適應新時期讀者需求的創(chuàng)新服務方式,以更好地為讀者提供真正有效、優(yōu)質(zhì)的服務。
(三)落實購書流程,鼓勵和提倡讀者薦購圖書,優(yōu)化購書比例
在購書方面要充分下功夫使每次購置的新書有一定的質(zhì)量。另外就是購書比例,在圖書館中不怎么被借閱或近年呈嚴重下降趨勢的圖書要適當減少比例,以此來逐步提高圖書利用量。
(四)縮短借閱期限,建立借閱提醒和催還服務
適當縮短圖書的借閱期限,比如2到3周即可,這樣既可以催促讀者及時完成已借圖書的閱讀,還可以方便后續(xù)讀者的及時借閱。另外,可以建立借閱提醒和催還服務。一方面可以減少讀者因為遺忘所造成的不必要罰款,另一方面也可以使圖書及時回館,方便了之后讀者的圖書借閱,提高圖書的利用率。
參考資料:
[1]李萌遠.論高校圖書館員的素質(zhì)提升[j].中國成人教育,2009(11).
關(guān)鍵詞: 圖書借閱量;組合預測;GM(1,1);線性回歸
中圖分類號:G251.4
文獻標識碼:A文章編號:1672-8513(2010)03-0170-03
Research on the Grey Regression Combination Model for the Library Loan
LIU Subing,LIU Haiming,MIAO Jiajing,ZHANG Hongyu,ZHANG Peng
(Department of Mathematic, Mudanjiang Normal University,Mudanjiang 157012,China)
Abstract:
Taking “the erroneous sum of squares is smallest” as the most superior criterion,this paper combines the GM(1,1) with the linear regression forecast model to establish the combination forecasting model for the library loan. The result shows the combination forecasting models forecast precision surpasses that of each sub-method and has much good application value.
Key words:
library loan;forecasting combination;GM(1,1); linear regression
借閱量是圖書館業(yè)務統(tǒng)計中的重要指標,可以衡量圖書情報部門的工作質(zhì)量與效益.有關(guān)借閱量的調(diào)查、統(tǒng)計、分析、預測等研究和探討,一直是圖書情報學界的研究熱點[1-2].目前,在圖書借閱量預測的工作中,傳統(tǒng)的圖書借閱量的預測方法有統(tǒng)計回歸分析法[3-4]、灰色GM(1,1)預測法[5-6]、時間序列法[7]、混沌預測[8]等,但由于單一模型的假設(shè)條件及適用范圍存在著這樣或那樣的局限性,使用單一模型往往使許多有用的信息得不到有效的利用,若對單一模型進行適當?shù)慕M合,則可充分利用有效信息,彌補單一模型的不足而使預測結(jié)果具有更大的可信度.本文以“誤差平方和最小”作為最優(yōu)準則,建立灰色回歸組合模型,該模型改善了原灰色GM(1,1)模型中沒有線性因素和原線性回歸模型中指數(shù)增長趨勢的不足,得到圖書借閱量更為精確的預測結(jié)果.
1 最優(yōu)加權(quán)組合預測模型和最優(yōu)權(quán)數(shù)的計算
1.1 基于誤差平方和最小的組合預測模型
假設(shè)對同一預測問題,設(shè)yt為一預測對象某個指標序列(t=1,2,…,n),用m個不同的預測模型來進行預測,由m個模型得到的預測值記為yit(i=1,2,…,m;t=1,2,…,n),則這m個預測模型構(gòu)成的組合預測模型為:
t=w1y1t+w2y2t+…+wmymt,t=1,2,…,n.(1)
其中,t為組合預測值,w=(w1,w2,…,wm)T為m個預測模型加權(quán)系數(shù)向量,wi為第i個模型在組合預測中所占的權(quán)系數(shù),wi滿足約束條件∑mi=1wi=1,wi≥0(i=1,2,…,m)
,eit=yt-yit為第i個預測模型在第t時刻的預測誤差(i=1,2,…,m;t=1,2,…,n),第i個單一模型的誤差向量為Ei=[ei1,ei2,…,ein]T,i=1,2,…,m;預測誤差矩陣e=[E1,E2,…Em],記預測誤差信息矩陣為E,則E=(eit)m×n(eit)Tm×n=eTe,設(shè)在t時刻組合模型的預測誤差為:et=yt-t,t=1,2,…,n,則,
et=yt-t=∑mi=1wi(yt-yit)=∑mi=1wieit,t=1,2,…,n.
則組合模型的預測誤差平方和為:
SSE=∑nt=1e2t=∑nt=1(∑mi=1wieit)2=WTEW.
1.2 組合最優(yōu)加權(quán)系數(shù)的確定
以誤差平方和(SSE)最小為準則,不變權(quán)系數(shù)線性組合模型最優(yōu)權(quán)系數(shù)W0為線性規(guī)劃問題的最優(yōu)解,其中Rm=[1,1,…,1].
min SSE=WTEW,
s.t.RmW=1.(2)
由以上模型(2)解得線性組合模型的最優(yōu)加權(quán)系數(shù)W0為:W0=E-1RTmRmE-1RTm.
2 圖書借閱量的2種預測模型
2.1 灰色GM(1,1)預測
劉素兵,劉海明,苗佳晶,等:圖書借閱量的灰色回歸組合模型研究
1)數(shù)列選擇. 采集圖書借閱量1999~2003年的5年數(shù)據(jù)[5](見表1)為原始數(shù)據(jù)數(shù)列:X(0)=x(0)(k),k=1,2,…,5;
2)形成1-AGO數(shù)據(jù)序列X(1)={x(1)(k)},其中,x(1)(k)=∑ki=1x(0)(i),k=1,2,…,5;
3)建立灰色預測GM(1,1)模型.
該模型是一個包含單變量的一階微分方程構(gòu)成的動態(tài)模型:
x(0)(k)+az(1)(k)=b,k=2,3,…,5.(3)
相應的白化方程為:dX(1)dt+aX(1)=b.
(4)
由最小二乘估計解得式(3)中參數(shù)列[a,b]T=[-0.1277,141760.982]T.
取x(1)(1)=x(0)(1)=149568,求得白化方程的解,即時間響應函數(shù)為:
(1)(k+1)=(x(0)(1)-ba)e-ak+ba=
(x(0)(1)+141760.9820.1277)e0.1277k-141760.9820.1277 ;(5)
4) 累減還原. 對式(5)做1-IAGO累減還原,X(0)的預測公式為
(0)(k+1)=(1)(k+1)-(1)(k)=1259974(1-e-0.1277)e0.1277k;(6)
5) 模型檢驗. 原始數(shù)據(jù)的后驗差比值S2S1=0.14450.95,精度p0=97.79根據(jù)灰色相關(guān)檢驗標準[9],該模型精度,后驗差比值和小誤差概率都為一級指標水平,可知模型為較好模型,可以用于預測.
2.2 回歸模型預測
讀者量與借閱量Xt之間相關(guān)密切,且有線性正相關(guān)關(guān)系,線性回歸模型預測借閱量的回歸方程為:
y2t=32675.3258+19.8392Xt .(7)
由可決系數(shù)r2=0.9618,F(xiàn)=75.5788,P=0.0032
3 組合預測模型及其單一模型的對比分析
以式(6)、(7)作為單一模型,采用第1節(jié)介紹的組合預測方法計算出GM(1,1)模型和回歸模型的權(quán)系數(shù)分別為w1=0.6972,w2=0.3028,則建立的灰色回歸組合模型如下:
t=0.6972y1t+0.3028y2t.(8)
使用灰色回歸組合模型對借閱量進行擬合,并對2004~2005學年的圖書借閱量進行了檢驗性預測,其中,單項模型與組合模型的擬合效果比較見表1.
為了進一步對模型進行評價,采用以下2種統(tǒng)計評價指標(結(jié)果見表2):
通過比較上述3種模型的平均相對誤差、MSE和MAE可以看到,灰色GM(1,1)模型要優(yōu)于線性回歸模型,而灰色回歸組合模型充分融合各種信息,彌補單一模型的不足,由表2可以看到,組合模型的2種統(tǒng)計指標均優(yōu)于2種單一預測模型的計算結(jié)果.另外,以2004~2005學年圖書借閱量預測做一步檢驗,實際值為272226,組合預測值為275438,相對誤差僅為-1.18%.因此,組合預測模型在模擬性能和預測性能方面的改善是顯而易見的,它綜合了2種單一預測方法所提供的有用信息,使考慮的因素更加全面,因而,較圖書借閱量單一預測模型而言,它具有更好的科學性和通用性.
表3 2006~2010年圖書借閱量預測結(jié)果
年份2006~20072007~20082008~20092009~2010
灰色回歸組合模型316995354465396016439610
基于灰色回歸組合模型,對2006年至2010年圖書借閱量預測結(jié)果如表3所示.
4 結(jié)語
本文將灰色GM(1,1)模型和線性回歸模型,通過優(yōu)化組合,建立了圖書借閱量的灰色回歸組合預測模型,對圖書借閱量進行了模擬和預測.結(jié)果表明,該模型其預報精度優(yōu)于各單個模型,可以用來預測未來連續(xù)若干個學年度的借閱量,這對于改進圖書館管理,提高服務質(zhì)量,具有較好的指導作用和實際意義.
參考文獻:
[1]
李丕仕,黃賢樹.中文圖書入藏量和借閱量關(guān)系的定性探討[J]. 情報雜志,1993(3):42-43.
[2] 李秀鳳,曹 健.借閱統(tǒng)計分析[J]. 農(nóng)業(yè)圖書情報學刊,2008,20(9):83-84.
[3] 孫寶,劉玲.線性回歸模型預測借閱量[J]. 現(xiàn)代情報,2007(9):159-161.
[4] 蔡智裎.圖書館流通系統(tǒng)讀者分布密度及回歸分析[J]. 情報雜志,2004(3):114-115.
[5] 孫寶,王志麗,劉琳.基于GM的高校圖書館借閱量預測模型研究[J].現(xiàn)代情報,2008(4):186-188.
[6] 譚文華.高校圖書館圖書流通的灰色預測[J].現(xiàn)代情報,2003(10): 119-120.
[7] 吳紅艷.圖書借閱流量行為季節(jié)預測模型[J].圖書情報工作,2007,51(11):98-101.
[關(guān)鍵詞] R;圖書館用戶;借閱行為;數(shù)據(jù)挖掘
[中圖分類號] TP311 [文獻標識碼] A [文章編號] 1671-0037(2017)2-91-6
Data Mining Study of Library Users' Borrowing Behavior based on R
Hou Songxia
(Tianjin Transportation Vocational College, Tianjin 300112)
Abstract: The article aims at the status of inefficient use of library data, adopts R based data mining technology, and deeply evacuates the borrowing data of library, hoping to find the implied values of the data. In order to complete the efficient use of the value of the data by data mining, we explore the implied laws of the borrowing data by data mining and apply the mined laws into practical application .
Key words: R; library users; borrowing behavior; data mining
1 引言
評判一個圖書館服務水平的基本標準應當是借閱者的借閱需求滿足情況。為盡可能滿足借閱者的借閱需求,圖書館需要在館藏文獻管理及對借閱者提供個性化服務兩個方面做出努力。因此,需要通過對用戶借閱行為進行深入的數(shù)據(jù)挖掘,得到更加接近真實的用戶需求情況。通過對用戶的借閱興趣、借閱習慣進行分析總結(jié),在預測未來的借閱行為的基礎(chǔ)上,發(fā)揮圖書館對用戶的引導教育作用。
2 圖書館用戶借閱行為分析數(shù)據(jù)特點
圖書館的服務對象主要可以分為:教師和學生。根據(jù)專業(yè)的不同,又可以進一步細分,如學生用戶可以進一步分為理工類學科與人文社科類學科等。顯然,各類用戶群對信息的需求層次差異很大,同一用戶群中不同專業(yè)的用戶信息需求也存在較大差異[1]。圖書館用戶的學科專業(yè)性非常明顯,信息需求主要集中在與專業(yè)領(lǐng)域緊密相關(guān)的專業(yè)文獻上,不同專業(yè)的用戶需求差異十分明顯,可以根據(jù)挖掘數(shù)據(jù)的結(jié)果進行分析,將書籍的擺放位置和書籍的數(shù)量進行調(diào)整,而相同專業(yè)的用戶也具有相近的興趣度,可以通過數(shù)據(jù)挖掘技術(shù)對各個用戶的借閱行為數(shù)據(jù)進行挖掘,并對挖掘結(jié)果進行專業(yè)性的分析,針對各個用戶的相似性開展大量的個性化服務。
3 挖掘過程
3.1 數(shù)據(jù)挖掘目標的確定
本文數(shù)據(jù)挖掘采用R語言,其目的是根據(jù)圖書館用戶借閱行為的數(shù)據(jù)來得到用戶的借閱習慣、借閱特點等,最終實現(xiàn)對館藏文獻的優(yōu)化管理及對借閱者提供個性化服務[2]。挖掘工作的重點應該是分析并獲取:1.用戶類型及各自類型的借閱特點;2.不同種類圖書的利用率。
3.2 數(shù)據(jù)獲取
在用戶利用圖書館的資源過程中會留下諸如讀者基本信息、借閱歷史、檢索歷史等大量的有價值信息,這就是我們進行數(shù)據(jù)挖掘的數(shù)據(jù)來源,通過對用戶信息和借閱歷史的挖掘來得到我們需要的信息。
3.2.1 讀者信息。讀者的具體身份信息作為數(shù)據(jù)挖掘中的一項基礎(chǔ)數(shù)據(jù)。主要用來為用戶分類、借閱行為分類聚類提供信息,由于數(shù)據(jù)量龐大,在預處理時需刪掉無用的數(shù)據(jù),保留本次挖掘所需數(shù)據(jù),如用戶編號、專業(yè)、性別屬性,如表1所示,本文針對某圖書館近幾年的圖書借閱情況進行挖掘。
3.2.2 書目信息。書目信息與用戶信息類似,是所有館藏書目的一個數(shù)據(jù)庫,主要包括書目名稱、書目編號、出版社、所屬類別、類別編號、館藏位置、入館時間、下架時間等屬性。通過預處理后,所選擇的有效數(shù)據(jù)如表2所示。
3.2.3 讀者借閱記錄。讀者借閱歷史記錄主要包含了借閱的目標信息(書籍數(shù)據(jù))、時間信息及連接信息(編號數(shù)據(jù)),如表3所示。其中目標信息的主要組成部分為書籍的屬性信息;時間信息的主要內(nèi)容包含借閱書籍的起止時間信息;聯(lián)系信息主要內(nèi)容為用戶編號等起聯(lián)系作用的信息[3]。但是這三種信息不應該被撕裂開來,而應該是呈相互關(guān)聯(lián)、缺一不可的關(guān)系。在這里主要為方便敘述將其分為三類:
第一,目標信息。目標信息是進行聚類分類的重要核心數(shù)據(jù),主要通過用戶編號與用戶信息進行連接從而進行數(shù)據(jù)挖掘。在此只截取數(shù)據(jù)中書名及圖書編號等數(shù)據(jù)進行概化后用于數(shù)據(jù)挖掘;
第二,時間信息。時間信息對于數(shù)據(jù)挖掘的主要意義是進行時間序列的分析,其主要內(nèi)容包括借閱時間、歸還時間等;
第三,聯(lián)系信息。聯(lián)系信息則為用戶編號等起聯(lián)系性作用的數(shù)據(jù)。這部分信息是利用數(shù)據(jù)挖掘技術(shù)獲取圖書館文獻利用狀況的關(guān)鍵,通過對它們的統(tǒng)計、歸類、分析有助于了解書刊的使用情況并進行預測分析同樣需要通過基于屬性的歸納算法進行數(shù)據(jù)概化。最后得到的主要屬性有圖書主題、圖書編號、借閱時間段、借閱時長。
3.3 數(shù)據(jù)預處理
從圖書館得到的用戶數(shù)據(jù)往往十分雜亂,結(jié)構(gòu)化進行的并不完全,而且存在大量的無效信息。因此需要對其數(shù)據(jù)進行預處理。
經(jīng)過預處理后的數(shù)據(jù)結(jié)構(gòu)如表4所示。
3.4 挖掘過程
根據(jù)指導圖書館實現(xiàn)其館藏文獻優(yōu)化目標及給借閱者提供個性化推薦的目標,對具體的挖掘任務進行分配。根據(jù)借閱行為的主體及客體,我們將挖掘分為三個大的環(huán)節(jié)[4]。首先是對整體數(shù)據(jù)的大的挖掘,即得出高頻借閱者和高頻書籍,通過這一步驟的挖掘,我們會對于整體的數(shù)據(jù)結(jié)構(gòu)有直觀的理解。其次是對館藏文獻的挖掘。對文獻的挖掘,要考慮時間要素、優(yōu)質(zhì)資源、待下架資源這三方面的信息。最后是對于借閱者的需求信息的挖掘,其目的是挖掘出讀者的不同需求。
3.4.1 概覽。通過對多個數(shù)據(jù)集的聯(lián)立(merge()函數(shù))得到了數(shù)據(jù)的整體情況。經(jīng)過對預處理數(shù)據(jù)進行簡單的統(tǒng)計,其中借閱記錄10 342條,借閱者編號(人數(shù))3 321個,圖書編號4 032個。如圖1所示。
然后對數(shù)據(jù)中的用戶和書目進行統(tǒng)計,發(fā)現(xiàn)國際經(jīng)濟與貿(mào)易,金融學,成教院,信息管理與信息系統(tǒng),計算機科學與技術(shù)和數(shù)學與應用數(shù)學專業(yè)的同學借閱量最多,然后將所有出現(xiàn)次數(shù)前5的單位單獨導出,作為后續(xù)分析中的重點挖掘?qū)ο?。同理導出被借閱書籍最多的種類,作為向?qū)W校推薦加強館藏建設(shè)的重點內(nèi)容。如圖2所示。
3.4.2 挖掘文獻使用規(guī)律
圖書館的文獻被借閱情況,其往往表現(xiàn)出一定的規(guī)律性。
第一,對時間要素的挖掘
在時間序列上,往往表現(xiàn)在特定時間的某種類型書籍被大量借閱,而突然增大的借閱量必然會影響圖書館的服務質(zhì)量。所以通過對時間要素的挖掘,我們可以對圖書館在借閱量增加的時候?qū)D書館的工作情況進行適當?shù)恼{(diào)整。如圖3所示。
經(jīng)過觀察發(fā)現(xiàn)數(shù)據(jù)集中在2011年的11月,因此時間序列上以天數(shù)為劃分標準,然后利用table()函數(shù)及plot()函數(shù)來繪制出不同月份圖書借閱量的圖表。以便于直觀地對借閱量的月度變化進行掌握。通過對圖書館不同月份借閱量的對比,我們可以根據(jù)圖4看出,在該月,圖書借閱量隨著時間變化呈現(xiàn)出明顯的規(guī)律性變化,整體呈現(xiàn)出波動性變化。再結(jié)合周度記錄的圖表圖5,可以得出圖書館的借閱活動相對高峰期出現(xiàn)在每周的周二前后,并且在周五前后將出現(xiàn)一個較明顯的低落,經(jīng)過分析后判斷出這種規(guī)律性變動,主要是因為學校在課程安排以周為單位。很多同學會在新的一周開始時接到教師安排的新的學習任務,為了滿足專業(yè)性的知識需求,會在周一之后開始去圖書館借閱書籍,這直接導致了周二前后借閱的出現(xiàn)。在經(jīng)過一周的學習后,面對即將到來的周末,由于周末休息時間較長,部分讀者利用周末安排了外出游玩等社交休閑活動,因此借閱熱情減退,這也導致了周五前后的借閱量低潮的出現(xiàn)。
第二,對優(yōu)質(zhì)資源的挖掘。圖書館中存在著大量的優(yōu)質(zhì)資源,這些優(yōu)質(zhì)資源常常處于被借閱的狀態(tài),但是在實際流通中其表現(xiàn)出的流通率卻并不高,因為這些資源經(jīng)常被同一用戶反復借閱[5]。這就為我們挖掘出這一部分優(yōu)質(zhì)的資源埋下了巨大的障礙,因為既不能單純以流通率來判斷(部分書籍可能因為封面設(shè)計吸引眼球而被頻繁借閱,但質(zhì)量并不足夠優(yōu)質(zhì)),也不能單純以被借閱時長來判斷(部分書籍被借走但卻長期停留在書架上)。
因此,在篩選出優(yōu)質(zhì)資源時需要考慮多個參數(shù)的影響:a.平均借閱時間;b.被借閱次數(shù);c.重復借用率。在這三個參數(shù)都滿足閾值的記錄時應該基本滿足優(yōu)質(zhì)資源的標準。但是,因為這種篩選方法在閾值這個門檻上將大量的新進書籍排除在外,所以還需要再進行重新考慮。為尋求更合適的篩選方法,我們可以通過聚類分析的方法來進行初步的探索(即對新進書籍與歷史書籍進行聚類分析)。
第三,對待下架資源的挖掘。在獲取了優(yōu)質(zhì)資源目錄的同時,我們還需要對圖書館中的陳舊資源進行清理,以避免部分類新購進書籍因為書架資源有限而無法陳列出來。對待下架資源的挖掘需要考慮兩方面的因素:1.新增加的書籍數(shù)量,這是驅(qū)動對待下架資源挖掘的動力;2.文獻的被借閱量,這是評判一本書籍是否需要下架的主要因素。
因為文獻使用的量是動態(tài)變化的,所以通過數(shù)據(jù)挖掘?qū)v史數(shù)據(jù)的分析,獲取平均上架數(shù)量對于圖書館的優(yōu)化館藏排架結(jié)構(gòu)十分重要。新增書籍的數(shù)量可以通過書目記錄信息獲得,而流通數(shù)量可以通過以下方式獲得:首先利用往年相同時期的流通數(shù)量變化情況,特別是在高校圖書館,由于院系課程進度的原因,會出現(xiàn)周期性學生大量借閱同類書籍文獻的現(xiàn)象,利用這一已知規(guī)律,可以很方便地來推算當前流通數(shù)量。當然這有一個前提,就是該類書籍必須具有這種周期性變化,在這里可以使用回歸分析、時間序列分析的方法來獲取這些規(guī)律。當某類圖書不存在周期性借閱起伏時可以利用其回歸曲線的變化趨勢來分析,如果曲線歷來比較平穩(wěn),說明這類書籍的在館率比較穩(wěn)定,而如果偶然出現(xiàn)一次高峰,我們可以向上文一樣通過關(guān)聯(lián)挖掘獲取其當時借閱量突增的原因。
第四,挖掘用戶特點。通過對借閱者與借閱記錄的聯(lián)合挖掘,可以得出大量的用戶需求信息,而這些需求信息,是指導圖書館實現(xiàn)其館藏文獻優(yōu)化目標及給借閱者提供個性化推薦的重要指導。要實現(xiàn)對這些聯(lián)合信息的挖掘,我們需要頻繁使用到關(guān)聯(lián)規(guī)則的挖掘,因此在此進行較為具體的描述。我們主要采用的是購物籃分析(Market Basket Analysis)[6]。購物籃分析是通過顧客購物時的籃子內(nèi)的商品所顯示的信息來研究顧客的購買行為,通過這些信息,可以了解到不同顧客的不同需求以及需求的原因,從而得到一定的規(guī)律。主要的目的在于找出什么樣的東西應該放在一起,并藉由這些規(guī)則的挖掘獲得利益與建立競爭優(yōu)勢。這種思路對于我們進行圖書的個性化推薦具有重要參考價值。我們可以通過對借閱者借閱記錄中的書籍進行匯總,進而形成每個借閱者的“數(shù)據(jù)籃子”,然后對眾多的“數(shù)據(jù)籃子”進行匯總,通過apriori算法,對其進行相關(guān)性的挖掘,然后對形成的關(guān)聯(lián)規(guī)則進行排序,將其中聯(lián)系性較強的數(shù)據(jù)進行推廣利用,主要的目的在于推斷借了某本書的人還會借閱哪本書,并藉由這些信息來實現(xiàn)對讀者的個性化推薦。
關(guān)聯(lián)規(guī)則的挖掘包括兩個階段的工作,首先是對于資料的整理,因為一般的數(shù)據(jù)集需要經(jīng)過整理符合其算法的需求才可以進行下一步的輸入處理。在此過程中,主要利用as(transactions,數(shù)據(jù)集名稱)函數(shù)將一般性的數(shù)據(jù)轉(zhuǎn)換為購物籃類型的數(shù)據(jù)。如圖6所示。
其次,就是具體的關(guān)聯(lián)過程。是從資料集合中找出所有的高頻項目組,在圖書館用戶行為數(shù)據(jù)挖掘中,使用關(guān)聯(lián)規(guī)則挖掘技術(shù),對數(shù)據(jù)庫中的紀錄進行資料挖掘,首先必須要設(shè)定最小支持度與最小信賴度兩個門檻值。符合此需求的關(guān)聯(lián)規(guī)則將必須同時滿足以上兩個條件。最后,再由這些高頻項目組中產(chǎn)生關(guān)聯(lián)規(guī)則,若經(jīng)過挖掘過程所找到的關(guān)聯(lián)規(guī)則(如「專業(yè),書目類別),滿足設(shè)定最小支持度與最小信賴度兩個門檻值,將可接受該關(guān)聯(lián)規(guī)則。因此,今后若有某讀者已_定某一相關(guān)要素,則圖書館將可推薦該讀者借閱某一類書籍。如圖7所示。
在對整體數(shù)據(jù)進行關(guān)聯(lián)分析之后,又對不同類別數(shù)據(jù)(如金融系等)進行了多次重復性關(guān)聯(lián)之后[7],我們得出很多的結(jié)論,如通過對整體數(shù)據(jù)挖掘發(fā)現(xiàn)借閱計算機類圖書的讀者往往會再借閱一些文學性的書籍,而對管理學專業(yè)的挖掘表明,管理學學生的借閱內(nèi)容范圍往往十分廣泛,不易形成關(guān)聯(lián)規(guī)則(支持度往往不高),這些結(jié)論對于圖書館的館藏內(nèi)容進行優(yōu)化就具有比較明顯的作用,而且根據(jù)得出的具體關(guān)聯(lián)規(guī)則,還可以在進行圖書推薦時針對不同院系的學生進行相對個性化的推薦。
4 結(jié)語
因為本次挖掘完全依賴數(shù)據(jù)驅(qū)動,只是根據(jù)數(shù)據(jù)內(nèi)容上挖掘出需要的規(guī)則,所以源數(shù)據(jù)的準確性完全決定了本次挖掘準確性,但是部分的數(shù)據(jù)挖掘過程因為數(shù)據(jù)量太小,僅為幾百條,所以進行個性化推薦的挖掘中得出的結(jié)論可能會受此影響。與此同時,我們只是對源數(shù)據(jù)進行了挖掘,對于源數(shù)據(jù)的準確性并未深究,所以,本次挖掘結(jié)果并不一定與實際情況吻合。通過數(shù)據(jù)挖掘這一工具,我們得到的用戶模型必定與事實存在著一定的差異。因此,將模型與實際情況進行驗證,并進行適當?shù)恼{(diào)整應當是提高挖掘結(jié)果準確性的一種重要思路。
參考文獻:
[1] 李賢虹.基于數(shù)據(jù)挖掘的讀者個性化信息服務系統(tǒng)的研究與設(shè)計[D].南昌:南昌大學,2009.
[2] 譚云江.基于數(shù)據(jù)挖掘技術(shù)的高校圖書館讀者行為研究[J].圖書情報工作,2012(S).
[3] 艾金勇.圖書館讀者借閱行為的關(guān)聯(lián)規(guī)則挖掘研究[J].情報探索,2017(1):40-43.
[4] 陳靜榮.圖書借閱分析系統(tǒng)的數(shù)據(jù)挖掘技術(shù)[J].農(nóng)業(yè)圖書情報學刊,2017(2):69-72.
[5] 陳潔.數(shù)據(jù)挖掘在高校圖書館服務中的應用探析[J]. 大學圖書情報學刊,2016(2):53-57.