前言:想要寫出一篇引人入勝的文章?我們特意為您整理了地域文化數字化保護和大數據應用方案范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:地域文化的保護、傳承、發展與利用,對于一個地區彰顯地方魅力,提高知名度與美譽度,發展地方經濟和旅游文化產業,乃至凝聚人心力量,增加地方軟實力,都有著十分重要的意義。本文以淮安地域文化的實踐為例,對地域文化數字化保護和大數據應用的方案進行了研究和設計,闡述了地域文化資源的數字化手段,分析了地域文化數據庫的特點,說明了地域文化數據庫的大數據處理技術,提出了地域文化數據庫共建共享和利用的方法機制。
關鍵詞:地域文化;地域文化數字化;地域文化數據庫;大數據
0引言
中華文化源遠流長,指出:中華優秀傳統文化中很多思想理念和道德規范,不論過去還是現在,都有其永不褪色的價值。在新的時代條件下傳承和弘揚中華優秀傳統文化,一定要以高度的文化自覺和文化自信推動中華優秀傳統文化的創造性轉化和創新性發展。地域文化作為中華民族文化不可缺少的一部分,是指一定空間范圍內的人們在長期的生產和生活實踐中逐漸形成的歷史遺存、文化形態、社會習俗、生產生活方式等獨具特色、積極向上的文化傳統,其反映不同地域人群的品格特點及文化內涵、審美情趣以及價值取向等。地域文化的傳承、保護與發展,對于形成良好的地域精神與道德風尚具有重要的導向作用,是一個地區綜合竟爭力的重要體現。然而長期以來,許多地方對地域文化的保護發展工作重要性的認識還不夠,缺乏應時而上保護發展利用地域文化的有效舉措,除公共圖書館之外,其他機構的地域文化數據庫建設基本上沒有開展。因此,設計建設一種地域文化數字化保護和有效利用的方案機制有著極為重要的社會意義。
1總體方案
地域文化數字化保護應用平臺的建設,應以數字化手段實現地域文化資源永久保存為前提,以充分利用、創造性轉化和創新性發展為目標,堅持開放分享,以多方合作模式構建地域文化資源數據庫和共享平臺,利用大數據技術保證資源數量和類型的豐富和無限擴容。不同文化機構和用戶,運用各種數字化手段將文化資源加工成數字化的資源,并利用平臺搭建的接口處理入庫,實現對分散無序、相對獨立的資源的類聚、重組和融合。為應對數據的海量增長和因資源使用產生的非結構數據對計算機存儲和計算能力的挑戰,必須采用大數據技術,通過分布式文件系統和分布式數據集市保證存儲的可擴展性和數據的高可用性,并實現對非結構數據的有效轉換和利用,最終提供統一的數據服務。資源的整合是為了讓廣大用戶發現資源、利用資源,因此必須以地域文化大數據庫為中心構建各種軟件,為不同類型的用戶提供信息服務,如資源存儲檢索、旅游公司廣告、文化產品銷售、決策的統計分析等。
2地域文化資源的數字化采集
2.1地域文化資源選取原則
淮安作為國家歷史文化名城,坐落于古淮河與京杭大運河的交點,境內有中國第四大淡水湖——洪澤湖,是曾經的南船北馬交會之地,大運河沿線四大名都之一,南北文化交融,經濟發達、人文昌盛,又是淮揚名菜的發源地,的故鄉……,可謂地域文化內涵豐富,獨具特色。在淮安浩如煙海的地域文化資源中,我們堅持以下三條選取原則:(1)它必須是積極向上的文化資源,正所謂去其糟粕,取其精華;(2)它必須具有淮安的歷史淵源和地域特色,有較為深厚的歷史積淀和底蘊;(3)它要有較為寬泛的覆蓋面和認同基礎,能得到大多數淮安人的認同。
2.2地域文化資源數字化手段和分類選擇
綜合運用多種手段實現地域文化資源的數字化再現,包括:圖書文獻掃描加工、全景攝像、虛擬現實、航拍、3D建模、網絡爬蟲抓取等先進的信息技術集成,實現快速、便捷、科學地加工、分類、整理地域文化資源,極大地擴大地域文化的來源渠道,豐富地域文化資源的形態。淮安地域文化的分類主要包括:(1)水文化(運河文化、淮河文化、洪澤湖文化、水利工程、水上交通等);(2)名人名家(政治名人、經濟名人、文化名人等);(3)淮揚美食(歷史文化、淮揚名菜、烹飪名師、餐飲名店等);(4)民俗風情(服飾、住居、節日、婚姻、喪葬、宗教等);(5)方言文化(清淮方言、淮劇、淮書等);(6)生態文化(淮安生態、示范基地、政策文件等)。
3地域文化資源的大數據處理
3.1地域文化資源數據的特點分析
淮安地域文化極其豐富,要充分保護和高效利用,其數字化資源必須作為一種社會基礎性資源長期建設。根據數據的不同來源,地域文化資源庫的數據主要分為三大類:一是政府部門或社會公益組織為了實現地域文化的數字化保存和利用,利用各種技術手段形成數字化資源之后,按照一定的入庫標準,有意識地將各類文化資源分類匯集而產生的結構化數據或有序的數據,如媒體資源庫、數字出版庫等,這類數據有約定俗成的格式規范,可以利用關系數據庫將其存儲在預定義的表格中,也能方便地進行查詢和分析。二是從其他數據庫接入或從相關網站搜集下載的數據。包括專業的期刊數據庫如知網,電子圖書館如超星,其他相關網站如旅游公司、文化產品公司等,都會有關于淮安地域文化的資源,甚至景點的售票、文化產品的銷售數據也應成為我們關注的數據信息。為了給用戶提供統一的訪問通道,要以“海納百川,有容乃大”的理念,兼收并蓄,利用信息技術手段實現資源匯聚。三是基于用戶對文化資源數據庫的訪問行為產生的大量數據。搜索、下載、點擊、上傳等用戶行為會隨機悄然產生大量的多形態數據:視頻、照片、社交媒體評論、網站評述、訪問量等,可稱為非結構化數據或隨機數據。這些數據無法利用傳統的關系數據庫進行存儲,而某些數據又生成速度極快,甚至來不及分析后存儲,但這些數據對于分析地域文化的接受度、喜好度,以及文化消費特點具有重要價值。
3.2地域文化數據庫大數據處理的必要性
上段所述表明,地域文化資源庫的數據已經具備了大數據的特點,一是模態繁多,包括結構化數據和非結構化數據;二是數據量大,生成快速,具有很強的時效性。同時,在互聯網+時代,我們要最大限度地發揮地域文化的價值,必然需要對地域文化資源的數據庫進行深度挖掘分析。對這些數據進行挖掘分析的目的在于更全面地了解各種文化資源,發掘數據間的內在聯系,通過分析用戶的線上行為,掌握文化旅游、文化產品、文化活動的市場需求,更有針對性地開發和創作相關內容、形式的旅游文化產品,以滿足各類消費者的需要。這對于提高文化產業的生產效率是具有重要意義的。因此為應對地域文化資源對數據存儲、數據管理和數據分析的挑戰,我們必須采用大數據技術。
3.2地域文化資源數據庫大數據處理技術的使用
地域文化數據庫作為一個公益的社會基礎資源平臺,采用開源的技術工具建設是最為合適的選擇。Hadoop作為一種成熟的大數據開源框架,其可靠性、擴展性、高效性和容錯能力已得到眾多案例證明。利用Hadoop生態系統中Sqoop工具,能夠將第三方數據高效地導入,實現結構數據和非結構數據的快速轉換。HDFS和YARN是Hadoop實現分布式數據存儲的組件,使得我們能夠充分利用集群的威力,實現淮安地域文化數據庫的無限擴容,并帶來集群在利用率、資源統一管理和數據共享方面的巨大優勢。MapReduce編程模型是處理地域文化數據庫中大量半結構化和非結構化數據的利器,任何形式的數據都可以轉換成最終的鍵值對形式。而Hive和Pig提供了數據分析的手段,Hive適合用于對地域文化數據的使用日志的分析,Pig做高級的數據分析處理,比如可以用來發現地域文化資源數據庫中多條數據資源之間的深層次聯系。
4地域文化資源的大數據利用
作為一種基礎性資源的淮安地域文化數據庫,要發揮其最大價值,必須貫徹共建共享的理念。共建是數據庫保持持久吸引力的保證,首先要匯聚多方資源,接入或導入各方數據,讓平臺成為訪問淮安地域文化的統一入口,然后要集合多方力量參與資源貢獻,進行資源的持續更新。共享是數據庫建設的目標和動力,只有共享才能讓淮安地域文化發揮其最大價值,真正發揚光大。共享面向的用戶有三種:一是普通民眾,讓更多的淮安市民了解淮安文化,接受淮安文化,有利于提高城市的凝聚力和文明程度;二是研究淮安地域文化的專家學者,為其對資源間聯系和某個研究方向的研究現狀進行分析提供最全面的資源;三是旅游公司和文化產品企業,他們可以獲得廣告銷售服務,也能根據平臺的大數據分析并制定更好的銷售策略,設計更符合消費者需求的產品;四是相關的政府部門,如旅游局、文化局等,平臺能為其提供定制的資源存儲空間和訪問接口,更為重要是平臺的大數據分析功能可以為他們提供決策服務。
參考文獻:
[1]姜念云,張松海,謝夏.大數據分析技術在文化資源管理中的應用[J].中國基礎科學,2014,16(1):17-20+27.
[2]盧艷艷.基于Hadoop的大數據存儲關鍵技術研究[D].保定:華北電力大學,2016.
[3]付文靜.基于HBase的大數據存儲查詢技術研究[D].成都:電子科技大學,2015.
作者:安宇 郭艾華 單位:淮安信息職業技術學院