前言:想要寫出一篇引人入勝的文章?我們特意為您整理了在線學(xué)習(xí)個性化服務(wù)方案設(shè)計范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:基于數(shù)據(jù)挖掘技術(shù),在分析在線學(xué)習(xí)個性化服務(wù)的基礎(chǔ)上,以Hadoop為大數(shù)據(jù)分析平臺、MapReduce/Spark為計算框架設(shè)計了面向個性化服務(wù)的在線學(xué)數(shù)據(jù)挖掘解決方案。
關(guān)鍵詞:數(shù)據(jù)挖掘;在線學(xué)習(xí);個性化服務(wù);數(shù)據(jù)采集;數(shù)據(jù)建模
1概述
伴隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,教育及知識傳播方式也發(fā)生了根本變化。在線學(xué)習(xí)逐步興起,由于其不受時間、空間限制等特征,逐步被大家所接受。大數(shù)據(jù)時代的在線學(xué)習(xí),也為個性化教學(xué)提供了機(jī)遇。在線學(xué)習(xí)者在學(xué)習(xí)的過程中會產(chǎn)生相應(yīng)的學(xué)習(xí)軌跡,例如,觀看學(xué)習(xí)視頻時間的長短、訪問的學(xué)習(xí)資源類型、對所學(xué)內(nèi)容的評價等一系列的相關(guān)數(shù)據(jù)。通過在線學(xué)習(xí)平臺或系統(tǒng)對這些數(shù)據(jù)進(jìn)行收集并采用合適算法對相關(guān)數(shù)據(jù)進(jìn)行降維處理,提取在線學(xué)習(xí)者相關(guān)特征,在大數(shù)據(jù)技術(shù)的基礎(chǔ)上對在線學(xué)習(xí)者進(jìn)行評價及預(yù)測,從而對在線學(xué)習(xí)者進(jìn)行個性化服務(wù),進(jìn)一步提高在線學(xué)習(xí)質(zhì)量,進(jìn)而優(yōu)化學(xué)習(xí)過程、提高教學(xué)效果。[1]
2基于數(shù)據(jù)挖掘的在線學(xué)習(xí)個性化服務(wù)
2.1數(shù)據(jù)收集
用戶行為數(shù)據(jù)是用作許多個性化服務(wù)算法的數(shù)據(jù)源,因此必須收集在線學(xué)習(xí)者的學(xué)習(xí)日志數(shù)據(jù)。此外,還記錄用戶用來檢索和推薦引擎本身的數(shù)據(jù),并進(jìn)一步優(yōu)化后續(xù)算法。[2]
2.2角色建模
角色建模包括用戶建模和學(xué)習(xí)資源建模。用戶建模和文檔建模具有本體建模方法和非本體建模方法,這兩種方法都可以在MAPRECECE/SPARK計算框架下高效實現(xiàn)。[3]模型可以由HBASE數(shù)據(jù)庫分發(fā)和檢索。推薦,檢索和推送算法基于建立的用戶模型和文檔模型以不同方式執(zhí)行計算,最終找到與用戶或輸入匹配的文檔。[4]
2.3數(shù)據(jù)特征選取
考慮到當(dāng)前在線學(xué)習(xí)平臺之間通常不形成社交網(wǎng)絡(luò),可以選擇基于內(nèi)容和基于行為的特征。內(nèi)容功能涵蓋在線學(xué)習(xí)內(nèi)容的標(biāo)題和類別,用戶的背景和興趣等。用戶行為則涵蓋了他們?yōu)g覽了哪些學(xué)習(xí)資源。基于內(nèi)容和用戶行為的特征可以相互補(bǔ)充。
2.4算法選取
從準(zhǔn)確性,效率和穩(wěn)定性的角度簡要分析基于產(chǎn)品和基于用戶的協(xié)同過濾推薦算法這兩種方法在在線學(xué)習(xí)個性化服務(wù)中的適用性。[5](1)準(zhǔn)確性:推薦系統(tǒng)的準(zhǔn)確性在很大程度上取決于用戶數(shù)量與系統(tǒng)中項目數(shù)量之間的比率。在線學(xué)習(xí)用戶包括學(xué)生,教師,社會人員等。每種類型的用戶都可以細(xì)分。基于用戶的協(xié)同過濾可以使在線學(xué)習(xí)個性化建議更加準(zhǔn)確。(2)高效性:盡可能提高挖掘效率。當(dāng)用戶數(shù)遠(yuǎn)遠(yuǎn)大于項目數(shù)時,項目的相似度計算消耗的資源遠(yuǎn)遠(yuǎn)少于用戶的相似度計算,因此基于項目的協(xié)同過濾更有效。(3)穩(wěn)定性:在線學(xué)習(xí)資源和在線學(xué)習(xí)用戶不斷變化。對于在線學(xué)習(xí),一方面,新生每天進(jìn)入在線學(xué)習(xí)平臺,在線學(xué)習(xí)者每天都會有結(jié)業(yè)學(xué)生。學(xué)生用戶很不穩(wěn)定;另一方面,在線學(xué)習(xí)平臺每天都會有新的學(xué)習(xí)資源建立,學(xué)習(xí)資源內(nèi)容的更新和升級。從穩(wěn)定性的角度來看,基于用戶和基于項目的方法難以區(qū)分。
3基于數(shù)據(jù)挖掘的在線學(xué)習(xí)個性化服務(wù)方案設(shè)計
3.1在線學(xué)數(shù)據(jù)支撐環(huán)境
在目前常使用的云計算設(shè)施中,HADOOP由于其快速及可靠性為在線學(xué)習(xí)用戶提供了一個大數(shù)據(jù)分析及處理平臺。
3.2基于數(shù)據(jù)挖掘的在線學(xué)習(xí)個性化服務(wù)方案
基于以上分析,本文將HADOOP設(shè)計為大數(shù)據(jù)分析平臺,將MAPREDUCE/SPARK設(shè)計為計算框架,為個性化服務(wù)設(shè)計在線學(xué)數(shù)據(jù)挖掘解決方案。4結(jié)語本文在數(shù)據(jù)挖掘技術(shù)的基礎(chǔ)上,結(jié)合在線學(xué)習(xí)特點,對在線學(xué)習(xí)個性化服務(wù)進(jìn)行分析研究,從數(shù)據(jù)收集、數(shù)據(jù)建模、數(shù)據(jù)特征選擇、算法選擇四方面對在線學(xué)習(xí)個性化服務(wù)進(jìn)行方案設(shè)計,從而進(jìn)一步提高在線學(xué)習(xí)的學(xué)習(xí)質(zhì)量,為個性化教學(xué)提供一種新的方法。
參考文獻(xiàn):
[1]趙慧瓊,姜強(qiáng),趙蔚,李勇帆,趙艷.基于大數(shù)據(jù)學(xué)習(xí)分析的在線學(xué)習(xí)績效預(yù)警因素及干預(yù)對策的實證研究[J].電化教育研究,2017,38(01):62-69.
[2]宋遠(yuǎn)方,馮紹雯,宋立豐.互聯(lián)網(wǎng)平臺大數(shù)據(jù)收集的瓶頸與區(qū)塊鏈理念下的新發(fā)展路徑探索[J].管理現(xiàn)代化,2018,38(03):27-30.
[3]高學(xué)偉,付忠廣,孫力,張剛.基于HADOOP分布式支持向量機(jī)球磨機(jī)大數(shù)據(jù)建模[J].河北大學(xué)學(xué)報(自然科學(xué)版),2017,37(03):309-315.
[4]柳益君,何勝,馮新翎,等.大數(shù)據(jù)挖掘在高校圖書館個性化服務(wù)中應(yīng)用研究[J].圖書館工作與研究,2017,(5):23-29.
[5]王茜,鄧偉偉,喻繼軍.一種考慮群成員接受度及相似度的群體推薦算法[J].計算機(jī)應(yīng)用研究,2017,34(11):3285-3290+3298.
作者:郭飛雁 單位:湖南電氣職業(yè)技術(shù)學(xué)院經(jīng)濟(jì)管理學(xué)院