前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數(shù)據(jù)挖掘的貧困助學金評定方法分析范文,希望能給你帶來靈感和參考,敬請閱讀。
【摘要】貧困學生的教育資助受到了國家、社會、學校的高度重視,為促進享受教育資源的公平性,需要建立更加完善的貧困生助學金發(fā)放制度,避免出現(xiàn)需要資助的學生未得到資助,而不需要資助的學生得到資助。通過大數(shù)據(jù)挖掘,結合某高校一卡通及貧困助學金發(fā)放數(shù)據(jù),利用K-means聚類分析模型,對學校的消費方式進行分析,得到最低消費人群占比25.5%,符合貧困生資助比例,但該校的資助比例為21%,未達到資助覆蓋面。由此方法構建的預測模型,可以為學校貧困生精準資助提供幫助。
【關鍵詞】數(shù)據(jù)挖掘;貧困生;分類預測;貧困資助
由于社會區(qū)域經(jīng)濟發(fā)展差異及地理環(huán)境等歷史原因,部分地區(qū)經(jīng)濟仍然不發(fā)達,貧困人口較多,特別是中國西部地區(qū)。這些貧困家庭中,又不少勤奮好學的學子,考上了大學,而其本人和家庭難以支付學生在校期間學費、生活費等,為不讓每一個學子因貧困失學,國家相關政府部門高度重視,近年來投入了大量的資金用于資助貧困學生,使得莘莘學子能圓滿完成學業(yè)[1]。而在對貧困生的認定在,也需要一系列相關的政策好和措施,從而才能起到真正幫助貧困學生的目的。建立一個完善的貧困學生資助體系,有效的降低因家庭貧困而造成學生失學的情況發(fā)生。目前諸多學校不僅僅依靠貧困補助,同時也已經(jīng)制定了許多辦法和措施來積極解決貧困學生的經(jīng)濟來源問題,比方各類的獎學金、助學金、勤工儉學崗位等,進一步擴大對貧困學生的資助額[2]。為保障貧困學生認定的公平、公正和公開,提高貧困學生資助工作的精準度,一方面需要學校在資助預算上分配準確,另一方面也需要對貧困學生的認定更加精確,就調(diào)研情況來看,現(xiàn)階段許多學校對助學金的評定分兩種情況,一種是在新生入學前通過學生家庭情況的調(diào)研,綜合考慮來評定助學金等級,另一種是根據(jù)在校學生的申請和各學院的評定來確定助學金的等級。雖然助學金的評價體系日趨完善,但仍然有一些不盡人意的地方,例如有些需要受到資助的學生并未獲得資助,少數(shù)并不需要自身的學生卻得到了補助等。因此,精準的資助同樣成為了現(xiàn)階段需要解決的問題。
一、學生行為數(shù)據(jù)分析
(一)數(shù)據(jù)來源學生一卡通數(shù)據(jù)及全校助學金發(fā)放情況,一般由于隱私保護這類數(shù)據(jù)較難查詢和獲得,因此,通過某官網(wǎng),獲取了某高校2016~2017年助學金發(fā)放情況,以及學生一卡通行為數(shù)據(jù)及學生的學習成績及排名情況。數(shù)據(jù)類型包括:圖書館借閱收集數(shù)據(jù)、圖書館門禁數(shù)據(jù)、一卡通數(shù)據(jù)、成績數(shù)據(jù)和助學金數(shù)據(jù)。(二)數(shù)據(jù)初探對選取的5個數(shù)據(jù)進行說明如下:1.圖書館借閱數(shù)據(jù)和門禁數(shù)據(jù)可以反映學生在校學習情況,分析學生在課后的學習興趣和學習態(tài)度,數(shù)據(jù)日期和時間非常準確,圖書編號缺失率僅1%,圖書名完整,不影響數(shù)據(jù)分析。2.學生的成績數(shù)據(jù)排名為學生所有數(shù)據(jù)的成績加權求和,然后除于總學分,并按照學生所在學院進行排名。3.助學金補償人數(shù)為學生總人數(shù)的21%,基本達到了助學金覆蓋學生20%~30%的要求,分為三檔:4000元、3000元、2000元,比例分別4%、7%、10%。4.學生一卡通數(shù)據(jù)量較大,且包含面較廣,基本包括:POS機刷卡消費、卡充值、存轉賬、換卡補卡等,其中POS機刷卡消費為頻率最高的部分,包括:超市購物、食堂、淋雨、洗衣房、校車、圖書館、校醫(yī)院等。
二、分類預測
(一)基于K-means的聚類分析該分析方法是將數(shù)據(jù)分成有意義或者不同特征的組,K-means是其中一種動態(tài)聚類分析方法,將多個樣本點依據(jù)某個特征來進行分離,使每一類樣本都是聚合的,并且每一類之間都有很好的差異性[3-4]。具體步驟如下:1.按照某種規(guī)則將樣本分為K類,計算該類重心,并作為初始凝聚點。2.計算出每個樣本點與各初始凝聚點的相似性,并將相似度進行歸類。3.重復步驟二,將所有樣本進行處理,使得所有樣本不再分配。相似度計算公式見式1。(式1)該方法的優(yōu)勢是能夠良好的將高消費人群和低消費人群區(qū)分開,使得能夠更好的分析助學金發(fā)放的準確性。(二)分析成果根據(jù)消費方式將學生分為4類,最低消費群體(A類)、較低消費群體(B類)、較高消費群體(C類)和高消費群體(D類),由此來拉開兩個極端群體的差異.利用K-means聚類得到消費最低的A類人群比例為25.5%,因此,學校應該擴大貧困資助比例。聚類分析成果見表2。其中消費水平最低的909人應當被認為貧困生,其中721位沒有受到資助。消費水平較高的238人,其中有43人受到資助。消費水平較高的D類中,僅校園卡平均消費已經(jīng)較高,不應再認定為需要資助的學生[6]。
三、結語
應用K-means聚類分析方法判定助學是否存在誤判的情況,能夠較為全面的反應學生在學校的消費水平和經(jīng)濟能力。
參考文獻
[1]郭兆云,黃文婷.影響高校貧困生認定公平性的因素及對策[J].學校黨建與思想教育,2016,(18):71-72.
[2]宋美喆.基于模糊綜合評價方法的高校貧困生認定研究[J].黑龍江高教研究,2016,(07):16-20.
[3]鄧巍偉.基于貧困生認定的高校資助精準化研究[J].長沙民政職業(yè)技術學院學報,2016,(01):110-112.
[4]楊良斌.數(shù)據(jù)挖掘領域研究現(xiàn)狀與趨勢的可視化分析[J].圖書情報工作,2015,(S2):142-147.
[5]賀瑤,王文慶,薛飛.基于云計算的海量數(shù)據(jù)挖掘研究[J].計算機技術與發(fā)展,2013,(02):69-72.
[6]雷燕,隗送爽.試析高校貧困生認定中存在的問題和對策[J].成都紡織高等專科學校學報,2010,(04):25-27+50.
作者:李瑾 單位:西安石油大學 陜西財經(jīng)職業(yè)技術學院