前言:想要寫出一篇引人入勝的文章?我們特意為您整理了統計學專業大數據分析與處理課程規劃范文,希望能給你帶來靈感和參考,敬請閱讀。
關鍵詞:大數據分析與處理;課程規劃;Python;課程教學
1大數據背景
大數據時代已經到來,在商業、經濟及其他領域中基于數據和分析去發現問題并做出科學、客觀的決策越來越重要[1]。大數據從各領域的專業角度來看,大致可以從兩個方面來理解:一是大數據體現在數據的量、類型及產生速度上,不僅數據海量,還包含著各種半結構化數據和非結構化數據;二是在數據處理流程中,利用常規的統計軟件已經無法對當今的數據進行及時有效的存儲、分析及運用[2]。在數據的搜集上,相對于傳統的普查及抽樣等調查取得一手數據和通過非調查手段獲得的二手數據,大數據時代的來臨使數據搜集方式變為在線互聯網數據庫獲取的二手數據;在數據分析上,統計學方法采取的是對樣本數據的有目的的建模,而大數據分析技術則是通過云計算平臺,對大數據進行挖掘[2]。此外,大數據分析技術將幫助企業用戶在合理時間內獲取、管理、處理以及整理海量數據,為企業經營決策提供積極的幫助,而數據分析作為一門前沿技術,廣泛應用于物聯網、云計算、移動互聯網等戰略新興產業[3]。有實踐經驗的數據分析人才已經成了各企業爭奪的熱門,而與此發展趨勢不相協調的則是高校相關專業畢業生在大數據方向上基礎薄弱,真正掌握大數據管理、分析和產品研發等相關技術的人才極度匱乏[2]。為了推動我國大數據的發展,滿足日益增長的數據分析人才需求,我校特面向統計學專業學生開設大數據分析與處理課程。
2課程規劃與設計
2.1培養對象和目標
對于統計學專業學生來說,要想成為一個兼具統計學專業知識和大數據分析技能的合格人才,需要具備以下基礎:一是完整的數學和統計學知識體系,以專業理論知識為基礎,理解處理數據時采用的相關模型;二是具備搜集數據的能力,包括傳統的抽樣調查和從互聯網上抓取數據;三是具有計算編程的能力,以實現Hadoop、Hive等計算工具在大規模多源異構數據上的處理[4],特別地,應該掌握最兼容的腳本語言Python。通過大數據分析與處理課程的學習,使統計學專業學生不僅能利用Python進行科學計算、可視化繪圖、數據預處理,還能利用聚類、回歸、分類等算法對實際問題進行分析與建模,將理論知識與實踐運用相結合,為將來從事數據分析和挖掘研究工作奠定基礎。
2.2課程規劃思路
本課程的規劃主要擬從以下幾個方面展開:一是結合統計學專業學生的基礎,考慮其對課程的接受程度,選擇和安排合適的課程教學內容和教學方式。在課堂教學過程中,深入淺出地講解理論知識,特別地,要避免課堂上枯燥乏味的數學論證,同時需結合實例交叉進行,以激發學生學習與探索的興趣。二是將理論與實踐相結合,合理分配理論學時與實驗學時。配合課程的理論知識與實例,安排學生進行上機實驗,利用Python實現相關實例的操作與驗證。三是補充練習與案例討論部分,并在課程結束時安排課程設計環節。除了教材內的案例,適當補充當前生活中出現的具有代表性新案例,與時俱進;也可將學生進行分組,每個小組選擇一個感興趣的新案例進行深入分析與探討,以強化學生綜合運用知識、融會貫通的能力。
2.3課程教學內容安排
本課程擬采用黃紅梅和張良均編寫的教材《Python數據分析與應用》。在教學過程中,將采用理論與實踐相結合的教學方法,側重于培養學生的動手分析能力,因此,在總共40學時的課程學習中,安排理論課時16課時,實驗課時24課時。在理論學習中,通過任務引入概念、原理和方法;在實驗上機練習中,充分地利用現有的硬件資源和網絡資源,發揮學生的主觀能動性,指導學生使用NumPy進行科學計算,利用matplotlib進行基礎圖形繪制以實現數據可視化,使用pandas進行統計分析和數據預處理,使用sklearn進行建模,同時結合三個典型的綜合案例,引導學生將所學知識與企業需求相結合,將知識活學活用[3]。課程學時分配如表1所示,具體的理論教學內容如表2所示。
2.4教學效果評價與考核方式
對統計學專業學生來說,大數據分析與處理這門課程側重于培養學生解決實際問題的能力,而教學效果體現在學生平時上機實驗與課程設計中的動手操作能力,因此,該課程的考核方式設置為考查,學生的成績由平時實驗作業、課堂出勤以及課程設計三部分構成,占比為4:2:4。
3結論
本文對面向統計學專業學生開設的大數據分析與處理課程進行教學規劃與設計,結合學生的學情與基礎,在有限的課時內合理安排理論教學內容與實驗教學內容,通過理論與實踐相結合的方式,使學生既能理解大數據分析與處理的原理與方法,又能掌握分析和解決實際問題的能力。
參考文獻:
[1]張良均.Python與數據挖掘實戰[M].北京:機械工業出版社,2016.
[2]張海波,黃世祥.統計學專業學生大數據分析能力的培養方式選擇[J].統計與決策,2014(24):66-68.
[3]黃紅梅,張良均.Python數據分析與應用[M].北京:人民郵電出版社,2018.
[4]王濤,邵國強,鄒紅,付丹丹.“基于Hadoop的大數據分析”課程規劃與設計[J].電腦知識與技術,2015(11):190-192.
作者:何少芳 周麗 單位:湖南農業大學