基于二元邏輯回歸模型的MOOC退課預測
發(fā)布時間:2019-08-07 來源: 幽默笑話 點擊:
摘 要: MOOC(Massive Open Online Courses)作為一種新的教學模式正發(fā)展得如火如荼,但學員退課率一直高居不下,直接影響了MOOC教師以及MOOC平臺的發(fā)展。本研究以“學堂在線”平臺學員的學習行為數(shù)據(jù)為基礎,對影響退課的七種學習行為進行相關性分析,為了避免多重指標帶來的多重共線性問題,根據(jù)相關性較小的原則選擇其中的五種學習行為。最后采用二元邏輯回歸模型進行建模并預測學員的退課情況。實驗表明,選取的五種學習行為對退課影響顯著,預測準確率較高。本研究為MOOC教師盡早采取教學干預提供了一定的理論依據(jù)。
關鍵詞: MOOC; 學習行為; 相關性分析; 二元邏輯回歸; 退課預測
中圖分類號:G434 文獻標志碼:A 文章編號:1006-8228(2017)12-50-04
Predicting the MOOC dropout rate with binary logistic regression model
Guo Wenfeng1, Fan Chao1, Guo Xindong2
。1. College of Arts and Sciences, Shanxi Agricultural University, Taigu, Taigu 030801, China;
2. College of Information Science and Engineering, Shanxi Agricultural University)
Abstract: Although MOOC develops prosperously as a new teaching model, the dropout rate of trainee remains high all the time. This will directly influence the development of MOOC teachers and MOOC platforms. According to the data from xuetangx.com, this study analyzes the correlation of seven learning behaviors affecting dropout. To avoid multicollinearity generated from multiple indicators between seven learning behavior, five of them are selected based on the rule of little correlation. Binary logistic regression model is used to predict the dropout rate. Experiments demonstrate that the selected five learning behaviors have significant influence to the dropout and the accuracy of prediction is higher. The study offers a theoretic basis for MOOC teachers to take teaching intervention as soon as possible.
Key words: MOOC; learning behavior; correlation analysis; binary logistic regression; dropout prediction
0 引言
MOOC(Massive Open Online Courses),大型開放式網(wǎng)絡課程,簡稱“慕課”,是近幾年由美國一些著名大學發(fā)起的網(wǎng)絡學習平臺。與傳統(tǒng)的課堂學習相比,MOOC具有如下特點:①采用各種社交網(wǎng)絡工具,形式多樣化;②課程的學習不受空間和時間的限制;③課程對學員的學歷沒有任何限制;④更強調(diào)學員的學習自主性。
目前對MOOC的研究基本可以歸結(jié)為三類。
、 通過分析學習行為發(fā)現(xiàn)規(guī)律,改善MOOC教學活動以及評價體系。
Yousef等通過對在線課程、遠程課程和MOOC的相關文獻分析,提出了一套包含75個評價指標的MOOC質(zhì)量保障標準[1]。童小素等在借鑒已有評價規(guī)范的基礎上,采用文獻調(diào)研法和專家訪談法,建立了一套質(zhì)量評價指標體系,其中包括3個一級指標和26個二級指標[2]。秦瑾若等通過MOOC與傳統(tǒng)網(wǎng)絡課程教學活動的對比,提出基于深度學習理論的MOOC學習活動設計,并將其應用于“現(xiàn)代教育技術(shù)”課程中[3]。樊超等從人類動力學的角度對MOOC在線學習行為進行分析發(fā)現(xiàn),用戶的選課量和選課人數(shù)存在很大差異,在線學習具有陣發(fā)和重尾的特征,以及在線學習時間和次數(shù)服從冪律分布[4]。
⑵ 通過對學習行為進行統(tǒng)計分析,進而提出整改意見。
李帥等以東北大學MOOC平臺上的《高級語言課程設計》課程為數(shù)據(jù)集,對學生的知識點學習情況、在網(wǎng)站上的逗留時間以及觀看視頻的行為動作(快進/退、全屏、跳轉(zhuǎn)課程、暫停、滾動條滾動、文本模塊間跳轉(zhuǎn))進行了統(tǒng)計分析[5]。吳江等分別從選課、退課、課程參與和成績四個方面對愛課程網(wǎng)絡平臺上的一門課程的學習者行為進行統(tǒng)計分析[6]。王萍等基于edX平臺的數(shù)據(jù)集,采用統(tǒng)計分析方法,對學習者類型、特征、行為進行分析研究[7]。徐舜平等借鑒數(shù)據(jù)挖掘中的回歸分析方法,對“學堂在線”平臺的一門課程“電路原理”學習行為數(shù)據(jù)進行研究[8]。
、 通過對學習行為與學習效果之間的關系進行分析,建立模型對學習效果進行預測。
熱點文章閱讀