準備工作:
1.“雷丁學姐”給我的,10年收集的學生申請數據,以Excel的數據作爲整理。
2.Pytho 3.6本人使用Anaconda (數據包比較全)
基本實現方法:
學生數據解析,因爲“雷丁學姐”在整理學生的資料過程中,學生的相關信息過於複雜有很多的維度,需要提取主要的信息,學生的維度有,1)大學在國內的排名,2)大學是否是985,3)或者211,4)學生的支付信用,5)學生的實習經歷,6)學生是否參見了學校活動,7)學生是否在主要學科中獲得了比較高的成績,8)學生在於研究生課程相關的課程中是否獲得好成績,8)學生的雅思成績。9)推薦文書的是由那個老師執筆的
經過篩選“雷丁學姐”,案例中這1萬名學生的成績發現,學校看重的幾點
1)雅思成績是硬性要求
2)文書老師決定了學校的申請的成功率
3)學生的在校成績是對申請的很有影響的
己過這些分析我們基本得到了,每個專業的某分數的入取概率,
具體信息可以看着個視頻
https://v.qq.com/x/page/c091617pspe.html
算法採用機器學習,來學習這些變量與錄取率的關係
最終應用到“雷丁學姐”的研究生申請中