2020-10-29 Machine Learning (ML)

今天是2020年10月29日星期四

2/21【24/88】今天是開始習慣養成練習的第524天。

每日一練:

1.In the use of machine learning (ML):

A some techniques are termed “black box” due to data biases.

B human judgment is not needed because algorithms continuously learn from data.

C training data can be learned too precisely, resulting in inaccurate predictions when used with different datasets.

常言道:“要想人不知,除非己莫爲。”意思是,別以爲你偷偷摸摸躲在小角落裏看個霓虹視頻別人就不知道,第二天首頁都開始給你推送京東方的股票了。 還不是因爲老大哥(大誤)算法根據你喜歡霓虹視頻的特點,得出你對 LED 有 特殊偏好,所以給你推送了京東方的股票。

機器學習(Machine Learning)這個名字聽起來就很趕客,但其實它早已在 生活中應用了。比如如何用小程序查你另一半的手機。首先,要查詢的範圍是 TA 手機裏面所有的應用程序,所有格式的圖片,視頻,文本信息,語音,位置以及 轉賬等等這些信息,這個量非常大,光靠人力去做當然不大現實。這時候,機器 學習就閃亮登場了,把這些數據全部交給一個算法,定一些指標,比如給某個異 性轉賬超過 1000,和某個異性在視頻中或照片中有牽手擁抱這些舉動,或者跟 某個異性有非常曖昧的言語或者文字交流等。

觸犯這其中的任何一條都給出黃燈 警告,同時觸犯其中兩條就給出紅燈高度疑似出軌警告。同時滿足三條或者以上 就算事實出軌了。

那我們就建立了一個簡單地機器學習,把 TA 的手機裏面的數 據導入這個程序中就可以得出 TA 是否出軌的結論。當然,你怕冤枉了 TA,可以 等幾天再測一組數據,如果還中三元那就別存幻想了,如果這次測出的結論跟上 次存在衝突,那你就得三思了,是 TA 察覺到了什麼,還是冤枉 TA 了,這種模 棱兩可的結論被稱爲黑盒子(black box)。

當然還有一種很極端的情況,第一次一條沒中,第二次依然還是一條沒中, 出現這種情況你應該高枕無憂嗎?

我想這個時候你會倒吸一口涼氣吧。太假了吧, 你能信一個人平時跟別的異性沒有任何交集嗎?言談舉止非常正經,坐懷不亂, 你信這是 TA 嗎?從結果來看,兩次都沒觸犯這些規則,按照算法的規定那就是 非常清白的人。

但是我估計沒人會信,大家都會覺得這貨絕對把很多數據都從手機裏面刪去了,絕對心裏有鬼。那麼這種讓機器學習看起來擬合程度非常高的, 但實際非常假的結論就被稱爲過度擬合(over-fitting),想要驗證也很簡單嘛, 對於這類貨多關注,不信 TA 露不出馬腳。

所以光靠這些鐵憨憨去查出軌是不靠 譜的,還是用點子智慧。 現實中我們常說人無完人的,滿身都是優點沒有缺點的你還是離我遠一點吧。

C is correct. Overfitting occurs when the ML model learns the input and target dataset too precisely. In this case, the model has been “over trained” on the data and is treating noise in the data as true parameters. An ML model that has been overfitted is not able to accurately predict outcomes using a different dataset and may be too complex.

阮建清

2020-10-29

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章