2020-10-29 Machine Learning (ML)

今天是2020年10月29日星期四

2/21【24/88】今天是开始习惯养成练习的第524天。

每日一练:

1.In the use of machine learning (ML):

A some techniques are termed “black box” due to data biases.

B human judgment is not needed because algorithms continuously learn from data.

C training data can be learned too precisely, resulting in inaccurate predictions when used with different datasets.

常言道:“要想人不知,除非己莫为。”意思是,别以为你偷偷摸摸躲在小角落里看个霓虹视频别人就不知道,第二天首页都开始给你推送京东方的股票了。 还不是因为老大哥(大误)算法根据你喜欢霓虹视频的特点,得出你对 LED 有 特殊偏好,所以给你推送了京东方的股票。

机器学习(Machine Learning)这个名字听起来就很赶客,但其实它早已在 生活中应用了。比如如何用小程序查你另一半的手机。首先,要查询的范围是 TA 手机里面所有的应用程序,所有格式的图片,视频,文本信息,语音,位置以及 转账等等这些信息,这个量非常大,光靠人力去做当然不大现实。这时候,机器 学习就闪亮登场了,把这些数据全部交给一个算法,定一些指标,比如给某个异 性转账超过 1000,和某个异性在视频中或照片中有牵手拥抱这些举动,或者跟 某个异性有非常暧昧的言语或者文字交流等。

触犯这其中的任何一条都给出黄灯 警告,同时触犯其中两条就给出红灯高度疑似出轨警告。同时满足三条或者以上 就算事实出轨了。

那我们就建立了一个简单地机器学习,把 TA 的手机里面的数 据导入这个程序中就可以得出 TA 是否出轨的结论。当然,你怕冤枉了 TA,可以 等几天再测一组数据,如果还中三元那就别存幻想了,如果这次测出的结论跟上 次存在冲突,那你就得三思了,是 TA 察觉到了什么,还是冤枉 TA 了,这种模 棱两可的结论被称为黑盒子(black box)。

当然还有一种很极端的情况,第一次一条没中,第二次依然还是一条没中, 出现这种情况你应该高枕无忧吗?

我想这个时候你会倒吸一口凉气吧。太假了吧, 你能信一个人平时跟别的异性没有任何交集吗?言谈举止非常正经,坐怀不乱, 你信这是 TA 吗?从结果来看,两次都没触犯这些规则,按照算法的规定那就是 非常清白的人。

但是我估计没人会信,大家都会觉得这货绝对把很多数据都从手机里面删去了,绝对心里有鬼。那么这种让机器学习看起来拟合程度非常高的, 但实际非常假的结论就被称为过度拟合(over-fitting),想要验证也很简单嘛, 对于这类货多关注,不信 TA 露不出马脚。

所以光靠这些铁憨憨去查出轨是不靠 谱的,还是用点子智慧。 现实中我们常说人无完人的,满身都是优点没有缺点的你还是离我远一点吧。

C is correct. Overfitting occurs when the ML model learns the input and target dataset too precisely. In this case, the model has been “over trained” on the data and is treating noise in the data as true parameters. An ML model that has been overfitted is not able to accurately predict outcomes using a different dataset and may be too complex.

阮建清

2020-10-29

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章