Fast.ai Machine Learning for coders - Lesson 1

原創

2018-11-07 02:42

之前一直在吴恩达的公开课那块学习，一方面学习了一些算法以及思想，另一方面也了解了一些理论。现在开始看 fast.ai，以实践著称。作者Jeremy Howard并不是学术圈的人，是工业界的人，在Kaggle 2010和2011上得了冠军。其实有的时候啊，学术圈总是弄个准确率增加了0.1%啥的，类似于通信圈写了8页纸然后增加0.1 dB。所以想看看这种实践性的人是怎么考虑问题的。
因为是实践性的课程，所以就列出要点了：

现在比较好用的算法是结构化的数据，用集成的随机森林比较好使，非结构化的用深度学习比较好使。
Dimensional Curse和NO Free Lunch 两个理论是：“They are largely meaningless and basically stupid.”（这就是为啥我觉得为啥好多理论是bullshit）。因为首先数据并不是一个纯粹的随机数据，而是一个高维空间的低维流形。因此并不是说纬度越高，最后点与点之间的距离就没意义了，是依旧有意义的。另外一个NO Free Lunch也是第一个意思，就是数据不是纯随机的。如果是纯随机，那确实是这样。
如果是数值的特征发生了缺失，应该扩展一列，将缺失的按照1标注，没缺失的按照0标注，然后在缺失的位置填上平均数。如果是类别特征缺失，直接将缺失单独作为一列就可以了。
日期、时间特征的特征工程。需要给时间加上是不是周末，第几季度，是不是节假日等等。
随机森林很好用，把特征整理好之后，直接一跑，就能Kaggle 前25%。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

sorted 在python2和3中的区别

文章目錄sorted 在python2和3中的區別 sorted 在python2和3中的區別 python3中取消了cmp參數 python3中的使用方法如下: from functools import cmp_to_key

2020-07-08 12:31:35

monggoDB学习笔记

1、mongo是什麼關鍵詞：分佈式、可擴展、介於關係與非關係數據庫之間、文檔存儲、JSON格式存儲（可對字段建索引，實現關係數據庫的某些功能）、默認監聽端口27017 MongoDB是一個基於分佈式文件存儲的開源數據庫系統。由C++語言

2020-07-08 12:27:44

Shell编程入门（二）

多練習纔會記得牢這裏的題目來自於（個別刪選）知乎：shell編程如果當前用戶是管理員，則使用yum 安裝 vsftpd,如果不是,則提示您非管理員，不可安裝提示用戶輸入用戶名和密碼,腳本自動創建相應的賬戶及配置密碼。

存在即合理_

2020-07-08 11:22:52

在使用Django出现的疑难杂症

不知道會被笑的點讀法 Django的讀法是 [ˈdʒæŋɡo] 中文發音是迪亞戈重點是D 是輕輔音，讀出來的時候有點像是不發音。版本問題 Python3.0在 2020年是不支持 Django 3.0.4版本的。Djan

存在即合理_

2020-07-08 11:22:52

运维入门（一）

專業名詞出包：項目在執行機上運行，打包出結果，再由運維工程師轉交給開發工程師的一項活動。門禁：門禁指的是CICD的門禁，是指必要的時候進行一系列測試，以保證代碼的質量和其功能是否實現。一般由CI集成工具完成搭建與配置。門禁設

存在即合理_

2020-07-08 11:22:52

Shell编程入门（三）

簡單的Shell 命令 ll /usr/bin/java ll命令顯示詳細信息，如果java是一個目錄，顯示目錄中文件的詳細信息，如果java是一個軟連接，顯示軟連接的指向 ll ‘which java’ 顯示命令的詳細信息

存在即合理_

2020-07-08 11:22:52

Android M 新特性

六大特性： App Permission （軟件權限管理）安裝時候不會提醒權限，而是在使用時候由程序請求權限；用戶也可以在設置中對應用進行相關權限控制Chrome Custom Tags (網頁體驗提升) 登陸網站存儲密碼，自動補全資料

Jay白色风车

2020-07-08 10:03:22

学习笔记----伸展树

最近在看伸展樹，看到了一個不錯的文章，轉載一下便於以後學習轉載地址：http://dongxicheng.org/structure/splay-tree/ 1、概述二叉查找樹（Binary Search Tree，也叫二

2020-07-08 09:04:26

mini2440开发板学习裸机开发——day1 裸机运行LED灯程序

開發背景：系統：ubuntu18.04系統開發板:mini2440 串口連接工具 J-link連接工具工具：secureCRT J-link 本次學習基於韋東山老師的嵌入式linux應用開發手冊書，結合友善之臂給出的官方資料以

2020-07-08 08:59:17

java入门程序100例学习笔记（005递归调用）

問題：兩年期整存零取，每月1000元，年利率1.17，問應存多少錢思路：使用遞歸調用實現：問題：局部變量的問題，變量的定義應該放在哪裏總結：遞歸要掌握好代碼下載鏈接：http://download.csdn.net/detai

2020-07-08 06:59:06

pandas数据分析读书笔记（五）

plt.xlabel()，畫x軸標題 Plt.ylabel()，畫y軸標題 Plt.savefig(‘figpath.png’)，把圖片保存爲文件 S = pd.Series(np.random.randn(10).cumsum())

2020-07-08 06:46:51

Spring+SpringMVC+Mybatis项目中pom.xml模板

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaL

2020-07-08 06:30:02

Redis在Windows系统下安装成服务

我們知道Redis沒有Windows系統的安裝版。Windows系統下使用Redis，每次都要打開他的redis-server.exe，並保持cmd窗口不關閉，才能正常使用。要是一不小心關掉cmd窗口，那Redis服務也關閉了。其實Re

2020-07-08 06:30:02

小程序数据请求注意事项

本文僅作爲個人學習經驗總結，如有理解有誤的地方，歡迎在評論區指出，謝謝！1.小程序的請求格式官方文檔中有明確的說明，不懂得可以看官方文檔，微信小程序開發文檔2.微信只支持https的請求方式3.文檔中要求，客戶端的 HTTPS TLS

2020-07-08 04:25:07

js原生事件封装

自己寫的js事件的一些封裝，僅做學習筆記使用第一部分 event 添加事件，刪除事件，以及冒泡的屏蔽，並都做了兼容性的處理<span style="font-size:24px;">var event = { //添加句柄添

2020-07-08 04:25:07

24小時熱門文章

python gdal 安装使用（Windows， python 3.6.8）

最新文章

最新評論文章