好的特徵
本章比較簡單,直接貼代碼和圖片
python代碼
# coding=utf-8
# 什麼是好的特徵(feature)
# 要求判斷狗是灰狗還是拉布拉多
# 現在的數據有2個feature,一個是身高,一個是眼睛的顏色
# 首先說身高
# 灰狗的身高大概在28cm,正負4cm
# 拉布拉多的身高大概在24cm,正負4cm
# 我們來模擬一些隨機數據
import numpy as np
import matplotlib.pyplot as plt
# 生成500個數據
greyhounds = 500
labs = 500
grey_height = 28 + 4 * np.random.randn(greyhounds)
labs_height = 24 + 4 * np.random.randn(labs)
plt.hist([grey_height,labs_height],stacked=True,color=['r','b'])
plt.show();
# 可以看到圖像中間段,這些區間讓我們無法很好的判斷狗的種類
# 所以我們需要更多的特徵
# 由於狗的品種跟狗的眼睛的顏色沒有直接關係,所以"眼睛的顏色"是個"壞"的特徵
報表
藍色爲拉布拉多 紅色爲灰狗