原创 spark ML第二篇_ML流程

使用一個小型的合成數據集來幫助使用ML。 數據集解釋: 數據集包括了有兩個值(bad、good)的分類標籤,以及【其實應該說是啞變量】分類變量(顏色)、兩個數值變量。 雖然數據是合成的,但讓我們假設這個數據集代表了公司的客戶健康狀