原创 聊聊機器學習之邏輯迴歸

一說到機器學習算法,相信很多人想到的第一個機器學習算法就是邏輯迴歸,那麼什麼是邏輯迴歸?怎麼用邏輯迴歸這一算法呢?這篇文章就跟大家來聊聊這個話題。不深入聊底層實現原理,純粹聊聊基於應用層面的一些知識。 1、什麼是邏輯迴歸 用一句話來解釋什

原创 python基礎知識整理--環境部署

相信一說到數據分析領域的編程語言,大多數第一反應就是Python,Python具有簡單、易學、速度快、免費、開源、高層語言、可移植性、解釋性、面向對象、可擴展性、可嵌入性、豐富的庫等優點,深受數據領域工程師的喜愛;數據挖掘和人工智能領域也

原创 聊聊大數據之特徵工程

1 特徵工程是什麼?   有這麼一句話在業界廣泛流傳:數據和特徵決定了機器學習的上限,而模型和算法只是逼近這個上限而已。那特徵工程到底是什麼呢?顧名思義,其本質是一項工程活動,目的是最大限度地從原始數據中提取特徵以供算法和模型使用。通過總