原创 拉勾數據告訴你,如何選擇大數據行業切入點

=========版權所有,如需轉載,請聯繫作者========= 長文預警:本文5000字,各位看官可挑選感興趣的章節查看,全部讀完體驗更佳哦 這份報告是我正好在一年前(2018.6)寫的,基於2018年6月成都地區的拉勾數據進行的挖掘

原创 零經驗轉行數據分析,需要做什麼準備?

數據分析讓我通過數據,以“上帝視角”看世界,這是我選擇數據分析行業的主要原因。 本文從以下幾點爲你梳理轉行數據分析的思路, 人人都可以轉行數據分析麼? 數據分析行業升級路線 轉行數據分析的學習路線以及資源 花了一週時間打磨這篇文章

原创 數據降維 | 主成分分析(PCA)

01 數據降維 數據分析中,我們常常面對較大的數據集,這裏的“大”,一是指樣本量大(如千萬量級),二是指高維度(如幾百個維度)。因此在正式分析這些大數據前,我們需要對它們做預處理,從而縮減數據維度,提升處理效率和訓練效果。 數據降維就是一

原创 經典梳理|經濟機器是如何運轉的

01 資源分享 宏觀經濟說來與我們平常百姓的錢袋子沒啥關係,不過仔細想想,如果我們能夠理解當前所處的經濟週期,就能夠遊刃有餘地進行投資決策:擇時和配置。 這裏有一個帶我們零基礎理解宏觀經濟週期的資料,我真誠地把它分享給你。 Ray Dal

原创 FP-Growth|高效挖掘頻繁項集

01 搜索引擎如何聯想的? 在使用搜索引擎時,你應該會發現一個現象:當我們在搜索框輸入一個字符時,它就會幫你聯想補全後面的搜索內容。 比如,你想搜索“西瓜”,當你輸入“西”時,搜索引擎會幫你聯想出“西部、西瓜、西南地區”等等。這大大提高

原创 Apriori | 挖掘關聯規則

01 啤酒與尿布 好久沒寫代碼了,腦子快生鏽了,今天我們來實操一個比較有意思的算法——Apriori算法。 Apriori算法是一種用於挖掘數據集內部關聯規則的算法,“apriori”在拉丁語中翻譯爲“來自以前”,聽意思你應該就能猜到了,

原创 樹迴歸

在上一篇文章中,我們比較全面地學習了線性迴歸的原理是實現,今天我們還是留在迴歸板塊,針對樹迴歸進行學習和實踐。 01 樹迴歸原理 相比於線性迴歸,樹迴歸更適合對複雜、非線性的數據進行迴歸建模。 原理 回想一下決策樹,樹迴歸的原理就是決策樹(

原创 量化計算 | 你值多少錢?

嘿,其實正標題叫:如何評估一個企業的內在價值 01 起 在前一篇文章[宏觀經濟形勢將如何影響我們的錢包]中,我說到“2019年會有很多有價值的投資機會,但能不能慧眼識珠,還是看個人的投資能力。” 長期來看,我看好中國A股市場,我認爲201

原创 預測 | 宏觀經濟形勢將如何影響我們的錢包

01 投資決策 你的財富增長與否,與你的努力勤奮拼命工作關係並不大! 如果掙了錢不去理它,它將年年貶值,如果掙了錢亂理財(不跟着宏觀經濟趨勢的方向理財),它可能化爲烏有。 所以我們要做正確的投資決策。 投資決策,就是要回答三個問題:投什麼

原创 思考人生 | 目標管理小組

01 誰都逃避不了的拷問 最近在思考一個問題:一生中,不論任何人說了什麼話、做了什麼事,任何逆境,都不會動搖我去做的事情,是什麼? 我越是思考,越是迷惑,到底什麼事情能讓我毫不動搖地去完成呢?到底什麼事情我這一生要是做不到就會滿懷遺憾

原创 聚類 | KMeans理論與算法實現

01 物以類聚 經過半年的不懈努力,我們已經學習並實踐了經典的分類算法和經典的迴歸算法,下面我們開始學習經典的聚類算法(興奮~~~) 目前打算對三種聚類算法進行學習和代碼實操(俗稱“造輪子”): KMeans Apriori FP-G

原创 一場桌遊引發的思考

週末被朋友拉着去玩了一場桌遊,作爲經常玩桌遊的老司機,我還是得說,這場桌遊讓我受益匪淺,可以這麼說,從這場桌遊得到的啓發將對我之後的生活產生巨大的影響。 我想把這份感悟分享給你,希望你也有一些收穫,或許親身參與這個桌遊會更有感悟。 01

原创 樹迴歸|理論與算法實現

在上一篇文章中,我們比較全面地學習了線性迴歸的原理是實現,今天我們還是留在迴歸板塊,針對樹迴歸進行學習和實踐。 01 樹迴歸原理 相比於線性迴歸,樹迴歸更適合對複雜、非線性的數據進行迴歸建模。 原理 回想一下決策樹,樹迴歸的原理就是決策樹

原创 常見線性迴歸|理論與算法實現

01 分類 v.s. 迴歸 之前我們學習了很多分類方法,在機器學習中,還有一種任務叫回歸,迴歸和分類其實挺像的,都是對樣本預測一個值,區別在於, 分類:輸出爲離散值 迴歸:輸出爲連續值 今天我們學習一波線性迴歸的理論和算法

原创 AdaBoost | 算法實現

在這篇文章中,我們一起學習了AdaBoost算法的原理,今天我們在python3的環境下,根據原理,自己寫一段代碼來實現AdaBoost算法。 01 構造單層決策樹 邏輯: 遍歷數據集的每個特徵: 遍歷特徵的每個步長: