原创 通過簡單示例來理解什麼是機器學習

  1 什麼是機器學習 什麼是機器學習? 這個問題不同的人員會有不同的理解。我個人覺得,用大白話來描述機器學習,就是讓計算機能夠通過一定方式的學習和訓練,選擇合適的模型,在遇到新輸入的數據時,可以找出有用的信息,並預測潛在的需求。最終反映

原创 Python: Pandas運算的效率探討以及如何選擇高效的運算方式

本文就Pandas的運行效率作一個對比的測試,來探討用哪些方式,會使得運行效率較好。 測試環境如下: windows 7, 64位 python 3.5 pandas 0.19.2 numpy 1.11.3 jupyter notebo

原创 Python庫:序列化和反序列化模塊pickle介紹

1 前言 在“通過簡單示例來理解什麼是機器學習”這篇文章裏提到了pickle庫的使用,本文來做進一步的闡述。 通過簡單示例來理解什麼是機器學習 pickle是python語言的一個標準模塊,安裝python後已包含pickle庫,不需

原创 Python項目實戰:福布斯系列之數據採集

1 數據採集概述 開始一個數據分析項目,首先需要做的就是get到原始數據,獲得原始數據的方法有多種途徑。比如: 獲取數據集(dataset)文件 使用爬蟲採集數據 直接獲得excel、csv及其他數據文件 其他途徑… 本次福布斯系列數

原创 乾貨: 可視化項目實戰經驗分享,輕鬆玩轉 Bokeh (建議收藏)

作者 | Will Koehrsen 翻譯 | Lemon 譯文出品 | Python數據之道 (ID:PyDataRoad) 本文通過一個項目案例,詳細的介紹瞭如何從 Bokeh 基礎到構建 Bokeh 交互式應用程序的過程,內容循序

原创 推薦:這纔是你尋尋覓覓想要的 Python 可視化神器

Plotly Express 是一個新的高級 Python 可視化庫:它是 Plotly.py 的高級封裝,它爲複雜的圖表提供了一個簡單的語法。 受 Seaborn 和 ggplot2 的啓發,它專門設計爲具有簡潔,一致且易於學習的 API

原创 PyCharm:2017.3版即將新增科學計算模式,預覽版現在可以下載使用

  編譯:Lemon,原文作者:Ernst Haagsman 公衆號:Python數據之道(ID:PyDataRoad) pycharm:2017.3版即將新增科學計算模式 在JetBrains將發佈的新版本PyCharm中,考慮到越

原创 世界盃:用Python分析熱門奪冠球隊-(附源代碼)

2018年,火熱的世界盃即將拉開序幕。在比賽開始之前,我們不妨用 Python 來對參賽隊伍的實力情況進行分析,並大膽的預測下本屆世界盃的奪冠熱門球隊。 通過數據分析,可以發現很多有趣的結果,比如: 找出哪些隊伍是首次進入世界盃的黑馬隊

原创 機器學習很枯燥,不想繼續學了怎麼辦?或許,這些建議值得一看

    本文介紹的是我在機器學習方面的 實際經歷,想以此給大家提供些建議與思路,供各位參考。 希望通過一些途徑,來提高機器學習的興趣: (1)參與打卡活動:45天機器學習實戰 (2)加入專門的微信羣 (3)建立機器學習的Github項目倉

原创 從歷史來看印度的裂痕和隱憂 | 閱覽羣書

2017年6月,印度軍隊進入我國洞郎地區,與印度相關的新聞成爲了近期的熱點。由於筆者幾年前去過印度,恰好最近又閱讀了《印度通史》一書,下面結合筆者自己的見聞、感想、書籍中的記錄以及查閱相關資料,對印度的大致情況做一個簡單的描述,希望能使

原创 歷史文章分類彙總-Anaconda安裝第三方包(whl文件)

  本文主要是對公衆號之前發佈的文章進行分類整理,方面大家查閱,以後會不定期對文章彙總進行更新與發佈。   一、推薦閱讀: Anaconda安裝第三方包(whl文件) 福布斯系列之數據分析思路篇 福布斯系列之數據採集 pyth