原创 數據探索很麻煩?推薦一款史上最強大的特徵分析可視化工具:yellowbrick

作者:xiaoyu 微信公衆號:Python數據科學 前言 玩過建模的朋友都知道,在建立模型之前有很長的一段特徵工程工作要做,而在特徵工程的過程中,探索性數據分析又是必不可少的一部分,因爲如果我們要對各個特徵進行細緻的分析,那麼必然會進

原创 還在抱怨pandas運行速度慢?這幾個方法會顛覆你的看法

作者:xiaoyu 微信公衆號:Python數據科學 知乎:python數據分析師 前言 當大家談到數據分析時,提及最多的語言就是Python和SQL。Python之所以適合數據分析,是因爲它有很多第三方強大的庫來協助,pandas就是

原创 【機器學習筆記】:一文讓你徹底記住什麼是ROC/AUC(看不懂你來找我)

作者:xiaoyu 微信公衆號:Python數據科學 知乎:python數據分析師 ROC/AUC作爲機器學習的評估指標非常重要,也是面試中經常出現的問題(80%都會問到)。其實,理解它並不是非常難,但是好多朋友都遇到了一個相同的問題,那

原创 還在爲找數據而發愁嗎?看完這篇應該再也不會了

作者:xiaoyu 微信公衆號:Python數據科學 知乎:python數據分析師 學數據分析當然要先有數據,數據是分析的根本,不然一切都是空談。如果是在公司裏,得到數據輕而易舉,因爲公司有客戶,有業務,必然會產生大量數據。但僅僅是個人

原创 【Kaggle入門級競賽top5%排名經驗分享】— 建模篇

作者:xiaoyu 微信公衆號:Python數據科學 知乎:python數據分析師 前情回顧 上一篇是數據挖掘的前戲,主要目的是認識數據特徵、判斷特徵重要性、觀察數據異常,掌握數據間聯繫。本篇將繼續上一篇分析進行數據挖掘建模部分。 上篇

原创 【Python數據分析基礎】: 異常值檢測和處理

作者:xiaoyu 微信公衆號:Python數據科學 知乎:python數據分析師 上一篇分享了關於數據缺失值處理的一些方法,鏈接如下:【Python數據分析基礎】: 數據缺失值處理 本篇繼續分享數據清洗中的另一個常見問題:異常值檢測和處

原创 .net字符串加密

1.使用 SHA1 生成散列  using System.Security.Cryptography;using System.Text;private string  Hashtext( String TextToHash)     

原创 C#處理JSON

using Newtonsoft.Json; using Newtonsoft.Json.Linq; using System; using System.Collections.Generic; using System.IO; usi

原创 如何使用Emqttd

1.下載安裝進入如下網站:     http://emqtt.com/downloads 進行下載下面以安裝Windows版爲例子:點擊紅框中的鏈接,進行下載.2.下載複製到D:盤,進行解壓 到emqttd目錄,2.1在cmd模式下, 進

原创 Mono--發佈程序

原创 VirtualBox安裝CentOS

向開源軟件看齊,向Linux看齊.記錄在VBox先安裝CentOS7.0的方法.1.1.新建虛擬機:名稱爲CentOS,版本因爲沒有CentOS,就現在Red Had,反正都是同一家公司的.1.2.設置內存大小(2G)1.3.創建硬盤。1

原创 Web.config中配置Access連接

Web.config  and Access config web.config : <configuration> <appSettings>    <!--連接ACCESS數據庫-->  <add key="ConnStr" valu

原创 將Dataview中的數據轉化爲EXCEL中的數據

//將Dataview中的數據轉化爲EXCEL中的數據 Response.ClearContent(); Response.AddHeader("conte

原创 C#中命名空間嵌套的兩種方法

在C#中有一個重要的管理代碼的方法,就是命名空間.現在我就和大家談談命名空間的兩種表示形式: 第一種方法: namespace a { namespace b

原创 軟件工程

現在開始複習軟件工程面向對象的開發方法了!!主要有OOA(Object Oriented Analyse面向對象分析),OOD(Object Oriented Desgin 面向對象設計),OOP(Obje