原创 kaggle 代碼pipeline學習

#留坑

原创 django分頁和消息隊列

起源於一個神奇的項目,內容就是爬取搜索引擎的搜索重新建立一個搜索入口.然後就碰到了一些問題: 1. 一次性爬取所有頁面的話爬取速度是一個問題,能不能爬一頁的內容先展示出來,後臺繼續爬取第二頁及以後的頁面,在繼續展示? 2.

原创 unicode 和 str(Python字符編碼解碼)

python讀寫字符串數據,最痛苦的事情之一就是編碼的問題,這裏收集並整理一下 ed在編碼解碼問題上一般會出現的幾種問題 1.爲什麼Python使用過程中會出現各式各樣的亂碼問題,明明是中文字符卻顯示成“/xe4/xb8/

原创 c++單元測試框架Catch

Catch是一個不錯的單元測試框架,幫助刷Leetcode github在此 使用也比較簡單,最簡單的方式就是直接下載Catch.hpp,做好引用。 #define CATCH_CONFIG_MAIN // This t

原创 [LeetCode]378. Kth Smallest Element in a Sorted Matrix

Given a n x n matrix where each of the rows and columns are sorted in ascending order, find the kth smallest elem

原创 [leetcode.Tree]563. Binary Tree Tilt

Given a binary tree, return the tilt of the whole tree. The tilt of a tree node is defined as the absolute differen

原创 探索性數據分析(EDA)

全版英文教程在此 探索性數據分析(EDA)目的是最大化對數據的直覺,完成這個事情的方法只能是結合統計學的圖形以各種形式展現出來。通過EDA可以實現: 1. 得到數據的直觀表現 2. 發現潛在的結構 3.

原创 STL Heap使用方法

概述 STL中的heap並不是container,默認是最大堆,如果需要最小堆,則需要添加參數greater<type>() 常用堆操作:make_heap(), pop_heap(), push_heap(), sort

原创 幾種樸素貝葉斯分類器

* 樸素的由來 * 樸素的假設:認爲各個特徵相互獨立。 * 種類 * 1. 高斯樸素貝葉斯(Gaussian Naive Bayes) 2. 多項式樸素貝葉斯(Multinomial Naive Bayes) 3. 伯努

原创 核密度估計(KDE)

對於大量數據的可視化,在一維數據中,直方圖(histogram)是一種普遍的方式,另外還有一種方式:核密度估計(kernel density estimation)。除了在可視化方面的用處以外,核密度估計有利與進行聚類算法的構

原创 Matplotlib入門

教程在此,點擊教程中的圖片會有相應的代碼。 總結如下: 在matplotlib.artist裏面有兩種類型:primitives和containers,primitives包含基本的圖形元素,如線Line2D,Rectangl

原创 協方差與協方差矩陣

參考文獻 1.http://blog.csdn.net/ybdesire/article/details/6270328/ 點贊 收藏 分享 文章舉報 Leonardo7

原创 工廠模式(facotory)

簡單工廠模式 由工廠函數控制具體生產出來的產品 class car: # 產品基類 def drive(self) class BMW(car): # 產品1: BMW def __init__(

原创 Seaborn教程

原教程 繪圖風格管理 控制圖形審美 matplotlib是高度自定義的,但是很難去知道怎麼調節參數獲得一個很漂亮的plot,Seaborn庫包含一些定製好的主題和一些高層次的參數去調節matplotlib的圖像。 Seabor

原创 Mac上安裝oh-my-zsh

1.克隆這個項目到本地(前提是你得有裝git) git clone git://github.com/robbyrussell/oh-my-zsh.git ~/.oh-my-zsh 2.創建一個zsh的配置文件 注意:如果你已經有