原创 matplotlib 支持中文

支持思路: 找到matplotlib 字體目錄和配置文件 在目錄中添加中文字體並修改配置文件 畫圖的代碼指定中文字體 找到配置文件地址: import matplotlib print(matplotlib.matplotlib_fna

原创 分層拆分

分層拆分保證拆分後的數據集標籤列比例還一樣。比如在原來數據集中正負樣本比例是2:1,那麼在拆分後的測試集和訓練集中,正負標籤也是2:1。 可以用來修正隨機拆分後的測試集和訓練中比例不一樣的問題。 如果正樣本特別少,並且測試集也很少,那麼測試

原创 Mac給SSD開啓Trim

前提: 覆蓋寫入: 不刪除數據的情況下寫入 ssd 不允許覆蓋寫入。 hdd 可以覆蓋寫入 trim 的目標:實現覆蓋寫入 沒有trim寫入分成兩步:刪除->寫入 有了trim則就節省了刪除這個步驟,理論上提升寫入數據速度,並且避免了數

原创 joblib to implement multi-progress

from joblib import Parallel, delayed def get_pid(p_num): import os import time time.sleep(10) return "%

原创 迴歸評估:R2

表達式:R2=SSR/SST SSR(regression sum of squares)爲迴歸平方和 SST(total sum of squares)爲總平方和 SSR與SST接近時模型比較好,也就是R2=1, SST是一個常量, R2

原创 評估曲線

曲線: P-R X軸是Percision, Y軸是Reall。 Percision=TP/FP+TP,也就是預測是陽性並且正確的/預測是陽性的。這個值大意味着這個模型預測出來的陽性很多都是對的,當置信度大時,一般精確度也大。 Recall=

原创 python數組切片

numpy 切片 In [8]: arr = np.array( [[1, 2], [3, 4]]) In [9]: arr Out[9]: array([[1, 2], [3, 4]]) In [10]: arr[0]

原创 docker -ti

docker -it -t, --tty Allocate a pseudo-TTY -i, --interactive Keep STD

原创 LabelEncoder和OrdinalEncoder

# LabelEncoder OrdinalEncoder 輸入輸出 1d 2d 作用對象 目標列 特徵列 OrdinalEncoder 相當於 LabelEncoder 支持多列版,在列多時候有性能優勢,處理特徵時

原创 自定義React組件

如果還沒有項目,請看創建umi項目 . 訪問http://localhost:8000 實際由src/pages/index.js渲染,內容爲: export default function() { return "Hello" }

原创 dva數據流

數據流、我理解爲用戶輸入=> 後臺響應 => 頁面渲染, dva的作用是中間一環,把響應數據給頁面去渲染,把來自瀏覽器的數據發送給後端服務,這裏面的兩個關鍵問題: 如何把用戶輸入數據給dva, dva再傳給服務器 dva的數據如何傳遞頁面

原创 創建umi項目

使用umi構建react項目,先安裝umi: npm install create-umi umi -g 然後交互式創建項目: ❯ mkdir demo ❯ cd demo ❯ create-umi ? Select the boiler

原创 OS X/Mac 沒有聲音

重啓音頻服務: sudo killall coreaudiod

原创 rst標記語法

插入鏈接 `Hypernets <https://github.com/DataCanvasIO/Hypernets>`_ 效果: Hypernets 注意開始插入鏈接標記的開始和結束都要有空格。 行內標記 ``Searcher ``

原创 pandas自動推斷日期類型

構建一個csv文件: import pandas as pd pd.DataFrame(data={"datetime": ["1999-10-10 10:10:10"] * 150, "index": range(150)}).to_cs