原创 使用scikit-learn對csv數據文件構建決策樹並可視化

本篇內容是如何使用sklearn構建訓練評估決策樹模型,並使用官方API,或stackoverflow等一些網站上的大牛自定義的方法來可視化決策樹。 1、對數據進行處理並訓練評估模型 from sklearn.model_sele

原创 pyspark一些錯誤

1、在特徵列還未整合成一個"features"時,Assembler纔是將特徵列組合的,而不是用Stringindexer 出錯語句: indexer2 = StringIndexer(inputCol=new_columns_n

原创 np.where()函數(返回值很坑)

最近將matlab的代碼遷移到python,雖然有了numpy這個好用的工具,但是因爲索引的關係還是很煩。其中matlab find()函數轉換成np.where()函數就遇到了一些麻煩。 一、我們先來看看一維矩陣的對比 1、m

原创 吐血整理華爲MateBookD Win10+940MX顯卡下 安裝NVIDIA控制面板、CUDA、CuDNN、Anaconda環境GPU版本tensorflow2.0

先上一張圖,然後我們再詳細的談具體過程。不要被嚇跑了哦!應該沒什麼人能倒黴到我這樣整個流程圖都跑了一遍。 一、安裝CUDA10.0及其配套的CuDNN 記住,tensorflow2.0一定要安裝CUDA10,CUDA9是不行的

原创 記錄一次cupy pycharm報錯問題

我是用的阿里雲源pip安裝的cupy for cuda10.0 pip install cupy-cuda100 但是發現pycharm中發現將所有np改成cupy後,都爆出了沒有.array,.arange等方法,很是頭疼。 有

原创 數據樣本不平衡時處理方法(imblearn實現,pandas/numpy轉換)

def getDataAndSubsample(sample_strategy="under"): """ 獲得數據並採樣 :param sample_strategy: 採樣策略 :return:

原创 ImportError: cannot import name 'rcParams' from 'matplotlib' (unknown location)

這個問題很難說什麼原因。我在cmd中pip uninstall matplotlib想重裝都不行。 後來參考了 《關於不同python的兼容問題導致的ImportError: cannot import name ‘xxxx’》,

原创 華爲matebook win+deepin 15.11雙系統 + 雙顯卡 + 使用/卸載大黃蜂方案 + NVIDIA獨顯驅動安裝 + tensorflow-gpu-2.0

先說結果,我沒安裝成功NVIDIA的最新驅動,因爲我的BIOS上沒有切換顯卡的設置。 但是我覺得有幾個需要說的提醒在這裏總結一下! 1、如果你之前在windows上沒有裝過NVIDIA驅動或CUDA,可以通過這個網站看你的 顯卡是

原创 SoftmaxMultiClassObj: label must be in [0, num_class).

xgboost.core.XGBoostError: [00:13:00] src/objective/multiclass_obj.cu:110: SoftmaxMultiClassObj: label must be in [

原创 python numpy錯誤記錄

1、ValueError: all the input arrays must have same number of dimensions 我的代碼是這樣的: total_np_data = np.hstack([x_resam

原创 numpy.loadtxt()

np.loadtxt()用於從文本加載數據(文本格式csv,tsv等都可)。 文本文件中的每一行必須含有相同的數據。 loadtxt(fname, dtype=<class 'float'>, comments='#

原创 VS2017 const char*類型的實參與LPSTR 類型的形參不兼容

如果你是在windows創建進程函數CreateProcess中,嘗試輸入路徑參數時遇到該問題 if (!CreateProcess(NULL, "D:\\markdown\\Typora\\bin\\typora.exe",

原创 hdu 2015偶數求和

#include<iostream> using namespace std; int main() { int n, m; while (cin >> n >> m) { // end

原创 詳解埃氏篩選法篩選質數(C++實現)

說明:篇中的n和N都是同一個意義,大小寫不過是爲了表現具體和一般形式而已,穿插着用可能讓讀者容易混淆,請多體諒。 一、質數定義 指在大於1的整數中,只能被1和它本身整除的數。 二、埃氏篩選法最重要的結論: N有因數的話,那麼至少有

原创 python textblob+NTLK語料包下載

下載運行textblob包後可能會出現這樣的提示: textblob.exceptions.MissingCorpusError: Looks like you are missing some required data for