台部落lww1993

1. 創建分區表: CREATE TABLE IF NOT EXISTS first_table( user_id STRING, salary decimal(10, 2), ) PARTITIONED by (part

2020-06-04 06:57:21

Error : cannot allocate vector of size X Gb 類似於這種問題的可能處理辦法： 1. 可以用matrix儘量不要用data frame; 2. 可以用integer matrix儘量不要用 doub

2020-06-04 06:57:21

獲取linux下的python命令位置: which python(which python3) whereis python(whereis python3) 獲取linux下的python 包安裝位置: pip list(pip3 l

2020-05-23 06:17:07

1. 如果是英語文檔的話，有一個非常好用的包，memor, 方便添加各種圖表，而且作者提供了模型； 2. 如果是中文文檔的話，推薦使用rticles包，裏面有ctex模板，非常方便寫中文pdf文檔，裏面可以使用Latex.

2020-05-16 14:57:48

1. 安裝 pip install pdfkit pip install Jinja2 同時安裝 wkhtmltopdf； https://towardsdatascience.com/creating-pdf-reports-with-

2020-05-12 13:08:04

1. map(function, list) x = ['a', 'b', 'c'] result = map(str.upper, x) list(result)

2020-05-10 16:18:46

常用的有兩種度量: Jaccard Similarity與Cosine Similarity Jaccard Similarity的定義如下: 兩組文本的交集大小除以兩組文本的並集大小； Cosine Similarity的定義如下

2020-05-08 20:12:26

https://lightgbm.readthedocs.io/en/latest/Parameters-Tuning.html lightgbm相比xgboost/catboost, 其是leaf-wise的，也就是其會首選可以最大in

2020-03-06 01:20:06

1. jupyter notebook輸出所有的代碼表達式: https://stackoverflow.com/questions/36786722/how-to-display-full-output-in-jupyter-not-o

2020-02-25 18:00:46

假定我們的問題是一個分類問題，要預測的變量Y={-1, 1}, X是解釋變量，樣本的個數是N. 第一步，給每個樣本一個初始的權重第二步，當m從1到M循環的時候，執行以下步驟： 1. 基於權重, 利用訓練集得到相應的分類器; 2. 計算

2018-08-25 19:47:05