台部落htuhxf

直接上結論： apply()和apply_async().get()可以說是一樣的，但在處理task上有點不一樣。使用apply_async().get相對節省時間。一、爲什麼兩者可以說是一樣的？首先扯點歷史（鏈接）

2020-06-30 11:01:29

注：本文幾乎所有東西都不是原創，但鑑於來源複雜不易查明、僅作爲個人筆記查詢，故不再一一插入鏈接。如有侵權，立刪。 1. SVM是什麼？ Support Vector Machine。一個普通的SVM就是一條直線，用來完美劃分lin

2020-06-30 11:01:29

混淆矩陣前提概念縮寫全拼含義 TP True Positive 預測對了，預測了“Positive” FN False Negative 預測錯了，預測了“Negetive” FP False

2020-06-30 11:01:29

一、座標軸的label（stackoverflow鏈接）根據pandas官方文檔： The plot method on Series and DataFrame is just a simple wrapper aroun

2020-06-30 11:01:29

一、算法圖解首先，圖a & 圖b：指定cluster的個數。上圖設k=2（初始點爲從圖b開始出現的“+”號）；其次，圖c：把每個數據樣本劃到到最近的中心點那一cluster；再次，圖d & 圖e：指第一輪化cluster

2020-06-30 11:01:29

時間序列模型：嚴格來說包含4個要素，Trend/趨勢、Circle/循環、Seasonal /季節性和不規則要素。但是實際中C和S差不代指同一個東西。一組時間序列數據有可能包含T和S，這都導致數據集不平穩。因爲T會造成均值跟

2020-06-30 11:01:29

Q：我知道r2_score表示的是在總變變量中模式解釋的百分比。但是explained_variance_score和它有什麼區別？ A：從公式的差別角度看：當殘差的均值爲0時，它倆是一樣的。至於用哪個，就看你有沒有假設殘差均值

2020-06-30 11:01:29

一、算法圖解 DBSCAN：Dense-Based Spatial Clustering of Applications with Noise（基於密度的&帶噪點的空間聚類應用方法）舉個栗子：此處潛在設定條件：Min_sm

2020-06-30 11:01:29

用於分類和迴歸一、優點簡單易懂，條理清晰，可以用圖畫出來；需要較少的數據預處理，計算量不大。其他算法常常需要數據標準化、刪除空值、創建虛擬變量。需要注意的是，此處模型不支持缺失值； Tree的使用成本（例如預測）等於訓練數

2020-06-30 11:01:29

例如，有如下數字： df = pd.DataFrame({'a': ['A', 'A', 'A', 'B', 'C'], 'b': ['H', 'H', 'I', 'J', 'J']}) pr

2020-06-30 11:01:29

官方文檔：MySQL 8.0 Reference Manual: 10.9.2 The utf8mb3 Character Set (3-Byte UTF-8 Unicode Encoding) 首先，上結論：國際上的UTF

2020-06-30 11:01:29

df = pd.DataFrame({'name': ['A(上海)AAA', 'BB(上海)BB', 'CCC', 'DDD'] }) print(df) # 結果如下 na

2020-06-30 11:01:29

背景：SARIMA，簡單說就是AR+MA+差分+季節性因素+趨勢。所以參數在statsmodels.tsa.statespace.sarimax.SARIMAX裏邊，用3個指標涵蓋核心參數，order(p,d,q)、season

2020-06-16 13:07:43

來源：How do I flatten a python/pandas pivot table and manipulate the column names?鏈接這裏。問題：把一般情況下得到的透視表，變成想要的格式： ""

2020-05-31 20:26:27

官方文檔鏈接數據給定&模型給定的前提下，怎麼提高訓練模型的效果？數據和模型給定之後，我們只有一條路：提高數據的利用效率。方法有兩個： 1）使用train_test_split函數分成訓練集和測試集； 2）通過CrossValidato

2020-05-31 20:26:16