原创 pandas 學習 第15篇:分組 groupby

對DataFrame 和 Series 進行分組之後,會返回一個數據類型爲GroupBy的對象。對數據進行分組之後,能夠得到一個分組鍵和一個分組數據,一個分組對應的分組鍵是唯一的,分組是具有相同分組鍵的行或列的列表。 一,groupby函數

原创 PowerBI 開發 第22篇:異常檢測(Anomaly Detection)

異常檢測通過自動檢測時間序列數據中的異常來增強折線圖,並且提供了異常解釋,以幫助用戶進行根本原因的分析。異常檢測只能用於Line Chart中,並且必須有Date字段作爲X座標軸,實際上,PowerBI按照時間序列,用SR-CNN算法來檢測

原创 PowerBI開發 第21篇:關鍵因素(Key Influencer)

關鍵因素(Key Influencer)圖表能夠幫助用戶分析KPI的因素,並按照因素的重要性進行排名,也就是說,該圖表可以查看哪些因素會影響到KPI,並計算出因素的相對重要性。使用Key Influencer Visual,不僅可以查看單個

原创 【轉】評估分類模型的指標:ROC/AUC

原文:【機器學習筆記】:一文讓你徹底理解準確率,精準率,召回率,真正率,假正率,ROC/AUC 作者:xiaoyu 微信公衆號:Python數據科學 知乎:python數據分析師 ROC/AUC作爲機器學習的評估指標非常重要,也是面試中經

原创 DAX :操作數據表的函數 ADDCOLUMNS、SELECTCOLUMNS

函數ADDCOLUMNS和SELECTCOLUMNS的功能相似,都是迭代函數,在行下文中計算表達式,並返回一個表,但是從數據沿襲的角度來看: 在ADDCOLUMNS函數中,添加的列不具有數據沿襲的能力。 在SELECTCOLUMNS函數中

原创 DAX 第八篇:【翻譯】數據沿襲(Data Lineage )

數據沿襲實際上存在DAX中的每個角落,它的設計如此好,以至於很多開發人員在不知情的情況使用。 DAX使用數據沿襲來維護關於列值來源的信息。數據沿襲實際上是一個標籤(Tag),分配給表中的每一列,此Tag用於標識數據模型中的原始列,即列的值源

原创 DAX:直接過濾和交叉過濾

在篩選上下文中,一列可能是由於應用了過濾器而被直接篩選,也可能是由於關係的傳遞,其他列被篩選而導致該列被間接篩選。因此,可以把數據模型中的篩選分爲直接過濾和交叉過濾。 直接過濾:當過濾器直接作用到表中的一列上時,該列是被直接過濾的。直接過濾

原创 DAX:表值函數 VALUES、DISTINCT和FILTERS

表值函數 VALUES, DISTINCT 都用於返回一列的唯一值,唯一的區別是處理表種空行的行爲不同。 當關系代表的約束無效時,數據模型會再關係的“一”端的任何表中自動創建一個空行,這就是空值的由來,也就是說,在一個1:M的關係中,如果“

原创 在Windows服務器上啓用遠程桌面連接

按照以下的步驟來啓用遠程桌面連接,可以允許同時連接多人。 Step1:登錄Windows 服務器“”,打開“Start”(按下Windows鍵),輸入“Edit group policy” 或 “gpedit.msc”來加載“Local G

原创 DAX:RELATED 和 RELATEDTABLE

函數RELATED 和 RELATEDTABLE 用於在表達式內部操作關係,從關係的角度,這兩個函數的區別是: 在一對多的關係中,RELATED 用於從“多”端訪問“一”端,在這種情況下,相關表中至多有一行。如果數據行不存在,那麼RELA

原创 PowerBI開發:用自然語言來探索數據--Q&A

Power BI報表的用戶,肯定會被Q&A的功能驚豔到,在查看報表時,僅僅通過輸入文本就可以探索數據,並且結果是可視化的,更令人驚豔的時,結果幾乎是實時顯示出來的。這使得Q&A Visual就像一個搜索引擎,輸入你想查詢的問題,Q&A返回一

原创 Python 數據類型:布爾類型和None

bool(也叫邏輯值)有True和False,用於表示真或假。True和False是預先定義的關鍵字,在內部,True和False是bool的實例,實際上僅僅是內置的整數類型int的子類。True和False的行爲跟整數1和0是相同的。 有

原创 numpy 學習:數組的查找

1,查找最大值或最小值所在的索引 按照特定的軸查找最大值或最小值的索引 numpy.argmax(a, axis=None, out=None, *, keepdims=<no value>) numpy.argmin(a, axis=N

原创 numpy 學習:統計函數和相關性

數組的統計函數用於對數組做統計運算。 一,統計方法 NumPy內置數據分析常用的統計量: mean():計算元素的均值 median():計算中位數 var():計算元素的方差 std() :計算元素標準差 max():計算元素的最大值

原创 Python 開始:變量、操作符、print()和type()

Python的對象分爲變量和常量,常量的值是字面意思,其值是不可變的;變量的值是可變的,例如,123,"上海"是常量,而a=1,a=2,其中a是變量名。內置的核心數據類型有:數字、字符串、列表(list)、字典(dictionary)、元組