原创 tableau----LOD(level of detail)詳細級別表達式

tableau的的計算維度分類 非視圖級別聚合計算或表達式 視圖級別聚合計算 行級別計算(顆粒度最細緻) 按照顆粒度的從低到高,從整體到詳細,分爲如下情況: 顆粒度 計算方式 含義 聚合的聚合 表計算 windo

原创 R語言----泊松迴歸

泊松迴歸包括迴歸模型,其中響應變量是計數形式。 例如,足球比賽系列中的出生次數或勝利次數。 此外,響應變量(因變量y)的值遵循泊松分佈。 泊松迴歸的一般數學方程爲 : log(y) = a + b1x1 + b2x2 + bnx

原创 kaggle--House Price(房價預測)--線性迴歸模型

關於kaggle–House Price(房價預測)的入門級解答 本文只涉及入門級的完成,所以對於數據的處理和模型較爲粗略,並不涉及詳細優化,所以kaggle的提交測試了一下應該是處於中間水平,後續優化請按照個人蔘考修改。 數據集

原创 Tableau 羣集部署

目錄: 一.安裝和配置工作服務器 二.其他參考文檔 一. 安裝和配置工作服務器 在做操作之前可以先看官方的相關文檔瞭解一下概念. Improve Server Performance http://onlinehelp.table

原创 如何解決--tableau維度超過X個後自動合併

當維度超過6個的時候,tableau自動合併維度展示,如下操作可以取消自動合併: 分析 >> 表佈局 >> 高級 選擇最大列標籤級別數 同理行的最大展示也可以更改

原创 詳解錯誤---IndexError: too many indices for array

問題來源:參照一個網上案例 問題 這段代碼是有效的: >>> a = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]]) >>> a[: , 2] array([ 3, 7, 11])

原创 R語言----(標準正態&二項)分佈

標準分佈也即是:正態分佈。 在來自獨立源的數據的隨機集合中,通常觀察到數據的分佈是正態的。 在圖中,曲線的中心表示數據集的平均值。 50%的值位於平均值的左側,另外50%位於圖表的右側。 正態分佈 開始前先附一篇下述四個函數的統

原创 kaggle--Digital Recognition(數字識別)--kNN算法

關於kaggle-----Digital Recognition(數字識別)項目的算法詳解, 題目鏈接: https://www.kaggle.com/c/digit-recognizer 需說明,因爲本題目使用了KNN算法,所以

原创 Tableau Server 9.1.2 配置集羣手冊

Tableau Server 9.1.2 配置集羣手冊 由於工作中需要使用TableauServer,如果只安裝單機版,儘管我們的單機服務器配置已經很不錯了,但是在使用的時候依然感覺有點力不從心,最明顯的表現是每天的數據提取定時任

原创 面試中常見的三個SQL問題及詳解總結

題目1:客戶活躍度 有一個表VUA,裏面有ID,DATE兩個變量, 要選出在3.5號出現的用戶ID,在後三天3.21-3.23出現的總次數統計 建表語句: create table vua ( id varchar(20) no

原创 R語言----方差與協方差分析

直接舉個栗子: 考慮在數據集mtcars中內置的R語言。 在其中我們觀察到汽車的每加侖英里數(mpg)取決於馬力(“hp”)的值。 又觀察到汽車的每加侖英里數(mpg)也取決於字段“am”表示傳輸的類型(自動或手動)。 它是值爲0

原创 本命年起起落落,被金三銀四踩踏着上船成功,又努力抗爭病魔

差點被病情戰勝,一個月沒更博…今年23,這一篇,感嘆本命年曲曲曲曲曲曲曲曲折折~ ……………………………………………………… 逃離奇怪的圈 還有兩週,我就是一個有兩年工作經驗的成熟社畜了。 兩年前還記得被公司用善意的謊言招來爲國

原创 A/B 測試的統計學原理及用例詳解

統計學在 A/B 測試中的作用 A/B 測試是一種對比試驗(下文中對比試驗特指 AppAdhoc 平臺上的 A/B 測試),而試驗就是從總體中抽取一些樣本進行數據統計,進而得出對總體參數的一個評估。可以看出,做試驗並從試驗數據中得

原创 Pyhton--家用電器用戶行爲分析與事件識別--多層神經網絡

問題背景 如果你是一個家電公司的,你要賣熱水器,但是不同的地區氣候、不同區域、用戶的差別都會導致使用不同,你爲了能因地制宜,因人而異的掙更多錢,你需要了解用戶的熱水器使用習慣。由於你們公司熱水器能記錄用戶熱水器的溫度,開機,加熱等