原创 數據中臺實戰(四):商品分析(產品設計篇)

上一講講了《數據中臺實戰(三):用戶分析(產品設計篇)》用戶模塊我們用的是海盜模型,從用戶的獲取、激活、留存、收入、推薦的角度來做分析。這些指標是沒問題,但是作爲電商產品,如果站在價值的角度來思考就有問題。 你可以分析下我們提到的用戶相關

原创 Flink 從入門到精通 Release 文檔解讀

集羣和部署 支持 Hadoop 3.0 及更高的版本:Flink 不再提供任何 flink-shaded-hadoop- 依賴。用戶可以通過配置 HADOOP_CLASSPATH 環境變量(推薦)或在 lib 文件夾下放入 Hadoop

原创 在Tableau中去除選擇高亮效果

在Tableau中,點擊選擇某些數據後,默認被選中的數據會高亮顯示,這本是一種人性化的設計。但是在一些特殊的應用場景中,高亮顯示會破壞整體的美觀和一致性,所以需要去除掉。 最近學到一個簡便的方法,運用篩選器去除高亮效果。 我們用銷售數據

原创 用Tableau畫小提琴圖

小提琴圖 (Violin Plot)是用來展示多組數據的分佈狀態以及概率密度。這種圖表結合了箱形圖和密度圖的特徵,主要用來顯示數據的分佈形狀。跟箱形圖類似,但是在密度層面展示更好。在數據量非常大不方便一個一個展示的時候小提琴圖特別適用。

原创 用Tableau畫圓形網絡關係圖

創建數據集 數據集就是隨機生成的,[index start]和[index end]就是[start]和[end]中,各字母的放在一起的總排序值,排序決定了每個點在圓環中的位置,這個可以參考上面和絃圖的文章。排序一定是按順序的。 Tab

原创 如何找到產品商業化的競爭壁壘?

近些年,越來越多的互聯網產品在創立之初就開始注重商業化模式的打造,畢竟歷史上有太多實現了上億流量但卻苦於商業化模式不明朗而遲遲沒有變現的產品。 那在這個過程裏,大家就會碰到同樣的一個問題,自家產品應該選擇怎樣的產品形態或者是怎樣的商業化模

原创 用Tableau畫延展條形圖(Extended Bar Chart)

Extended Bar Chart來自Rajeev Pandey大神,他在前人的基礎上進行了一些創造性的改進,把延展條形圖帶到了Tableau中。大家可以參考下面原文的介紹,學習基本的製圖思路。 https://vizartpand

原创 用Tableau快速製作網絡關係圖

創建數據集 唯一的一點點難度就在數據集的製作上,需要自己製作JSON文件,我用最簡單的例子介紹:   數據生成網站:https://observablehq.com/@ladataviz/network-data-generator {

原创 用Tableau製作3D旋轉地球

下載數據集 原文提供了兩種精確度不同的數據集,我們只需要用簡版的即可(2.86MB)。 簡版數據集Coast_Line_Rough:https://note.com/api/v2/attachments/download/26e4f60

原创 內容社區,爲什麼有必要做內容標籤系統?

社區內容量很大時,內容曝光有限,非常影響社區作者創作的積極性。爲了解決內容曝光有限的問題,內容標籤系統不失爲一種有效的解決方案。本文結合一些案例來探討,做內容標籤系統的必要性。   一、問題背景 社區產品中,在內容量大的情況下,曝光數

原创 美團是如何實現數據治理的?一篇長文帶你深入瞭解下

背景   大數據時代的到來,讓越來越多的企業看到了數據資產的價值。將數據視爲企業的重要資產,已經成爲業界的一種共識,企業也在快速探索應用場景和商業模式,並開始建設技術平臺。 但這裏要特別強調一下,如果在大數據“拼圖”中遺忘了數據治理,可能

原创 關於數據中臺的深度思考與總結

數據中臺   數據匯聚 數據匯聚是數據中臺必須提供的核心工具,把各種異構網絡、異構數據源的數據方便地採集到數據中臺中進行集中存儲,爲後續的加工建模做準備。數據匯聚方式一般有數據庫同步、埋點、網絡爬蟲、消息隊列等;從匯聚的時效性來分,有離

原创 滴滴出行2020數據分析面試題

  題目 問題 1.訂單的應答率、完單率分別是多少? 2.呼叫應答時間多長? 3.從這一週的數據來看,呼叫量最高的是哪一個小時(當地時間)?呼叫量最少的是哪一個小時(當地時間)? 4.呼叫訂單第二天繼續呼叫的比例有多少? 5.如果要對錶

原创 LIBSVM多分類問題 參數詳解及實例演示

前言 安裝包及具體安裝步驟,搜博主之前的MATLAB專欄文章 1. 入門案例  1.1 分類的小例子--根據身高體重進行性別預測 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21

原创 數據中臺實戰入門篇:數據中臺對內、對外合作機制

數據中臺人員構成 架構師:架構師是整個數據中臺團隊的技術負責人。涉及到大的模塊比如標籤平臺、推薦,要拿到業界比較成熟的架構設計,這樣有個參考,能避免我們踩很多坑。另外包括技術選型比如大數據常用的計算框架spark、handoop等用那個