原创 使用Selenium模擬瀏覽器,實現自動爬取數據

最近需要在一個網站下載一批數據。但是輸入一個查詢,返回三四萬條結果,每次只能導出500條,而且每次還得輸入下載條目的範圍!這樣點擊下載,還不要了我的老命。於是乎想自動化這個過程。 我的需求主要是兩點:1. 要求自動化程度高。最好有直接模擬

原创 用Tableau畫3D模型之三(進階篇)

前兩篇文章我們介紹了3D模型的基本畫法和數據集的結構。如果你已經掌握了前面的內容,那麼就可以運用本篇文章的方法制作,輕鬆搞定一個3D模型。 本篇文章參考了《The 3D Tableau Full Monty》這篇很經典的教程,但是教程中製

原创 用Tableau畫3D模型之二(提高篇)

上一篇文章裏我們學習了雙軸旋轉的3D模型製作方法,由於建立的字段比較少,所以相對簡單。 本篇文章,我們學習三軸旋轉的3D模型,難度略微有些增加。 建立數據集 我們用上一篇中的第二個數據集,也就是增加了連線的數據   group,id,x

原创 Mac 上搭建 Flink 1.6.0 環境並構建運行簡單程序入門

準備工作 1、安裝查看 Java 的版本號,推薦使用 Java 8。 安裝 Flink 2、在 Mac OS X 上安裝 Flink 是非常方便的。推薦通過 homebrew 來安裝。 1brew install apache-flin

原创 用Tableau畫3D模型之一(入門篇)

這次我計劃用三篇文章來介紹用Tableau製作3D模型的方法,分爲入門篇、提高篇和進階篇。 今天我們先來入門,學習一下雙軸旋轉的3D模型製作方法。 相信很多接觸過Tableau的同學都看過Noah Salvaterra的3D特斯拉模型。當

原创 基於 Flink 和 Drools 的實時日誌處理

背景 日誌系統接入的日誌種類多、格式複雜多樣,主流的有以下幾種日誌: filebeat採集到的文本日誌,格式多樣 winbeat採集到的操作系統日誌 設備上報到logstash的syslog日誌 接入到kafka的業務日誌

原创 用Tableau畫冪函數柱狀圖

本文靈感來源於tableaumagic網站上的兩篇文章Drawing Curved Bar Charts in Tableau,用sigmoid函數來畫柱狀圖,大致效果如下。 另一篇Drawing Triangle Bar Charts

原创 用Tableau畫Arc Bar Chart

創建數據集   Category Start Point End Point Value Path Step A 2001 2005 10 1 1 A 2001 2005 10 1

原创 如何讓簽到成爲提升用戶活躍度的利器

本文將爲大家解讀哪些應用適合簽到功能,哪些應用不適合簽到功能,以及如何充分發揮簽到功能的潛力,讓用戶和應用都能夠從簽到功能獲益。   一、爲什麼要設計簽到? 傳統意義上的簽到絕對不是一件令人開心的事情, 因爲錯過簽到往往意味着懲罰,比

原创 如何分析和定位 Flink 作業 OOM 問題?

生產環境,我們的 Flink 作業偶爾會出現 heap OOM,那麼當出現這種情況我們會怎麼辦?通常來說會通過 jmap 命令去將作業的 heap dump 一份文件出來,可是 jmap 導出的文件我們也看不懂啊,那麼該怎麼分析呢?今天推

原创 用Tableau製作滾動時間軸(下)

上一篇文章《用Tableau製作滾動時間軸(上)》我們介紹了滾動時間軸的基本製作方法。這篇文章我們繼續豐富和美化時間軸。 製作內容顯示工作表 由於數據集內有大量的文字描述內容,那麼讓這些內容顯示到時間軸裏,就不太現實了。需要單獨建立一個工

原创 以貼吧和頭條爲例,爲什麼產品都有極速版和標準版

當用戶需要從應用市場上下載一款軟件的時候,往往可以發現不止一個版本。沒有任何標誌的爲標準版本,而除此之外往往還有一個極速版本。 此外不少軟件還有HD版本以及福利版本等多個不同的版本供用戶選擇。 本文將對比其中最常見的兩種版本極速版本以及

原创 鬥魚VS虎牙,誰纔是直播之王?一文帶你看看兩家平臺 的競品報告

直播是一羣孤獨者的狂歡,雖然每個用戶都在不同的地方,從事不同的工作,但通過直播這個平臺可以將大家聚集起來。讓大家同時參與到一場演出中來,直播驚人的流量以及豐厚的回報讓相應的產品接連產生,本文將帶大家瞭解其中知名的兩款。   直播作爲的

原创 用戶簽到功能優化競品分析

一、項目背景 一個好的用戶成長體系能夠提升用戶的主動活躍,用戶也可以從體系中獲得成就感、兌換禮品等權益。對於平臺講,也有利於提高用戶粘性和忠誠度。 用戶簽到功能是成長體系中的重要環節,在主流的新聞資訊應用中,今日頭條和趣頭條,可以將金幣兌

原创 LIBSVM 多分類問題- 葡萄酒種類識別

3.1 原始數據分析 1)測試數據爲:wine data set,儲存在chapter_WineClass.mat。classnumer = 3;wine,記錄了178個樣本的13個屬性;wine_labels.178×1,記錄了178個