原创 用戶畫像從入門到挖坑 原

0、背景 用戶流量從搜索引擎爲入口的增量時代到移動互聯網普及人口紅利不再的存量時代,這個變化對每個公司的獲客成本,運營思路都產生了很大的影響,在流量日益枯竭,獲客成本越來越高的時代,伴隨着大數據、精細化運營、人工智能、機器學習等一大波新技

原创 Hive Lock 那些事兒 原

0、背景 最近兩天數據倉庫中一張核心表遭遇了鎖的問題,導致數據插入失敗,影響挺大,之前一直沒注意到這個問題,藉此總結一下這塊的知識和遇到的坑。 hive 在 0.7 版本之後開始支持併發,線上的環境默認是用 zookeeper 做 hiv

原创 文本編輯利器Notepad++ 10個強大而又鮮爲人知的特性 原 薦

Notepad++ 顧名思義就是 windows 內置 Notepad 的增強版,它採用 C++ 編寫,性能優秀,不僅小巧(完整安裝包僅 3.8MB),功能衆多,插件豐富,而且最關鍵的是“完全免費”!這一點比起 Editplus、Ultra

原创 CPU 100% 異常排查實踐與總結 原 薦

1、問題背景 昨天下午突然收到運維郵件報警,顯示數據平臺服務器cpu利用率達到了98.94%,而且最近一段時間一直持續在70%以上,看起來像是硬件資源到瓶頸需要擴容了,但仔細思考就會發現咱們的業務系統並不是一個高併發或者CPU密集型的應用

原创 深入分析詭異的 Excel 求和統計缺失問題 原

1、背景 昨天有同學在用 Excel 做數據統計時偶然發現 Excel 會少算一些數據,而且這個坑讓這位同學排查了很久才確認不是自己統計程序錯誤而只是 Excel 簡單的彙總出錯。最初看到這個問題時,我也覺得好奇:歷史如此悠久、普及率這麼

原创 一千個不用 Null 的理由 原

港真,Null 貌似在哪裏都是個頭疼的問題,比如 Java 裏讓人頭疼的 NullPointerException,爲了避免猝不及防的空指針異常,千百年來程序猿們不得不在代碼裏小心翼翼的各種 if 判斷,麻煩而又臃腫,爲此 java8 引入

原创 實戰 virtualenv 搭建多版本 Python 環境 轉

Python 2k、3k 問題已經存在很多年了,不僅是初學者學習,也是老碼農版本選擇、項目管理中遇到的一個頗爲頭疼的問題。而咱們今天要介紹的 virtualenv 可以搭建虛擬且獨立的多個版本 python 環境,使每個項目特有環境與其他項

原创 手把手教你 Spark 性能調優 原 薦

0、背景 上週四接到反饋,集羣部分 spark 任務執行很慢,且經常出錯,參數改來改去怎麼都無法優化其性能和解決頻繁隨機報錯的問題。 看了下任務的歷史運行情況,平均時間 3h 左右,而且極其不穩定,偶爾還會報錯: 1、優化思路 任務的

原创 SSD Win8 系統盤 4K 無損對齊歷險記 原

1、背景:爲什麼要 4K 對齊 簇是系統在硬盤上讀寫文件時的單位,是一個數據塊(邏輯概念)。而扇區是硬盤劃分的最小單位值,就是簇(數據塊)佔用的地方(物理概念)。NTFS對於大於2GB的分區,默認簇大小爲8個扇區(4KB)。 絕大多數的機

原创 MySQL 死鎖與日誌二三事 原 薦

最近線上 MySQL 接連發生了幾起數據異常,都是在凌晨爆發,由於業務場景屬於典型的數據倉庫型應用,白天壓力較小無法復現。甚至有些異常還比較詭異,最後 root cause 分析頗費周折。那實際業務當中咱們如何能快速的定位線上 MySQL

原创 線上服務 CPU 100%?一鍵定位 so easy! 原

0、背景 經常做後端服務開發的同學,或多或少都遇到過 CPU 負載特別高的問題。尤其是在週末或大半夜,突然羣裏有人反饋線上機器負載特別高,不熟悉定位流程和思路的同學可能登上服務器一通手忙腳亂,定位過程百轉千回。 對此,也有不少同學曾經整

原创 15 個簡單、有趣而實用的 單行 HTTP Server 原

不少語言或服務開發框架都內置了簡單的 Web Server 供我們方便的調試使用。比如有時候我們需要調試單個 PHP 頁面而不想搭建一套完整的 PHP 環境,亦或者我們只是臨時的共享一下文件而不想搭建一套完整的 Web 服務器或者 FTP,

原创 詳解 MySQL 5.7 新的權限與安全問題 原

1、新版 MySQL 權限問題:  問題:SQL Error (1130): Host '192.168.1.100' is not allowed to connect to this MySQL server     說明所連接的用戶

原创 Linux Shell 從入門到刪除根目錄跑路指南 原 薦

shell 作爲一門 linux 下使用廣泛的系統語言,語法簡單,上手容易,但是想要用好,少犯錯誤,也不是那麼容易的一件事,可謂雖是居家旅行之良藥,但也是殺人滅口之利器~ 今天就來聊聊 linux 下一個常見的問題:如何避免誤刪目錄。下文會

原创 Shell 黑科技之匿名函數實現任務並行化 原

shell 作爲一門系統級別膠水語言,學習成本低,用起來很方便,但是缺點也顯而易見:性能問題一直爲人鎖詬病。所以 shell 也就多用在簡單的系統管理等場合,數據處理等等要求比較高的場合一般會選擇 java、Python 等功能更強大、性能