原创 跨境電商 Shopee 的實時數倉之路

導讀:本文講述 Flink 在 Shopee 新加坡數據組 ( Shopee Singapore Data Team ) 的應用實踐,主要內容包括: 實時數倉建設背景 Flink 在實時數據數倉建設中結合 Druid、Hive 的應

原创 置信學習:讓樣本中的“髒數據“原形畢露

在實際工作中,你是否遇到過這樣一個問題或痛點:無論是通過哪種方式獲取的標註數據,數據標註質量可能不過關,存在一些錯誤?亦或者是數據標註的標準不統一、存在一些歧義?特別是badcase反饋回來,發現訓練集標註的居然和badcase一樣?如下

原创 MySQL優化CPU消耗

誰在消耗cpu? 用戶+系統+IO等待+軟硬中斷+空閒         禍首是誰? 用戶 用戶空間CPU消耗,各種邏輯運算 正在進行大量tps 函數/排序/類型轉化/邏輯IO訪問... 用戶空間消耗大量cpu,產生的系統調用是什麼?那

原创 MAT分析OOM問題

生產環境,我們的 Flink 作業偶爾會出現 heap OOM,那麼當出現這種情況我們會怎麼辦?通常來說會通過 jmap 命令去將作業的 heap dump 一份文件出來,可是 jmap 導出的文件我們也看不懂啊,那麼該怎麼分析呢?今天推

原创 Flutter升級到1.12填坑指南

最近由於項目需要,需要把flutter升級到stable版本,目前的stable版本是1.12.13的hotfix,而我們項目目前的版本是1.7.3。Google在發佈flutter 1.12對Android做了不少改動,只能說官方的指南

原创 把MySQL中的各種鎖及其原理都畫出來

疫情期間在家工作時,同事使用了 insert into on duplicate key update 語句進行插入去重,但是在測試過程中發生了死鎖現象: ERROR 1213 (40001): Deadlock found when

原创 一個依賴搞定 Spring Boot 反爬蟲,防止接口盜刷!

kk-anti-reptile 是適用於基於 spring-boot 開發的分佈式系統的反爬蟲組件。原文http://33s.co/6s37 系統要求 基於 spring-boot 開發(spring-boot1.x, spring-bo

原创 微信實時Look-alike算法分享賞析

導讀:本期賞析分享是微信看一看團隊在 KDD2019 上發表的一篇論文。長尾問題是推薦系統中的經典問題,但現今流行的點擊率預估方法無法從根本上解決這個問題。文章在 look-alike 方法基礎上,針對微信看一看的應用場景設計了一套實時

原创 廣告出價--如何使用PID控制廣告投放成本

文章來源:AlphaSue https://zhuanlan.zhihu.com/p/139244173 背景 任何一個廣告投放體系在商業化的過程中必須考慮的兩個因素就是,投放成本、投放量. 只有投放成本低於整個商業鏈條中可接受的成本,這

原创 深入分析Netty的高性能

點擊上方疾風先生可以訂閱哦 在講述Netty的高性能特性之前,基於之前的epoll技術分析中談到C10K問題,其實是屬於一個性能優化問題,目的是爲了能夠在單臺機器上支撐更多的併發連接調度所做的性能優化,爲了達到上述目標,需要要求我們設計

原创 高速緩存與一致性

我一直堅持由淺入深的方式發佈文章,因此時間線就是很好的閱讀順序。但是文章日益增多,或許部分讀者喜歡閱讀自己感興趣方向的文章。因此,爲了方便大家,有必要引入一個索引。 首先是介紹高速緩存的基本原理,硬件是如何緩存和查找數據,這是個基礎入門。

原创 從原理上理解MySQL的優化建議

概述 自從學習 MySQL 以來,我們一直聽到或者看到很多優化建議,比如說不要用 select * 查詢,用什麼字段就查什麼字段;建議用自增主鍵來作爲表的主鍵,等等。這些建議聽得很多感覺都成了 MySQL 開發的常識了,但是對於這些優化建

原创 知識蒸餾在推薦系統中的應用

導讀:隨着深度學習的快速發展,優秀的模型層出不窮,比如圖像領域的 ResNet、自然語言處理領域的 Bert,這些革命性的新技術使得應用效果快速提升。但是,好的模型性能並非無代價的,你會發現,深度學習模型正在變得越來越複雜,網絡深度越來越

原创 Elasticsearch對壘8大競品技術

Elasticsearch當前熱度排名很高   青出於藍,而勝於藍。   入行Elastic-Stack技術棧很久很久,爲了免於知識匱乏眼光侷限,有必要到外面的世界看看,豐富自己的世界觀。本篇內容從Elastic的競爭產品角度分析探討。

原创 商業化廣告策略隨筆

導讀:隨着互聯網的高速發展,在線廣告的市場規模水漲船高,成爲互聯網主流的變現模式之一,也催生了一批廣告巨頭,如國外的Google、Facebook,國內的字節跳動、阿里、百度、騰訊,廣告在整個營收中佔據着重要的位置。本文將從廣告動態化、目