原创 大數據正當時,理解這幾個術語很重要

目前,大數據的流行程度遠超於我們的想象,無論是在雲計算、物聯網還是在人工智能領域都離不開大數據的支撐。那麼大數據領域裏有哪些基本概念或技術術語呢? 今天我們就來聊聊那些避不開的大數據技術術語,梳理並補充我們對大數據的理解。01 離線計算

原创 Apache Kafka 版本演進及特性介紹

前段時間有一個同事問到:Kafka 0.8.2 只能使用Zookeeper連接嗎?雖然仍有一部分Kafka的老用戶在使用 0.8.x 版本,但 Kafka 0.8.x 確實是比較老的版本了。如果不是對Kafka非常熟悉,很容易忽略各個版

原创 日均 5 億查詢量的ElasticSearch架構如何設計?

作者:張sir   來源:京東技術(id:jingdongjishu) 背景 京東到家訂單中心繫統業務中,無論是外部商家的訂單生產,或是內部上下游系統的依賴,訂單查詢的調用量都非常大,造成了訂單數據讀多寫少的情況。 京東到家的訂單數

原创 京東JDHBase異地多活實踐

JDHBase在京東集團作爲線上kv存儲,承擔了大量在線業務,11.11、6.18 均經歷了每天萬億級讀寫訪問請求,目前規模達到7000+節點,存儲容量達到了90PB。場景涉及商品訂單、評價、用戶畫像、個性推薦、金融風控、物流、監控等7

原创 Flink 1.10.0 重磅發佈,迄今最大規模版本升級!

翻譯|宋辛童校對|李鈺Apache Flink 社區迎來了激動人心的兩位數位版本號,Flink 1.10.0 正式宣告發布!作爲 Flink 社區迄今爲止規模最大的一次版本升級,Flink 1.10 容納了超過 200 位貢獻者對超過

原创 字節跳動,正在動搖騰訊的根基

最近幾年,互聯網圈裏風頭最盛的公司,當屬字節跳動。接連推出今日頭條、抖音、西瓜視頻、火山小視頻等十餘款爆品APP,其中6款產品日活上千萬,更有抖音這種國民級應用。時至今日,字節跳動估值已經超過750億美金。僅此於騰訊、阿里。  以上,是

原创 HBase 性能測試之讀寫P999延時壓測實踐

我們在使用HBase的時候,必須要能夠清楚HBase服務端的性能,這對HBase的合理使用以及性能調優都非常重要,所以一般在使用HBase之前,建議做一些必要的基準性能測試,其中,讀寫P99/P999延時就是一項衡量HBase性能的關鍵

原创 網易基於 HBase 的最佳實踐

本文根據網易杭州研究院技術專家範欣欣在中國HBase技術社區第3屆 MeetUp 杭州站分享的《網易HBase實踐》編輯整理而成。HBase 在大數據領域的地位網易 HBasae 核心應用場景RIT & HBCKHBase 問題排查思路

原创 分佈式一致性算法:解決分佈式系統 80% 核心問題

身爲後端工程師,你對這類招聘要求肯定不陌生:熟悉分佈式系統的設計和應用;熟悉分佈式、緩存、消息、搜索等機制;對分佈式常用技術進行合理應用、解決問題等等。 而這其中,又以分佈式協議與算法尤甚。很多大公司在招聘架構師或高級工程師時,都要求熟

原创 全網最細緻的 HBase 內核解析

最近在網上看到一篇很好的講 HBase 架構的文章(原文:https://mapr.com/blog/in-depth-look-hbase-architecture/),簡潔明瞭,圖文並茂,所以這裏將其翻譯成中文分享。圖片引用的是原文中

原创 一文讀懂 HBase 核心原理與應用場景

HBase是大數據NoSQL領域裏非常重要的分佈式KV數據庫,是一個高可靠、高性能、高伸縮的分佈式存儲系統,目前國內知名公司都有在大規模使用,社區也非常活躍。本文就是學習HBase的敲門磚,主要從以下幾個方面解讀HBase。 1、存儲引

原创 穿梭時空的實時計算框架——Flink對於時間的處理

Flink對於流處理架構的意義十分重要,Kafka讓消息具有了持久化的能力,而處理數據,甚至穿越時間的能力都要靠Flink來完成。我們知道,對於流式處理最重要的兩件事,正確性,時間推理工具。而Flink對兩者都有非常好的支持。Flink

原创 必須要懂的Spark內存管理模型

0、前 言 Apache Spark是目前大數據領域主流的內存計算引擎,無論是在批處理還是實時流處理方面都有着廣泛的應用。我們跑作業的時候,首先要給Spark Job分配一定的資源,比如一個executor分配5G內存,有時候我們會糾結於

原创 巧用這19條MySQL優化,效率至少提高3倍

來源:21CTO本文我們來談談項目中常用的MySQL優化方法,共19條,具體如下:1、EXPLAIN命令做MySQL優化,我們要善用EXPLAIN查看SQL執行計劃。下面來個簡單的示例,標註(1、2、3、4、5)我們要重點關注的數據:t

原创 貝殼找房基於 Flink 的實時平臺建設

摘要:本文由貝殼找房實時計算負責人劉力雲分享,主要內容爲 Apache Flink 在貝殼找房業務中的應用,分爲以下三方面: 業務規模與演進 Hermes 實時計算平臺介紹 未來發展與規劃 業務規模及演進 下圖爲貝殼找房的業