原创 Spark性能調優-Shuffle調優[轉]

• Spark底層shuffle的傳輸方式是使用netty傳輸,netty在進行網絡傳輸的過程會申請堆外內存(netty是零拷貝),所以使用了堆外內存。 • shuffle過程中常出現的問題 常見問題一:reduce oom?

原创 ElasticSearch的JVM淺談(轉)

JVM對ElasticSearch集羣的穩定性有很大的影響。 Java是一個垃圾收集語言,意思是這個程序不會手動管理分配和釋放內存。程序員只需要編寫代碼,jvm管理根據需要管理分配內存的處理,然後在不需要的時候清理。 Young (or

原创 ElasticSearch優化的一些方法 些方法

多線程程序插入,可以根據服務器情況開啓多個線程index 速度可以提高n倍, n>=2 如果有多臺機器,可以以每臺設置n個shards的方式,根據業務情況,可以考慮取消replias curl -XPUT ‘http://10

原创 Mysql索引命令

1.PRIMARY KEY(主鍵索引) mysql>ALTER TABLE table_name ADD PRIMARY KEY ( column ) 2.UNIQUE(唯一索引) mysql>AL

原创 Java命令學習系列(5):Jhat(分析java堆)(轉)

jhat(Java Heap Analysis Tool),是一個用來分析java的堆情況的命令。之前的文章講到過,使用jmap可以生成Java堆的Dump文件。生成dump文件之後就可以用jhat命令,將dump文件轉成html的形式,

原创 spark streaming driver內存泄露

症狀 spark streaming driver內存一直增長,直到小心臟受不了,凝固在那裏不死但是動不了內存爆滿。塊丟失 環境 amabri hdp 2.3 spark 1.4.1 hadoop/yarn 2.7 yarn-clien

原创 數據庫三範式總結

第一範式(1NF)所謂第一範式(1NF)是指數據庫表的每一列都是不可分割的基本數據項,同一列中不能有多個值,即實體中的某個屬性不能有多個值或者不能有重複的屬性。如果出現重複的屬性,就可能需要定義一個新的實體,新的實體由重複的屬性構成,新實

原创 Kylin基本原理

一、Kylin介紹 1.1 現狀 Hadoop於2006年初步實現,改變了企業級的大數據存儲(基於HDFS)和批處理(主要基於MR)問題,10幾年過去了,數據量隨着互聯網的發展井噴式增長,如何高速、低延遲的分析數據成爲後續面臨的挑戰,

原创 Kafka如何保證at-least-once

kafka最初是被LinkedIn設計用來處理log的分佈式消息系統,因此它的着眼點不在數據的安全性(log偶爾丟幾條無所謂),換句話說kafka並不能完全保證數據不丟失。 儘管kafka官網聲稱能夠保證at-least-once,但如果

原创 Linux權限修改

可以使用chmod命令,爲改文件提供其他的權限。u表示用戶、a表示全部、g表示組,r表示可讀、w表示可寫、x表示可執行,你可以使用“chmod a+w test.c”來添加權限,這是比較方便的直觀的方法。還可以像之前的人回答的一樣使用數字

原创 用柵欄(CyclicBarrier)實現高併發測試

public class TestCyclic { @Test public void test01() { int count = 10000;//併發線程數 CyclicBarrier

原创 ZooKeeper集羣管理

ZooKeeper應用場景 1.數據訂閱和發佈 實現思路: 發佈方註冊一個節點/data 訂閱節點監聽這個/data 節點 只有節點發生變化,證明有新的數據產生,從而去獲取數據 注意:不要在zookeeper上存儲大量數據

原创 Java併發工具包- java.util.concurrent

(隊列)阻塞隊列 BlockingQueue 一個線程往裏邊放,另外一個線程從裏邊取的一個 BlockingQueue BlockingQueue是一個接口常用實現類爲: *ArrayBlockingQueue:內存連續,查詢快

原创 淺談MySQL中優化sql語句查詢常用的30種方法

1.對查詢進行優化,應儘量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。 2.應儘量避免在 where 子句中使用!=或<>操作符,否則將引擎放棄使用索引而進行全表掃描。 3.應儘量避免在 wher

原创 Mybatis使用總結:

(具體關鍵字不懂得去度娘,給我留言也可以) Mybatis是一個優秀企業級的並且適合數據吞吐量大的,有着靈活輕巧的結構,簡單的編寫過程,低成本學習的持久層框架。 好處那麼多,就先說說搭建的過程。 簡要搭建過程(不分先後): 1、