台部落njyuxinag

1.數據不一致性產生原因 1.1.數據分散在多處：多個DB; DB和緩存案例：二手交易平臺案例：用戶、商品、交易等功能電商平臺購買商品：下單（訂單庫）-》減庫存（商品庫）-》支付（交易庫） 2.

2019-08-06 09:56:04

1.分佈式鎖定義：分佈式環境下，鎖定全局唯一資源，請求處理串行化，實際表現互斥鎖 2.分佈式鎖目的 2.1.交易訂單鎖定防止重複下單解決業務層冪等問題 2.2.MQ消息消費冪等性發送消息重複消息消費端去重比如手機提現

2019-08-06 08:23:41

1.電商秒殺系統特點： 1.1.大量併發，在某一時間99%的用戶涌入 1.2.有效請求數很低，可以認爲有效請求數和庫存數一致，可能99%以上的流量都是無效的 1.3.庫存數據的一致性要求嚴格，不能超賣 2.秒殺系統架構思路 2.1.數據分

2019-08-06 08:23:41

一、完整的故障處理恢復機制服務的發現依賴註冊在zk上的服務節點一般網關層與業務邏輯層都是使用長連接，一般不使用http協議（原因：IO不高，都包含頭信息，http經常是短連接），一般使用rpc通信 1.故障自動發現 1.1. 一般業務

2019-08-06 08:23:41

1.請求的冪等(請求重試）定義：一個請求執行一次，讀請求不需要做冪等，寫請求需要，因爲寫請求可能對數據發生改變，原則：誰對數據發生改變就需要做冪等。如：一個寫請求網關層發到業務邏輯層1上進行寫數據，但由於寫操作比較慢，返回網關狀態是寫

2019-08-06 08:23:41

一、性能優化手段 1.空間換時間特點：系統時間是瓶頸如：緩存複用計算結果，降低時間開銷，因爲CPU時間較內存容量更加昂貴。 2.時間換空間特點：數據大小是瓶頸如：網絡傳輸是瓶頸使用系統時間換取傳輸的空間，使用http的gzip壓

2019-08-06 08:23:41

-Xms20m -Xmx20m -Xmn1m -XX:SurvivorRatio=2 -XX:+PrintGCDetails -XX:+UseSerialGC 1.堆的初始值與堆內存最大值一定要保持一致，這樣可以減少垃圾回收次數。 -

2019-08-01 10:42:49

1.process:一個獨立運行單位系統資源：cpu時間，存儲空間 2.OS: VM CPU: 時間：切片緩存：緩存當前進程數據

2019-02-21 23:39:57

show databases; use hive; show tables; create table student(id int, name string) ROW FORMAT DELIMITED FIELDS TERMINATED

2019-02-19 15:56:02

1.shuffle reduce端緩衝大小以避免OOM map端的task是不斷的輸出數據的，數據量可能是很大的。但是，其實reduce端的task，並不是等到map端task將屬於自己的那份數據全部寫入磁盤文件之後，再去拉取的。map端

2019-01-06 16:08:59

1.聚合源數據咱們現在，做一些聚合的操作，groupByKey、reduceByKey；groupByKey，說白了，就是拿到每個key對應的values；reduceByKey，說白了，就是對每個key對應的values

2019-01-06 16:08:59

1.分配更多的資源 1.1.增加executor 1.2.增加每個executor的cpu core 增加executor的並行能力，一個cpu core運行一個task 1.3.增加每個exec

2019-01-05 16:05:55

1.Map到MapPartitions的使用如果是普通的map，比如一個partition中有1萬條數據；ok，那麼你的function要執行和計算1萬次。但是，使用MapPartitions操作之後，一個task僅僅會執行一次fun

2019-01-05 16:05:55

1.利用deployment創建pods 創建deployment_nginx.yml文件 apiVersion: apps/v1 kind: Deployment metadata: name: nginx-deployment

2018-12-16 15:38:25

1.創建yaml配置文件 apiVersion: apps/v1 kind: ReplicaSet metadata: name: nginx labels: tier: frontend spec: replicas

2018-12-16 15:38:25