分佈式的基礎設施:
- 存儲 常見的HDFS
- 通信
- 計算 常見的如MapReduce
實現上:
- RPC
- 線程
- 併發控制
分佈式關注的重點:
- 性能(Performance)
- 可拓展性(Scalability) 2倍的機器,2倍的性能
- 容錯(Fault Tolerance)
- 可用性(Availability)常見的5個9
- 可恢復性(Recoverability)
另外提到了2個關鍵詞:
- NV storage 非易失性存儲如硬盤、SSD等
- Replication 副本/備份,通常作爲容錯的主要手段
- 一致性(Consistency)
- 強一致性 客戶端put之後,在任何節點get都是最新的
- 弱一致性 存在舊值,在一段時間後會一致