台部落此星爺非彼星爺

聲明：本文轉自我的個人博客，有興趣的可以查看原文。轉發請註明來源。最近工作需要，使用airflow搭建了公司的ETL系統，順帶在公司分享了一次airflow，整理成文，Enjoy！ 1. airflow 介紹 1.1 airflow

2020-09-16 07:23:05

35

聲明：本文轉自我的個人博客，有興趣的可以查看原文。轉發請註明來源。最近工作開始接觸Spark，本系列博客可以作爲學習思考的紀錄。如果無特殊說明，均針對Spark 2.2 。 1. Spark 介紹 1.1 Spark 是什麼 Ap

2020-09-16 07:23:05

Cassandra 設計用來處理多節點大型數據工作負載，系統中沒有單點，Cassandra 採用peer-to-peer架構，數據在所有節點之間分發。 cluster中所有node具有相同的角色。每個node互相獨立，同時在內部又互相溝通

2020-09-15 02:36:06

8

上篇介紹了Cassandra的架構、數據distribution 與 replication，本文主要介紹Cassandra的內部工作機制，包括存儲引擎、Cassandra讀寫、數據一致性等。 1. 存儲引擎在分佈式系統中，有些系統寫數據

2020-09-15 02:36:06

7

Overview Apache Cassandra 是一個大規模可擴展的分佈式開源NoSQL數據庫，完美適用於跨數據中心／雲端的結構化數據、半結構化數據和非結構化數據，同時，Cassandra 高可用、線性可擴展、高性能、無單點。特點

2020-09-15 02:36:06

本文不是詳細的CQL教程，僅記錄下CQL的一些要點。 Keyspace keyspace類似關係型數據庫中的database概念，Cassandra 的 keyspace 是一個命名空間，定義了數據備份的方式。舉例如下，keyspace c

2020-09-12 22:03:57

10