原创 clickhouse使用心得

clickhouse目前用在實時BI後臺,只要數據穩定落庫了,出報表很快,臨時查詢也很快,在使用過程中,對它的一些優點和不足也是深有體會,這裏總結一下,不能做到面面俱到,但儘可能詳細的介紹實際應用需要注意的問題和應用技巧。 我們是通過編寫F

原创 Flink DataStream API 編程模型

Flink系列文章 第01講:Flink 的應用場景和架構模型 第02講:Flink 入門程序 WordCount 和 SQL 實現 第03講:Flink 的編程模型與其他框架比較 第04講:Flink 常用的 DataSet 和 Dat

原创 Flink異步IO

本文講解 Flink 用於訪問外部數據存儲的異步 I/O API。 對於不熟悉異步或者事件驅動編程的用戶,建議先儲備一些關於 Future 和事件驅動編程的知識。 對於異步 I/O 操作的需求 在與外部系統交互(用數據庫中的數據擴充流數據)

原创 ClickHouse主鍵索引最佳實踐

在本文中,我們將深入研究ClickHouse索引。我們將對此進行詳細說明和討論: ClickHouse的索引與傳統的關係數據庫有何不同 ClickHouse是怎樣構建和使用主鍵稀疏索引的 ClickHouse索引的最佳實踐 這篇文章主要

原创 ClickHouse數據副本引擎

我的gitee地址:https://gitee.com/ddxygq/bigdata-technical-pai ,相關文章都放到這個倉庫裏了。 只有 MergeTree 系列裏的表可支持副本: ReplicatedMergeTree

原创 ClickHouse MergeTree引擎

Clickhouse 中最強大的表引擎當屬 MergeTree (合併樹)引擎及該系列(*MergeTree)中的其他引擎。 MergeTree 系列的引擎被設計用於插入極大量的數據到一張表當中。數據可以以數據片段的形式一個接着一個的快速寫

原创 ClickHouse入門教程

目錄什麼是ClickHouse?OLAP場景的關鍵特徵列式數據庫更適合OLAP場景的原因輸入/輸出CPUClickHouse的特性真正的列式數據庫管理系統數據壓縮數據的磁盤存儲多核心並行處理多服務器分佈式處理向量引擎實時的數據更新索引適合在

原创 Flink SQL管理平臺flink-streaming-platform-web安裝搭建

文章都在個人博客網站:https://www.ikeguang.com/ 同步,歡迎訪問。 最近看到有人在用flink sql的頁面管理平臺,大致看了下,嘗試安裝使用,比原生的flink sql界面確實好用多了,我們看下原生的,通過bin/

原创 Flink同步Kafka數據到ClickHouse分佈式表

公衆號文章都在個人博客網站:https://www.ikeguang.com/ 同步,歡迎訪問。 業務需要一種OLAP引擎,可以做到實時寫入存儲和查詢計算功能,提供高效、穩健的實時數據服務,最終決定ClickHouse。 什麼是ClickH

原创 paddleocr安裝與圖片識別快速開始

本文首發我的個人博客:paddleocr安裝教程快速開始 1. 安裝Python環境 wget https://mirrors.huaweicloud.com/python/3.8.5/Python-3.8.5.tgz 下載後,解壓,

原创 flink-cdc同步mysql數據到hive

本文首發於我的個人博客網站 等待下一個秋-Flink 什麼是CDC? CDC是(Change Data Capture 變更數據獲取)的簡稱。核心思想是,監測並捕獲數據庫的變動(包括數據 或 數據表的插入INSERT、更新UPDATE、

原创 flink-cdc同步mysql數據到hbase

本文首發於我的個人博客網站 等待下一個秋-Flink 什麼是CDC? CDC是(Change Data Capture 變更數據獲取)的簡稱。核心思想是,監測並捕獲數據庫的變動(包括數據 或 數據表的插入INSERT、更新UPDATE、

原创 flink-cdc同步mysql數據到kafka

本文首發於我的個人博客網站 等待下一個秋-Flink 什麼是CDC? CDC是(Change Data Capture 變更數據獲取)的簡稱。核心思想是,監測並捕獲數據庫的變動(包括數據 或 數據表的插入INSERT、更新UPDATE、

原创 flink-cdc實時同步mysql數據到elasticsearch

本文首發於我的個人博客網站 等待下一個秋-Flink 什麼是CDC? CDC是(Change Data Capture 變更數據獲取)的簡稱。核心思想是,監測並捕獲數據庫的變動(包括數據 或 數據表的插入INSERT、更新UPDATE、

原创 mysql索引不生效

並不是索引越多越好,索引是一種以空間換取時間的方式,所以建立索引是要消耗一定的空間,況且在索引的維護上也會消耗資源。本文首發我的個人博客mysql索引不生效 這裏有張用戶瀏覽商品表,建表語句: CREATE TABLE `product_v