少點代碼,多點頭髮
本文已經被GitHub收錄,歡迎大家踊躍star 和 issues。
https://github.com/midou-tech/articles
說點廢話
前面寫了Es開篇簡介,別管原理,先run起來 兩篇關於Es的文章,反響還不錯,有讀者也在催接下來的更新進度。
在一個400人的大羣裏,直接催我更新,只能說壓力山大啊…
其實還好,催更說明兩個問題
- 文章有被大家看到
- 文章確實有點東西
最近剛進入新的工作環境,需要去了解新的工作內容、瞭解需求、瞭解工程架構,工作上的事情比較多。
Elasticsearch系列我也是邊學邊寫,很多不確定知識點需要去查大量的資料。
來點正文
既然是學習,就必須給自己制定一個好的學習路線,把自己要掌握的知識梳理下來,後期學習也不會迷失方向。
加之前面說了要寫這一系列的文章,也沒有個具體大綱,忍不住吐槽自己一把。
花了一些時間總結了關於Elasticsearch的整體知識框架,也是之後更新的寫作框架。
看不清楚的可以後臺回覆【ES腦圖】獲取高清pdf文件。
這個腦圖,不簡單是一個寫作路線圖,也是一個很好的學習路線圖,同時也是一個es整體知識框架圖。
爲什麼要學ES
ES的發展史
競爭優勢
使用場景
基本概念
索引(Index)
文檔(Document)
映射(mapping)
集羣(cluster)
分片(shard)
先用起來(使用者)
本地搭建安裝Es集羣/服務端搭建集羣
寫入數據進Es
- 爬蟲系統爬取互聯網數據
- filebeat採集數據
- 監聽binlog
- 上報數據系統
Es簡單查詢語法
重要配置講解
數據處理
基本的數據操作
-
CRUD
- filebeat/client/http
-
文檔的Bulk操作
-
文檔的併發操作
數據建模
- 索引建模
- 文檔建模
- mappings&settings
數據修復
- 通過pipeline預處理
- query更新數據
- 重建索引
文本數據分析
- Analyzer
- Tokenizer
索引管理
搜索姿勢
搜索API
結構化查詢
全文檢索
join查詢
符合查詢
地理位置檢索
搜索結果處理
相關性干預
講講原理
核心概念
- 索引
- 文檔
- 映射
- 分片
- 副本
- 節點
- 集羣
- 路由
倒排索引
-
分詞
- 內置分詞器
- 多語言分詞器
-
倒排結構探析
搜索相關性
-
相關性算法
- TF-IDF/BM25
- 向量空間模型、餘弦定理
-
相關度指標
插件開發
API擴展
分詞插件
安全插件
業務邏輯插件
分佈式支持
分佈式索引原理
分佈式路由
分片原理
節點故障轉移
分佈式搜索流程
Es管理
集羣部署與水平擴展
集羣備份與升級
集羣安全
集羣監控
集羣問題診斷與排查
架構設計
ES架構設計圖分析
項目實戰
知名博主博文檢索系統
- 優選一批優秀原創作者,三太子敖丙、java3y、接水怪等等
- 博文檢索,標題、正文、內容、作者、內容標籤
- 熱點排序
業界通用ELK實戰
接下來的幾篇會寫關於一個使用者,如何用好Elasticsearch,用一些常見的示例去寫這部分的文章。
例如,大量日誌數據怎樣寫進es?寫進去之後如何建索引?怎麼查詢我想要的數據?
會圍繞這一系列去寫,先用好Elasticsearch之後,再去探索他的原理。