Elasticseach學習路線

少點代碼,多點頭髮

本文已經被GitHub收錄,歡迎大家踊躍star 和 issues。

https://github.com/midou-tech/articles

說點廢話

前面寫了Es開篇簡介別管原理,先run起來 兩篇關於Es的文章,反響還不錯,有讀者也在催接下來的更新進度。

在一個400人的大羣裏,直接催我更新,只能說壓力山大啊…

其實還好,催更說明兩個問題

  • 文章有被大家看到
  • 文章確實有點東西

最近剛進入新的工作環境,需要去了解新的工作內容、瞭解需求、瞭解工程架構,工作上的事情比較多。

Elasticsearch系列我也是邊學邊寫,很多不確定知識點需要去查大量的資料。

來點正文

既然是學習,就必須給自己制定一個好的學習路線,把自己要掌握的知識梳理下來,後期學習也不會迷失方向。

加之前面說了要寫這一系列的文章,也沒有個具體大綱,忍不住吐槽自己一把。

花了一些時間總結了關於Elasticsearch的整體知識框架,也是之後更新的寫作框架。

看不清楚的可以後臺回覆【ES腦圖】獲取高清pdf文件。

這個腦圖,不簡單是一個寫作路線圖,也是一個很好的學習路線圖,同時也是一個es整體知識框架圖。

爲什麼要學ES

ES的發展史

競爭優勢

使用場景

基本概念

索引(Index)

文檔(Document)

映射(mapping)

集羣(cluster)

分片(shard)

先用起來(使用者)

本地搭建安裝Es集羣/服務端搭建集羣

寫入數據進Es

  • 爬蟲系統爬取互聯網數據
  • filebeat採集數據
  • 監聽binlog
  • 上報數據系統

Es簡單查詢語法

重要配置講解

數據處理

基本的數據操作

  • CRUD

    • filebeat/client/http
  • 文檔的Bulk操作

  • 文檔的併發操作

數據建模

  • 索引建模
  • 文檔建模
  • mappings&settings

數據修復

  • 通過pipeline預處理
  • query更新數據
  • 重建索引

文本數據分析

  • Analyzer
  • Tokenizer

索引管理

搜索姿勢

搜索API

結構化查詢

全文檢索

join查詢

符合查詢

地理位置檢索

搜索結果處理

相關性干預

講講原理

核心概念

  • 索引
  • 文檔
  • 映射
  • 分片
  • 副本
  • 節點
  • 集羣
  • 路由

倒排索引

  • 分詞

    • 內置分詞器
    • 多語言分詞器
  • 倒排結構探析

搜索相關性

  • 相關性算法

    • TF-IDF/BM25
    • 向量空間模型、餘弦定理
  • 相關度指標

插件開發

API擴展

分詞插件

安全插件

業務邏輯插件

分佈式支持

分佈式索引原理

分佈式路由

分片原理

節點故障轉移

分佈式搜索流程

Es管理

集羣部署與水平擴展

集羣備份與升級

集羣安全

集羣監控

集羣問題診斷與排查

架構設計

ES架構設計圖分析

項目實戰

知名博主博文檢索系統

  • 優選一批優秀原創作者,三太子敖丙、java3y、接水怪等等
  • 博文檢索,標題、正文、內容、作者、內容標籤
  • 熱點排序

業界通用ELK實戰

接下來的幾篇會寫關於一個使用者,如何用好Elasticsearch,用一些常見的示例去寫這部分的文章。

例如,大量日誌數據怎樣寫進es?寫進去之後如何建索引?怎麼查詢我想要的數據?

會圍繞這一系列去寫,先用好Elasticsearch之後,再去探索他的原理。

Elasticsearch相關文章

龍躍十二

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章