ELK日誌分析平臺-----實戰（一）-----ES搜索引擎

學習目標：

ELK主要由三個重要組件：

elasticsearch搜索分析引擎
logstash數據採集
kibana可視化

##########elasticsearch實戰#############

1.elasticsearch的簡介

Elasticsearch 是一個開源的分佈式搜索分析引擎，建立在一個全文搜索引擎庫 Apache Lucene基礎之上。

Elasticsearch 不僅僅是 Lucene，並且也不僅僅只是一個全文搜索引擎：

一個分佈式的實時文檔存儲，每個字段可以被索引與搜索
一個分佈式實時分析搜索引擎
能勝任上百個服務節點的擴展，並支持 PB 級別的結構化或者非結構化數據

模塊介紹

基礎模塊         功能
cluster：       管理集羣狀態，維護集羣層面的配置信息。
alloction：		封裝了分片分配相關的功能和策略。
discovery：		發現集羣中的節點，以及選舉主節點。
gateway：		對收到master廣播下來的集羣狀態數據的持久化存儲。
indices：		管理全局級的索引設置。
http：			允許通過JSON over HTTP的方式訪問ES的API。
transport：		用於集羣內節點之間的內部通信。
engine：		封裝了對Lucene的操作及translog的調用。

elasticsearch應用場景:

信息檢索
日誌分析
業務數據分析
數據庫加速
運維指標監控

官網：https://www.elastic.co/cn/

注意：我們下載軟件時可以去這個網站下載，https://elasticsearch.cn/download/ 這個網站的速度快。

2.elasticsearch安裝與配置

軟件下載：
https://elasticsearch.cn/download/
安裝軟件：
#rpm -ivh jdk-8u171-linux-x64.rpm
#rpm -ivh elasticsearch-7.6.1.rpm //7.6版本自帶jdk

[root@server4 ~]# rpm -ivh elasticsearch-7.6.1.rpm		# 安裝ES

修改配置文件：
# vim /etc/elasticsearch/elasticsearch.yml
cluster.name: my-es					#集羣名稱
node.name: server4					#主機名需要解析
path.data: /var/lib/elasticsearch	#數據目錄
path.logs: /var/log/elasticsearch	#日誌目錄
bootstrap.memory_lock: true			#鎖定內存分配
network.host: 192.168.43.74			#主機ip
http.port: 9200						#http服務端口
cluster.initial_master_nodes: ["server4"]

對配置文件進行修改之後，我們的服務是不能啓動的，因爲我們還需修改系統的限制

修改系統限制
# vim /etc/security/limits.conf        			在最後添加以下內容：
elasticsearch soft memlock unlimited            
elasticsearch hard memlock unlimited			
elasticsearch 	   - 	nofile 	65536			#限定文件數量，不得大於內核限制（sysctl -a | grep file）
elasticsearch	   -	nproc 	4096			# 進程數


由於服務有systemd 啓用，所以我們去指定systemd的系統限制：
vim /usr/lib/systemd/system/elasticsearch.service
## 在service語句塊下添加以下內容###
LimitNOFILE=65535
LimitMEMLOCK=infinity


修改java虛擬機限制：
[root@server4 elasticsearch]# vim /etc/elasticsearch/jvm.options
-Xms1g
-Xmx1g
Xmx設置不超過物理RAM的50%,以確保有足夠的物理RAM留給內核文件系統緩存。但不要超過32G。
這裏我們應該給這臺虛擬機2G的內存。

我們還需要去禁用交換分區，會影響數據的交互：

[root@server4 elasticsearch]# echo 0 > /proc/sys/vm/swappiness #數值越大越傾向於使用swap分區
[root@server4 elasticsearch]# cat /proc/sys/vm/swappiness 
0
[root@server4 elasticsearch]# swapoff -a
[root@server4 elasticsearch]# vim /etc/fstab      # 禁用掉開機自啓
#/dev/mapper/rhel-swap   swap                    swap    defaults        0 0

配置完以上步驟後，現在就可以啓動了：

[root@server4 elasticsearch]# systemctl daemon-reload
[root@server4 elasticsearch]# systemctl start elasticsearch.service
[root@server4 elasticsearch]# curl 192.168.43.74:9200
{
  "name" : "server4",
  "cluster_name" : "my-es",
  "cluster_uuid" : "dcU5g1TWRzqUQnsLmRf-lw",
  "version" : {
    "number" : "7.6.1",
    "build_flavor" : "default",
    "build_type" : "rpm",
    "build_hash" : "aa751e09be0a5072e8570670309b1f12348f023b",
    "build_date" : "2020-02-29T00:15:25.529771Z",
    "build_snapshot" : false,
    "lucene_version" : "8.4.0",
    "minimum_wire_compatibility_version" : "6.8.0",
    "minimum_index_compatibility_version" : "6.0.0-beta1"
  },
  "tagline" : "You Know, for Search"
}

但是，我們發現這樣顯然還不夠刺激，我們想要給它加一個圖形界面：
我們需要去下載插件：下載elasticsearch-head插件

wget https://github.com/mobz/elasticsearch-head/archive/master.zip
head插件本質上是一個nodejs的工程,因此需要安裝node:
wget https://mirrors.tuna.tsinghua.edu.cn/nodesource/rpm_9.x/el/7/x86_64/nodejs9.11.2-1nodesource.x86_64.rpm

[root@server4 ~]# ls
 master.zip								# 需要這個插件
[root@server4 ~]# unzip master.zip 
[root@server4 ~]# ls
 elasticsearch-head-master  master.zip
然後我們需要進入這個目錄裏面執行 npm 這個命令，這時我們安裝node包
[root@server4 ~]# rpm -ivh nodejs-9.11.2-1nodesource.x86_64.rpm 
warning: nodejs-9.11.2-1nodesource.x86_64.rpm: Header V4 RSA/SHA256 Signature, key ID 34fa74dd: NOKEY
Preparing...                          ################################# [100%]
Updating / installing...
   1:nodejs-2:9.11.2-1nodesource      ################################# [100%]

然後我們進入目錄，由於npm install 很慢，所以我們更換一個倉庫下載
[root@server4 ~]# cd elasticsearch-head-master/
[root@server4 elasticsearch-head-master]# npm install --registry=https://registry.npm.taobao.org
PhantomJS not found on PATH		# 發現環境變量少了一個東西，
Downloading https://github.com/Medium/phantomjs/releases/download/v2.1.1/phantomjs-2.1.1-linux-x86_64.tar.bz2
Saving to /tmp/phantomjs/phantomjs-2.1.1-linux-x86_64.tar.bz2
# 讓去這裏下載

[root@server4 ~]# ls
 phantomjs-2.1.1-linux-x86_64.tar.bz2		#下載好了
 [root@server4 ~]# tar jxf phantomjs-2.1.1-linux-x86_64.tar.bz2 
 [root@server4 ~]# cd phantomjs-2.1.1-linux-x86_64/


[root@server4 phantomjs-2.1.1-linux-x86_64]# ls
bin  ChangeLog  examples  LICENSE.BSD  README.md  third-party.txt
[root@server4 phantomjs-2.1.1-linux-x86_64]# cd bin/			
[root@server4 bin]# ls
phantomjs
[root@server4 bin]# cp phantomjs /usr/local/bin/		# 複製這個二進制文件到環境變量就可以使用這個命令了


[root@server4 ~]# phantomjs 
phantomjs: error while loading shared libraries: libfontconfig.so.1:  #又缺少了一個庫文件
[root@server4 ~]# yum install fontconfig-2.13.0-4.3.el7.x86_64 -y
[root@server4 ~]# phantomjs 
phantomjs> 
phantomjs> 
# 就代表成功了

在重新npm install
[root@server4 elasticsearch-head-master]# npm install --registry=https://registry.npm.taobao.org


我們還要修改ES主機ip和端口：
[root@server4 elasticsearch-head-master]# cd _site/
[root@server4 _site]# ls
app.css  app.js  background.js  base  fonts  i18n.js  index.html  lang  manifest.json  vendor.css  vendor.js
[root@server4 _site]#

[root@server4 _site]# npm run start &      # 啓動head插件
[1] 17355
[root@server4 _site]# 
> elasticsearch-head@0.0.0 start /root/elasticsearch-head-master
> grunt server

(node:17365) ExperimentalWarning: The http2 module is an experimental API.
Running "connect:server" (connect) task
Waiting forever...
Started connect web server on http://localhost:9100
^C
[root@server4 _site]# netstat -antlp |grep 9100
tcp        0      0 0.0.0.0:9100            0.0.0.0:*               LISTEN      17365/grunt

在瀏覽器訪問是這樣的，但是連接不成功，因爲不允許跨域訪問，所以我們應該修改ES跨域主持

[root@server4 _site]# vim /etc/elasticsearch/elasticsearch.yml
# Set a custom port for HTTP:    #在下面添加兩行內容
#
http.port: 9200

http.cors.enabled: true			# 是否支持跨域
http.cors.allow-origin: "*"		# *表示支持所有域名

systemctl restart elasticsearch.service		# 重啓服務

連接上了之後，創建一個索引：

刷新一下：

加粗的是主分片，細的是輔分片，健康狀態變成了黃色，代表主分片存在，輔分片丟失。如過變成了紅色，就代表沒有可用分片了。

3.elasticsearch分佈式部署

以相同的方法再安裝兩個ES節點,配置如下：

[root@server4 _site]# ssh-keygen
[root@server4 _site]# ssh-copy-id server1
[root@server4 _site]# ssh-copy-id server2		# 做免密,然後將配置的文件全部複製過去
[root@server4 ~]# scp elasticsearch-7.6.1-x86_64.rpm server1:
[root@server4 ~]# scp elasticsearch-7.6.1-x86_64.rpm server2:
[root@server4 elasticsearch]# scp -p /etc/elasticsearch/elasticsearch.yml server1:/etc/elasticsearch/                                                                                                                                                             
[root@server4 elasticsearch]# scp -p /etc/elasticsearch/elasticsearch.yml server2:/etc/elasticsearch/
[root@server4 security]# scp /etc/security/limits.conf server1:/etc/security/
[root@server4 security]# scp /etc/security/limits.conf server2:/etc/security/
[root@server4 system]# scp /usr/lib/systemd/system/elasticsearch.service server1:/usr/lib/systemd/system/
[root@server4 system]# scp /usr/lib/systemd/system/elasticsearch.service server2:/usr/lib/systemd/system/

然後更改他們的配置文件：

vim /etc/elasticsearch/elasticsearch.yml 

server4：
discovery.seed_hosts: ["server4", "server1", "server2"]		# 改這裏，其它不變
cluster.initial_master_nodes: ["server4","server1","server2"]		# 需要多個master結點進行切換

server1：
node.name: server1
network.host: 192.168.43.71
discovery.seed_hosts: ["server4", "server1", "server2"]
cluster.initial_master_nodes: ["server4","server1","server2"]

server2：
node.name: server2
network.host: 192.168.43.72
discovery.seed_hosts: ["server4", "server2", "server1"]
cluster.initial_master_nodes: ["server4","server1","server2"]


然後在三個結點都
 systemctl daemon-reload 
 systemctl start elasticsearch.service			# server1是restart

然後我們查看查看ES集羣狀態

當前server4 是master結點，其他兩個是worker結點

elasticsearch節點角色

Master：
主要負責集羣中索引的創建、刪除以及數據的Rebalance等操作。Master不負責數據的索引和檢索，所以負載較輕。當Master節點失聯或者掛掉的時候，ES集羣會自動從其他Master節點選舉出一個Leader。

Data Node：
主要負責集羣中數據的索引和檢索，一般壓力比較大。

Coordinating Node：
原來的Client node的，主要功能是來分發請求和合並結果的。所有節點默認就是Coordinating node，且不能關閉該屬性。

Ingest Node：
專門對索引的文檔做預處理

elasticsearch節點優化

在生產環境下，如果不修改elasticsearch節點的角色信息，在高數據量，高併發的場景下集羣容易出現腦裂等問題。

默認情況下，elasticsearch集羣中每個節點都有成爲主節點的資格，也都存儲數據，還可以提供查詢服務。

節點角色是由以下屬性控制：

node.master: false|true
node.data: true|false
node.ingest: true|false
search.remote.connect: true|false
默認情況下這些屬性的值都是true。

node.master：這個屬性表示節點是否具有成爲主節點的資格
    注意：此屬性的值爲true，並不意味着這個節點就是主節點。
    因爲真正的主節點，是由多個具有主節點資格的節點進行選
    舉產生的。
node.data：這個屬性表示節點是否存儲數據。
node.ingest: 是否對文檔進行預處理。
search.remote.connect：是否禁用跨集羣查詢

我們現在就有五種組合：

第一種組合：（默認）
node.master: true
node.data: true
node.ingest:  true
search.remote.connect: true
這種組合表示這個節點即有成爲主節點的資格，又存儲數據。
如果某個節點被選舉成爲了真正的主節點，那麼他還要存儲數據，這樣對於這個節點的壓力就比較大了。
測試環境下這樣做沒問題，但實際工作中不建議這樣設置。

第二種組合：（Data node）
node.master: false
node.data: true
node.ingest: false
search.remote.connect: false
這種組合表示這個節點沒有成爲主節點的資格，也就不參與選舉，只會存儲數據。
這個節點稱爲data(數據)節點。在集羣中需要單獨設置幾個這樣的節點負責存儲數據。後期提供存儲和查詢服務。

第三種組合：（master node）
node.master: true
node.data: false
node.ingest: false
search.remote.connect: false
這種組合表示這個節點不會存儲數據，有成爲主節點的資格，可以參與選舉，有可能成爲真正的主節點。
這個節點我們稱爲master節點。

第四種組合：（Coordinating Node）
node.master: false
node.data: false
node.ingest: false
search.remote.connect: false
這種組合表示這個節點即不會成爲主節點，也不會存儲數據，
這個節點的意義是作爲一個協調節點，主要是針對海量請求的時候可以進行負載均衡。

第五種組合：（Ingest Node）
node.master: false
node.data: false
node.ingest: true
search.remote.connect: false
這種組合表示這個節點即不會成爲主節點，也不會存儲數據，
這個節點的意義是ingest節點，對索引的文檔做預處理。

所以我們進行設置，來調整我們的集羣：

在server4中：

vim /etc/elasticsearch/elasticsearch.yml 

# ------------------------------------ Node ------------------------------------
#
# Use a descriptive name for the node:
#
node.name: server4
node.master: true
node.data: false
node.ingest: false
search.remote.connect: false

# 讓他成爲master節點

在server1上：

vim /etc/elasticsearch/elasticsearch.yml 

# Use a descriptive name for the node:
#
node.name: server1
node.master: true
node.data: true
node.ingest: false
search.remote.connect: false

讓他可以接管master，也存儲數據

server2上：

vim /etc/elasticsearch/elasticsearch.yml 

# Use a descriptive name for the node:
#
node.name: server1
node.master: true
node.data: true
node.ingest: false
search.remote.connect: false

讓他可以接管master，也存儲數據,這裏我們先不做預處理結點

然後重啓三臺服務，這時serve4是起不來的，是因爲我們設置不做存儲結點，但是之前已經有數據了，所以我們要進行清理

[root@server4 bin]# pwd
/usr/share/elasticsearch/bin

[root@server4 bin]# ./elasticsearch-node repurpose
------------------------------------------------------------------------

    WARNING: Elasticsearch MUST be stopped before running this tool.

23:38:49.741 [main] WARN  org.elasticsearch.cluster.metadata.MetaData - Adding unknown custom object with type index_lifecycle
23:38:49.744 [main] WARN  org.elasticsearch.cluster.metadata.MetaData - Adding unknown custom object with type licenses
Found 1 shards in 1 indices to clean up
Use -v to see list of paths and indices affected
Node is being re-purposed as master and no-data. Clean-up of shard data will be performed.
Do you want to proceed?
Confirm [y/N] y
Node successfully repurposed to master and no-data.

這時候，我們在刷新頁面：

生產集羣中可以對這些節點的職責進行劃分

建議集羣中設置3臺以上的節點作爲master節點，這些節點只負責成爲主節點，維護整個集羣的狀態。
再根據數據量設置一批data節點，這些節點只負責存儲數據，後期提供建立索引和查詢索引的服務，這樣的話如果用戶請求比較頻繁，這些節點的壓力也會比較大。
所以在集羣中建議再設置一批協調節點，這些節點只負責處理用戶請求，實現請求轉發，負載均衡等功能。

節點需求

master節點：普通服務器即可(CPU、內存消耗一般)
data節點：主要消耗磁盤、內存。
path.data: data1,data2,data3
這樣的配置可能會導致數據寫入不均勻，建議只指定一個數據路徑，磁盤可以使用raid0陣列，而不需要成本高的ssd。
Coordinating節點：對cpu、memory要求較高。

ELK日誌分析平臺-----實戰（一）-----ES搜索引擎

ELK日誌分析平臺-----實戰（一）-----ES搜索引擎

##########elasticsearch實戰#############

1.elasticsearch的簡介

模塊介紹

elasticsearch應用場景:

2.elasticsearch安裝與配置

3.elasticsearch分佈式部署

elasticsearch節點角色

elasticsearch節點優化

我們現在就有五種組合：

以上就是elasticsearch實戰的相關知識！！！！！！

《Python進階》學習筆記

Leetcode 3161. 物塊放置查詢

leetcode 60 排列序列

一個docker容器暴露多個端口

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

wpf附加屬性理解 WPF附加屬性

企業級------持續集成與持續交付------（一）-----git工具使用

ELK日誌分析平臺實戰-----（三）-----kibana數據可視化

ELK日誌分析平臺-----實戰（一）-----ES搜索引擎

ELK日誌分析平臺實戰-----（二）-----logstash數據採集

玩轉Docker----- 第二部（docker鏡像優化----四種優化方式）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結