nginx學習筆記之三：nginx作爲反向代理服務器

nginx不僅能作爲web server，還具有反向代理、負載均衡和緩存的功能

一、nginx的反向代理和負載均衡功能

1、proxy模塊

nginx通過proxy模塊實現將客戶端的請求代理至上游服務器，此時nginx與上游服務器的連接是通過http協議進行的。nginx在實現反向代理功能時的最重要指令爲 proxy_pass，它能夠並能夠根據URI、客戶端參數或其它的處理邏輯將用戶請求調度至上游服務器上(upstream server)。

⑴proxy_pass URL;

設置後端服務器的協議和地址；這條指令可以設置的協議是“http”或者“https”，而地址既可以使用域名或者IP地址加端口（可選）的形式來定義：

proxy_pass http://localhost:8000/uri/;

如果解析一個域名得到多個地址，所有的地址都會以輪轉的方式被使用。當然，也可以使用服務器組來定義多個地址。

如果proxy_pass沒有使用URI，傳送到後端服務器的請求URI一般是客戶端發起的原始URI，如果nginx改變了請求URI，則請求路徑與配置中的路徑的匹配部分將被替換爲指令中定義的URI：

若nginx接到的請求的uri是/name/a.html

location /name/ {
proxy_pass http://192.168.30.20/remote/;
} #傳送到後端服務器的URI是/remote/a.html

location /name/ {
proxy_pass http://192.168.30.20;
} #傳送到後端服務器的URI是/name/a.html

location /name/ {

proxy_pass http://192.168.30.20/;

} #注意與上面用法的區別，這裏地址末尾帶有斜線，實際上被認爲定義了URI，該“/”會替換“/name/"，傳送到後端服務器的URI是/a.html。

如果使用正則表達式定義路徑，則proxy_pass指令不應使用URI。例如：

location ~ ^/bbs {

proxy_pass http://www.magedu.com;

}

在需要代理的路徑中，使用rewrite指令改變了URI，那麼nginx將使用重寫後的URI處理請求，而忽略proxy_pass指令設置的URI。如下面所示的例子中，傳送給上游服務器的URI爲/index.php?page=<match>。

location / {

rewrite /(.*)$ /index.php?page=$1 break;

proxy_pass http://localhost:8080;

}

⑵proxy模塊的其它指令

①proxy_connect_timeout time;

與後端服務器建立連接的超時時間。一般不可能大於75秒；

②proxy_cookie_domain off; #取消當前配置級別的所有proxy_cookie_domain指令

proxy_cookie_domain domain replacement;

設置“Set-Cookie”響應頭中的domain屬性的替換文本，其值可以爲一個字符串、正則表達式的模式或一個引用的變量；例如：

proxy_cookie_domain localhost example.org;

說明：

　　瀏覽器對 Cookie 有很多限制，如果 Cookie 的 Domain 部分與當前頁面的 Domain 不匹配就無法寫入。所以如果請求 A 域名，服務器 proxy_pass 到 B 域名，然後 B 服務器輸出 Domian=B 的 Cookie，前端的頁面依然停留在 A 域名上，於是瀏覽器就無法將 Cookie 寫入。
　　不僅是域名，瀏覽器對 Path 也有限制。我們經常會 proxy_pass 到目標服務器的某個 Path 下，不把這個 Path 暴露給瀏覽器。這時候如果目標服務器的 Cookie 寫死了 Path 也會出現 Cookie 無法寫入的問題。

③proxy_cookie_path off;

proxy_cookie_path path replacement;

設置“Set-Cookie”響應頭中的path屬性的替換文本，其值可以爲一個字符串、正則表達式的模式或一個引用的變量；例如：

proxy_cookie_path /two/ /;

若“Set-Cookie”響應頭含有屬性“path=/two/some/uri/”，那麼該指令會將這個屬性改寫爲“path=/some/uri/”。

④proxy_hide_header field;

nginx默認不會將“Date”、“Server”、“X-Pad”，和“X-Accel-...”響應頭髮送給客戶端。該指令則可以設置額外隱藏的響應頭，這些響應頭也不會發送給客戶端。相反的，如果希望允許傳遞某些響應頭給客戶端，可以使用proxy_pass_header指令。

⑤proxy_set_header field value;

重新定義或者添加發往後端服務器的請求頭。value可以包含文本、變量或者它們的組合。例如：

proxy_set_header X-Real-IP $remote_addr; #給請求頭中添加客戶端IP

proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;

默認情況下，只有兩個請求頭會被重新定義：

proxy_set_header Host $proxy_host;
proxy_set_header Connection close;

如果某個請求頭的值爲空，那麼這個請求頭將不會傳送給後端服務器：

proxy_set_header Accept-Encoding "";

⑥proxy_pass_request_headers on|off; #是否將http首部發往上游服務器

⑦proxy_pass_request_body on|off; #是否將http請求報文的包體部分發往上游服務器

⑧proxy_redirect [default|off|redirect replacement];

修改上游服務器傳來的響應頭中的"Location"和"Refresh"字段。例如：

proxy_redirect http://localhost:8000/two/ http://frontend/one/;

replacement字符串可以省略服務器名：

proxy_redirect http://localhost:8000/two/ /;

此時將使用代理服務器的主域名和端口號來替換。如果端口是80，可以不加。

⑨proxy_send_timeout time;

在連接斷開之前兩次發送至upstream server的寫操作的最大間隔時長；

⑩proxy_read_timeout time;

在連接斷開之前兩次從接收upstream server接收讀操作的最大間隔時長；

⑶proxy模塊的內置變量

①$proxy_host：後端服務器的主機名和端口；

②$proxy_port：後端服務器的端口；

③$proxy_add_x_forwarded_for

將$remote_addr變量值添加在客戶端“X-Forwarded-For”請求頭的後面，並以逗號分隔。如果客戶端請求未攜帶“X-Forwarded-For”請求頭，$proxy_add_x_forwarded_for變量值將與$remote_addr變量相同

2、upstream模塊

如果有多個上游服務器，我們可以把它們放到一個組中，並且給它們賦予不同的權重和類型，進行負載均衡等，這些功能是由upstream模塊實現的。

⑴配置語法：

upstream name {

server address [parameters];

...

}

示例：

upstream backend {
server backend1.example.com weight=5;
server backend2.example.com:8080;
server unix:/tmp/backend3;
server backup1.example.com:8080 backup;
}

server {
location / {
proxy_pass http://backend;
}
}

⑵uptream使用注意：

①只能用於http上下文

②各server只能直接使用IP或主機名，不要加協議

⑶默認情況下，nginx按加權輪轉的方式將請求代理到各上游服務器。與上游服務器通信的時候，如果出現錯誤，請求會被傳給下一個服務器，直到所有可用的服務器都被嘗試過。如果所有服務器都返回失敗，客戶端將會得到最後通信的那個服務器的（失敗）響應結果。

⑷地址可以是域名或者IP地址，端口是可選的（默認是80），或者是指定“unix:”前綴的UNIX域套接字的路徑。如果一個域名解析到多個IP，本質上是定義了多個server。

⑸server後可定義的參數：

①weight=number #設定服務器的權重，默認是1。

②max_fails=number

設定Nginx與服務器通信的嘗試失敗的次數。在fail_timeout參數定義的時間段內，如果失敗的次數達到此值，Nginx就認爲服務器不可用。在下一個fail_timeout時間段，服務器不會再被嘗試。失敗的嘗試次數默認是1。設爲0就會停止統計嘗試次數，認爲服務器是一直可用的。

③fail_timeout=time #默認是10秒

設定：

統計失敗嘗試次數的時間段。在這段時間中，服務器失敗次數達到指定的嘗試次數，服務器就被認爲不可用。

服務器被認爲不可用的時間段。

④backup #標記爲備用服務器。當主服務器不可用以後，請求會被傳給這些服務器。

⑤down #標記服務器永久不可用，可以跟ip_hash指令一起使用

⑹upstream模塊的其它負載均衡算法（用於upstream上下文）：

①ip_hash;

作用同lvs中的sh調度算法，將來自於同一個客戶端的請求始終調度至同一臺後端服務器（除了當服務器不可用的時候）

②least_conn;

將請求發送到活動連接數最少的那臺服務器。如果這樣的服務器有多臺，就嘗試按加權輪循來調度

③sticky cookie name [expires=time] [domain=domain] [httponly] [secure] [path=path];

session綁定，將來自於同一個客戶端的請求始終調度至同一臺後端服務器，從而實現客戶端與後端服務器的session保持。

ip_hash指令無法實現對內網NAT用戶的均衡，而sticky指令可以做到；

◆sticky工作原理：

1.瀏覽器首次發起請求，請求頭未帶cookie。nginx接收請求，發現請求頭沒有cookie，則以輪詢方式將請求代理給後端服務器。

2.後端服務器處理完請求，將響應頭和內容返回給nginx。

3.nginx生成cookie，返回給客戶端瀏覽器。cookie的值與後端服務器對應，可能是明文，也可能是md5、sha1等Hash值。

4.瀏覽器接收請求，並創建cookie。

5.瀏覽器再次發送請求時，帶上cookie。

6.nginx接收到cookie，直接轉給對應的後端服務器

參數說明：

domain：cookie作用的域名

path：cookie作用的路徑

expires：cookie的過期時長

示例：

                    upstream backend {
                       server backend1.example.com;
                       server backend2.example.com;

                       sticky cookie srv_id expires=1h domain=.example.com path=/;
                    }

⑺health_check [interval=time] [fails=number] [passes=number] [uri=uri] [match=name];

對上游服務器組進行健康狀態檢測，用於location中；

參數說明：

interval=time #檢測的間隔時長，默認爲5秒

fails=number #連續檢測失敗多少次即認爲上游服務器不可用，默認爲1次

passes=number #上游服務器從不可用到可用狀態時需要連續檢測的次數，默認爲1次

uri=uri #定義用於健康檢測的URI，默認爲“/”，即默認檢測目標服務器的主頁

match=name #指定一段配置來當作檢測條件，默認當響應碼爲2XX或3XX時認爲上游服務器是可用的

示例：

http {

server {

...

location / {

proxy_pass http://backend;

health_check uri=/.health.html match=welcome;

}

match welcome { #match配置段要位於http上下文

status 200;

header Content-Type = text/html;

body ~ "Welcome to nginx!";

}

3、fastcgi模塊

nginx能夠通過fastcgi模塊實現將客戶端的動態文件請求代理至fastcgi server，此時nginx與fastcgi server的通信是通過fastcgi協議進行的

⑴fastcgi模塊的常用指令：

①fastcgi_pass address; #指定fastcgi server的地址和端口，也支持使用unix sock；

例如：

fastcgi_pass localhost:9000;

fastcgi_pass 192.168.30.20:9000;

fastcgi_pass unix:/tmp/fastcgi.socket;

②fastcgi_bind address | off; #指定聯繫fpm服務器時使用的地址；

③fastcgi_param parameter value [if_not_empty];

定義傳遞給fastcgi server的參數；參數值可以是文本、變量或它們的組合，if_not_empty表示不爲空時才傳遞

例：fastcgi_param SCRIPT_FILENAME /web/scripts$fastcgi_script_name;

④fastcgi_index name; #默認主頁名；就是當URI中的文件名缺省時，使用此文件名

⑤fastcgi_connect_timeout time; #連接fastcgi服務器的超時時長；

⑥fastcgi_send_timeout time; #向fastcgi服務傳輸數據的超時時長；

⑵通常建議nginx和fastcgi server（如php-fpm）部署在同一臺服務器上，因爲二者如果通過網絡通信的話會造成額外的性能開銷。

⑶配置示例：

location ~ \.php$ {

fastcgi_pass 127.0.0.1:9001;

fastcgi_index index.php;

fastcgi_param SCRIPT_FILENAME /web/scripts$fastcgi_script_name;

include fastcgi_params;

}

說明：

①參數SCRIPT_FILENAME保存是的腳本文件的絕對路徑；例如，若請求的URI是/test/status.php，那麼向fastcgi server傳遞的腳本文件路徑就是/web/scripts/test/status.php

②nginx有兩個文件fastcgi_params和fastcgi.conf，它們存放着nginx向fastcgi server傳遞的參數，二者唯一的區別是後者比前者多了一行 SCRIPT_FILENAME 的定義：

fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;

⑷通過nginx查看後端php-fpm的運行狀態

vim /etc/php-fpm.d/www.conf（若php-fpm是編譯安裝，則爲主配置文件）

pm.status_path = fpm_status

ping.path = fpm_ping

vim /etc/nginx/nginx.conf

location ~* /(fpm_status|fpm_ping) {

root /www/a.com;

fastcgi_pass 127.0.0.1:9000;

fastcgi_param SCRIPT_FILENAME $fastcgi_script_name;

include fastcgi_params;

}

二、nginx的緩存功能

nginx做爲反向代理時，能夠將來自上游服務器的響應緩存至本地，並在後續的客戶端請求同樣內容時直接從本地構造響應報文。nginx使用磁盤做緩存；

緩存將遵從上游服務器的響應報文首部中關於緩存的設定，如 "Expires"、"Cache-Control: no-cache"、 "Cache-Control: max-age=XXX"、"private"和"no-store" 等，但nginx在緩存時不會考慮響應報文的"Vary"首部。爲了確保私有信息不被緩存，所有關於用戶的私有信息可以在上游服務器上通過"no-cache" or "max-age=0"來實現，也可在nginx設定proxy_cache_key必須包含用戶特有數據如$cookie_xxx的方式實現，但最後這種方式在公共緩存上使用可能會有風險。因此，在響應報文中含有以下首部或指定標誌的報文將不會被緩存。

Set-Cookie

Cache-Control containing "no-cache", "no-store", "private", or a "max-age" with a non-numeric or 0 value

Expires with a time in the past

X-Accel-Expires: 0

與緩存有關的指令：

①proxy_cache zone | off; #定義一個用於緩存的共享內存區域，其可被多個地方調用；

②proxy_cache_key string; #設定在存儲及檢索緩存時用於“鍵”的字符串，可以使用變量爲$uri其值，但使用不當時有可能會爲同一個內容緩存多次；另外，將用戶私有信息用於鍵可以避免將用戶的私有信息返回給其它用戶；

例如：proxy_cache_key "$host$request_uri;

③proxy_cache_lock on | off; #啓用此項，可在緩存未命令中阻止多個相同的請求同時發往upstream，其生效範圍爲worker級別；

④proxy_cache_lock_timeout time; #proxy_cache_lock功能的鎖定時長；

⑤proxy_cache_min_uses number; #某響應報文被緩存之前至少應該被請求的次數；

⑥proxy_cache_path path [levels=levels] keys_zone=name:size [inactive=time] [max_size=size] [loader_files=number] [loader_sleep=time] [loader_threshold=time] ;

定義一個用記保存緩存響應報文的目錄，及一個保存緩存對象的鍵及響應元數據的共享內存區域(keys_zone=name:size)，其可選參數有：

levels：每級子目錄名稱的長度，有效值爲1或2，每級之間使用冒號分隔，最多爲3級；

inactive：非活動緩存項從緩存中剔除之前的最大緩存時長；

max_size：緩存空間大小的上限，當需要緩存的對象超出此空間限定時，緩存管理器將基於LRU算法對其進行清理；

loader_files：緩存加載器的每次工作過程最多爲多少個文件加載元數據；

loader_sleep：緩存加載器的每次迭代工作之後的睡眠時長；

loader_threashold：緩存加載器的最大睡眠時長；

示例：

proxy_cache_path /data/nginx/cache/one levels=1 keys_zone=one:10m;

在無法聯繫到upstream服務器時的哪種情形下(如error、timeout或http_500等)讓nginx使用本地緩存的過期的緩存對象直接響應客戶端請求；

⑧proxy_cache_valid [code ...] time;

用於爲不同的響應設定不同時長的有效緩存時長，例如：

proxy_cache_valid 200 302 10m;

⑨proxy_cache_methods GET | HEAD | POST ...; #爲哪些請求方法啓用緩存功能；

⑩proxy_cache_bypass string;

設定在哪種情形下，nginx將不從緩存中取數據。例如：

proxy_cache_bypass $cookie_nocache $arg_nocache $arg_comment;

proxy_cache_bypass $http_pragma $http_authorization;

nginx也可將後端fastcgi server的響應結果緩存：

fastcgi_cache

fastcgi_cache_path

fastcgi_cache_valid

...

這些指令用法同上述指令類似，不再贅述；

nginx學習筆記之三：nginx作爲反向代理服務器

MySQL學習筆記之四：併發控制和事務機制

MySQL學習筆記之五：存儲引擎和查詢緩存

MySQL學習筆記之二：源碼編譯安裝和二進制格式安裝MariaDB

rsyslog+loganalyzer+mysql部署日誌服務器

selinux簡介

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結