《大型網站技術架構：核心原理與案例分析》——大型網站架構演化過程

原創

2020-07-08 01:12

大型網站軟件系統的特點

高併發，大流量
高可用
海量數據
用戶分佈廣泛，網絡情況複雜
安全環境惡劣
需求快速變更，發佈頻繁
漸進式發展

大型網站架構演化發展歷程

初始階段的網站架構

Linux+PHP+Apache+MySQL

應用服務和數據服務分離

演化原因

一臺服務器逐漸不能滿足需求，越來越多的用戶訪問導致性能越來越差，越來越多的數據導致存儲空間不足
演化後

應用和數據分離後整個網站使用三臺服務器
- 應用服務器：需要更快更強大的CPU處理大量的業務邏輯
- 文件服務器：需要更大的硬盤存儲大量用戶上傳的文件
- 數據庫服務器：需要更快的硬盤和更大的內存進行快速磁盤檢索和數據緩存

使用緩存改善網絡性能

演化原因

大部分的業務訪問集中在一小部分數據上，把這一小部分數據緩存在內存可以減少數據庫的訪問壓力，提高整個網站的數據訪問速度
演化後

網站使用的緩存可以分爲兩種
- 本地緩存：緩存在應用服務器上，優點是訪問速度更快一些，但是受應用服務器內存的限制，其緩存的數據量有限，而且會出現和應用程序爭用內存的情況
- 遠程緩存：緩存在專門的分佈式緩存服務器上，優點是可以使用集羣的方式，部署大內存的服務器作爲專門的緩存服務器，可以在理論上做到不受內存容量限制的緩存服務

使用應用服務器集羣改善網站的併發處理能力

演化原因

當一臺服務器的處理能力、存儲空間不足時，應該增加一臺服務器分擔原有服務器的訪問及存儲壓力
演化後

通過負載均衡調度服務器，可將來自用戶瀏覽器的訪問請求分發到應用服務器集羣中的任何一臺服務器上，如果有更多的用戶，就在集羣中加入更多的應用服務器，使應用服務器的負載壓力不再成爲整個網站的瓶頸

數據庫讀寫分離

演化原因

在網站的用戶達到一定規模後，數據庫因爲負載壓力過高而成爲網站的瓶頸
演化後

利用數據庫的主從熱備功能，通過配置兩臺數據庫主從關係，可以將一臺數據庫服務器的數據更新同步到另一臺服務器上，實現數據庫讀寫分離，從而改善數據庫負載壓力

應用服務器在寫數據的時候，訪問主數據庫，主數據庫通過主從複製機制將數據更新同步到從數據庫，這樣當應用服務器讀數據的時候，就可以通過從數據庫獲得數據

應用服務器端應使用專門的數據訪問模塊，使數據庫讀寫分離對應用透明

使用反向代理和CDN加速網站響應

演化原因

不同地區的用戶訪問網站時，速度差別極大，爲了提供更好的用戶體驗，需要加速網站訪問速度
演化後

使用CDN和反向代理儘早返回數據給用戶，一方面加快用戶訪問速度，另一方面也減輕後端服務器的負載壓力
- CDN：CDN部署在網絡提供商的機房，使用戶在請求網站服務時，可以從距離自己最近的網絡提供商機房獲取數據
- 反向代理：部署在網站的中心機房，當用戶請求到達中心機房後，首先訪問的服務器是反向代理服務器，如果反向代理服務器中緩存着用戶請求的資源，就將其直接返回給用戶

使用分佈式文件系統和分佈式數據庫系統

演化原因

單一服務器滿足不了大型網站持續增長的業務需求，需要使用分佈式數據庫和分佈式文件系統
演化後

將數據庫拆分，把不同業務的數據庫部署在不同的物理服務器上

使用NoSQL和搜索引擎

演化原因

隨着網站業務越來越複雜，對數據存儲和檢索的需求也越來越複雜
演化後

採用一些非關係數據庫技術如NoSQL和非數據庫查詢技術如搜索引擎

業務拆分

演化原因

大型網站爲了應對日益複雜的業務場景，通過使用分而治之的手段將整個網站業務分成不同的產品線，如大型購物交易網站就會將首頁、商鋪、訂單、買家、賣家等拆分成不同的產品線，分歸不同的業務團隊負責
演化後

根據產品線劃分，將一個網站拆分成許多不同的應用，每個應用獨立部署維護，應用之間可以通過一個超鏈接建立關係，也可以通過消息隊列進行數據分發

分佈式服務

演化原因

隨着業務拆分越來越小，存儲系統越來越龐大，應用系統的整體複雜度呈指數級增加，部署維護越來越困難
演化後

既然每一個應用系統都需要執行許多相同的業務操作，比如用戶管理、商品管理等，那麼可以將這些共用的業務提取出來，獨立部署。由這些可複用的業務連接數據庫，提供共用業務服務，而應用系統只需要管理用戶界面，通過分佈式服務調用共用業務服務完成具體業務操作

淘寶網的架構演化

2003年 LAMP架構

2004年轉向Java+Oracle

2006年

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

純使用前端實現word導出，支持動態數據

使用的主要技術 jszip-utils 壓縮 docxtemplater word導出 pizzip 壓縮 file-saver

2020-07-02 07:00:55

logback的基本配置與使用技巧

logback的基本使用 maven的包  <dependency> <groupId>org.slf4j</groupId> <artifactId>slf4j

2020-07-02 05:18:17

rabbitmq安裝與介紹與踩坑

rabbitmq安裝與介紹 rabbitmq用途介紹了安裝環境： linux系統：CentOS 6.8 erlang: www.rabbitmq.com/releases/erlang/erlang-19.0.4-1.el6.x

2020-06-22 05:06:22

JVM指令手冊記錄查詢

如果想知道程序是怎麼在虛擬機下運行的，那麼就要了解程序通過類加載系統後，通過對應的操作指令，去調配對應的空間，這裏記錄一些JVM的操作指令集合 aconst_null 將null對象引用壓入棧 iconst_m1 將int類型常量

2020-06-22 05:06:22

Redis Cluster內存爆滿

今天遇到一個問題 MISCONF Redis is configured to save RDB snapshots, but is currently not able to persist on disk. Commands

2020-06-21 18:56:54

使用Java VisualVM監控遠程服務器部署在Docker容器中的java項目

有時候程序內存溢出或者做壓力測試的時候我們就需要監控我們的程序的運行狀況，包括內存使用情況、CPU使用情況等等，Java VisualVM就是監控這些數據的一個很好的工具，它在JDK安裝目錄的bin目錄下。在打開這個工具之前，

2020-06-21 18:56:54

項目參數校驗並拋出統一異常

實現步驟： 1.在dto中使用註解做參數校驗，並且爲參數添加get set方法，這是必須的，例如 <dependency> <groupId>org.projectlombok</groupId> <artifac

2020-06-21 18:56:54

三分鐘內教你使用Ngrok實現內網穿透

1.下載和運行Ngrok 網址： http://www.ngrok.cc/ 下載後解壓縮得到以下兩個文件夾 windows_amd64這個文件夾裏有兩個文件，其中一個是bat後綴的批處理文件，雙擊它會彈出一個黑窗口，另外一個

2020-06-21 18:56:54

Docker環境下安裝Jenkins

1.拉去Jenkins鏡像 docker pull jenkins 2.啓動Jenkins容器把jenkins的工作目錄/var/jenkins_home 掛載到宿主機的/home/docker-compose/jenkins

2020-06-21 18:56:54

Centos7卸載docker，安裝或更新指定版本的docker

一、卸載Docker 如果需要卸載Docker或者更新Docker，先執行"卸載Docker"這一步，否則就跳跳過第一點，直接查看第二點“安裝Docker”。首先輸入rpm -qa | grep docker 使用yum r

2020-06-21 18:56:52

搭建私有代碼管理平臺（Gitlab）

如果英文還可以的同學可以直接看官方英文文檔，挺詳細的。也可以直接看這篇博客，幾乎每一步都有截圖了，跟着一步一步操作搭起自己的gitlab很簡單。一、環境準備先準備一臺服務器，這裏我使用的是阿里雲的服務器。然後使用以下命令查看一

2020-06-21 18:56:52

HashMap引發死鏈問題（HashMap、ConcurrentHashMap原理解析）

事故背景一個CPU使用率飆升至100%的線上故障，原因是在併發情況下使用HashMap導致死循環。當cpu使用率100%時，查看堆棧，發現程序都卡在了HashMap.get()這個方法上了，重啓程序後問題消失。但是過段時間又會

WangCw的夏天

2020-06-17 18:04:08

MQ的常用場景 && 最佳實踐

RocketMQ 消息隊列 RocketMQ 版是阿里雲基於 Apache RocketMQ 構建的低延遲、高併發、高可用、高可靠的分佈式消息中間件。消息隊列 RocketMQ 版既可爲分佈式應用系統提供異步解耦和削峯填谷的能

WangCw的夏天

2020-06-17 17:36:17

記一次通過優化日誌解決高併發服務性能瓶頸問題

事故發現服務在生產環境中，由於同一時間段請求量過大，導致服務響應速度急劇下降。甚至會出現拒絕服務的問題，第一時間想到是機器性能問題，無法滿足併發如此大的場景，需要進行擴容或者服務限流。經過擴容之後平穩了一個多月之後，又一次大量請

WangCw的夏天

2020-06-17 17:36:17

消息隊列 RocketMQ原理和使用整理

一、背景由於公司之前使用的隊列中間件是kafka，近期變更爲使用阿里的RocketMQ，所以對RocketMQ進行一下簡單的知識整理。後續研究其內部原理後，再來一篇深入理解。二、說明消息隊列 RocketMQ 版是阿里雲基於

WangCw的夏天

2020-06-17 17:36:03

24小時熱門文章

最新文章

最新評論文章