Guava RateLimiter限流以及源碼解析

前言

在開發高併發系統時有三把利器用來保護系統：緩存、降級和限流

緩存 緩存的目的是提升系統訪問速度和增大系統處理容量
降級 降級是當服務出現問題或者影響到核心流程時，需要暫時屏蔽掉，待高峯或者問題解決後再打開
限流 限流的目的是通過對併發訪問/請求進行限速，或者對一個時間窗口內的請求進行限速來保護系統，一旦達到限制速率則可以拒絕服務、排隊或等待、降級等處理

常用的限流算法

漏桶算法

漏桶算法思路很簡單，水（請求）先進入到漏桶裏，漏桶以一定的速度出水，當水流入速度過大會直接溢出，可以看出漏桶算法能強行限制數據的傳輸速率。

img

令牌桶算法

對於很多應用場景來說，除了要求能夠限制數據的平均傳輸速率外，還要求允許某種程度的突發傳輸。這時候漏桶算法可能就不合適了，令牌桶算法更爲適合。如圖所示，令牌桶算法的原理是系統會以一個恆定的速度往桶裏放入令牌，而如果請求需要被處理，則需要先從桶裏獲取一個令牌，當桶裏沒有令牌可取時，則拒絕服務。

img

RateLimiter使用以及源碼解析

Google開源工具包Guava提供了限流工具類RateLimiter，該類基於令牌桶算法實現流量限制，使用十分方便，而且十分高效。

RateLimiter使用

首先簡單介紹下RateLimiter的使用，

public void testAcquire() {
      RateLimiter limiter = RateLimiter.create(1);

      for(int i = 1; i < 10; i = i + 2 ) {
          double waitTime = limiter.acquire(i);
          System.out.println("cutTime=" + System.currentTimeMillis() + " acq:" + i + " waitTime:" + waitTime);
      }
  }

輸出結果：

cutTime=1535439657427 acq:1 waitTime:0.0
cutTime=1535439658431 acq:3 waitTime:0.997045
cutTime=1535439661429 acq:5 waitTime:2.993028
cutTime=1535439666426 acq:7 waitTime:4.995625
cutTime=1535439673426 acq:9 waitTime:6.999223

首先通過RateLimiter.create(1);創建一個限流器，參數代表每秒生成的令牌數，通過limiter.acquire(i);來以阻塞的方式獲取令牌，當然也可以通過tryAcquire(int permits, long timeout, TimeUnit unit)來設置等待超時時間的方式獲取令牌，如果超timeout爲0，則代表非阻塞，獲取不到立即返回。

從輸出來看，RateLimiter支持預消費，比如在acquire(5)時，等待時間是3秒，是上一個獲取令牌時預消費了3個兩排，固需要等待3*1秒，然後又預消費了5個令牌，以此類推

RateLimiter通過限制後面請求的等待時間，來支持一定程度的突發請求(預消費)，在使用過程中需要注意這一點，具體實現原理後面再分析。

RateLimiter實現原理

Guava有兩種限流模式，一種爲穩定模式(SmoothBursty:令牌生成速度恆定)，一種爲漸進模式(SmoothWarmingUp:令牌生成速度緩慢提升直到維持在一個穩定值) 兩種模式實現思路類似，主要區別在等待時間的計算上，本篇重點介紹SmoothBursty

RateLimiter的創建

通過調用RateLimiter的create接口來創建實例，實際是調用的SmoothBuisty穩定模式創建的實例。

public static RateLimiter create(double permitsPerSecond) {
    return create(permitsPerSecond, SleepingStopwatch.createFromSystemTimer());
  }

  static RateLimiter create(double permitsPerSecond, SleepingStopwatch stopwatch) {
    RateLimiter rateLimiter = new SmoothBursty(stopwatch, 1.0 /* maxBurstSeconds */);
    rateLimiter.setRate(permitsPerSecond);
    return rateLimiter;
  }

SmoothBursty中的兩個構造參數含義：

SleepingStopwatch：guava中的一個時鐘類實例，會通過這個來計算時間及令牌
maxBurstSeconds：官方解釋，在ReteLimiter未使用時，最多保存幾秒的令牌，默認是1

在解析SmoothBursty原理前，重點解釋下SmoothBursty中幾個屬性的含義

/**
 * The work (permits) of how many seconds can be saved up if this RateLimiter is unused?
 * 在RateLimiter未使用時，最多存儲幾秒的令牌
 * */
 final double maxBurstSeconds;
 

/**
 * The currently stored permits.
 * 當前存儲令牌數
 */
double storedPermits;

/**
 * The maximum number of stored permits.
 * 最大存儲令牌數 = maxBurstSeconds * stableIntervalMicros(見下文)
 */
double maxPermits;

/**
 * The interval between two unit requests, at our stable rate. E.g., a stable rate of 5 permits
 * per second has a stable interval of 200ms.
 * 添加令牌時間間隔 = SECONDS.toMicros(1L) / permitsPerSecond；(1秒/每秒的令牌數)
 */
double stableIntervalMicros;

/**
 * The time when the next request (no matter its size) will be granted. After granting a request,
 * this is pushed further in the future. Large requests push this further than small requests.
 * 下一次請求可以獲取令牌的起始時間
 * 由於RateLimiter允許預消費，上次請求預消費令牌後
 * 下次請求需要等待相應的時間到nextFreeTicketMicros時刻纔可以獲取令牌
 */
private long nextFreeTicketMicros = 0L; // could be either in the past or future

接下來介紹幾個關鍵函數

setRate

public final void setRate(double permitsPerSecond) {
  checkArgument(
      permitsPerSecond > 0.0 && !Double.isNaN(permitsPerSecond), "rate must be positive");
  synchronized (mutex()) {
    doSetRate(permitsPerSecond, stopwatch.readMicros());
  }
}

通過這個接口設置令牌通每秒生成令牌的數量，內部時間通過調用SmoothRateLimiter的doSetRate來實現

doSetRate

@Override
  final void doSetRate(double permitsPerSecond, long nowMicros) {
    resync(nowMicros);
    double stableIntervalMicros = SECONDS.toMicros(1L) / permitsPerSecond;
    this.stableIntervalMicros = stableIntervalMicros;
    doSetRate(permitsPerSecond, stableIntervalMicros);
  }

這裏先通過調用resync生成令牌以及更新下一期令牌生成時間，然後更新stableIntervalMicros，最後又調用了SmoothBursty的doSetRate

resync

/**
 * Updates {@code storedPermits} and {@code nextFreeTicketMicros} based on the current time.
 * 基於當前時間，更新下一次請求令牌的時間，以及當前存儲的令牌(可以理解爲生成令牌)
 */
void resync(long nowMicros) {
    // if nextFreeTicket is in the past, resync to now
    if (nowMicros > nextFreeTicketMicros) {
      double newPermits = (nowMicros - nextFreeTicketMicros) / coolDownIntervalMicros();
      storedPermits = min(maxPermits, storedPermits + newPermits);
      nextFreeTicketMicros = nowMicros;
    }
}

根據令牌桶算法，桶中的令牌是持續生成存放的，有請求時需要先從桶中拿到令牌才能開始執行，誰來持續生成令牌存放呢？

一種解法是，開啓一個定時任務，由定時任務持續生成令牌。這樣的問題在於會極大的消耗系統資源，如，某接口需要分別對每個用戶做訪問頻率限制，假設系統中存在6W用戶，則至多需要開啓6W個定時任務來維持每個桶中的令牌數，這樣的開銷是巨大的。

另一種解法則是延遲計算，如上resync函數。該函數會在每次獲取令牌之前調用，其實現思路爲，若當前時間晚於nextFreeTicketMicros，則計算該段時間內可以生成多少令牌，將生成的令牌加入令牌桶中並更新數據。這樣一來，只需要在獲取令牌時計算一次即可。

SmoothBursty的doSetRate

@Override
void doSetRate(double permitsPerSecond, double stableIntervalMicros) {
  double oldMaxPermits = this.maxPermits;
  maxPermits = maxBurstSeconds * permitsPerSecond;
  if (oldMaxPermits == Double.POSITIVE_INFINITY) {
    // if we don't special-case this, we would get storedPermits == NaN, below
    // Double.POSITIVE_INFINITY 代表無窮啊
    storedPermits = maxPermits;
  } else {
    storedPermits =
        (oldMaxPermits == 0.0)
            ? 0.0 // initial state
            : storedPermits * maxPermits / oldMaxPermits;
  }
}

桶中可存放的最大令牌數由maxBurstSeconds計算而來，其含義爲最大存儲maxBurstSeconds秒生成的令牌。
該參數的作用在於，可以更爲靈活地控制流量。如，某些接口限制爲300次/20秒，某些接口限制爲50次/45秒等。也就是流量不侷限於qps

RateLimiter幾個常用接口分析

在瞭解以上概念後，就非常容易理解RateLimiter暴露出來的接口

@CanIgnoreReturnValue
public double acquire() {
  return acquire(1);
}

/**
* 獲取令牌，返回阻塞的時間
**/
@CanIgnoreReturnValue
public double acquire(int permits) {
  long microsToWait = reserve(permits);
  stopwatch.sleepMicrosUninterruptibly(microsToWait);
  return 1.0 * microsToWait / SECONDS.toMicros(1L);
}

final long reserve(int permits) {
  checkPermits(permits);
  synchronized (mutex()) {
    return reserveAndGetWaitLength(permits, stopwatch.readMicros());
  }
}

acquire函數主要用於獲取permits個令牌，並計算需要等待多長時間，進而掛起等待，並將該值返回，主要通過reserve返回需要等待的時間，reserve中通過調用reserveAndGetWaitLength獲取等待時間

/**
 * Reserves next ticket and returns the wait time that the caller must wait for.
 *
 * @return the required wait time, never negative
 */
final long reserveAndGetWaitLength(int permits, long nowMicros) {
  long momentAvailable = reserveEarliestAvailable(permits, nowMicros);
  return max(momentAvailable - nowMicros, 0);
}

最後調用了reserveEarliestAvailable

@Override
final long reserveEarliestAvailable(int requiredPermits, long nowMicros) {
  resync(nowMicros);
  long returnValue = nextFreeTicketMicros;
  double storedPermitsToSpend = min(requiredPermits, this.storedPermits);
  double freshPermits = requiredPermits - storedPermitsToSpend;
  long waitMicros =
      storedPermitsToWaitTime(this.storedPermits, storedPermitsToSpend)
          + (long) (freshPermits * stableIntervalMicros);

  this.nextFreeTicketMicros = LongMath.saturatedAdd(nextFreeTicketMicros, waitMicros);
  this.storedPermits -= storedPermitsToSpend;
  return returnValue;
}

首先通過resync生成令牌以及同步nextFreeTicketMicros時間戳，freshPermits從令牌桶中獲取令牌後還需要的令牌數量，通過storedPermitsToWaitTime計算出獲取freshPermits還需要等待的時間，在穩定模式中，這裏就是(long) (freshPermits * stableIntervalMicros) ，然後更新nextFreeTicketMicros以及storedPermits，這次獲取令牌需要的等待到的時間點， reserveAndGetWaitLength返回需要等待的時間間隔。

從`reserveEarliestAvailable`可以看出RateLimiter的預消費原理，以及獲取令牌的等待時間時間原理（可以解釋示例結果），再獲取令牌不足時，並沒有等待到令牌全部生成，而是更新了下次獲取令牌時的nextFreeTicketMicros，從而影響的是下次獲取令牌的等待時間。



 `reserve`這裏返回等待時間後，`acquire`通過調用`stopwatch.sleepMicrosUninterruptibly(microsToWait);`進行sleep操作，這裏不同於Thread.sleep(), 這個函數的sleep是uninterruptibly的，內部實現：

public static void sleepUninterruptibly(long sleepFor, TimeUnit unit) {
    //sleep 阻塞線程 內部通過Thread.sleep()
  boolean interrupted = false;
  try {
    long remainingNanos = unit.toNanos(sleepFor);
    long end = System.nanoTime() + remainingNanos;
    while (true) {
      try {
        // TimeUnit.sleep() treats negative timeouts just like zero.
        NANOSECONDS.sleep(remainingNanos);
        return;
      } catch (InterruptedException e) {
        interrupted = true;
        remainingNanos = end - System.nanoTime();
        //如果被interrupt可以繼續，更新sleep時間，循環繼續sleep
      }
    }
  } finally {
    if (interrupted) {
      Thread.currentThread().interrupt();
      //如果被打斷過，sleep過後再真正中斷線程
    }
  }
}

sleep之後，`acquire`返回sleep的時間，阻塞結束，獲取到令牌。

public boolean tryAcquire(int permits) {
  return tryAcquire(permits, 0, MICROSECONDS);
}

public boolean tryAcquire() {
  return tryAcquire(1, 0, MICROSECONDS);
}

public boolean tryAcquire(int permits, long timeout, TimeUnit unit) {
  long timeoutMicros = max(unit.toMicros(timeout), 0);
  checkPermits(permits);
  long microsToWait;
  synchronized (mutex()) {
    long nowMicros = stopwatch.readMicros();
    if (!canAcquire(nowMicros, timeoutMicros)) {
      return false;
    } else {
      microsToWait = reserveAndGetWaitLength(permits, nowMicros);
    }
  }
  stopwatch.sleepMicrosUninterruptibly(microsToWait);
  return true;
}

private boolean canAcquire(long nowMicros, long timeoutMicros) {
  return queryEarliestAvailable(nowMicros) - timeoutMicros <= nowMicros;
}

@Override
final long queryEarliestAvailable(long nowMicros) {
  return nextFreeTicketMicros;
}

tryAcquire函數可以嘗試在timeout時間內獲取令牌，如果可以則掛起等待相應時間並返回true，否則立即返回false
canAcquire用於判斷timeout時間內是否可以獲取令牌，通過判斷當前時間+超時時間是否大於nextFreeTicketMicros 來決定是否能夠拿到足夠的令牌數，如果可以獲取到，則過程同acquire，線程sleep等待，如果通過canAcquire在此超時時間內不能回去到令牌，則可以快速返回，不需要等待timeout後才知道能否獲取到令牌。

到此，Guava RateLimiter穩定模式的實現原理基本已經清楚，如發現文中錯誤的地方，勞煩指正！

上述分析主要參考了：https://segmentfault.com/a/1190000012875897，再此基礎上做了些筆記補充

Guava RateLimiter限流以及源碼解析

前言

常用的限流算法

漏桶算法

令牌桶算法

RateLimiter使用以及源碼解析

RateLimiter使用

RateLimiter實現原理

Javascript實現商品秒殺倒計時（時間與服務器時間同步）

Python字符串編碼相關問題

win 7 和 win 10 開機後臺自動運行腳本

四種解決Nginx出現403 forbidden 報錯的方法

H5直播之MSE(Media Source Extensions)

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結