Leveldb源碼分析--2

原創

2020-02-21 00:31

3 Int Coding

輕鬆一刻，前面約定中講過Leveldb使用了很多VarInt型編碼，典型的如後面將涉及到的各種key。其中的編碼、解碼函數分爲VarInt和FixedInt兩種。int32和int64操作都是類似的。

3.1 Decode

首先是FixedInt編碼，直接上代碼，很簡單明瞭。

void EncodeFixed32(char* buf, uint32_t value)

{

if (port::kLittleEndian) {

memcpy(buf, &value,sizeof(value));

} else {

buf[0] = value & 0xff;

buf[1] = (value >> 8)& 0xff;

buf[2] = (value >> 16)& 0xff;

buf[3] = (value >> 24)& 0xff;

}

}

下面是VarInt編碼，int32和int64格式，代碼如下，有效位是7bit的，因此把uint32按7bit分割，對unsigned char賦值時，超出0xFF會自動截斷，因此直接*(ptr++) = v|B即可，不需要再把(v|B)與0xFF作&操作。

char* EncodeVarint32(char* dst, uint32_t v)

{

unsigned char* ptr =reinterpret_cast<unsigned char*>(dst);

static const int B = 128;

if (v < (1<<7)) {

*(ptr++) = v;

} else if (v < (1<<14)){

*(ptr++) = v | B;

*(ptr++) = v>>7;

} else if (v < (1<<21)){

*(ptr++) = v | B;

*(ptr++) = (v>>7) | B;

*(ptr++) = v>>14;

} else if (v < (1<<28)){

*(ptr++) = v | B;

*(ptr++) = (v>>7) | B;

*(ptr++) = (v>>14) | B;

*(ptr++) = v>>21;

} else {

*(ptr++) = v | B;

*(ptr++) = (v>>7) | B;

*(ptr++) = (v>>14) | B;

*(ptr++) = (v>>21) | B;

*(ptr++) = v>>28;

}

return reinterpret_cast<char*>(ptr);

}

char* EncodeVarint64(char* dst, uint64_t v) {// 對於uint64，直接循環

static const int B = 128;

unsigned char* ptr =reinterpret_cast<unsigned char*>(dst);

while (v >= B) {

*(ptr++) = (v & (B-1)) |B;

v >>= 7;

}

*(ptr++) =static_cast<unsigned char>(v);

returnreinterpret_cast<char*>(ptr);

}

3.2 Decode

Fixed Int的Decode，操作，代碼：

inline uint32_t DecodeFixed32(const char* ptr)

{

if (port::kLittleEndian) {

uint32_t result;

memcpy(&result, ptr,sizeof(result)); // gcc optimizes this to a plain load

return result;

} else {

return((static_cast<uint32_t>(static_cast<unsigned char>(ptr[0])))

|(static_cast<uint32_t>(static_cast<unsigned char>(ptr[1])) <<8)

| (static_cast<uint32_t>(static_cast<unsignedchar>(ptr[2])) << 16)

|(static_cast<uint32_t>(static_cast<unsigned char>(ptr[3])) <<24));

}

}

再來看看VarInt的解碼，很簡單，依次讀取1byte，直到最高位爲0的byte結束，取低7bit，作(<<7)移位操作組合成Int。看代碼：

const char* GetVarint32Ptr(const char* p, const char* limit, uint32_t* value)

{

if (p < limit) {

uint32_t result =*(reinterpret_cast<const unsigned char*>(p));

if ((result & 128) == 0) {

*value = result;

return p + 1;

}

}

return GetVarint32PtrFallback(p,limit, value);

}

const char* GetVarint32PtrFallback(const char* p, const char* limit,uint32_t* value)

{

uint32_t result = 0;

for (uint32_t shift = 0; shift<= 28 && p < limit; shift += 7) {

uint32_t byte =*(reinterpret_cast<const unsigned char*>(p));

p++;

if (byte & 128) { // More bytes are present

result |= ((byte & 127)<< shift);

} else {

result |= (byte <<shift);

*value = result;

returnreinterpret_cast<const char*>(p);

}

}

return NULL;

}

發佈了90 篇原創文章 · 獲贊 99 · 訪問量 164萬+

他的留言板關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

JWT 簽名用對稱加密還是非對稱加密？

一概念梳理對稱加密和非對稱加密是兩種基本的加密方法，它們在現代密碼學中扮演着核心角色，用於保護數據的安全和隱私。 1.1 對稱加密（Symmetric Encryption）對稱加密是指加密和解密使用同一個密鑰的過程。這意味着發送方和

2024-06-03 13:17:51

基於Fluid與JindoCache的大模型訓練加速實踐

隨着人工智能技術的不斷髮展，深度學習模型變得越來越複雜，參數量動輒幾十億甚至上百億。這樣的“大模型”在帶來強大性能的同時，也對訓練過程提出了極高的要求。尤其是在數據加載和計算資源利用方面，傳統的訓練方法往往難以滿足快速、高效的需求。爲此，我

2024-05-28 12:12:15

輕鬆掌握ArkTS！鴻蒙新作《鴻蒙HarmonyOS應用開發入門》簡介

《鴻蒙HarmonyOS應用開發入門》由清華大學出版社出版，已於近期上市。該書基於HarmonyOS 3.1 ArkTS編寫，所有示例採用了比較新的API 9，可謂是目前市面上最新的鴻蒙力作。本文對《鴻蒙HarmonyOS應用開發入門》一

2024-05-13 00:24:45

詳解GaussDB(DWS)中的行執行引擎

本文分享自華爲雲社區《GaussDB(DWS)行執行引擎詳解》，作者：yd_227398895。 1.前言 GaussDB（DWS）包含三大引擎，一是SQL執行引擎，用來解析用戶輸入的SQL語句，生成執行計劃，供執行引擎來執行；二是執行引

2024-05-11 11:30:53

從零開始學架構V2-架構設計基礎知識-3

說明在瞭解完軟件架構的基本設計原則、涉及流程，還需要補充一下架構設計中一些常見的基礎知識，分爲基礎的技術知識、常見的軟件架構都有哪些，本章節介紹的是基礎知識。一、數據庫單機的性能總是有限的，當業務發展到一定規模後，單機性能瓶頸問題就會

2024-05-10 01:31:57

深入理解分佈式鎖：原理、應用與挑戰| 京東物流技術團隊

前言在單機環境中，我們主要通過線程間的加鎖機制來確保同一時間只有一個線程能夠訪問某個共享資源或執行某個關鍵代碼塊，從而防止各種併發修改異常。例如，在Java中提供了synchronized/Lock。但是在分佈式環境中，這種線程間的鎖機制

2024-05-10 00:30:02

01-電商商品中心解密：僅憑SKU真的足夠嗎？

在電子商務系統中，SKU（Stock Keeping Unit，庫存單位）和SPU（Standard Product Unit，標準產品單位）是兩種不同的概念，它們共同用於商品管理和庫存控制。雖然理論上可以只使用SKU來管理商品，但在實際應

2024-05-07 01:08:03

巧用 TiCDC Syncpiont 構建銀行實時交易和準實時計算一體化架構

本文闡述了某商業銀行如何利用 TiCDC Syncpoint 功能，在 TiDB 平臺上構建一個既能處理實時交易又能進行準實時計算的一體化架構，用以優化其零售資格業務系統的實踐。通過遷移到 TiDB 並巧妙應用 Syncpoint，該銀行成

2024-04-30 22:24:58

Apache RocketMQ ACL 2.0 全新升級

作者：徒鍾引言 RocketMQ 作爲一款流行的分佈式消息中間件，被廣泛應用於各種大型分佈式系統和微服務中，承擔着異步通信、系統解耦、削峯填谷和消息通知等重要的角色。隨着技術的演進和業務規模的擴大，安全相關的挑戰日益突出，消息系統的訪問控

2024-04-26 21:12:10

clickhouse vs starRocks|||

比對結論如果只能單機部署的話，clickhouse基本無敵。如果集羣化，starRocks可以替換clickhouse，但支持的函數會相對少一些（clickhouse有不少自定義函數）信息比對功能 clickhouse

2024-04-26 11:25:43

實踐探討Python如何進行異常處理與日誌記錄

本文分享自華爲雲社區《Python異常處理與日誌記錄構建穩健可靠的應用》，作者：檸檬味擁抱。異常處理和日誌記錄是編寫可靠且易於維護的軟件應用程序中至關重要的組成部分。Python提供了強大的異常處理機制和靈活的日誌記錄功能，使開發人員能夠

2024-04-25 22:33:43

高可用 - 隔離原則

前言當討論高可用時，那麼必然有與之對應的低可用甚至不可用，但無論是哪種可用描述，其中都暗含了一個大衆共識，即不存在永久穩定運行的系統程序。事實上，幾十年前圖靈也論證過類似的問題，稱爲“停機問題”，具體的描述是：能否爲A計算機編程，使得

2024-04-24 23:17:13

03-爲啥大模型LLM還沒能完全替代你？

1 不具備記憶能力的它是零狀態的，我們平常在使用一些大模型產品，尤其在使用他們的API的時候，我們會發現那你和它對話，尤其是多輪對話的時候，經過一些輪次後，這些記憶就消失了，因爲它也記不住那麼多。 2 上下文窗口的限制大模型對其inpu

2024-04-23 01:07:00

01-大語言模型發展

AI大模型的相關的一些基礎知識，一些背景和基礎知識。多模型強應用AI 2.0時代應用開發者的機會。 0 大綱 AI產業的拆解和常見名詞應用級開發者，在目前這樣一個大背景下的一個職業上面的一些機會實戰部分的，做這個agent，即所謂智

2024-04-22 01:12:50

工程中實踐的微服務設計模式

最近在讀《微服務架構設計模式》，開始的時候我非常的好奇，因爲在我印象中，設計模式是常說的那23種設計模式，而微服務的設計模式又是什麼呢？這個問題也留給大家，在文末我會附上我對這個問題的理解。本次文章的內容主要是工作中對微服務設計模式的應

2024-04-19 23:17:23

24小時熱門文章

最新文章

最新評論文章