raft mit 6.824 實現領導者選舉（LAB2A）

1.程序結構

lab2的實驗是要實現以下接口

// create a new Raft server instance:
rf := Make(peers, me, persister, applyCh)

// start agreement on a new log entry:
rf.Start(command interface{}) (index, term, isleader)

// ask a Raft for its current term, and whether it thinks it is leader
rf.GetState() (term, isLeader)

// each time a new entry is committed to the log, each Raft peer
// should send an ApplyMsg to the service (or tester).
type ApplyMsg

其中參數在註釋中基本都有解釋。
Make 用來創建點對點server ，peers是所有的server，len(peers)也就是所有的server數量，me就是當前的server，也就是在peers中的下標。persister和applyCh 以及Start函數在2A實驗中沒有用上。

做實驗前強烈建議多讀幾遍raft論文。
助教的student guide 也很重要：

student guide

FAQ

locking and structure

2.常見問題

什麼時候需要重置超時選舉時間？在 studen guide中寫到有3種情況需要重置超時時間：
a) 從當前的leader 中收到 AppendEntries ，收到過期的不需要重置
b) 開始一輪選舉的時候，當然本輪沒有選舉結果開始下一輪的時候也應該重置
c) 當你給其他節點投票的時候
什麼時候重置votefFor？
當term改變的時候重置votedfor，例如投票的時候收到了term更高，那麼不管此刻是否投票過，都應該轉變爲follower並且重置votedfor；當leader掉線一段時間重連回來，此刻羣組有新leader，那麼old leader應該轉變爲follower並且重置votedfor。
在做RPC請求的時候不應該加鎖。例如:
rf.mu.Lock()
rf. sendRequestVote(...)
rf.mu.UnLock()
這種寫法是不合邏輯的，容易造成死鎖，我們僅需對共享資源加鎖就足夠了，比如這裏對參數構造加鎖。
server 成爲leader之後不需要進行選舉超時倒計時。

3.實現給出部分代碼，僅供參考

3.1 流程

首先 raft 啓動，在Make 中做初始化，一開始所有的server都是follower，並且每個server會隨機分配一個選舉超時時間，同時所有的server都有相同的心跳間隔時間。那麼由於涉及到角色轉換，我們最好爲每一種角色寫一個轉換函數，convertToFollower，convertToCandidate，convertToLeader。

什麼時候會轉變到follower呢？不外乎在心跳，投票或者appendEntries的時候收到了更加新的server的信息，這時候需要轉變到follower的同時更新自己的Term
轉變到candidate只有一種，當選舉超時內沒有收到心跳或者appendEntries，那麼超時之後主動變成candidate
轉變到leader，只有在candidate收到大多數請求的時候，競選成功，成爲leader

func (rf* Raft) convertToCandidate(){
    rf.raftStatus = Candidate
    rf.currentTerm++
    rf.votedFor = rf.me
    rf.nonLeaderCond.Signal() // awake electionTimeoutTick

}

func (rf* Raft) convertToFollower(newTerm int){
    rf.raftStatus = Follower
    rf.currentTerm = newTerm
    rf.votedFor = -1
    rf.nonLeaderCond.Signal() // awake electionTimeoutTick

}

func (rf* Raft) convertToLeader(){
    rf.raftStatus = Leader

}

初始化的時候，爲了防止瓜分選票的情況發生，需要隨機設置不同的超時時間，論文建議是150-300ms ，建議寫個函數，用時間戳做隨機種子，論文建議每次生成不同的超時時間。

func (rf *Raft) getRandElecTime() int {
    rand.Seed(time.Now().UnixNano())
    electionTimeout := rand.Intn(150) + 150 // [150,300)
    return electionTimeout
}
func (rf* Raft) resetElectionTimer()  {
    rf.lastHeartbeatTime = time.Now().UnixNano()
    rf.electionTimeout = rf.getRandElecTime()
}

根據論文解析，我們需要長時間運行的gorutinue （可以簡單理解爲死循環）來處理事件和統計選舉超時。

func (rf *Raft) EventLoop() () {
    for{
        rf.mu.Lock()
        if rf.killed(){
            rf.mu.Unlock()
            return
        }
        rf.mu.Unlock()
        select {
        case <- rf.electionTimeoutChan:
            rf.mu.Lock()
            DPrintf("[EventLoop]: Id %d Term %d State %s \t || \t election timeout , start an eletion\n",
                rf.me, rf.currentTerm, state2name(rf.raftStatus))
            rf.mu.Unlock()
            // start election, if election timeout
            go rf.startElection()

        case <-rf.heartbeatPeriodChan:
            DPrintf("[EventLoop]: Id %d Term %d State %s \t || \t election timeout , start to send heartbeat\n",
                rf.me, rf.currentTerm, state2name(rf.raftStatus))
            go rf.broadcastHeartbeat()
        }
    }
}

func (rf *Raft) electionTimeoutTick()  {
    for {
        rf.mu.Lock()
        _, isLeader := rf.GetState()
        if rf.killed(){
            rf.mu.Unlock()
            return
        }
        rf.mu.Unlock()
        if isLeader {
            // if is leader , no need to check election timeout
            rf.nonLeaderCond.L.Lock()
            rf.nonLeaderCond.Wait()
            rf.nonLeaderCond.L.Unlock()
        }else { // follower and candidate
            rf.mu.Lock()
            elapseTime := time.Now().UnixNano() - rf.lastHeartbeatTime
            if elapseTime/int64(time.Millisecond) > int64(rf.electionTimeout){
                DPrintf("[electionTimeoutTick]: Id %d Term %d State %s\t || \ttimeout,"+
                    "convert to candidate\n" , rf.me, rf.currentTerm ,state2name(rf.raftStatus))
                DPrintf("[electionTimeoutTick] : %d %d\n",elapseTime/int64(time.Millisecond),int64(rf.electionTimeout))
                rf.electionTimeoutChan <- true
            }
            rf.mu.Unlock()
            time.Sleep(time.Millisecond*10)
        }
    }
}

實驗部分要求心跳不超過10次/s，也就是不小於100ms/次，而心跳時間間隔應該小於選舉超時時間，因此設置爲100到150ms之間。

func (rf* Raft) broadcastHeartbeat()  {
    for {
        rf.mu.Lock()
        _,isLeader := rf.GetState()
        if rf.killed(){
            rf.mu.Unlock()
            return
        }
        rf.mu.Unlock()

        if !isLeader {
            // not leader , then return
            return
        }

        // send heart beat
        for i,_ := range rf.peers{
            if i == rf.me{
                continue
            }
            rf.mu.Lock()
            //prevLogIndex := len(rf.log)-1
            prevLogIndex,PrevLogTerm :=rf.getLastLogInfo()
            args := AppendEntriesArgs{Term: rf.currentTerm,LeaderId: rf.me,PrevLogIndex: prevLogIndex,
                PrevLogTerm: PrevLogTerm, LeaderCommit: rf.commitIndex}
            var reply AppendEntriesReply
            rf.mu.Unlock()
            go func(index int, args *AppendEntriesArgs, reply* AppendEntriesReply) {
                ok := rf.sendAppendEntries(index,args,reply)
                rf.mu.Lock()
                defer rf.mu.Unlock()
                if ok == false{
                    // send heartbeat failed
                    //DPrintf("[broadcastHeartbeat]: %d send to peer's id %d failed term %d\n",args.LeaderId,index,reply.Term)

                }else {
                    //DPrintf("[broadcastHeartbeat]: Id %d Term %d State %s\t || \ttimeout,"+
                    //  "send heartbeat to %d success\n" , rf.me, rf.currentTerm ,state2name(rf.raftStatus),index)

                    if reply.Term > rf.currentTerm{
                        //
                        DPrintf("[broadcastHeartbeat]: Id %d Term %d State %s\t || \ttimeout,"+
                            "send heartbeat failed, reply term %d\n" , rf.me, rf.currentTerm ,state2name(rf.raftStatus),reply.Term)
                        rf.convertToFollower(reply.Term)

                    }else if reply.Term == rf.currentTerm && reply.Success == false{
                        // follower's log index and log term not match

                    }else {
                        //
                    }

                }
                // check reply


            }(i,&args,&reply)
        }

        // sleep
        time.Sleep(time.Duration(rf.heartbeatInterval)*time.Millisecond)
    }

}

開始選舉。當某一臺server 的選舉超時計時先倒數完，這臺server按照規則，先給變成candidate，term加一，給自己投票，重置選舉超時計時器，然後讓其他server投票。只要超過半數，那麼就當選leader，開始給其餘節點發心跳。

func (rf* Raft) startElection()  {
    rf.mu.Lock()
    rf.convertToCandidate()
    nVotes := 1 // has voted in the term
    // 3.reset election timeout
    rf.resetElectionTimer()
    DPrintf("[startElection]: Id %d Term %d state %s \n",rf.me, rf.currentTerm, state2name(rf.raftStatus))
    rf.mu.Unlock()
    // 4.send request vote to other server
    go func(nVotes* int ,rf* Raft) {
        var wg sync.WaitGroup
        winThreadHold := len(rf.peers)/2 + 1

        for i,_ := range rf.peers{
            if i == rf.me{
                continue
            }
            rf.mu.Lock()
            lastLogIndex ,LastLogTerm := rf.getLastLogInfo()

            reqArgs := RequestVoteArgs{Term: rf.currentTerm,CandidateId: rf.me, LastLogIndex: lastLogIndex,LastLogTerm: LastLogTerm}
            rf.mu.Unlock()

            wg.Add(1)

            var reply RequestVoteReply
            go func(index int, rf* Raft, args* RequestVoteArgs, reply* RequestVoteReply) {
                defer wg.Done()
                DPrintf("[startElection]: Id %d Term %d state %s \t || \t" +
                    "start send request vote to %d \n",rf.me, rf.currentTerm, state2name(rf.raftStatus),index)

                ok := rf.sendRequestVote(index,args,reply)
                if ok == false {
                    DPrintf("[startElection]: Id %d Term %d state %s \t || \t" +
                        "send request vote to %d failed \n",rf.me, rf.currentTerm, state2name(rf.raftStatus),index)
                    return
                }

                rf.mu.Lock()
                defer rf.mu.Unlock()
                // reject vote
                if reply.VoteGranted == false{
                    if reply.Term > rf.currentTerm{
                        DPrintf("[startElection]: Id %d Term %d state %s \t || \t" +
                            "peer term:%d \n",rf.me, rf.currentTerm, state2name(rf.raftStatus),reply.Term)
                        rf.convertToFollower(reply.Term)
                    }
                }else{
                    *nVotes += 1
                    // if it self has became leader , then no need to do
                    _,isLeader := rf.GetState()
                    if isLeader{
                        return
                    }
                    if rf.raftStatus == Candidate && *nVotes >= winThreadHold {
                        DPrintf("[startElection]: Id %d Term %d state %s \t || \t" +
                            "win election votes:%d \n",rf.me, rf.currentTerm, state2name(rf.raftStatus),*nVotes)

                        // win election
                        rf.convertToLeader()

                        // re init nextIndex
                        rf.reInitNextIndex()

                        // send heartbeat immediately to all server
                        DPrintf("start send heartbeat\n")
                        go rf.broadcastHeartbeat()
                    }
                }

            }(i,rf,&reqArgs,&reply)
        }

        // wait all send finish
        wg.Wait()

    }(&nVotes,rf)

}

處理投票
那麼這裏主要是根據term和lastlogindex來判斷是否投票。
不投票？
a) 比自己Term小
b) log比自己舊
c) 在本次Term中已經投票過了(args.Term == rf.currentTerm && rf.votedFor!= -1)
處理心跳
論文說了，entries爲空表示心跳信息。
如果收到了term更高的發來的心跳，應該轉變爲follower並重置選舉超時計時器
收到當前term的，直接重置選舉超時計時器
同時我們應該在reply中附上自己的term，以便leader檢測自己是否是過時的leader（leader斷線重連，term比自己小）

本篇文章由一文多發平臺ArtiPub自動發佈

raft mit 6.824 實現領導者選舉（LAB2A）

1.程序結構

2.常見問題

3.實現給出部分代碼，僅供參考

3.1 流程

linux安裝cuda和cudnn

測試人員都是畫畫大神，讓我看看誰還不會用代碼圖？

Object.values()對象遍歷

我拍了拍Redis，被移出了羣聊···

網絡現代化通向雲原生應用的高速公路

面試官：說說你對序列化的理解

我宣佈，這是我找到的史上AI最全論文體系！

如何在 source 的腳本里獲取腳本的絕對路徑

WSL 2 配置代理

C++ 兩個線程交替打印

C++ 實現 String 類

lt.588 設計內存文件系統

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

raft mit 6.824 實現領導者選舉（LAB2A）

1.程序結構

2.常見問題

3.實現 給出部分代碼，僅供參考

3.1 流程

3.實現給出部分代碼，僅供參考