[Nova] nova-compute服務正常但狀態Down

原創

2019-06-12 01:59

問題現象

在下面這張圖中我們可以看到有一個Compute是Down的。
這個時候的第一印象是Compute的掛掉了。但是檢查的時候有時會發現Compute並沒有掛掉，nova-compute服務也跑的好好的。

問題分析

這個情況基本上是由於時間不同步導致的。
在/etc/nova.conf中有如下配置，默認的service_down_time是60秒。

# Maximum time since last check-in for up service (integer value)
# service_down_time=60

在nova.servicegroup.drivers.db中有如下處理用於判斷服務的狀態是up還是down的。

class DbDriver(base.Driver):
    def __init__(self, *args, **kwargs):
        self.service_down_time = CONF.service_down_time
...
    def is_up(self, service_ref):
        """Moved from nova.utils
        Check whether a service is up based on last heartbeat.
        """
        ...
        elapsed = timeutils.delta_seconds(last_heartbeat, timeutils.utcnow())
        is_up = abs(elapsed) <= self.service_down_time
        ...
...

從上可以看到，在默認的配置下，如果Compute比Controller慢了1分鐘以上，那即使Controller能不斷的收到Compute上報的信息。但還是會認爲Compute是Down的。

安裝配置NTP

安裝

yum install ntp ntpdate

同步時間

# Sync time with server
ntpdate <server>
# Set the Hardware Clock to the current System Time
clock -w

配置/etc/ntp.conf

server <server>
restrict 127.0.0.1
restrict -6 ::1
restrict <server> mask 255.255.255.255 nomodify notrap noquery
driftfile /var/lib/ntp/drift
includefile /etc/ntp/crypto/pw
keys /etc/ntp/keys

啓動ntp服務

systemctl start ntpd
systemctl enable ntpd

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

當你輸入 nova boot時，client做了什麼？

當你輸入上圖命令後，會發生什麼？導讀：本博文以nova boot爲例分析nova創建虛擬機時, nova client的工作流程。在之後的博文中會分析 nova 創建虛擬機的後續流程。基礎簡介： nova boot –

2020-07-08 05:51:26

OpenStack-Nova組件理解

Nova是OpenStack雲中的計算組織控制器。支持OpenStack雲中實例（instances）生命週期的所有活動都由Nova處理。這樣使得Nova成爲一個負責管理計算資源、網絡、認證、所需可擴展性的平臺。但是，Nova自身並沒有提

椰子哥·天行者

2020-07-08 11:49:03

Keystone初探

導讀：本博文簡要介紹openstack中keystone模塊，受衆是剛接觸openstack的同學。什麼是keystone？爲什麼要keystone? keystone爲什麼要設計成這樣？ keystone client有哪

2020-07-08 05:51:26

neutron api 手冊

https://docs.openstack.org/api-ref/network/#

2020-07-08 02:35:33

openstack共享服務組件-Rabbitmq消息隊列概念及配置

隊列（MQ）概念： MQ 全稱爲 Message Queue, 消息隊列（ MQ ）是一種應用程序對應用程序的通信方法。應用程序通過讀寫出入隊列的消息（針對應用程序的數據）來通信，而無需專用連接來鏈接它們。消息傳遞指的是程序之

2020-07-08 01:52:27

openstack共享服務組件-NTP時鐘同步服務

NTP Network Time Protocol即，網絡時間協議 NTP工作請求 (1) 客戶端將採用隨機端口向 NTP 服務器 (UDP:123) 發出時間同步請求 (2)NTP 服務器收到請求後會將發出調校時間 (3)NTP

2020-07-08 01:52:27

openstack核心組件-horizon— Web管理界面

horizon 介紹： Horizon 爲 Openstack 提供一個 WEB 前端的管理界面 (UI 服務 )通過 Horizone 所提供的 DashBoard 服務 , 管理員可以使用通過 WEB UI 對 Opensta

2020-07-08 01:52:27

openstack創建實例ping不通外網怎麼辦

一，實例啓在控制節點控制節點管理網ip 192.168.146.51 #ip netns list #ip netns exec qrouter-bd6b3d04-cc2f-4cac-a75d-5df7af223218 r

2020-07-08 01:52:27

openstack核心組件-glance-鏡像服務

Glance是Openstack項目中負責鏡像管理的模塊，其功能包括虛擬機鏡像的查找、註冊和檢索等。 Glance提供Restful API（接口）可以查詢虛擬機鏡像的metadata及獲取鏡像。 Glance可以將鏡像保存到多種

2020-07-08 01:52:27

openstack核心組件-keystone-身份驗證服務

keystone 是OpenStack的組件之一，用於爲OpenStack家族中的其它組件成員提供統一的認證服務，包括身份驗證、令牌的發放和校驗、服務列表、用戶權限的定義等等。雲環境中所有的服務之間的授權和認證都需要經過 keys

2020-07-08 01:52:27

openstack核心組件-neutron-網絡服務-配置

neutron 介紹：控制節點：創建庫 #mysql -uroot -p123 >CREATE DATABASE neutron; 創建用戶賦予權限 > GRANT ALL PRIVILEGES ON neutron.*

2020-07-08 01:52:27

openstack cinder查錯

1.cinder產生的殭屍實例 2013-11-05 11:26:00 ERROR [cinder.openstack.common.rpc.amqp] Exception during message handling Trac

2020-07-07 22:38:21

go使用openstack-swift

工作中需要使用swift進行文件的上傳，在網上搜了一下，感覺對go的使用都不是很友好，這裏引用了一個包，進行了二次封裝，菜鳥剛用go時間不久，歡迎大神指出問題。作者原創，如需轉載請標明出處。先說一下我的目錄結構。 Bean.

Hello,树先生

2020-07-07 18:05:24

Linux鏡像快速定製方法

可以實現自動獲得ssh-key和硬盤自動擴容（需要重啓） 1. 環境準備 Centos6.x/7.x操作系統 6.x yum –y install http://download.fedoraproject.org/pu

2020-07-07 03:28:59

horizon學習小結（2）

1、寫在前面上一篇說到mypanel，這裏着重說說source code 。 2、content 創建mypanel，可以利用如django創建的命令manage.py（和horizon,openstack_da

2020-07-07 02:51:47

24小時熱門文章

python gdal 安裝使用（Windows， python 3.6.8）

最新文章

最新評論文章